算力、算法、数据是人工智能大模型的三驾马车,驱动AI奔向新纪元。在这幅图景里,拉车的是“三马”,狂奔的是AI大模型,那么“车”是谁?
2025年5月,腾讯混元大模型星脉网络技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在RoCE(基于融合以太网的远程直接内存访问技术)、IB(无限带宽)等多种网络环境下实现性能提升。之后,腾讯团队也将这一技术开源。
这是开源社区一次友好的开放共建、互动共享。星脉网络是腾讯Angel机器学习平台“超级流水线”上关键一环,它的使命是让训练模型的成千上万张算力卡能够“集团作战”,以便算力集群能够更好地协作,高效处理海量数据,支持算法落地。
这辆“马车”就是AI机器学习平台,它包含了模型训练和推理一整套流程。从开发者的角度来看,能够同时把算力、算法、数据这三匹“骏马”整合在一起的,便是AI机器学习平台这一大模型“工厂”。
“超级流水线”赋能产业生产力
如今,在算力、算法和数据之外,AI机器学习平台正在成为基础大模型“大厂”越来越重视的新基建。
作为大模型训推的“工厂”,AI机器学习平台在大模型出现之前,人们习惯称之为“深度学习框架”;现在,人们更愿意叫它“机器学习平台”或“训练/推理平台”。就其功能性而言,AI机器学习平台更像是一片沃土和工厂,离开了它,开发者将“难为无米之炊”。
也正因此,机器学习平台几乎成了基础大模型厂商的标配。可以看到在国内,阿里通义有PAI,百度文心有飞桨,腾讯有Angel等。
机器学习平台为何如此受青睐?腾讯机器学习平台部总经理陈鹏说,提升业务效率、促进团队协作、优化资源管理等等,都可以成为“大厂”蓄力发育机器学习平台的理由,但它最重要的角色,“我认为是AI‘工业化’的核心基础设施”。
陈鹏以腾讯Angel机器学习平台为例谈道,作为AI工业化的基础设施,Angel机器学习平台对内驱动全系列混元大模型(从0.5B至万亿参数)的迭代升级,涵盖语言模型、多模态生成模型等,支撑其应用于微信、广告推荐等业务场景;对外,Angel机器学习平台支撑各型号混元大模型通过腾讯云服务30万企业客户,覆盖金融风控、广告投放、工业质检等场景。
陈鹏介绍说,在大模型训练任务中,机器学习平台是“工厂超级流水线”。在这条流水线上,共性技术被提炼、流程要素被整合;模型从训练到部署,质量可控、效率翻倍,从“实验室研发”转化为产业生产力。
夯实生态基础 释放普惠应用潜力
“大厂”重视AI训练平台的建设,离不开打造开发者生态。
AI机器学习平台为数据工程师、算法工程师、业务研发工程师等不同角色提供了统一的工作平台和流程。各方可以在平台上协作,实现数据、模型、代码等资源的共享和管理,提高团队协作效率。同时,机器学习平台还提供可视化界面和统一接口,方便不同专业背景的人员理解和使用,降低沟通成本。
未来随着 AI 工业化加速,AI机器学习平台将进一步成为技术民主化的基础设施,推动全球开发者共建普惠的AI落地和应用。
在刚刚落下帷幕不久的世界人工智能大会(WAIC)上,腾讯向世界展示了其加速推动AI从技术突破迈向场景落地、打造“好用的AI”的实践与愿景。
在WAIC腾讯论坛上的信息显示,腾讯混元大模型已实现图像、视频、3D、文本等在内的全模态开源,图像、视频衍生模型数量超过3000个,混元3D系列模型社区下载量超过230万。而面向端侧的0.5B到7B系列小模型也在近期陆续开源,助力开发者高效构建AI原生应用。
自2025年以来,腾讯混元大模型持续迭代、小步快跑,混元家族不断拓展,端到端语音模型Voice、多模态理解模型Vision等相继推出。
而对于AI发展态势,腾讯相关负责人表示,AI是一场工业革命级的技术创新,对个人和产业发展都将产生前所未有的价值。但相对于一个完整的技术周期,当前AI还处于发展的初级阶段。
陈鹏表示,腾讯将持续围绕模型、平台、应用等维度发力,结合腾讯丰富的应用生态优势,推动AI从技术突破走向场景实践,让好用的AI出现在离用户和产业更近的地方。