本文作者:author

突发!蚂蚁集团放大招:暴击英伟达“算力霸权”!

突发!蚂蚁集团放大招:暴击英伟达“算力霸权”!摘要: 英伟达“算力霸权”面临新挑战:蚂蚁集团百灵大模型横空出世英伟达长期以来凭借其高性能芯片在AI领域建立了强大的“算力霸权”,尤其在AI模型训练方面占据绝对主导地位。然而,随着De...

英伟达“算力霸权”面临新挑战:蚂蚁集团百灵大模型横空出世

英伟达长期以来凭借其高性能芯片在AI领域建立了强大的“算力霸权”,尤其在AI模型训练方面占据绝对主导地位。然而,随着DeepSeek等创新技术的涌现,英伟达的地位开始受到冲击。如今,蚂蚁集团发布的百灵系列大模型,再次为这场竞争增添了新的变数。

蚂蚁集团发布百灵系列模型:降低AI训练成本的新突破

3月初,由蚂蚁集团首席技术官何征宇带领的Ling团队发布了一项重要的技术成果——百灵系列开源混合专家(MoE)模型。该系列包含两款模型:Ling-Lite(总参数168亿)和Ling-Plus(总参数2900亿)。尽管参数规模不及GPT-4.5(1.8万亿)或DeepSeek-R1(6710亿),但百灵模型展现出了令人瞩目的性能。

技术细节:低成本硬件实现高性能

Ling团队最引人注目的突破在于,他们能够在模型预训练阶段使用较低规格的硬件系统,从而显著降低计算成本。具体而言,训练1万亿Token的成本从635万元人民币降至508万元人民币,降幅约为20%。这意味着,百灵模型在成本效益方面取得了巨大优势,并最终实现了与使用英伟达H100、H800等高性能芯片的模型相当的效果。

据蚂蚁集团相关人士透露,在模型训练过程中,他们同时使用了国产芯片和英伟达芯片。

百灵模型的性能表现:多项基准测试结果

蚂蚁Ling团队的技术成果论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》显示,在不同基准测试中,百灵系列模型展现出强大的竞争力:

  • 英语理解能力: Ling-Lite模型在一项关键基准测试中的表现与Qwen2.5-7B相当,优于Llama3.1-8B和Mistral-7B-v0.3。
  • 中文理解能力: Ling-Lite和Ling-Plus模型表现明显优于海外模型Llama3.1-8B和Mistral-7B-v0.3。在部分基准测试中,Ling-Plus表现略优于DeepSeek-V2.5,与Qwen2.5-7B相当。
  • 数学和代码基准测试: Ling-Lite的表现与Qwen2.5-7B-Instruct相当,优于Llama3.1-8B和Mistral-7B-v0.3。Ling-Plus的表现优于DeepSeek-V2.5,接近Qwen2.5-72B的水平。

此外,在工具使用和安全性方面,Ling-Plus也表现出色。特别是在安全性和错误拒绝之间的平衡性上,Ling-Plus表现最佳。

应用前景与开源计划

蚂蚁百灵大模型Ling-Plus和Ling-Lite计划开源,并应用于医疗、金融等行业领域,为这些领域带来新的AI解决方案。

突发!蚂蚁集团放大招:暴击英伟达“算力霸权”! 突发!蚂蚁集团放大招:暴击英伟达“算力霸权”! 突发!蚂蚁集团放大招:暴击英伟达“算力霸权”!

挑战英伟达?蚂蚁集团探索AI训练新路径

百灵系列混合专家模型的推出,无疑标志着蚂蚁集团正式加入AI领域的激烈竞争。此前,DeepSeek已经展示了以远低于OpenAI和谷歌的成本训练强大模型的能力,加速了这场竞争的升级。

DeepSeek的成功与黄仁勋的表态

DeepSeek在技术论文中提到,DeepSeek-V3模型(总参数671B,激活参数37B)的总训练成本为557.6万美元,消耗了278.8万个GPU小时,几乎是同等性能水平模型训练所需的十分之一。这种高效利用GPU的能力,甚至引发了资本市场的关注。

尽管如此,英伟达CEO黄仁勋多次公开赞扬DeepSeek,并认为更高效模型的出现反而会刺激计算需求的增长。

市场质疑与技术独立之路

然而,蚂蚁集团正在探索一条与DeepSeek不同的路径——在无高端GPU的情况下扩展模型训练能力。百灵系列混合专家模型的问世,再次引发市场对英伟达“算力信仰”的质疑。HuggingFace工程师Tiezhen Wang甚至在社交媒体上发问:“做空英伟达的又一理由?”

著名硬件媒体Tom’s Hardware指出,如果蚂蚁集团的技术突破能够实现与DeepSeek类似的AI训练效率飞跃,那么这将极有可能成为中国降低对西方技术依赖进程中的又一个重要里程碑。

蚂蚁集团相关人士表示,在模型训练过程中,他们同时使用了国产芯片和英伟达芯片。Tom’s Hardware评论称,蚂蚁集团的这一技术突破清晰地展现出中国正坚定地朝着技术独立的方向迈进。

专家观点:中国AI的快速进步

彭博资深商业智能分析师罗伯特·李(Robert Lea)指出,蚂蚁集团的研究展示了中国在AI创新方面的快速进步,也显示出本土企业正朝着AI自给自足的方向迈进。

突发!蚂蚁集团放大招:暴击英伟达“算力霸权”!

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

验证码

评论列表 (暂无评论,93人围观)参与讨论

还没有评论,来说两句吧...