突发！蚂蚁集团放大招：暴击英伟达“算力霸权”！

author 03-29 93 抢沙发

默认

摘要： 英伟达“算力霸权”面临新挑战：蚂蚁集团百灵大模型横空出世英伟达长期以来凭借其高性能芯片在AI领域建立了强大的“算力霸权”，尤其在AI模型训练方面占据绝对主导地位。然而，随着De...

英伟达“算力霸权”面临新挑战：蚂蚁集团百灵大模型横空出世

英伟达长期以来凭借其高性能芯片在AI领域建立了强大的“算力霸权”，尤其在AI模型训练方面占据绝对主导地位。然而，随着DeepSeek等创新技术的涌现，英伟达的地位开始受到冲击。如今，蚂蚁集团发布的百灵系列大模型，再次为这场竞争增添了新的变数。

蚂蚁集团发布百灵系列模型：降低AI训练成本的新突破

3月初，由蚂蚁集团首席技术官何征宇带领的Ling团队发布了一项重要的技术成果——百灵系列开源混合专家（MoE）模型。该系列包含两款模型：Ling-Lite（总参数168亿）和Ling-Plus（总参数2900亿）。尽管参数规模不及GPT-4.5（1.8万亿）或DeepSeek-R1（6710亿），但百灵模型展现出了令人瞩目的性能。

技术细节：低成本硬件实现高性能

Ling团队最引人注目的突破在于，他们能够在模型预训练阶段使用较低规格的硬件系统，从而显著降低计算成本。具体而言，训练1万亿Token的成本从635万元人民币降至508万元人民币，降幅约为20%。这意味着，百灵模型在成本效益方面取得了巨大优势，并最终实现了与使用英伟达H100、H800等高性能芯片的模型相当的效果。

据蚂蚁集团相关人士透露，在模型训练过程中，他们同时使用了国产芯片和英伟达芯片。

百灵模型的性能表现：多项基准测试结果

蚂蚁Ling团队的技术成果论文《每一个FLOP都至关重要：无需高级GPU即可扩展3000亿参数混合专家LING大模型》显示，在不同基准测试中，百灵系列模型展现出强大的竞争力：

英语理解能力： Ling-Lite模型在一项关键基准测试中的表现与Qwen2.5-7B相当，优于Llama3.1-8B和Mistral-7B-v0.3。
中文理解能力： Ling-Lite和Ling-Plus模型表现明显优于海外模型Llama3.1-8B和Mistral-7B-v0.3。在部分基准测试中，Ling-Plus表现略优于DeepSeek-V2.5，与Qwen2.5-7B相当。
数学和代码基准测试： Ling-Lite的表现与Qwen2.5-7B-Instruct相当，优于Llama3.1-8B和Mistral-7B-v0.3。Ling-Plus的表现优于DeepSeek-V2.5，接近Qwen2.5-72B的水平。

此外，在工具使用和安全性方面，Ling-Plus也表现出色。特别是在安全性和错误拒绝之间的平衡性上，Ling-Plus表现最佳。