蚂蚁集团发布最新AI成果:无需高端GPU,计算成本降低20%_顶尖财经网

  您的位置:首页 >> 财经频道 >> 投资互联网 >> 文章正文

蚂蚁集团发布最新AI成果:无需高端GPU,计算成本降低20%

加入日期:2025-3-27 7:05:32

每经记者 宋欣悦 每经编辑 兰素英

长久以来,英伟达凭借高性能芯片构筑起“算力霸权”,在AI(人工智能)模型训练领域占据主导地位。这一局面在DeepSeek(深度求索)问世后遭遇到不小冲击,如今又面临着新的挑战。

3月初,由蚂蚁集团首席技术官何征宇带领的Ling团队发表了一篇技术成果论文。论文显示,该团队开发了两款百灵系列开源混合专家(MoE)模型Ling-Lite(总参数为16.8B)和Ling-Plus(总参数为290B)。相比之下,据《麻省理工科技评论》,GPT-4.5总参数为1.8T,DeepSeek-R1总参数为671B。

惊艳之处在于,Ling团队在模型预训练阶段使用较低规格的硬件系统,将计算成本降低了约20%,训练1万亿Token(词元)成本从635万元降至508万元,最终取得了与使用高性能芯片(如英伟达H100、H800等)的模型相当的效果。

百灵系列混合专家模型的横空出世,让市场再次质疑英伟达的“算力信仰”。Hugging Face(抱抱脸)工程师Tiezhen Wang(人名)在社交媒体上表示,“做空英伟达的又一理由?”Tom’s Hard-ware(一个测评网站)发表评论称,蚂蚁集团此次的技术突破清晰展现出中国正坚定地朝着技术独立方向迈进。

针对此事,3月24日蚂蚁集团回应媒体称,针对不同芯片持续调优,以降低AI应用成本,目前取得了一定的进展,也会逐步通过开源分享。

计划应用于医疗等领域

目前,蚂蚁集团Ling团队的技术成果论文《每一个FLOP都至关重要:无需高级GPU(图形处理器)即可扩展3000亿参数混合专家LING大模型》已发表在预印本平台arXiv上。

蚂蚁Ling团队认为,正如DeepSeek开源发布中分析的“昼夜推理负载不均”问题,在推理服务高峰期,高性能资源同样面临短缺。在长期科研实践中,许多机构都持续面临着高端AI加速卡供应不足的问题。相比之下,性能较低的加速器更易获得,且单价更低。因此,模型需要能在异构计算单元和分布式集群间切换的技术框架,同时在AI Infra(人工智能基础设施)部分,在跨集群、跨设备的兼容和可靠层面进行性能优化。

该团队的实验结果表明,参数规模为300B左右的混合专家模型可以在性能较低的设备上有效训练,并在性能上达到与同规模的其他模型相当的水平。

以Ling-Plus模型为例,在实验中,该模型在五种不同硬件配置下完成9万亿Token的预训练任务。经测算,使用高性能硬件设备训练1万亿Token,预计成本高达635万元人民币,而使用低规格硬件系统,成本则可控制在约508万元,节省近20%。

在英语理解能力上,LingLite模型在一项关键基准测试中的表现与Qwen2.5-7B(模型名)相当,优于Llama3.1-8B(模型名)和Mistral-7B-v0.3(模型名)。

在中文理解能力上,LingLite和Ling-Plus模型表现明显优于海外模型Llama3.1-8B(模型名)和Mistral- 7B- v0.3(模型名)。在部分基准测试中,LingPlus表现略优于DeepSeekV2.5(模型名),与Qwen2.5-7B相当。

在数学和代码基准测试方面,Ling- Lite的表现与Qwen2.5-7B-Instruct(模型名)相当,优于Llama3.1- 8B和Mistral- 7B-v0.3。Ling- Plus的表现优于DeepSeek-V2.5,接近Qwen2.5-72B的水平。

在工具使用方面,大多数情况下,Ling-Plus和Ling-Lite在基准测试中均取得了最佳成绩。而工具使用对于大语言模型来说是一项重要且具有挑战性的任务。工具使用能力使模型能够作为AI代理工作、控制机器人系统并与众多软件工具集成。

此外,在安全性方面,LingPlus和Qwen2.5-7B表现突出,而Ling-Plus在错误拒绝方面表现更佳。

提高大模型的无害性(harmlessness)通常会导致其有用性(helpfulness)的降低。测试结果表明,Ling-Plus在安全性和错误拒绝之间整体平衡性上表现最佳。

据悉,蚂蚁百灵大模型LingPlus和Ling-Lite计划开源,并应用于医疗、金融等行业领域。

打破“算力霸权”?

有分析称,百灵系列混合专家模型的推出标志着蚂蚁集团加入AI领域的竞赛。自DeepSeek展示出能够以远低于OpenAI(公司名)和谷歌投入的数十亿美元成本训练出强大模型以来,这一竞争加速升级。

此前,DeepSeek在技术论文中表示,DeepSeek-V3模型(总参数671B,激活参数37B)总训练成本为557.6万美元,完整训练消耗了278.8万个GPU小时,几乎是同等性能水平模型训练所需的十分之一,堪称“榨干”GPU,也因此引发了资本市场的恐慌。

对此,英伟达CEO(首席执行官)黄仁勋在公开场合多次赞美DeepSeek,但其认为,DeepSeek-R1等更高效的模型出现,反而会刺激计算需求增长。

然而,蚂蚁集团正在探索一条新的路径——在无高端GPU的情况下扩展模型训练能力。

百灵系列混合专家模型的横空出世,让市场再次质疑英伟达的“算力信仰”。Tiezhen Wang在社交媒体上表示,“做空英伟达的又一理由?”著名硬件媒体Tom’s Hardware指出,这极有可能成为(中国)降低对西方技术依赖进程中的又一重要里程碑。

蚂蚁集团有关人士告诉《每日经济新闻》记者,在模型训练过程中,他们既使用了国产芯片,也采用了英伟达芯片。

Tom’s Hardware发表评论称,蚂蚁集团此次技术突破清晰展现出中国正坚定地朝着技术独立方向迈进。彭博资深商业智能分析师罗伯特·李(Robert Lea)同样指出,蚂蚁集团的研究展示了中国在AI创新方面的快速进步,也显示出本土企业正朝着AI自给自足的方向迈进。

编辑: 作者:chengtianhao 来源:和讯
打印 】【关闭

 



    闂備緡鍠楅崹鍧楀闯閸涘﹦鐝堕柣妤€鐗婇~鏍煥濞戞瑧鐓ù婊勫笚缁嬪绻濇担椋庣畾闂佽鍙庨崹顖滄嫻閻旂厧绀嗛柛鈩冡缚閳ь剛鏅弫顕€宕煎☉鎺戜壕濞达絽鎲¢崐銈吤归敐鍡欑煁闁哄瞼鍠栭獮鎾诲箛椤忓棜绻戦梺鎸庣☉閺堫剙锕㈤幍顔惧崥婵炲棗娴烽悷婵嬫煙閺嬵偄鍔滄繝鈧笟鈧幃褔宕奸悢鍝ョК闂佹寧绋戦惉鍏兼櫠濡ゅ懎绾ч柛鎰╁妿缁夋椽鏌涘Ο鐓庢瀺缂傚秵妫冮幊鎾诲川椤旂⒈鏆¢梺鍝勭墕椤р偓缂佽鲸绻冩穱濠囧磼濞戞瑧鐣虫繛鎾存皑閺佸憡鎱ㄩ柆宥呯畺闁靛ě鍕殸闂佺粯顨呴悧濠傖缚閿燂拷,闁荤姴娲ら崲鎻掝嚕閻戣棄绫嶉柟顖烆暒缁挾绱掗婊呭笡闁搞劍绮嶇粋鎺楁晸閿燂拷,闂佺懓鐡ㄩ崹鍐测堪閹寸姳鐒婇柛鈩冪懅瑜板矂鏌涘Δ鍕彧闁轰胶鍘ч~銏ゆ晲韫囨洜锛滄繛瀵稿О閸庢壆绮崒鐐叉闁搞儮鏅濊ぐ鍧楁煕閹邦剚鍣规い鏃€鍔栫粋鎺楀川椤掆偓閺佲晠鎮跺☉鏍у缂傚秵妫冮幊鎾诲川椤掑嫬娈濇繛瀛樼矒缂傛岸锝為崶顒佸€烽柣褍鎽滅粈澶娾槈閹炬娊鍙勯柕鍡楋功娴滄悂寮介鈧崑宥囩磽娴e摜绠崇紓宥咁樀瀵噣鎮╅幓鎺戠稑闂侀潧妫楅崐鎼佸矗妤e啫鍌ㄩ柣鏂垮槻閻忥繝鏌熼顒€鍊风花浼存煕濞嗗骏鏀婚柡瀣暞缁嬪顢橀姀鈽嗏偓鎴﹀级閳哄啫顣奸柡瀣暟閳ь剚绋掗〃鍛村箯娴兼潙绀冮柛娑卞弾閸熷洭鏌¢崼顐$敖缂侇噯绻濆鐢割敆閸屾粌璁查柣鐘叉矗缁€渚€鎮块崟顖涙櫖閻忕偟鐡旈崵鐘绘煛閸偄澧柡瀣暞缁傛帡濡烽妷銉﹀皨闂佺ǹ绻戝﹢褰掓嚈閹达箑绀傞柕濞炬櫅閸斻儵鏌熺€涙ḿ澧抽柍褜鍓欓幊姗€宕曢幘顔肩闁糕剝顨呴弫鍫曟倵閻熸壆鐣柍褜鍏涢悞锕傚几閸愵亖鍋撳☉娆樻畼婵炲牊鍨块幆鍥偄妞嬪孩婢栭梺璇″劯娴f彃浜惧ù锝呮憸閺嗘岸鏌℃担鍝ユ憼闁逞屽劯娴f彃浜惧ù锝嚽归幐銈夋煛閸愵厼鐓愰柍褜鍎搁崟顒佸缂備焦姊归悷銈囩箔婢跺濯存繝濠傚暙濮e霉閻樹警鍞虹紓宥呯У缁屽崬鈹戞繝鍕潔闂佺懓鐡ㄩ悧妤佺珶濞嗘垶瀚氶柣姘嚟缁€澶愭偣閸モ晜鐒挎い鏇氬嵆閹虫捇宕ㄩ鍌滅厒婵炶揪绲剧划灞筋嚕椤掑嫭鍤€闁告劘娉曠粈澶嬵殽閻愭潙鍔舵い鏇ㄥ墴閹虫盯顢旈崶鑸垫杸闂佸搫绉舵灙闁汇倕瀚伴幆鍕矙閸喖缍橀梺鍛婂姇閹冲酣顢欓幇鏉课ラ柛灞剧⊕閹烽亶鏌¢崒姘煑缂佹顦伴幏鍛堪閳ь剛鎷归悢鐓庣闁哄浄绱曢妶顐︽煟閵娿儱顏х紒鍓佸厴楠炴垿鏁撻敓锟�,婵炲濮撮幊宥囨閻㈢ǹ鐭楅柛灞剧妇閸嬫捇宕樼捄銊ь槷闂佺顕栭崰妤咁敆濠靛绀傞柕澶堝劤椤忥拷,婵$偛顑呴柊锝呪枍閹剧粯鍤婃い蹇撴噹椤庢捇鏌曢崱妤€鈧瓕銇愰崒婊勬殰闁告劏鏅滈幏閬嶆煛閸屾碍鐭楃紒鐙呯秮閹嫰顢欓悙顒傛殸闂侀潻璐熼崝瀣姳椤掍礁顕遍柣妯挎珪鐏忥繝鏌¢崶銊︾稇妞わ附瀵х粚閬嶅焺閸愌呯闂佹寧绋戦懟顖炴嚐閻斿摜鈻旂€广儱妫楁竟鍫ユ煕濞戞ḿ锛嶆繛鐓庡暞閵囧嫮鎹勯搹瑙勭檨闁荤姵鍔戦崹鑽ゅ垝閿涘嫮纾鹃柟杈剧悼椤╃敻鏌涘顒佹拱闁搞劊鍔戦幊鎾诲川椤撶喎鍓ㄩ柣搴ゎ潐绾板秴锕㈡导鏉戞闁搞儺鍓欓崝銉╂煕閹烘垶顥欏ù婊勫浮瀹曪絾绻濋崒姘紟闂備緡鍠撻崝蹇涳綖閸ヮ剚鍊烽悷娆忓閻忔鏌涢幇顒佸櫣妞ゆ梹鍔欐俊鎾磼濮樺吋鎼愰柣搴濈祷椤锕㈡导鏉戞闁搞儜鍐╂殽闁诲海顢婇~澶婏耿娓氣偓閹潡骞嬪⿰鍛瀫闂佹寧绋戦惌渚€顢氶鍕煑濠电姴鍟ˇ褍鈽夐幘鍐差劉闁搞劍绮嶇粋鎺楊敆閸愌呯煉缂備緡鍨遍惇褰掑焵椤掑﹥瀚�

婵$偑鍊ч幏锟� 闁诲繐楠忛幏锟� 闁荤姵鍔ч幏锟� 缂傚倷绶ら幏锟� -- 婵炴垶鎼幏锟� 闂佸憡顨愰幏锟� 婵$偑鍊ч幏锟� 闁诲繐楠忛幏锟� 缂傚倸鍠涢幏锟� 缂傚倷绶ら幏锟� 婵烇絽娴勯幏锟� 闂佽鍙忛幏锟� 闂佸搫鐗為幏锟� 闂佸憡妫戦幏锟� 婵炴垶鎼幏锟� 闂婎偄娴勯幏锟�
www.58188.com