分享好友 资讯首页 资讯分类 切换频道

国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10

2024-10-18 17:54710

国产大模型首次在公开榜单上超过GPT-4o!

就在刚刚,“大模型六小强”之一的零一万物正式对外发布新旗舰模型——Yi-Lightning(闪电)。

在大模型竞技场(Chatbot Arena)上,Yi-Lightning性能直冲总榜单并列6数学分榜并列第3,代码等其它分榜也名列前茅。

总成绩几乎与马斯克最新xAI大模型Grok-2-08-13持平,超越GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude3.5Sonnet等顶流。同时,国内清华系大模型公司智谱AI的GLM-4-Plus也杀进了总榜,位居第9位。

该榜单结果来自全球累积超千万次的人类用户盲测投票。

前段时间大模型竞技场还刚刚更新了规则,新榜单对AI回答的长度和风格等特征做了降权处理,分数更能反映模型真正解决问题的能力。

这次Yi-Lightning杀出重围,Lmsys团队特意发帖子,称这是竞技场上的大新闻:

图片

大模型竞技场总榜第六、国产第一

细看大模型竞技场分类榜上的“赛况”,Yi-Lightning各项能力都排在前头。

中文能力上,Yi-Lightning和GLM-4-Plus两个国产大模型都名列前位。

Yi-Lightning跃居并列第二,和o1-mini相差无几。

图片

数学能力,Yi-Lightning和Gemini-1.5-Pro-002并列第3,仅次于o1-preview、o1-mini。

图片

代码能力Yi-Lightning排名并列第4。

图片

另外在Hard promptsLonger Query分榜,Yi-Lightning也都排在第4位。

图片

图片

最后同样值得关注的是,竞技场新功能风格控制过滤,确保分数反映模型真正解决问题的能力,而不是用漂亮的格式、增加回答长度。

在对长度和风格等特征做了降权处理后,所有模型分数均有下降,Yi-Lightning排名变化不大,整体还与GPT-4o、Grok-2同一梯队。

图片

发布会上,零一万物创始人兼CEO李开复博士展示了Yi-Lightning在不同场景上的能力。

Yi-Lightning主打一个“推理速度更快,生成质量更好”。

相比上半年Yi-Large,Yi-Lightning首包速度提升1倍,推理速度也提升了4成。

像是翻译下面这种文学作品,Yi-Lightning不仅速度更快:

图片

而且用词更精准,更具文学色彩:

图片

那么Yi-Lightning是如何做到的?

好用还得极速

Yi-Lightning采用MoE混合专家模型架构。

底层技术上,Yi-Lightning在以下方面进行了提升。

图片

首先是优化混合注意力机制(Hybrid Attention),只在模型的部分层次中将传统的全注意力(Full Attention)替换为滑动窗口注意力(Sliding Window Attention)。

由此以来,模型在保证处理长序列数据高性能表现的同时,还能大大降低推理成本。

Yi-Lightning还引入了跨层注意力(Cross-Layer Attention, CLA),允许模型在不同的层次之间共享键(Key)和值(Value)头,减少对存储需求。

这使得Yi-Lightning能在不同层次之间更有效地共享信息。

总的来说,KV cache缩小了2-4倍,同时将计算的复杂度从O(L²)降至O(L)。

其次,Yi-Lightning还采用了动态Top-P路由机制

也就是说,Yi-Lightning可以根据任务的难度动态自动选择最合适的专家网络组合——

训练过程中会激活所有专家网络,使模型能学习到所有专家知识;而推理阶段,根据任务的难度,模型会选择性激活更匹配的专家网络。

另外,之前有一些传言称国内大模型“六小强”,有一些已经不做预训练了,李开复博士这次在发布会上直接“辟谣”:

零一万物绝不放弃预训练。

而且在模型预训练阶段,团队还积累了丰富的多阶段训练方法,将整个训练分为两块,一块做好以后就把它固定起来,然后在这个固定的模型上再做后段训练。

训练前期,更注重数据多样性,使得Yi-Lightning尽可能学习不同的知识;训练后期更重内容更丰富、知识性更强的数据。

同时团队还在不同阶段采用不同的batch size和LR schedule保证训练速度和稳定性。

李开复博士还表示,零一万物开发模型讲究“模基共建”,也就是共建模型和基础架构

模型的训练、服务、推理设计,与底层的AIInfra架构和模型结构必须高度适配。

这样做的目的,不仅是让模型更好,而且让它在推理的时候能够更便宜。

再加上以上种种抬升“性价比”的技术加持,所以Yi-Lightning这次也是打到了白菜价——

0.99元每1M token

在中文等方面,Yi-Lightning比肩OpenAI的o1-mini,o1-mini的定价是每百万输入3美元,每百万输出12美元。

Yi-Lightning每百万token只需0.99RMB也是打到了骨折。

但李开复博士表示,即便这样也:不亏钱。

图片

除了发布新模型,零一万物这次还首发了AI2.0数字人方案。

图片

目前该数字人已接入Yi-Lightning,实时互动效果相比以往更强更自然了,belike:

最后谈起和国外头部大模型的差距,李开复博士表示这次Yi-Lightning的排名证明了国产大模型跟硅谷最顶尖模型的差距缩小到了五个月。

去跟追上美国最顶尖的模型,缩短这个时间差非常困难,要付出很大的努力和有独特的打法。在国内不少公司都在努力,“模基共建”则是零一万物自己摸索的独特路径。

参考链接:

[1]https://x.com/lmarena_ai/status/1846245604890116457

[2]https://x.com/01AI_Yi/status/1845776529185476613

举报
收藏 0
打赏 0
评论 0
小孩细菌感染支气管炎吃什么药
儿童细菌性支气管炎常用药物包括阿莫西林克拉维酸钾、头孢克洛和罗红霉素。细菌性支气管炎主要由肺炎链球菌、流感嗜血杆菌等病原体感染引起,需在医生指导下根据药敏结果选择抗生素。1、阿莫西林克拉维酸钾:作为β-内酰胺类复合制剂,对产β-内酰胺酶的流感嗜血杆菌有良好抗菌活性。该药需整粒吞服,常见不良反应包括腹泻、皮疹等。用药期间需监测肝功能,青霉素过敏患儿禁用。2、头孢克洛:二代头孢菌素对肺炎链球菌覆盖较好

0评论2026-04-130

一夜没睡第二天可以健身吗
睡眠不足后健身可能加重身体负担,建议优先补眠或降低运动强度,具体需评估疲劳程度、运动类型、身体信号、营养补充和恢复措施。1、疲劳评估:整夜未眠会导致皮质醇水平升高,肌肉修复能力下降。此时进行高强度训练易引发运动损伤或心律异常。建议用晨起静息心率测试:若比平时高5次/分钟以上,应取消力量训练。可改为低强度活动如散步或瑜伽,时长控制在30分钟内。2、运动调整:睡眠剥夺状态下,身体协调性降低40%以上。

0评论2026-04-130

肚子大按摩肚子管用吗
按摩腹部对减小肚腩有一定辅助作用,需配合饮食运动综合调理,具体涉及促进肠道蠕动、加速局部代谢、缓解胀气、改善循环、调节脾胃功能。1、促进肠道蠕动:腹部按摩通过顺时针打圈手法刺激大肠经,帮助缓解便秘型肚腩。中医认为长期便秘与脾胃虚弱相关,可重点按压天枢穴脐旁2寸、大横穴脐旁4寸,配合陈皮山楂茶饮加强效果。每日晨起空腹按摩5分钟,力度以轻微酸胀为宜。2、加速局部代谢:针对脂肪堆积型腹部,推拿手法能激活

0评论2026-04-130

正 规 平 台 有 哪 些 , 游 戏 推 荐 牛 牛 房 卡 出 售 海 蓝 大 厅 / 开 群 怎 么 买 房 卡
IT之家 消息,牛牛咨询房/卡添加微信:88355042市场调查机构 IDC 昨日发布博文,预测受苹果首款折叠屏 iPhone 及三星三折叠屏手机

0评论2026-04-132

健身喝牛奶好还是喝蛋白粉好
健身期间选择牛奶或蛋白粉需根据个体需求决定,主要考量因素有蛋白质吸收效率、乳糖耐受性、训练强度、营养全面性和经济成本。1、吸收效率:乳清蛋白粉的蛋白质吸收速率显著快于牛奶,训练后30分钟内补充可快速修复肌纤维。牛奶中的酪蛋白属于缓释蛋白,适合在两餐之间或睡前饮用以持续供能。乳糖不耐受人群更适合选择分离乳清蛋白粉,避免腹胀腹泻。2、营养构成:牛奶提供钙、维生素D等13种必需营养素,蛋白粉通常仅含蛋白

0评论2026-04-130

金 花 创 建 房 间 / 金 花 房 卡 制 作 链 接 新 八 戒 / / 全 网 房 卡 低 价 售
据了解,星空乐娱金花房卡添加微信33549083VARA大会是国内网络安全领域极具影响力的年度盛会,创办于2008年,是凝聚“政产学研用

0评论2026-04-132

北京割双眼皮需要多少钱
北京割双眼皮一般需要5000-30000元,具体费用与手术方式、医生经验、医疗机构等因素相关。割双眼皮手术费用通常由基础手术费、麻醉费、材料费、术后护理费等构成。埋线法价格较低,约为5000-10000元,适合眼皮薄且无松弛的年轻群体。三点定位法价格居中,约8000-15000元,通过微小切口实现持久效果。全切法价格较高,约10000-30000元,适用于需要去除多余皮肤或脂肪的案例。部分机构可能

0评论2026-04-130

金 花 创 建 房 间 / 游 戏 推 荐 牛 牛 房 卡 出 售 上 游 联 盟 / 房 卡 最 低 良 心 价 售
华盛顿--(美国商业资讯)--官方宣布:上游联盟添加微信33549083通往2026年国际足联世界杯(FIFA World Cup 26?)的道路始于Visa。

0评论2026-04-132

三餐吃糙米会瘦吗
三餐吃糙米有助于控制体重,但需配合整体饮食结构调整。糙米富含膳食纤维、B族维生素和矿物质,主要通过延长饱腹感、稳定血糖、减少脂肪吸收、促进肠道蠕动、降低热量摄入等机制辅助减重。1、延长饱腹感:糙米的外层麸皮含有大量不可溶性膳食纤维,在胃内吸水膨胀后能延缓胃排空速度。相比精白米,同等分量的糙米可使饱腹时间延长1.5-2小时,减少两餐间的零食摄入欲望。研究显示,每日用糙米替代精制谷物可使总热量摄入减少

0评论2026-04-130

脊髓损伤后的疼痛麻木怎么办
脊髓损伤后疼痛麻木需综合康复治疗与中医调理,改善神经功能需药物干预、物理疗法、中医外治、心理调适及生活管理。1、药物干预:神经病理性疼痛常用加巴喷丁、普瑞巴林调节异常放电,麻木可配合甲钴胺营养神经;中药选用活血化瘀的丹参、川芎嗪注射液静脉滴注,或口服大活络丹促进微循环。严重痉挛疼痛可短期使用巴氯芬,但需警惕药物依赖。2、物理康复:功能性电刺激通过电流触发肌肉收缩延缓萎缩,水中运动利用浮力减轻关节负

0评论2026-04-130