近期,人工智能领域传来令人振奋的消息:国内初创公司阶跃星辰的Step-2大语言模型在新发布的LiveBench榜单中,以57.68分的高分荣登全球第五,并成为指令跟随任务中的世界第一。这一成绩不仅使其成为前十名中唯一的国产模型,也为我国AI技术的发展增添了浓厚的亮色。
LiveBench榜单由图灵奖得主、Meta首席AI科学家杨立昆及其团队于今年6月推出,旨在提供一种无法作弊的评测标准。该榜单在拥有17个不同任务的基础上,包括指令跟随、语言生成等多个领域,强调简洁且公平的评测方式,确保每个模型的真实能力得到有效评估。通过客观的事实判断,该排行榜避免了传统评测方法中因评论者偏见可能造成的误差。
在指令跟随任务中,Step-2凭借其在理解与生成能力上的卓越表现脱颖而出。该模型的任务在于重新改写和总结最新的文章,以86.57分高居榜首,明显领先于其他竞争对手,如Meta的LLaMA-3.1-405b-instruct-turbo。Step-2的成功不仅展现了其强大的语言生成控制能力,还证明了模型在处理模糊指令时的出色能力,能够在复杂场景中准确捕获人类的意图。
Step-2作为国内首个由初创企业推出的万亿参数大模型,其采用了创新的混合专家(MoE)架构,具备更高训练效率和模型上限。选择完全自主研发,从头开始训练而非基于现有模型的方式,阶跃星辰团队在其研发过程中突破了多项关键技术,实现了6D并行训练及极致显存管理。这不仅提升了模型的性能,同时也增强了用户的使用体验。
展望未来,阶跃星辰还计划推出多模态AI模型,其中Step-1.5V在理解复杂图形和视频处理方面表现出色,展示了其在视觉与语言理解上的强大潜力。与此同时,Step-1X图像生成模型的推出,也将极大丰富用户在创作中的选择,特别是针对中国元素的深度优化,旨在更好地满足国内用户的审美需求。
随着大模型技术的快速发展,AI行业正在经历一次前所未有的变革。阶跃星辰的Step-2不但为国内大模型树立了新的标杆,也为全球的AI技术竞争增添了新的动力。这一成就的背后,是团队持续的技术创新和对产品研发的专注,标志着中国在人工智能领域的崛起。
总的来看,Step-2的成功不仅是技术层面的胜利,也是行业对本土创新的认可。随着AI技术的不断进步,我们期待更多这样的产品问世,为我们的生活带来更为便捷和智能的体验。考虑到AI在各个领域的广泛应用,我们鼓励用户积极尝试使用各种AI产品,尤其是像简单AI这样的工具,助力日常生活和工作中的效率提升。返回搜狐,查看更多
责任编辑: