国产Step-2模型登顶全球指令跟随榜单，AI行业新标杆诞生_阶跃_技术

近期，人工智能领域传来令人振奋的消息：国内初创公司阶跃星辰的Step-2大语言模型在新发布的LiveBench榜单中，以57.68分的高分荣登全球第五，并成为指令跟随任务中的世界第一。这一成绩不仅使其成为前十名中唯一的国产模型，也为我国AI技术的发展增添了浓厚的亮色。

LiveBench榜单由图灵奖得主、Meta首席AI科学家杨立昆及其团队于今年6月推出，旨在提供一种无法作弊的评测标准。该榜单在拥有17个不同任务的基础上，包括指令跟随、语言生成等多个领域，强调简洁且公平的评测方式，确保每个模型的真实能力得到有效评估。通过客观的事实判断，该排行榜避免了传统评测方法中因评论者偏见可能造成的误差。

在指令跟随任务中，Step-2凭借其在理解与生成能力上的卓越表现脱颖而出。该模型的任务在于重新改写和总结最新的文章，以86.57分高居榜首，明显领先于其他竞争对手，如Meta的LLaMA-3.1-405b-instruct-turbo。Step-2的成功不仅展现了其强大的语言生成控制能力，还证明了模型在处理模糊指令时的出色能力，能够在复杂场景中准确捕获人类的意图。

Step-2作为国内首个由初创企业推出的万亿参数大模型，其采用了创新的混合专家（MoE）架构，具备更高训练效率和模型上限。选择完全自主研发，从头开始训练而非基于现有模型的方式，阶跃星辰团队在其研发过程中突破了多项关键技术，实现了6D并行训练及极致显存管理。这不仅提升了模型的性能，同时也增强了用户的使用体验。

展望未来，阶跃星辰还计划推出多模态AI模型，其中Step-1.5V在理解复杂图形和视频处理方面表现出色，展示了其在视觉与语言理解上的强大潜力。与此同时，Step-1X图像生成模型的推出，也将极大丰富用户在创作中的选择，特别是针对中国元素的深度优化，旨在更好地满足国内用户的审美需求。

随着大模型技术的快速发展，AI行业正在经历一次前所未有的变革。阶跃星辰的Step-2不但为国内大模型树立了新的标杆，也为全球的AI技术竞争增添了新的动力。这一成就的背后，是团队持续的技术创新和对产品研发的专注，标志着中国在人工智能领域的崛起。

总的来看，Step-2的成功不仅是技术层面的胜利，也是行业对本土创新的认可。随着AI技术的不断进步，我们期待更多这样的产品问世，为我们的生活带来更为便捷和智能的体验。考虑到AI在各个领域的广泛应用，我们鼓励用户积极尝试使用各种AI产品，尤其是像简单AI这样的工具，助力日常生活和工作中的效率提升。返回搜狐，查看更多

责任编辑：