在AI大模型的竞争中,国内新秀DeepSeek凭借其最新开源的R1推理模型,似乎迎来了一波热潮。月之暗面的K1.5模型与DeepSeek-R1齐头并进,这在数学、代码及多模态推理领域再度点燃了精彩的较量。简单来说,DeepSeek-R1在推理能力方面的表现,已经达到了与OpenAI的o1版不相上下的境地。
自去年的DeepSeek-V3发布以来,这家公司不断打破传统,频频引发讨论。而最新推出的R1无疑是再次震撼了AI界的神经。著名AI研究者Casper Hansen表示,R1采用了一种独特的多阶段循环训练法,令其在样本输入不足的情况下,依然能够大幅提升推理性能。UCBerkeley的教授Alex Dimakis也认为,DeepSeek可能已经在技术上占据了领先地位,值得美国公司警惕。
DeepSeek的R1模型分为660B的两个版本,各个参数小模型也相继登场,全都开源,鼓励更多开发者参与其中。R1開發团队在强化学习阶段的创新应用,吸引了业内众多目光。他们巧妙地采用了群组相对策略优化(GRPO),大幅降低了模型训练的开销,与以往依赖监督数据提升性能的方式,形成鲜明对比。
在具体设计上,DeepSeek-R1-Zero在强化学习的道上更是展现出自我进化的能力,从最初的15.6%提升到71%,与OpenAI的o1-0912模型不相上下。
不过,虽然DeepSeek的技术引发了广泛的关注和赞誉,但它依然面临诸多挑战,比如输出的可读性和语言混杂问题。在行业竞争日益激烈的当前,这对DeepSeek-R1来说,既是机遇也是挑战。
综上,DeepSeek-R1的强势推出不仅给AI圈带来了惊喜,更是对行业各大竞争者的强力冲击。随着技术的不断进步和创新应用的持续深入,谁将主导未来AI大模型的发展,令我们拭目以待。返回搜狐,查看更多