在科技发展的快车道上,12月16日迎来了一个激动人心的时刻——月之暗面正式发布了其备受瞩目的Kimi视觉思考模型K1。这个新模型在强化学习的基础上,毫不客气地宣称其在数学、物理和化学等基础科学领域的能力已超越了全球前沿的OpenAI O1和GPT-4o。
K1模型的跨越式创新在于它实现了原生端到端的图像理解与思维链技术,用户只需上传一张图片,K1就能瞬间洞察并作出反应,彻底摆脱了依赖额外OCR和视觉模型的限制。再也不需要繁琐的步骤,直接用图像进行互动,充分展现了K1在图像信息处理方面的强大手腕!
据内部信息披露,K1的训练分为两个关键阶段:首轮为预训练,生成基础模型;随后,进行强化学习,进一步优化模型性能。值得一提的是,K1在OCRBench测试中荣获903分,成为现阶段的行家里手!在数学、物理等基础科学的基准测试中,K1在MathVista-testmini、MMMU-val和DocVQA上分别取得了69.1、66.7和96.9的令人瞩目成绩,充分显示了其出色的能力。
然而,月之暗面也意识到K1并不是完美无瑕的。在内部测试中发现,K1在复杂问题的成功率、分布外泛化能力以及多轮问答的效果上仍有进步空间。与OpenAI O1系列模型相比,K1的表现也显示出差距。
不可否认的是,Kimi视觉思考模型K1的发布为科技界带来了新的竞争激励,它的新技术和应用场景都将引领更广泛的科学探索与研究。随着科技的不断进步,K1能否在未来成为更多领域的佼佼者,值得我们拭目以待!返回搜狐,查看更多
责任编辑: