DeepSeek-R1正式发布,挑战OpenAI O1!

今天,DeepSeek团队自豪地宣布DeepSeek-R1的正式发布,同时将模型权重开源。DeepSeek-R1遵循MIT许可证,为用户提供了蒸馏技术的便利,帮助他们利用R1进行其他模型的训练。全新上线的API,用户只需设置model='deepseek-reasoner',即可体验思维链输出的强大功能。

在性能方面,DeepSeek-R1与OpenAI的O1正式版竞争力十足。通过在后训练阶段的大规模强化学习应用,DeepSeek-R1在标注数据极少的环境下,显著提升了模型的推理能力。在数学、代码和自然语言推理等多项任务中,DeepSeek-R1的表现已堪比OpenAI的O1正式版。我们决定将DeepSeek-R1的所有训练技术向社区开放,以激励技术交流与创新合作。相关论文链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

在开源的同时,我们还推出了DeepSeek-R1-Zero和DeepSeek-R1两个660B模型,通过DeepSeek-R1的输出,我们成功蒸馏出了六个小型模型,其中32B和70B模型在多项能力上凭实力对标OpenAI O1-mini。想要探索相关模型的小伙伴们,可以通过这一链接访问HuggingFace:https://huggingface.co/deepseek-ai。

针对开源许可和用户协议,我们特别选择采用MIT许可证,以简化开发者的使用和理解成本。为了进一步推动开源的发展,我们允许用户进行“模型蒸馏”,并已更新线上产品的用户协议。只需登录DeepSeek官网或官方App,进入“深度思考”模式,即可使用最新版的DeepSeek-R1进行各类推理任务。

最后,关于API及其定价,DeepSeek-R1的API服务费用非常透明——每百万输入tokens为1元(缓存命中)/4元(缓存未命中),每百万输出tokens为16元。想了解详细的API调用指南,请参考我们的官方文档:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model。返回搜狐,查看更多

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
作者声明:本文包含人工智能生成内容
阅读 ()
大家都在看
我来说两句
0人参与, 0条评论
登录并发表