中国AI新星DeepSeek的崛起：如何颠覆硅谷与英伟达？_模型_OpenAI

在全球人工智能领域，中国初创企业DeepSeek正以惊人的速度引发广泛关注。其新发布的模型DeepSeek-R1于1月20日开源后，迅速在各大国际媒体上引发热烈讨论，震撼了包括《纽约时报》、《经济学人》与《华尔街日报》在内的众多英美主流媒体。CNBC更是直言DeepSeek-R1的性能超越美国同类产品，并在成本与算力消耗上均具优势，令硅谷紧张不已。

值得一提的是，知名半导体公司AMD近日宣布将DeepSeek-V3模型集成入其Instinct MI300X GPU芯片，二者协作期望在AI推理领域实现最佳表现。这被业内人士解读为，有可能动摇由英伟达和OpenAI组成的行业主导格局，改变现有的竞争规则。

自去年DeepSeek-V3发布后，该公司便被视为打破算力需求瓶颈的重要变革者。随之而来，DeepSeek-R1的问世，使得对其的海外讨论再度升温，甚至导致英伟达的股价在1月24日暴跌3.12%。一时间，DeepSeek的一次小波动竟被描绘成硅谷巨头们的焦虑象征。

1月26日，有网友反映DeepSeek的服务器出现崩溃，提示繁忙，但此问题在短短几分钟内便得到解决。对此，DeepSeek官方表示，流量激增是造成这一现象的主要原因。

根据DeepSeek介绍，DeepSeek-R1在后训练阶段利用强化学习技术，极大增强了模型的推理能力。其表现不亚于OpenAI的o1版本，针对数学、编程与自然语言推理等复杂任务中展现出优越的性能。此外，AI行业多位重量级人士纷纷对此发表看法，英伟达研究科学家Jim Fan甚至在社交平台上感慨：“一家非美企业正在继承OpenAI的使命，赋能全球。”

在近期举行的达沃斯论坛上，ScaleAI创始人Alexandr Wang也称DeepSeek的新模型表现卓越，强调这种来自中国的进展不可小觑。甚至被誉为“谷歌杀手”的Perplexity CEO Aravind Srinivas直言DeepSeek才真正配得上“OpenAI”的称号。

DeepSeek的崛起令硅谷巨头们惊慌失措，Meta的生成式人工智能团队似乎正处于焦虑之中，工程师们疯狂拆解DeepSeek，企图复制其模型的成功。侧耳倾听，Meta的高管们正为DeepSeek用不到600万美元便能训练出高性能模型而感到如坐针毡。

而媒体的聚焦也并非偶然，经济学人指出，训练美国大语言模型的费用往往高达数千万美元，而DeepSeek的开支却仅为550万美元，正在重新定义整个行业的游戏规则。金融时报的报道同样强调，DeepSeek的运作方式如同早期的DeepMind，专注于研究而非融资。

不仅如此，DeepSeek的开源政策和低成本模式可能将减少英伟达芯片的需求，给全球AI算力市场投下不小的阴影。尽管有观点认为DeepSeek的训练成本低并不代表算力需求的真正下降，但毫无疑问，DeepSeek正在以令人瞩目的效率撼动这一行业的明天。返回搜狐，查看更多