中国AI新星DeepSeek的崛起:如何颠覆硅谷与英伟达?

在全球人工智能领域,中国初创企业DeepSeek正以惊人的速度引发广泛关注。其新发布的模型DeepSeek-R1于1月20日开源后,迅速在各大国际媒体上引发热烈讨论,震撼了包括《纽约时报》、《经济学人》与《华尔街日报》在内的众多英美主流媒体。CNBC更是直言DeepSeek-R1的性能超越美国同类产品,并在成本与算力消耗上均具优势,令硅谷紧张不已。

值得一提的是,知名半导体公司AMD近日宣布将DeepSeek-V3模型集成入其Instinct MI300X GPU芯片,二者协作期望在AI推理领域实现最佳表现。这被业内人士解读为,有可能动摇由英伟达和OpenAI组成的行业主导格局,改变现有的竞争规则。

自去年DeepSeek-V3发布后,该公司便被视为打破算力需求瓶颈的重要变革者。随之而来,DeepSeek-R1的问世,使得对其的海外讨论再度升温,甚至导致英伟达的股价在1月24日暴跌3.12%。一时间,DeepSeek的一次小波动竟被描绘成硅谷巨头们的焦虑象征。

1月26日,有网友反映DeepSeek的服务器出现崩溃,提示繁忙,但此问题在短短几分钟内便得到解决。对此,DeepSeek官方表示,流量激增是造成这一现象的主要原因。

根据DeepSeek介绍,DeepSeek-R1在后训练阶段利用强化学习技术,极大增强了模型的推理能力。其表现不亚于OpenAI的o1版本,针对数学、编程与自然语言推理等复杂任务中展现出优越的性能。此外,AI行业多位重量级人士纷纷对此发表看法,英伟达研究科学家Jim Fan甚至在社交平台上感慨:“一家非美企业正在继承OpenAI的使命,赋能全球。”

在近期举行的达沃斯论坛上,ScaleAI创始人Alexandr Wang也称DeepSeek的新模型表现卓越,强调这种来自中国的进展不可小觑。甚至被誉为“谷歌杀手”的Perplexity CEO Aravind Srinivas直言DeepSeek才真正配得上“OpenAI”的称号。

DeepSeek的崛起令硅谷巨头们惊慌失措,Meta的生成式人工智能团队似乎正处于焦虑之中,工程师们疯狂拆解DeepSeek,企图复制其模型的成功。侧耳倾听,Meta的高管们正为DeepSeek用不到600万美元便能训练出高性能模型而感到如坐针毡。

而媒体的聚焦也并非偶然,经济学人指出,训练美国大语言模型的费用往往高达数千万美元,而DeepSeek的开支却仅为550万美元,正在重新定义整个行业的游戏规则。金融时报的报道同样强调,DeepSeek的运作方式如同早期的DeepMind,专注于研究而非融资。

不仅如此,DeepSeek的开源政策和低成本模式可能将减少英伟达芯片的需求,给全球AI算力市场投下不小的阴影。尽管有观点认为DeepSeek的训练成本低并不代表算力需求的真正下降,但毫无疑问,DeepSeek正在以令人瞩目的效率撼动这一行业的明天。返回搜狐,查看更多

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
作者声明:本文包含人工智能生成内容
阅读 ()
大家都在看
我来说两句
0人参与, 0条评论
登录并发表