最近,关于中国人工智能公司深度求索(DeepSeek)在大模型领域的成功震动了硅谷,甚至引发了Meta生成式人工智能部门的内部恐慌。1月23日,一名Meta员工在匿名职场论坛TeamBlind发布了一则引人注目的帖子,称从DeepSeek发布的DeepSeek-V3模型开始,Meta的Llama4在各项性能测试中均落后于竞争对手。更令人震惊的是,该模型的开发成本仅为550万美元,正好不到Meta AI部门某些领导薪资的一半!
这个巨大的成本差异让Meta团队倍感压力,甚至该员工还透露,Meta的工程师们每天都在拼命研究DeepSeek的成功经验,试图找到能够复制的技术。
不过,情况在DeepSeek-R1发布后变得更为复杂。虽然具体细节尚未公开,但Meta员工们对于即将出现的新挑战充满了不安。DeepSeek-R1,作为开源大模型的又一力作,正式对标OpenAI的闭源模型OpenAIo1,并且其训练成本与时间的节约更是让业内人士刮目相看。
DeepSeek-V3于去年12月发布后迅速攀升至开源模型之首,Meta的Llama3.1-405B在多项测试中表现不及DeepSeek-V3,尤其是在算法和工程类代码场景下,更是处于只及其一半的水平。
与此同时,DeepSeek-R1以277.8万GPU小时的训练时间,创造了在没有人类数据标记的情况下,自我成长的奇迹。这就像是让谷歌的围棋程序AlphaGo从零开始自我博弈,而无需任何人类大师的指导。
此外,其他科技公司也在热议DeepSeek的成就。三星的一名员工评论称,特朗普宣布的“星球之门计划”若无法与DeepSeek的低成本相媲美,投资者的耐心将会消失,而谷歌的员工则表示,面对如此成功的中国公司,OpenAI和Meta都感到了压力,但同时也认为,这样的竞争对行业创新是有益的。
从目前的形势来看,深度求索的成功不仅是其技术上的突破,也在于其低成本的运营模式正不断撼动着硅谷的信心。而Meta AI部门则需要认真反思组织规模与成本的问题,以应对这场行业变革。返回搜狐,查看更多