谷歌正加大对世界模型的投入,推出了一支新团队,目标是开发出可以精确模拟物理世界的人工智能系统。这个新团队的领导者,蒂姆·布鲁克斯(Tim Brooks),是前OpenAI视频生成器Sora的联合创始人,在2024年10月跳槽至谷歌的DeepMind。Brooks在社交媒体X上分享了他的新使命,表示DeepMind有着雄心勃勃的计划,旨在制造大规模的生成模型来模拟现实世界,以推动AI技术的新变革。
Brooks的新团队将专注于开发“实时交互生成”工具,力求将其与已有的多模态模型(如Gemini系列)进行整合。Gemini作为谷歌的旗舰AI模型,支持图像分析与文本生成,可以说是当前趋势的先锋。Veo则是专注于视频生成,而Genie正是为用户打开了虚拟世界大门的基础模型。今年12月,谷歌还推出了更为先进的Genie2,进一步提升了3D虚拟世界的交互体验。
所谓“世界模型”,是当今技术界面对的最复杂挑战之一,其门槛在于赋予机器如人类般的全面认知能力。包括WellLabs、Decart和Odyssey等众多初创企业,都在为实现这一目标而不懈努力,预计其成果将应用于创造互动媒体(如视频游戏和动画),甚至在机器人学习等领域中发挥重要作用。然而,这一进步也并非没有代价,近期调查显示,传统创意行业在面对AI浪潮时出现了大量裁员现象,例如动视暴雪(Activision Blizzard)便受到了显著影响。
数据显示,到2026年,约有超过10万个与电影和动画相关的工作岗位可能因为AI技术而逐渐消失。相比较被置换,越来越多像Odyssey这样的初创公司选择了与创意人才合作,共同探索AI与艺术的未来。但是,版权问题也成为了一道难题。部分世界模型在训练过程中使用了未经许可的游戏视频片段,可能引发法律诉讼。而谷歌凭借其旗下YouTube平台,声称拥有基于其视频内容训练模型的权利,然而具体实施细则尚不明确。
在这个快速变化的AI领域,谷歌的这番举动无疑引发了广泛关注。未来,Brooks及其团队的努力是否能够推动世界模型的进一步发展?这一全新的人工智能时代又将如何塑造各行各业,令人拭目以待。返回搜狐,查看更多