马斯克版ChatGPT引发热议！Grok应用初体验与DeepSeek新进展解析_模型_Meta-CoT

在生成式人工智能领域，最新动态让人目不暇接。马斯克推出的Grok应用上线，引发了极大的关注，同时DeepSeek也发布了其手机APP。以下是本周的关键亮点：

一、Grok应用初体验：一言不合就上手

Grok，马斯克版的ChatGPT应用，已经在iOS平台上独立推出，用户注册变得多余，操作简便。这款应用不仅支持文本、图片和文件输入，还能访问X平台的内容，虽然是回放的形式。值得注意的是，它在图像生成方面的表现相对自由，竟然能够生成著名公众人物的图像。不过，当涉及到实用的餐厅推荐时，它的表现确实有些粗糙。

二、DeepSeek重磅上线：手机搜索新选择

尽管它的推出稍晚，但DeepSeek的iOS和安卓版本终于问世。新的APP支持联网搜索、文件上传和图片解析功能，虽然在官网上并没有详细宣传。这款应用背后的底层模型是DeepSeekV3，开启深度搜索时还调用了DeepSeek-R1-Lite推理模型，而图像和文件解析的能力则依赖于OCR等外部工具，未利用自身的多模态能力。

三、UC伯克利开源32B推理模型Sky-T1

UC伯克利的科研团队令人瞩目，他们宣布开发出名为Sky-T1的推理模型，训练成本仅需450美元。它的性能与早期的o1-preview相当，并且首次完整开放了训练数据和代码。这款模型基于Qwen2.5-32B-Instruct进行微调，兼顾数学和编码数据，在多个测试基准中表现极为优异。

四、海螺AI引入「主体参考」功能

海螺AI最近推出了“主体参考”功能，基于S2V-01模型，用户只需一张图片，就可以生成一个保持角色特征的视频。这一技术路线与LoRA方案不同，它不需要大量素材，依靠图片参考快速生成高质量的内容，目前功能仍仅限于单个人物，未来则有望扩展到多人、物体和场景。

五、GAN模型重回舞台：新方法R3GAN

布朗大学的研究者通过新的损失函数有效解决了GAN的崩溃与不稳定性，使其性能超过当前流行的扩散模型。新方法R3GAN对StyleGAN2进行了改造，更加简化了模型架构，采用现代ConvNets和transformer的设计，展现出更加优越的表现。

六、Meta-CoT：推理的下一个阶段

Meta-CoT框架是应对复杂问题的一次创新，通过显式建模推理过程，扩展了思维链的传统方法。与以往仅提供最终结果的数据显示方式不同，Meta-CoT通过结合标准搜索算法生成过程数据，这为模型的推理能力提供了强大的支持，能够在上下文中探索和回溯。

七、OpenAI进军机器人领域

开放人工智能（OpenAI）正式宣布将进入机器人行业，并开启硬件人才招聘，目标是开发具备AGI级智能的通用机器人。团队目前招聘三类核心人才，旨在将AI与物理世界的机器人相结合，以实现更高的智能水平。

八、ScaleAI创始人的深刻见解

ScaleAI创始人认为，AIAgent的突破在于产品设计而非技术本身。面对日益增加的AI数据瓶颈，他强调需要变革思维，从传统方式转向新的、「人类生成的数据」形式，以加强模型发展。

九、AI对职业未来的影响：一场深刻的研究

清华的校友们发文探讨AI时代职场的未来，指出AI的兴起可能会对就业市场产生深远影响。尤其在自由职业领域，写作、编程等岗位将面对更多替代风险。建议当前职场从业者需重新考虑职业发展方向，适应与AI的共生关系。

这样的动态，简直让人跟不上时代的步伐，但我们又不能忽视其中的重要性。未来的职场将被AI重塑，我们都需要关注这些变化，提前做好准备。敬请关注未来的进一步发展！返回搜狐，查看更多

责任编辑：