马斯克版ChatGPT引发热议!Grok应用初体验与DeepSeek新进展解析

在生成式人工智能领域,最新动态让人目不暇接。马斯克推出的Grok应用上线,引发了极大的关注,同时DeepSeek也发布了其手机APP。以下是本周的关键亮点:

一、Grok应用初体验:一言不合就上手

Grok,马斯克版的ChatGPT应用,已经在iOS平台上独立推出,用户注册变得多余,操作简便。这款应用不仅支持文本、图片和文件输入,还能访问X平台的内容,虽然是回放的形式。值得注意的是,它在图像生成方面的表现相对自由,竟然能够生成著名公众人物的图像。不过,当涉及到实用的餐厅推荐时,它的表现确实有些粗糙。

二、DeepSeek重磅上线:手机搜索新选择

尽管它的推出稍晚,但DeepSeek的iOS和安卓版本终于问世。新的APP支持联网搜索、文件上传和图片解析功能,虽然在官网上并没有详细宣传。这款应用背后的底层模型是DeepSeekV3,开启深度搜索时还调用了DeepSeek-R1-Lite推理模型,而图像和文件解析的能力则依赖于OCR等外部工具,未利用自身的多模态能力。

三、UC伯克利开源32B推理模型Sky-T1

UC伯克利的科研团队令人瞩目,他们宣布开发出名为Sky-T1的推理模型,训练成本仅需450美元。它的性能与早期的o1-preview相当,并且首次完整开放了训练数据和代码。这款模型基于Qwen2.5-32B-Instruct进行微调,兼顾数学和编码数据,在多个测试基准中表现极为优异。

四、海螺AI引入「主体参考」功能

海螺AI最近推出了“主体参考”功能,基于S2V-01模型,用户只需一张图片,就可以生成一个保持角色特征的视频。这一技术路线与LoRA方案不同,它不需要大量素材,依靠图片参考快速生成高质量的内容,目前功能仍仅限于单个人物,未来则有望扩展到多人、物体和场景。

五、GAN模型重回舞台:新方法R3GAN

布朗大学的研究者通过新的损失函数有效解决了GAN的崩溃与不稳定性,使其性能超过当前流行的扩散模型。新方法R3GAN对StyleGAN2进行了改造,更加简化了模型架构,采用现代ConvNets和transformer的设计,展现出更加优越的表现。

六、Meta-CoT:推理的下一个阶段

Meta-CoT框架是应对复杂问题的一次创新,通过显式建模推理过程,扩展了思维链的传统方法。与以往仅提供最终结果的数据显示方式不同,Meta-CoT通过结合标准搜索算法生成过程数据,这为模型的推理能力提供了强大的支持,能够在上下文中探索和回溯。

七、OpenAI进军机器人领域

开放人工智能(OpenAI)正式宣布将进入机器人行业,并开启硬件人才招聘,目标是开发具备AGI级智能的通用机器人。团队目前招聘三类核心人才,旨在将AI与物理世界的机器人相结合,以实现更高的智能水平。

八、ScaleAI创始人的深刻见解

ScaleAI创始人认为,AIAgent的突破在于产品设计而非技术本身。面对日益增加的AI数据瓶颈,他强调需要变革思维,从传统方式转向新的、「人类生成的数据」形式,以加强模型发展。

九、AI对职业未来的影响:一场深刻的研究

清华的校友们发文探讨AI时代职场的未来,指出AI的兴起可能会对就业市场产生深远影响。尤其在自由职业领域,写作、编程等岗位将面对更多替代风险。建议当前职场从业者需重新考虑职业发展方向,适应与AI的共生关系。

这样的动态,简直让人跟不上时代的步伐,但我们又不能忽视其中的重要性。未来的职场将被AI重塑,我们都需要关注这些变化,提前做好准备。敬请关注未来的进一步发展!返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
作者声明:本文包含人工智能生成内容
阅读 ()