OpenAI推出智能体Operator,2025年将是AI智能体的时代

当地时间周四,OpenAI正式发布了其自主智能体——Operator,这标志着AI智能体在实际应用中的一个重要进展。Operator的推出不仅是OpenAI本月初推出新功能Tasks的延伸,也是其在智能体领域深化探索的重要一步。

Operator的核心功能在于能够代理用户执行基于网页的各种操作,包括但不限于查看、输入、点击以及滚动网页等。作为OpenAI最早的智能体之一,Operator目前仍处于研究预览阶段,其功能尚有局限,只有美国的ChatGPT Pro会员能够使用这一功能。在一段20分钟的介绍视频中,OpenAI详细演示了Operator如何完成各种复杂的网页任务,例如自动预定餐厅座位和处理购物清单。

在演示中,当用户要求Operator为傍晚7点的某家餐厅预定座位时,Operator能够自动打开相关网页,搜索餐厅并完成预定。如果发现该时间已满,Operator会主动建议改订7点45分。与此同时,用户还可以通过上传购物清单的图片,Operator会自动识别所需物品并添加到购物车中,甚至帮用户订购外卖。

值得注意的是,Operator的用户界面与ChatGPT非常相似,用户只需在对话框中提出请求即可。支撑Operator运行的模型是CUA(计算机代理使用)模型,它结合了GPT-4o的视觉能力与高级推理能力,能够识别屏幕上的按钮、菜单和文本,并模拟鼠标和键盘的操作。

在使用过程中,若遇到困难,Operator会利用其推理能力进行自我纠正,或将控制权交还给用户。此外,出于安全和隐私考虑,Operator在处理敏感信息时会请求用户接管输入过程,保证用户数据的安全。OpenAI还表示,Operator将会拒绝一些有害请求,确保使用环境的安全性。

OpenAI的总裁Greg Brockman在发布会上强调,2025年将是智能体的年度,这一预言引发了业界的广泛关注。山姆·奥尔特曼也曾表示,在不久的未来,我们将会看到第一批AI智能体“加入劳动力大军”,这将从根本上改变企业的运作模式。

在国内,智能体的概念也逐渐兴起。智谱AI等公司已开始布局这一区域。例如,智谱AI在去年11月发布的PC端智能体GLM-PC,已经具备类似的功能,包括点外卖和发送微信。最近,智谱AI还对该智能体进行了更新,推出了“深度思考”模式,增强了逻辑推理和代码生成能力。

随着AI智能体技术的不断成熟,行业间的竞争也愈发激烈。这些智能体通过更高的主动性,可以大幅提升日常任务的效率和便捷性,改变人们的生活和工作方式。尽管如此,智能体在应用中的安全性、隐私保护以及用户信任等问题依然值得关注。未来,如何合理利用智能体技术,并最大限度降低潜在风险,将是各方必须面对的挑战。总的来说,OpenAI的Operator代表了智能体技术的一个重要里程碑,也预示着未来人机交互的广阔前景。

解放周末!用AI写周报又被老板夸了!点击这里,一键生成周报总结,无脑直接抄 → → https://ai.sohu.com/pc/textHome?trans=030001_jdaidzkj

返回搜狐,查看更多

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
作者声明:本文包含人工智能生成内容
阅读 ()
大家都在看
我来说两句
0人参与, 0条评论
登录并发表