OpenAI推出智能体Operator,AGI之路上的一大步!

在科技界的瞩目关注下,OpenAI终于揭开了其首个智能体——Operator的神秘面纱。这一崭新产品的问世,不仅代表了OpenAI正式进入智能体时代,更意味着人工智能正在从简单的信息处理转向主动任务的执行,这是一次变革性的飞跃。Operator如同一个数字化的“超级助理”,能够模拟人类的电脑操作,包括点击、滚动和输入指令,轻松与网页交互,承担各种复杂任务,把繁琐的日常活动交给它。

在Operator前的实验中,OpenAI曾通过“Tasks”功能初步探索了如何将ChatGPT转变为能够主动派发任务的AI,但Operator的正式投入使用,则标志着这项技术向前迈进了一大步,朝着通用人工智能(AGI)目标更近了一步。

在一次引人注目的现场演示中,Operator被要求在Beretta餐厅为今晚7点的两人预定座位。它迅速开启内置云端浏览器,智能分析网页结构,找到搜索框及筛选选项,成功完成了预订。若指定的时间已满,Operator甚至能主动寻找并推荐其他合适的时间段,让用户有更多选择。在完成购物任务时,表现同样出众,持续搜索商品、添加到购物车,在结算程序中询问用户是否满意,确保用户拥有控制权。

如此强大的操作能力,得益于OpenAI特别研发的“计算机使用智能体(CUA)”。这一技术基于GPT-4o的视觉识别能力与高级推理,允许AI“看懂”和“操控”电脑界面。将浏览器运行在云端的设计,避免了智能体直接干预用户电脑的潜在问题,如占用系统资源及隐私风险,同时维护了操作过程的有效性和隐私安全。

尽管Operator依然处于研究预览阶段,现仅向美国的ChatGPT Pro用户开放,但其展现出的潜力和实际价值已获得广泛关注。它不仅帮助用户摆脱繁琐且重复的操作,提高生活和工作的效率,亦大幅降低了人机交互的门槛,将人工智能的应用推向了一个全新的高度。然而,智能体的发展依然面临不少挑战,保持在各种网站及交互设计下的适应性,是需要进一步解决的重点。

尽管挑战重重,Operator的诞生无疑为人工智能领域注入了新的活力与希望,让我们期待未来更多惊喜的降临!返回搜狐,查看更多

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
作者声明:本文包含人工智能生成内容
阅读 ()
大家都在看
我来说两句
0人参与, 0条评论
登录并发表