OpenAI推出智能体Operator，AGI之路上的一大步！_用户_任务

在科技界的瞩目关注下，OpenAI终于揭开了其首个智能体——Operator的神秘面纱。这一崭新产品的问世，不仅代表了OpenAI正式进入智能体时代，更意味着人工智能正在从简单的信息处理转向主动任务的执行，这是一次变革性的飞跃。Operator如同一个数字化的“超级助理”，能够模拟人类的电脑操作，包括点击、滚动和输入指令，轻松与网页交互，承担各种复杂任务，把繁琐的日常活动交给它。

在Operator前的实验中，OpenAI曾通过“Tasks”功能初步探索了如何将ChatGPT转变为能够主动派发任务的AI，但Operator的正式投入使用，则标志着这项技术向前迈进了一大步，朝着通用人工智能（AGI）目标更近了一步。

在一次引人注目的现场演示中，Operator被要求在Beretta餐厅为今晚7点的两人预定座位。它迅速开启内置云端浏览器，智能分析网页结构，找到搜索框及筛选选项，成功完成了预订。若指定的时间已满，Operator甚至能主动寻找并推荐其他合适的时间段，让用户有更多选择。在完成购物任务时，表现同样出众，持续搜索商品、添加到购物车，在结算程序中询问用户是否满意，确保用户拥有控制权。

如此强大的操作能力，得益于OpenAI特别研发的“计算机使用智能体（CUA）”。这一技术基于GPT-4o的视觉识别能力与高级推理，允许AI“看懂”和“操控”电脑界面。将浏览器运行在云端的设计，避免了智能体直接干预用户电脑的潜在问题，如占用系统资源及隐私风险，同时维护了操作过程的有效性和隐私安全。

尽管Operator依然处于研究预览阶段，现仅向美国的ChatGPT Pro用户开放，但其展现出的潜力和实际价值已获得广泛关注。它不仅帮助用户摆脱繁琐且重复的操作，提高生活和工作的效率，亦大幅降低了人机交互的门槛，将人工智能的应用推向了一个全新的高度。然而，智能体的发展依然面临不少挑战，保持在各种网站及交互设计下的适应性，是需要进一步解决的重点。

尽管挑战重重，Operator的诞生无疑为人工智能领域注入了新的活力与希望，让我们期待未来更多惊喜的降临！返回搜狐，查看更多