当地时间1月23日一场在线直播中,OpenAI团队揭开了首个AI智能体Operator的神秘面纱。这一创新成果打破了传统应用程序编程接口的限制,赋予了AI直接与图形用户界面交互的能力,就仿佛能像人类那样使用电脑,从而向实现通用人工智能迈进了一步。
演示中,Operator展现了其强大的能力。它不仅能够精确理解指令,还能自主完成复杂任务,如自动填写在线表单、进行网购、创建表情包以及处理重复性浏览器任务等。这一切都是通过一个被称为CUA的新模型实现的。该模型结合了GPT-4o的视觉功能和高级推理技术,并通过强化学习不断优化自己的性能。
值得注意的是,在多个测试环境中,CUA模型的表现令人印象深刻。例如,在OSWORLD上执行计算机使用任务的成功率达到了38.1%,比之前最佳结果提高了近16%;而在WebArena上的成功率更是高达58.1%,提升了22%。尽管这些成绩与人类相比还有一定差距(人类分别为72.4%和78.2%),但CUA在某些特定场景下展示了惊人的效率,比如在网页代理WebVoyager平台上,达到了87%的成功率。
为确保安全性和用户体验,当Operator执行任务时,会采取行动、抓取屏幕截图并创建子计划,形成一个“观察—计划—执行”的闭环。此外,用户可以随时接管控制权,并且在接管期间的所有操作都不会被记录下来,以此保护隐私。即使遇到买错东西或订错酒店的情况,Operator也会在继续行动之前请求人类确认。
面对可能存在的风险,如诈骗网站,OpenAI引入了一个提示注入监视器,类似于防病毒软件的功能,可以在发现可疑行为时立即停止操作。这标志着L3级别的智能体时代正式到来,而OpenAI也重申了其对2025年的展望——这一年将是智能体之年。
随着Operator的发布,未来几个月内,人们或有望见证更多智能体的出现。它们将进一步扩展动作空间,适应更加广泛的应用场景,开启下一轮人机交互革命。目前,Operator仅限于美国的ChatGPT Pro(付费服务)用户试用,不过未来很快会向更多用户提供服务。
当地时间1月23日一场在线直播中,OpenAI团队揭开了首个AI智能体Operator的神秘面纱。这一创新成果打破了传统应用程序编程接口的限制,赋予了AI直接与图形用户界面交互的能力,就仿佛能像人类那样使用电脑,从而向实现通用人工智能迈进了一步。
演示中,Operator展现了其强大的能力。它不仅能够精确理解指令,还能自主完成复杂任务,如自动填写在线表单、进行网购、创建表情包以及处理重复性浏览器任务等。这一切都是通过一个被称为CUA的新模型实现的。该模型结合了GPT-4o的视觉功能和高级推理技术,并通过强化学习不断优化自己的性能。
值得注意的是,在多个测试环境中,CUA模型的表现令人印象深刻。例如,在OSWORLD上执行计算机使用任务的成功率达到了38.1%,比之前最佳结果提高了近16%;而在WebArena上的成功率更是高达58.1%,提升了22%。尽管这些成绩与人类相比还有一定差距(人类分别为72.4%和78.2%),但CUA在某些特定场景下展示了惊人的效率,比如在网页代理WebVoyager平台上,达到了87%的成功率。
为确保安全性和用户体验,当Operator执行任务时,会采取行动、抓取屏幕截图并创建子计划,形成一个“观察—计划—执行”的闭环。此外,用户可以随时接管控制权,并且在接管期间的所有操作都不会被记录下来,以此保护隐私。即使遇到买错东西或订错酒店的情况,Operator也会在继续行动之前请求人类确认。
面对可能存在的风险,如诈骗网站,OpenAI引入了一个提示注入监视器,类似于防病毒软件的功能,可以在发现可疑行为时立即停止操作。这标志着L3级别的智能体时代正式到来,而OpenAI也重申了其对2025年的展望——这一年将是智能体之年。
随着Operator的发布,未来几个月内,人们或有望见证更多智能体的出现。它们将进一步扩展动作空间,适应更加广泛的应用场景,开启下一轮人机交互革命。目前,Operator仅限于美国的ChatGPT Pro(付费服务)用户试用,不过未来很快会向更多用户提供服务。
3月17日记者获悉,哈尔滨医科大学公共卫生学院副院长、教授田懋一与副研究员叶鹏鹏团队在一项研究中提出,应将预防老年人跌倒与国家基本公共卫生服务中各项服务流程融合起来。该研究全面梳理了 马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI 《科创板日报》3月18日讯(编辑 宋子乔) 似乎是为了表明自己始终坚持对AI模型开源,马斯克做出了与阿尔特曼全然不同的选择。3月17日,马斯克宣布开源Grok-1,这 美国《发现》杂志网站2月7日刊登题为《200万年前,我们的人类祖先开始从水里捞鱼》的文章,作者是科迪·科蒂尔,内容编译如下:捕鱼可能是一种占许多国家蛋白质消费极大比例的全球性行为,但捕 根据《天体物理学杂志》的最新报道,一个国际天文学家团队利用欧洲空间局的盖亚(Gaia)太空望远镜收集的数据,创建了迄今为止最庞大的三维宇宙地图。该地图涵盖了大约130万个活跃类星体的精确空间 2024年03月19日,以“初心如磐•向新出发”为主题的2024智能家居UP峰会CSHIA智能家居开年盛典在杭州成功举行。大会现场,由全国专业标准化技术委员会委员、CSHIA秘书长、中智盟投资创始人周 回望一加去年的整体节奏,如果要用一个词来总结其数字系列和Ace系列的概况,那就是“卷”!从外观质感、内存性能到整机体验,与友商的相互竞争中,一加表现的都比较强势,搭配清晰的产品定位策略和稳扎稳打 。本文链接:OpenAI智能体能像人那样使用电脑,向实现通用人工智能迈进一步http://www.sushuapos.com/show-2-10363-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。