孙悟空拔一把毫毛吹口气,就能拥有一群“小悟空”分身。日前,西湖大学孵化的西湖机器人公司发布了搭载全球机器人领域首个动作泛化大模型的人形机器人“泰坦O1”(TITAN O1),将这一神话场景带入现实——名为“GAE身外化身系统”的通用动作预训练大模型,相当于给来自不同厂家的机器人装上了可通用的强大“小脑”,让机器人可突破时空限制,实时模仿人类动作,只需一个人就能操控成百上千个身处天南地北不同地点的机器人“赛博分身”,实时进行同样的操作。
理论控制规模无上限,也几乎不设使用门槛
“泰坦O1”外观呈橙、黑、银三色拼接,风格颇具未来感。在演示现场,当身着动作捕捉服的工作人员摆手、转身、踢球时,“泰坦O1”会“如影随形”地在毫秒间复刻所有动作:无论手臂摆动角度、转身幅度,还是踢球时的步距与抬脚高度,甚至动作节奏,都与工作人员高度一致。
“这些动作并非预先编排,而是对人类随机行为的实时响应。”西湖机器人创始人、西湖大学机器智能实验室研究组长王东林教授介绍,无论操作者是谁、动作如何变化,“泰坦O1”都能快速跟上。
此外,“泰坦O1”还有不错的“动作记忆”能力,可通过后台指令复现已示范过的动作。在今年安徽卫视春节联欢晚会上,西湖机器人曾凭借这一能力完成了10台机器人的五禽戏群控表演——仅用数天调试,即可实现自定义动作生成与部署,大幅降低应用门槛。
“只要具备网络环境,穿上动捕设备,就可以远程操控机器人执行任务。”王东林表示,单人可同时控制多台机器人完成一致动作,理论上控制规模不设上限。
最令人惊喜的是,这一系统几乎不设使用门槛。无需编程经验,也不用依赖专业人员指导,用户仅通过动捕设备或电脑端操作,即可让机器人完成对应动作,实现“所想即所动”。
算法完全自研,技术领先国际同行6个月以上
在人体中,小脑负责协调运动、维持平衡,让动作精准流畅。而GAE则为人形机器人带来了强大的“通用小脑”——它能让机器人在收到信号后瞬间做出最合适的动作。王东林介绍,这套由西湖团队完全自研的算法,比国际上其他团队的同类技术领先至少6个月。
“目前市面上看到的机器人已经能跑能跳能比武,但其实基本靠提前编程。”王东林说,那就好像“背课文”,需要反复训练才能做到一字不差,而这正是传统机器人的最大技术瓶颈——由于缺乏通用的动作模型,一套程序只能对应一套动作,机器人无法“举一反三”。
而GAE这个“通用小脑”则能让机器人即使遇到没做过的动作,也能轻松应对。而且,它还具备“跨本体”能力,很多不同结构、不同尺寸的机器人都能搭载这套大模型。
“ChatGPT让AI能理解并生成各种语言,拥有语言的泛化能力;Sora能生成各种视频画面,拥有视觉的泛化能力。”王东林说,GAE则让机器人能模仿和执行各种人类动作,是机器人领域第一个实现动作泛化的大模型。
GAE的问世离不开长期的技术积累与数据支撑。此前,王东林团队已在四足机器人(机器狗)、人形机器人领域深耕多年,积累了丰富的机器人运动控制技术。同时,他们还拥有全球领先、国内最大的高质量全身运动数据集,包含了人类各种日常动作、复杂动作的详细数据,为这颗“通用小脑”提供了充足的“学习素材”。
“分身体验”只是一个开始。王东林表示,“泰坦O1”更重要的意义在于可替代人类进入高风险场景,如消防救援、矿区作业、高空维护等。
孙悟空拔一把毫毛吹口气,就能拥有一群“小悟空”分身。日前,西湖大学孵化的西湖机器人公司发布了搭载全球机器人领域首个动作泛化大模型的人形机器人“泰坦O1”(TITAN O1),将这一神话场景带入现实——名为“GAE身外化身系统”的通用动作预训练大模型,相当于给来自不同厂家的机器人装上了可通用的强大“小脑”,让机器人可突破时空限制,实时模仿人类动作,只需一个人就能操控成百上千个身处天南地北不同地点的机器人“赛博分身”,实时进行同样的操作。
理论控制规模无上限,也几乎不设使用门槛
“泰坦O1”外观呈橙、黑、银三色拼接,风格颇具未来感。在演示现场,当身着动作捕捉服的工作人员摆手、转身、踢球时,“泰坦O1”会“如影随形”地在毫秒间复刻所有动作:无论手臂摆动角度、转身幅度,还是踢球时的步距与抬脚高度,甚至动作节奏,都与工作人员高度一致。
“这些动作并非预先编排,而是对人类随机行为的实时响应。”西湖机器人创始人、西湖大学机器智能实验室研究组长王东林教授介绍,无论操作者是谁、动作如何变化,“泰坦O1”都能快速跟上。
此外,“泰坦O1”还有不错的“动作记忆”能力,可通过后台指令复现已示范过的动作。在今年安徽卫视春节联欢晚会上,西湖机器人曾凭借这一能力完成了10台机器人的五禽戏群控表演——仅用数天调试,即可实现自定义动作生成与部署,大幅降低应用门槛。
“只要具备网络环境,穿上动捕设备,就可以远程操控机器人执行任务。”王东林表示,单人可同时控制多台机器人完成一致动作,理论上控制规模不设上限。
最令人惊喜的是,这一系统几乎不设使用门槛。无需编程经验,也不用依赖专业人员指导,用户仅通过动捕设备或电脑端操作,即可让机器人完成对应动作,实现“所想即所动”。
算法完全自研,技术领先国际同行6个月以上
在人体中,小脑负责协调运动、维持平衡,让动作精准流畅。而GAE则为人形机器人带来了强大的“通用小脑”——它能让机器人在收到信号后瞬间做出最合适的动作。王东林介绍,这套由西湖团队完全自研的算法,比国际上其他团队的同类技术领先至少6个月。
“目前市面上看到的机器人已经能跑能跳能比武,但其实基本靠提前编程。”王东林说,那就好像“背课文”,需要反复训练才能做到一字不差,而这正是传统机器人的最大技术瓶颈——由于缺乏通用的动作模型,一套程序只能对应一套动作,机器人无法“举一反三”。
而GAE这个“通用小脑”则能让机器人即使遇到没做过的动作,也能轻松应对。而且,它还具备“跨本体”能力,很多不同结构、不同尺寸的机器人都能搭载这套大模型。
“ChatGPT让AI能理解并生成各种语言,拥有语言的泛化能力;Sora能生成各种视频画面,拥有视觉的泛化能力。”王东林说,GAE则让机器人能模仿和执行各种人类动作,是机器人领域第一个实现动作泛化的大模型。
GAE的问世离不开长期的技术积累与数据支撑。此前,王东林团队已在四足机器人(机器狗)、人形机器人领域深耕多年,积累了丰富的机器人运动控制技术。同时,他们还拥有全球领先、国内最大的高质量全身运动数据集,包含了人类各种日常动作、复杂动作的详细数据,为这颗“通用小脑”提供了充足的“学习素材”。
“分身体验”只是一个开始。王东林表示,“泰坦O1”更重要的意义在于可替代人类进入高风险场景,如消防救援、矿区作业、高空维护等。
据法新社巴黎3月15日报道,15日发布的一项新的重要分析称,影响神经系统的疾病——如中风、偏头痛和痴呆症——已经超过心脏病,成为全球范围内导致人们健康损害的主要原因。 3月18日,记者从中南大学生殖与干细胞研究所获悉,研究所林戈、卢光琇教授团队提出的一项新理论称,原始生殖细胞的性染色体组成在人类性别决定中起关键作用。相关论文日前发表于国际生殖领域杂志 3月22日消息,今天,数码博主“数码闲聊站”曝光了一部新款千元机的部分配置。该博主表示,欧加(OPPO/一加)有个5500mAh超大电池的千元曲屏机,正在测试IP68级防尘防水效果,主打就是防水抗摔耐用。该博主最 习近平总书记在中共中央政治局第三次集体学习时强调,要加强科研学风作风建设,引导科技人员摒弃浮夸、祛除浮躁,坐住坐稳“冷板凳”。甘坐“冷板凳”是一种平心静气从事科学研究、追寻科学真理的 作为月之暗面的创始人,杨植麟常把他的AGI梦想形容为“登月计划”,长文本就是这个伟大计划的第一步。但现在,随着Kimi的爆火出圈,赛道瞬间变得拥挤,24小时内,阿里、360、百度紧急“出手”,纷 记者从中国气象局了解到,3月24日、25日和26日三天,将可能出现地磁活动,其中3月25日可能发生中等以上地磁暴甚至大地磁暴,预计地磁活动将持续到26日。在此影响之下,空间站可能因大气拖拽造成轨道高 。本文链接:西湖大学发布机器人领域首个动作泛化大模型 “通用小脑”让机器人复刻如影随形http://www.sushuapos.com/show-2-15744-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: AI和真人演员,未必非此即彼