孙悟空拔一把毫毛吹口气,就能拥有一群“小悟空”分身。日前,西湖大学孵化的西湖机器人公司发布了搭载全球机器人领域首个动作泛化大模型的人形机器人“泰坦O1”(TITAN O1),将这一神话场景带入现实——名为“GAE身外化身系统”的通用动作预训练大模型,相当于给来自不同厂家的机器人装上了可通用的强大“小脑”,让机器人可突破时空限制,实时模仿人类动作,只需一个人就能操控成百上千个身处天南地北不同地点的机器人“赛博分身”,实时进行同样的操作。
理论控制规模无上限,也几乎不设使用门槛
“泰坦O1”外观呈橙、黑、银三色拼接,风格颇具未来感。在演示现场,当身着动作捕捉服的工作人员摆手、转身、踢球时,“泰坦O1”会“如影随形”地在毫秒间复刻所有动作:无论手臂摆动角度、转身幅度,还是踢球时的步距与抬脚高度,甚至动作节奏,都与工作人员高度一致。
“这些动作并非预先编排,而是对人类随机行为的实时响应。”西湖机器人创始人、西湖大学机器智能实验室研究组长王东林教授介绍,无论操作者是谁、动作如何变化,“泰坦O1”都能快速跟上。
此外,“泰坦O1”还有不错的“动作记忆”能力,可通过后台指令复现已示范过的动作。在今年安徽卫视春节联欢晚会上,西湖机器人曾凭借这一能力完成了10台机器人的五禽戏群控表演——仅用数天调试,即可实现自定义动作生成与部署,大幅降低应用门槛。
“只要具备网络环境,穿上动捕设备,就可以远程操控机器人执行任务。”王东林表示,单人可同时控制多台机器人完成一致动作,理论上控制规模不设上限。
最令人惊喜的是,这一系统几乎不设使用门槛。无需编程经验,也不用依赖专业人员指导,用户仅通过动捕设备或电脑端操作,即可让机器人完成对应动作,实现“所想即所动”。
算法完全自研,技术领先国际同行6个月以上
在人体中,小脑负责协调运动、维持平衡,让动作精准流畅。而GAE则为人形机器人带来了强大的“通用小脑”——它能让机器人在收到信号后瞬间做出最合适的动作。王东林介绍,这套由西湖团队完全自研的算法,比国际上其他团队的同类技术领先至少6个月。
“目前市面上看到的机器人已经能跑能跳能比武,但其实基本靠提前编程。”王东林说,那就好像“背课文”,需要反复训练才能做到一字不差,而这正是传统机器人的最大技术瓶颈——由于缺乏通用的动作模型,一套程序只能对应一套动作,机器人无法“举一反三”。
而GAE这个“通用小脑”则能让机器人即使遇到没做过的动作,也能轻松应对。而且,它还具备“跨本体”能力,很多不同结构、不同尺寸的机器人都能搭载这套大模型。
“ChatGPT让AI能理解并生成各种语言,拥有语言的泛化能力;Sora能生成各种视频画面,拥有视觉的泛化能力。”王东林说,GAE则让机器人能模仿和执行各种人类动作,是机器人领域第一个实现动作泛化的大模型。
GAE的问世离不开长期的技术积累与数据支撑。此前,王东林团队已在四足机器人(机器狗)、人形机器人领域深耕多年,积累了丰富的机器人运动控制技术。同时,他们还拥有全球领先、国内最大的高质量全身运动数据集,包含了人类各种日常动作、复杂动作的详细数据,为这颗“通用小脑”提供了充足的“学习素材”。
“分身体验”只是一个开始。王东林表示,“泰坦O1”更重要的意义在于可替代人类进入高风险场景,如消防救援、矿区作业、高空维护等。
孙悟空拔一把毫毛吹口气,就能拥有一群“小悟空”分身。日前,西湖大学孵化的西湖机器人公司发布了搭载全球机器人领域首个动作泛化大模型的人形机器人“泰坦O1”(TITAN O1),将这一神话场景带入现实——名为“GAE身外化身系统”的通用动作预训练大模型,相当于给来自不同厂家的机器人装上了可通用的强大“小脑”,让机器人可突破时空限制,实时模仿人类动作,只需一个人就能操控成百上千个身处天南地北不同地点的机器人“赛博分身”,实时进行同样的操作。
理论控制规模无上限,也几乎不设使用门槛
“泰坦O1”外观呈橙、黑、银三色拼接,风格颇具未来感。在演示现场,当身着动作捕捉服的工作人员摆手、转身、踢球时,“泰坦O1”会“如影随形”地在毫秒间复刻所有动作:无论手臂摆动角度、转身幅度,还是踢球时的步距与抬脚高度,甚至动作节奏,都与工作人员高度一致。
“这些动作并非预先编排,而是对人类随机行为的实时响应。”西湖机器人创始人、西湖大学机器智能实验室研究组长王东林教授介绍,无论操作者是谁、动作如何变化,“泰坦O1”都能快速跟上。
此外,“泰坦O1”还有不错的“动作记忆”能力,可通过后台指令复现已示范过的动作。在今年安徽卫视春节联欢晚会上,西湖机器人曾凭借这一能力完成了10台机器人的五禽戏群控表演——仅用数天调试,即可实现自定义动作生成与部署,大幅降低应用门槛。
“只要具备网络环境,穿上动捕设备,就可以远程操控机器人执行任务。”王东林表示,单人可同时控制多台机器人完成一致动作,理论上控制规模不设上限。
最令人惊喜的是,这一系统几乎不设使用门槛。无需编程经验,也不用依赖专业人员指导,用户仅通过动捕设备或电脑端操作,即可让机器人完成对应动作,实现“所想即所动”。
算法完全自研,技术领先国际同行6个月以上
在人体中,小脑负责协调运动、维持平衡,让动作精准流畅。而GAE则为人形机器人带来了强大的“通用小脑”——它能让机器人在收到信号后瞬间做出最合适的动作。王东林介绍,这套由西湖团队完全自研的算法,比国际上其他团队的同类技术领先至少6个月。
“目前市面上看到的机器人已经能跑能跳能比武,但其实基本靠提前编程。”王东林说,那就好像“背课文”,需要反复训练才能做到一字不差,而这正是传统机器人的最大技术瓶颈——由于缺乏通用的动作模型,一套程序只能对应一套动作,机器人无法“举一反三”。
而GAE这个“通用小脑”则能让机器人即使遇到没做过的动作,也能轻松应对。而且,它还具备“跨本体”能力,很多不同结构、不同尺寸的机器人都能搭载这套大模型。
“ChatGPT让AI能理解并生成各种语言,拥有语言的泛化能力;Sora能生成各种视频画面,拥有视觉的泛化能力。”王东林说,GAE则让机器人能模仿和执行各种人类动作,是机器人领域第一个实现动作泛化的大模型。
GAE的问世离不开长期的技术积累与数据支撑。此前,王东林团队已在四足机器人(机器狗)、人形机器人领域深耕多年,积累了丰富的机器人运动控制技术。同时,他们还拥有全球领先、国内最大的高质量全身运动数据集,包含了人类各种日常动作、复杂动作的详细数据,为这颗“通用小脑”提供了充足的“学习素材”。
“分身体验”只是一个开始。王东林表示,“泰坦O1”更重要的意义在于可替代人类进入高风险场景,如消防救援、矿区作业、高空维护等。
据法新社巴黎3月15日报道,15日发布的一项新的重要分析称,影响神经系统的疾病——如中风、偏头痛和痴呆症——已经超过心脏病,成为全球范围内导致人们健康损害的主要原因。 记者3月21日获悉,全球植物科学期刊《分子植物》刊载了中国科学家的最新研究,中国农业科学院作物科学研究所、国家南繁研究院与阿里达摩院(湖畔实验室)联合研发出全流程智慧育种平台,实现了育种数 记者3月21日从安徽农业大学获悉,该校生命科学学院韩毅教授课题组与国内外专家合作,发现了植物避盐性的关键基因。该研究对于提高植物耐盐性,帮助盐碱地下的农作物稳产具有重要理论指导意义。相 3月24日消息,今天数码博主“厂长是关同学”曝光了huaweiMate 70系列电话的部分配置信息。该博主表示,huawei全新的Mate 70系列首发会搭载新的芯片,芯片的性能差不多可以比肩5.5nm,还是值得期待的。同 3月22日,中国互联网络信息中心(CNNIC)发布第53次《中国互联网络发展状况统计报告》(以下简称《报告》)。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12月新增网民2480万人,互联网 3月23日20时30分许,内蒙古自治区鄂尔多斯市,约200米的高楼、磐石造型博物馆、书籍外形图书馆等主要地标建筑纷纷关闭灯光,人们在静下来的城市里感受地球的呼吸与脉动。今年“地球一小时”中国 。本文链接:西湖大学发布机器人领域首个动作泛化大模型 “通用小脑”让机器人复刻如影随形http://www.sushuapos.com/show-2-15744-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: AI和真人演员,未必非此即彼