设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

宇树宣布开源VLA大模型UnifoLM-VLA-0

发布时间: 2026-02-02 10:21:25 来源: 环球网

1月30日消息,宇树科技官方宣布,开源UnifoLM-VLA-0。RC3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据介绍,UnifoLM-VLA-0是UnifoLM系列下面向通用人形机器人操作的视觉-语言-动作(VLA)大模型。该模型旨在突破传统VLM在物理交互中的局限,通过在机器人操作数据上的继续预训练,实现了从通用“图文理解”向具备物理常识的“具身大脑”的进化。RC3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

该模型在多类任务场景下展现出显著增强的空间推理能力与可靠的多模态感知性能。针对操作类任务中对指令理解与空间感知的高要求,模型通过继续预训练深度融合了文本指令与2D/3D空间细节,增强了模型的空间感知能力。此外,还构建了全链路动力学预测数据,模型具备更好的任务泛化性。在真机验证中,仅需单一策略即可高质量完成12类复杂的操作任务。(青山)RC3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

1月30日消息,宇树科技官方宣布,开源UnifoLM-VLA-0。RC3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据介绍,UnifoLM-VLA-0是UnifoLM系列下面向通用人形机器人操作的视觉-语言-动作(VLA)大模型。该模型旨在突破传统VLM在物理交互中的局限,通过在机器人操作数据上的继续预训练,实现了从通用“图文理解”向具备物理常识的“具身大脑”的进化。RC3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

该模型在多类任务场景下展现出显著增强的空间推理能力与可靠的多模态感知性能。针对操作类任务中对指令理解与空间感知的高要求,模型通过继续预训练深度融合了文本指令与2D/3D空间细节,增强了模型的空间感知能力。此外,还构建了全链路动力学预测数据,模型具备更好的任务泛化性。在真机验证中,仅需单一策略即可高质量完成12类复杂的操作任务。(青山)RC3速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

眼眸深邃似海、璨如星河,中国医学科学院生物医学工程研究所眼科诊疗技术研发团队(以下简称“团队”)正是眼眸“侦探”。该团队不久前被授予“国家卓越工程师团队”称号。别看人眼只有8克左右,却 3月18日,伴随着搬运车的轰鸣声,全国首个大规模清洁能源特高压直流输电工程的送端±800千伏特高压祁连换流站迎来了一位“新成员”——1号调相机转子,该换流站第7次年度检修工作 从手机到手表再到电动汽车,锂离子充电电池为众多设备提供动力。但随着消费者丢弃电子产品的增加,越来越多的锂可能会进入环境。研究人员在美国化学会2024年春季会议上展示的一项研究成果,描述了 瑞士洛桑联邦理工学院工程学院研究团队制造了一种用于内存的新型纳米流体设备,这使他们第一次能连接两个“人工突触”。该设备为受大脑启发的液体硬件设计铺平了道路。这项研究发表在最新一期 3月22日消息,美国司法部对iPhone提起诉讼,声称其苹果生态系统构成垄断。司法部表示,iPhone将苹果生态系统视为一种垄断,以牺牲消费者、开发者和竞争对手的利益为代价,推动公司估值的飙升。司法部还指 有消息称,iPhone在中国寻找本土生成式AI提供方,iPhone讨论了在中国的设备中使用百度的人工智能技术。据《华尔街日报》报道,iPhone与百度进行了谈判,以授权其型号。这可能是为了向中国的iPhone客户提 。

本文链接:宇树宣布开源VLA大模型UnifoLM-VLA-0http://www.sushuapos.com/show-2-15117-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: AI虚拟偶像在北京获颁发全国首个身份认证

下一篇: 三星确认2026年推出下一代AR眼镜 主打多模态AI体验

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜