具身智能正从实验室走向工厂、家庭和医院,但数据这个瓶颈制约了行业的发展。4月16日,京东推出覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施,并对外展示了自研超高清采集终端JoyEgoCam、具身大模型JoyAI-RA、具身智能数据交易平台等,试图为陷入数据困局的具身智能企业上下游提供底层支撑。根据相关报告,我国具身智能产业市场规模有望在2030年达到4000亿元。高质量数据的供给是产业规模化落地的关键。
3月,京东宣布将建成全球最大具身数据采集中心;4月16日,京东发布首个具身数据全链路基础设施,打通从数据采集到模型测试的全流程闭环,将原始杂乱数据精炼为驱动模型进化的高价值“数据燃料”。
以此为基础,京东将构建全球规模最大的具身智能数据采集中心,发动最多60万人进行“大规模数据采集行动”,在两年内积累1000万小时人类真实场景视频数据,加速真实场景下的模型迭代优化,为机器人企业、具身模型研发机构、汽车厂商、医疗机构等各行业客户提供全流程数据服务。
在采集端,京东云自研的可穿戴式超高清采集终端JoyEgoCam,从清晰度、精准度、便携性、稳定性四个维度保障了源头数据质量,可在物流、零售、医疗、家庭等多种场景下“即戴即采”。
采集后的数据汇入AI数据湖平台,经PB级吞吐能力自动完成清洗、对齐、转换与预标注,再通过JoyBuilder仿真平台批量生成高逼真仿真数据,实现人类操作数据向仿真操作数据、真机操作数据的转换与泛化扩增。
“硬件发展很快,但大脑模型缺乏数据支撑,很多机器人能唱歌跳舞,却无法应用在真实的生产环节。”京东集团技术委员会主席、京东云总裁曹鹏在发布会上指出,行业训练一个具备泛化能力的具身大模型至少需要1000万小时真实场景数据,而目前市场可用数据集仅有几十万小时,“数据已经成为制约整个具身智能行业向前发展的关键痛点”。曹鹏强调,现有数据集普遍存在场景多样性不足、本体依赖性强、跨本体迁移困难等问题,难以支撑真正具有泛化能力的模型训练。
数据背后是京东在零售、物流、工业、健康等场景的资源积累——超过3600个仓库、过万线下门店、20多万药房以及5万家政人员的服务网络构成了天然的数据采集场域。
除了自建采集体系,京东还上线了具身智能数据交易平台,首批定向开放2000小时高精标注数据集,打通数据合规交易通道。曹鹏表示,该平台一方面开放京东自身采集的高精标注数据,另一方面希望聚合合作伙伴的数据资源,“光靠我们自己一家来做肯定做不好,需要更多伙伴一起把数据在数量、丰富度和质量上都做提升”。这一开放策略试图回应行业内数据孤岛、标准不一、难以流通的普遍困境。
北京商报记者 魏蔚
具身智能正从实验室走向工厂、家庭和医院,但数据这个瓶颈制约了行业的发展。4月16日,京东推出覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施,并对外展示了自研超高清采集终端JoyEgoCam、具身大模型JoyAI-RA、具身智能数据交易平台等,试图为陷入数据困局的具身智能企业上下游提供底层支撑。根据相关报告,我国具身智能产业市场规模有望在2030年达到4000亿元。高质量数据的供给是产业规模化落地的关键。
3月,京东宣布将建成全球最大具身数据采集中心;4月16日,京东发布首个具身数据全链路基础设施,打通从数据采集到模型测试的全流程闭环,将原始杂乱数据精炼为驱动模型进化的高价值“数据燃料”。
以此为基础,京东将构建全球规模最大的具身智能数据采集中心,发动最多60万人进行“大规模数据采集行动”,在两年内积累1000万小时人类真实场景视频数据,加速真实场景下的模型迭代优化,为机器人企业、具身模型研发机构、汽车厂商、医疗机构等各行业客户提供全流程数据服务。
在采集端,京东云自研的可穿戴式超高清采集终端JoyEgoCam,从清晰度、精准度、便携性、稳定性四个维度保障了源头数据质量,可在物流、零售、医疗、家庭等多种场景下“即戴即采”。
采集后的数据汇入AI数据湖平台,经PB级吞吐能力自动完成清洗、对齐、转换与预标注,再通过JoyBuilder仿真平台批量生成高逼真仿真数据,实现人类操作数据向仿真操作数据、真机操作数据的转换与泛化扩增。
“硬件发展很快,但大脑模型缺乏数据支撑,很多机器人能唱歌跳舞,却无法应用在真实的生产环节。”京东集团技术委员会主席、京东云总裁曹鹏在发布会上指出,行业训练一个具备泛化能力的具身大模型至少需要1000万小时真实场景数据,而目前市场可用数据集仅有几十万小时,“数据已经成为制约整个具身智能行业向前发展的关键痛点”。曹鹏强调,现有数据集普遍存在场景多样性不足、本体依赖性强、跨本体迁移困难等问题,难以支撑真正具有泛化能力的模型训练。
数据背后是京东在零售、物流、工业、健康等场景的资源积累——超过3600个仓库、过万线下门店、20多万药房以及5万家政人员的服务网络构成了天然的数据采集场域。
除了自建采集体系,京东还上线了具身智能数据交易平台,首批定向开放2000小时高精标注数据集,打通数据合规交易通道。曹鹏表示,该平台一方面开放京东自身采集的高精标注数据,另一方面希望聚合合作伙伴的数据资源,“光靠我们自己一家来做肯定做不好,需要更多伙伴一起把数据在数量、丰富度和质量上都做提升”。这一开放策略试图回应行业内数据孤岛、标准不一、难以流通的普遍困境。
北京商报记者 魏蔚
记者3月18日从安徽明天氢能科技股份有限公司(以下简称明天氢能)获悉,国家电网近日向明天氢能及董事长王朝云分别授予科学技术进步奖一等奖,获奖项目为“大规模氢电一体化站关键技术、核心装备及 记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展。研究组在最小资源消耗的量子态分辨问题中首次提出了全局最优自适应策略,并发展了自适应集体测量实验 记者3月21日获悉,全球植物科学期刊《分子植物》刊载了中国科学家的最新研究,中国农业科学院作物科学研究所、国家南繁研究院与阿里达摩院(湖畔实验室)联合研发出全流程智慧育种平台,实现了育种数 记者3月21日从安徽农业大学获悉,该校生命科学学院韩毅教授课题组与国内外专家合作,发现了植物避盐性的关键基因。该研究对于提高植物耐盐性,帮助盐碱地下的农作物稳产具有重要理论指导意义。相 习近平总书记在中共中央政治局第三次集体学习时强调,要加强科研学风作风建设,引导科技人员摒弃浮夸、祛除浮躁,坐住坐稳“冷板凳”。甘坐“冷板凳”是一种平心静气从事科学研究、追寻科学真理的 作为功能机时代的霸主,诺基亚手机曾经创造了巨大的辉煌,但也因错失智能手机发展机遇而“掉队”。近期,外媒Visual Capitalist统计了有史以来最畅销的15款手机型号,其中诺基亚和苹果包揽前十。今 。本文链接:当具身智能陷入“数据荒”,京东布局全链路基础设施http://www.sushuapos.com/show-2-16058-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。