设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

京东开源图像模型,实测AI如何能真正“看懂”空间

发布时间: 2026-04-09 10:07:48 来源: 新京报

用AI做图、修图时,大众经常会遇到一些难题:想把图中的杯子挪个位置,结果杯子变形了;想换个视角看看画面,透视却完全不对;想调整两个物体的前后位置,也会出现遮挡混乱、比例失衡……zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月8日,记者从京东获悉,京东探索研究院近日正式开源了自研的JoyAI-Image-Edit图像模型,以解决上述难题。京东探索研究院称该模型是业内首个把“空间智能”刻进骨子里的开源模型,让AI终于能真正“看懂”空间、“编辑”空间,从原来的平面修图,升级成了三维空间重塑,而且模型的推理代码全部开放,开发者能直接拿来做应用。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

官方资料显示,JoyAI-Image-Edit贴合真实世界空间规律,从空间位置关系、多视角一致性、相机感知到场景推理等维度全面建模,实现了相机坐标视角变换、物体空间位移旋转、几何结构精准控制等多项空间编辑技术突破,将空间认知能力深度融入文本与图像生成流程,搭建了完整的空间理解数据与任务体系。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

全面兼容15类通用编辑能力擅长长文本精准渲染zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具体而言,该模型打破了AI“理解图像”和“生成图像”的壁垒,让AI不仅能生成逼真的图像外观,更能精准理解图像背后的空间结构,在编辑过程中稳定保持主体形象与场景结构完整,多视角空间布局高度一致。不管是移动物体、换视角,还是调整物体间的关系,都能保持场景的几何规律,遮挡、光影也都自然合理,不会再出现变形、错乱的情况。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东探索研究院相关负责人对新京报贝壳财经记者表示,JoyAI-Image-Edit的核心跃升,在于其攻克了此前开源模型难以逾越的空间理解难题,具备三大辨识度高的空间编辑能力:视角变换——用户可通过自然语言指定相机的偏航角、俯仰角及缩放程度,模型在保持场景几何一致性的前提下生成新视角图像;空间漫游——支持连续的视角移动,生成在空间中逻辑连贯的多视角图像序列,类似于在三维场景中“走动”;物体空间关系操控——在保持场景整体结构稳定的前提下,对特定物体进行位移、缩放等空间变换,同时确保遮挡与光影关系自然合理。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在实现空间级突破的同时,JoyAI-Image-Edit全面兼容15类通用编辑能力,深度覆盖内容创作的高频需求。无论是物体的替换、删除、添加,还是整体风格迁移、细节精修等操作,模型均实现了高性能覆盖。结合顶尖的空间编辑技术,模型在长文本精准渲染、多视角一致性生成等行业高难度任务中表现卓越,真正做到了全场景、无死角的高效创作。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东高级副总裁何晓冬在接受新京报贝壳财经记者采访时表示,通用人工智能有两个方向要走,一个方向是多模态,大模型必须具有视觉能力,未来甚至可以更进一步延伸向嗅觉、触觉;另外一个方向是走向具身智能,包括机器人、机械臂、无人车等,让通用人工智能走向物理世界。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

重点应用于具身智能领域模型还将探索多种场景zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

应用层面,JoyAI-Image-Edit模型可广泛应用于电商内容生产、创意设计制作、智能图像处理、3D模型重建、具身智能视觉感知等多元领域,大幅提升AI图像技术在复杂空间场景中的适配性与实用性。尤其是在具身智能领域,空间理解能力是机器人“理解世界”的核心基础,而该模型的推出,也为相关技术研发提供了关键的底层能力。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具身智能相关测试图。受访者供图zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在具身智能实测领域,演示效果显示:用户仅需输入自然语言提示词(如“机器人左手举起来”),并通过画框框选目标区域,即可对指定物体的动作、姿态、旋转角度进行精细化操控。在机器人做家务的实拍场景中,模型在完整保留背景环境、物体空间关系与物理合理性的前提下,生成了机器人抬手的全新姿态。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2025年,京东在具身智能领域完成关键布局。其依托JoyAI大模型底层能力,正式推出JoyInside“附身智能”解决方案,面向智能家电、机器人等终端硬件植入高情商交互系统,将AI的认知与情感能力深度嵌入硬件终端,实现更贴合人类习惯的自然交互。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此后,京东持续探索具身智能生态建设。一方面,围绕JoyInside平台迭代技术版本,升级语音、多模态感知等核心能力;另一方面,加快产业落地,通过开放接口、合作开发等模式,与多家家电及机器人企业达成合作,推动具身智能技术在家庭陪伴、日常服务等场景的规模化应用。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东探索研究院相关负责人称,此次JoyAI-Image-Edit的开源,是京东在AI多模态模型领域的重要布局,让AI图像编辑实现了从平面到空间的大跨越。未来该模型还将持续落地更多场景,不断探索空间智能落地价值。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

用AI做图、修图时,大众经常会遇到一些难题:想把图中的杯子挪个位置,结果杯子变形了;想换个视角看看画面,透视却完全不对;想调整两个物体的前后位置,也会出现遮挡混乱、比例失衡……zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月8日,记者从京东获悉,京东探索研究院近日正式开源了自研的JoyAI-Image-Edit图像模型,以解决上述难题。京东探索研究院称该模型是业内首个把“空间智能”刻进骨子里的开源模型,让AI终于能真正“看懂”空间、“编辑”空间,从原来的平面修图,升级成了三维空间重塑,而且模型的推理代码全部开放,开发者能直接拿来做应用。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

官方资料显示,JoyAI-Image-Edit贴合真实世界空间规律,从空间位置关系、多视角一致性、相机感知到场景推理等维度全面建模,实现了相机坐标视角变换、物体空间位移旋转、几何结构精准控制等多项空间编辑技术突破,将空间认知能力深度融入文本与图像生成流程,搭建了完整的空间理解数据与任务体系。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

全面兼容15类通用编辑能力擅长长文本精准渲染zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具体而言,该模型打破了AI“理解图像”和“生成图像”的壁垒,让AI不仅能生成逼真的图像外观,更能精准理解图像背后的空间结构,在编辑过程中稳定保持主体形象与场景结构完整,多视角空间布局高度一致。不管是移动物体、换视角,还是调整物体间的关系,都能保持场景的几何规律,遮挡、光影也都自然合理,不会再出现变形、错乱的情况。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东探索研究院相关负责人对新京报贝壳财经记者表示,JoyAI-Image-Edit的核心跃升,在于其攻克了此前开源模型难以逾越的空间理解难题,具备三大辨识度高的空间编辑能力:视角变换——用户可通过自然语言指定相机的偏航角、俯仰角及缩放程度,模型在保持场景几何一致性的前提下生成新视角图像;空间漫游——支持连续的视角移动,生成在空间中逻辑连贯的多视角图像序列,类似于在三维场景中“走动”;物体空间关系操控——在保持场景整体结构稳定的前提下,对特定物体进行位移、缩放等空间变换,同时确保遮挡与光影关系自然合理。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在实现空间级突破的同时,JoyAI-Image-Edit全面兼容15类通用编辑能力,深度覆盖内容创作的高频需求。无论是物体的替换、删除、添加,还是整体风格迁移、细节精修等操作,模型均实现了高性能覆盖。结合顶尖的空间编辑技术,模型在长文本精准渲染、多视角一致性生成等行业高难度任务中表现卓越,真正做到了全场景、无死角的高效创作。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东高级副总裁何晓冬在接受新京报贝壳财经记者采访时表示,通用人工智能有两个方向要走,一个方向是多模态,大模型必须具有视觉能力,未来甚至可以更进一步延伸向嗅觉、触觉;另外一个方向是走向具身智能,包括机器人、机械臂、无人车等,让通用人工智能走向物理世界。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

重点应用于具身智能领域模型还将探索多种场景zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

应用层面,JoyAI-Image-Edit模型可广泛应用于电商内容生产、创意设计制作、智能图像处理、3D模型重建、具身智能视觉感知等多元领域,大幅提升AI图像技术在复杂空间场景中的适配性与实用性。尤其是在具身智能领域,空间理解能力是机器人“理解世界”的核心基础,而该模型的推出,也为相关技术研发提供了关键的底层能力。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具身智能相关测试图。受访者供图zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在具身智能实测领域,演示效果显示:用户仅需输入自然语言提示词(如“机器人左手举起来”),并通过画框框选目标区域,即可对指定物体的动作、姿态、旋转角度进行精细化操控。在机器人做家务的实拍场景中,模型在完整保留背景环境、物体空间关系与物理合理性的前提下,生成了机器人抬手的全新姿态。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2025年,京东在具身智能领域完成关键布局。其依托JoyAI大模型底层能力,正式推出JoyInside“附身智能”解决方案,面向智能家电、机器人等终端硬件植入高情商交互系统,将AI的认知与情感能力深度嵌入硬件终端,实现更贴合人类习惯的自然交互。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此后,京东持续探索具身智能生态建设。一方面,围绕JoyInside平台迭代技术版本,升级语音、多模态感知等核心能力;另一方面,加快产业落地,通过开放接口、合作开发等模式,与多家家电及机器人企业达成合作,推动具身智能技术在家庭陪伴、日常服务等场景的规模化应用。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

京东探索研究院相关负责人称,此次JoyAI-Image-Edit的开源,是京东在AI多模态模型领域的重要布局,让AI图像编辑实现了从平面到空间的大跨越。未来该模型还将持续落地更多场景,不断探索空间智能落地价值。zWL速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“远方巡视启动!”南方电网云南保山220千伏大寨变电站日前启动首次全套智能巡视,109个摄像头快速旋转,10套在线监测系统开始收集数据,变电站的无人机机巢弹开、无人机飞向工作点位,机器人从卷帘门 近年来,电动自行车以便利性受到大众青睐,但相关起火事故威胁着居民的生命财产安全。据国家消防救援局发布的统计数据,2023年全国共接报电动自行车火灾2.1万起,比2022年增加17.4%。电动自行车起火 自2023年以来,人工智能的“触角”已延伸到生活的方方面面。其中,“人工智能+情感”的赛道正悄然崛起。目前,国内外已经出现了多款较为成熟的AI伴侣应用。不少网友在社交媒体上晒出了与自己“AI 21世纪经济报道记者 石恩泽 深圳报道操作系统似乎对地理入迷。鸿蒙和深圳,就像Windows和西雅图,也似Linux和赫尔辛基。这是地理与技术的紧密交融。深圳,可以说是鸿蒙的诞生之地,在全球科 据英国《每日电讯报》网站3月18日报道,根据英国政府的新航空计划,首批电动飞行出租车将于2026年试飞。周一发布的《“飞行未来”行动计划》为飞行出租车在2030年广泛使用铺平道路。尽管在最初 3月24日是第29个世界防治结核病日,我国的宣传主题是“你我共同努力,终结结核流行”。在北京大学社会化媒体研究中心21日举办的“技术升级,加速我国终结结核流行进程”主题沙龙上,中国疾控中心结 。

本文链接:京东开源图像模型,实测AI如何能真正“看懂”空间http://www.sushuapos.com/show-2-15970-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 北京研发出全球首款全自主网球人形机器人

下一篇: DeepSeek上线专家模式

热门资讯

  • 我国成功研制可靶向送药的磁驱软体机器人

    中国科学院深圳先进技术研究院15日发布消息称,该院科研团队研发了一种具有靶向送药功能的磁驱软体机器人,该机器人能够根据器官内部环境的特点选择合

  • 创新中药八子补肾胶囊抗衰老研究取得重大突破

    3月20日对于我国抗衰老研究是个特殊的日子,经过近3年的不懈努力,八子补肾胶囊抗衰老取得又一重大突破。挑战人类生命极限是摆在全球科学家面前的重大

  • Sora将如何影响科学与社会

    英国《自然》周刊网站3月12日刊登题为《OpenAI的文生视频工具Sora会如何改变科学——以及社会》的文章,作者为乔纳森·奥卡拉汉,内

  • 来看金星土星“亲密一刻”

    3月22日黎明,太阳系中最明亮的行星金星与太阳系中拥有最多卫星的行星土星将在东南方低空近距离相伴,上演“结伴游”。北京星空摄影爱好者王俊峰2023

  • 我国首个制氢加氢一体站团体标准发布

    我国制氢加氢一体站建设有了团体标准。记者从中国石化获悉,为推动我国氢能交通产业发展,中国石化联合国内数十家氢能头部企业发布了国内首个《制氢加

  • 一种新的结核病候选疫苗在南非启动Ⅲ期临床试验

    在3月24日世界防治结核病日前夕,比尔及梅琳达∙盖茨医学研究所(以下简称盖茨医学研究所)宣布,启动评估结核病候选疫苗M72有效性的Ⅲ期临床试验。在Ⅱb

  • 植物避盐性的关键基因被发现

    记者3月21日从安徽农业大学获悉,该校生命科学学院韩毅教授课题组与国内外专家合作,发现了植物避盐性的关键基因。该研究对于提高植物耐盐性,帮助盐碱

  • 光储行业迎来2000V新时代

    3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光

  • 我国网民规模达10.92亿人:互联网普及率77.5%!

    3月22日消息,中国互联网络信息中心(CNNIC)今天发布了《中国互联网络变化状况计算报告》。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12

  • 千元机皇 小8Gen3+1.5K直屏+5500mAh大电池 有点香啊!

    回望一加去年的整体节奏,如果要用一个词来总结其数字系列和Ace系列的概况,那就是“卷”!从外观质感、内存性能到整机体验,与友商的相互竞争中,一加表现的都

  • Kimi掀起国产大模型长文本竞赛

    作为月之暗面的创始人,杨植麟常把他的AGI梦想形容为“登月计划”,长文本就是这个伟大计划的第一步。但现在,随着Kimi的爆火出圈,赛道瞬间变得

  • 新疆:南山26米射电望远镜4Gbps宽带VLBI联测首获成功

    记者从中国科学院新疆天文台获悉,近期南山26米射电望远镜在参与欧洲VLBI网组织的联测中,首次成功运用4Gbps宽带、高码率VLBI技术获得干涉条纹。相较

推荐资讯

  • 日榜
  • 周榜
  • 月榜