设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

2024-04-01 14:24:06 来源: 量子位

连黑客帝国的子弹都能数清楚iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

还记得黑客帝国经典的子弹时间吗?iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

IDEA研究院最新检测模型T-Rex2,可以齐刷刷给全部识别出来~iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

而面对难倒一众大模型「吉娃娃or松饼」的难题,它只需被投喂一张吉娃娃的照片,就能瞬间迎刃而解。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

此前,也是同样的团队,推出了基于视觉提示的检测模型T-Rex。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如今,他们将视觉和文本提示融合,相互弥补各自的缺陷,实现了更强的目标检测能力。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

并且与多目标跟踪模型结合后,各种视频检测任务也不在话下。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

来看新研究到底说了什么。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

打通文本和视觉提示

在开集目标检测领域,尽管文本提示受到一定的青睐,但也存在一定的局限性。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如长尾数据短缺。稀有或者全新的物体类别的数据稀缺可能会削弱其学习效率。还有描述上的局限性,对于一些难以用语言描绘的对象,因受限于无法精确描述,也会削弱效果。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而视觉提示提供了更直观且直接的对象表示方法,但在捕捉常见对象的概念时效果就会很差。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

T-Rex2通过对比学习在单个模型中整合两种提示,因此接受多种格式的输入,包括文本提示、视觉提示以及两者的组合。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

在不同场景中,它可以通过在两种提示方式之间切换来处理。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因此,它大致有三种工作模式:iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

文本提示模式、交互式视觉提示模式、通用视觉提示模式。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

以通用视觉提示模式为例,用户可以通过向模型提供任意数量的示例图片,来自定义特定对象的视觉嵌入,然后使用这个嵌入来检测任意图像中的对象。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

也就是不需要用户与模型直接互动,就能完成检测任务。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

最终在在四个学术基准测试集 COCO, LVIS, ODinW, 和Roboflow100 上取得了 Zero-Shot SOTA的性能。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

开箱即用诸多领域

无需重新训练或微调,T-Rex2即可检测模型在训练阶段从未见过的物体。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

该模型不仅可应用于包括计数在内的所有检测类任务,还为智能交互标注领域提供新的解决方案。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

除此之外,结合现有的多目标跟踪模型( 如ByteTrack ),T-Rex2还可用于视频检测任务。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompt

事实上,这种跨图检测能力,让目标检测技术在生产生活中可以真正开始广泛应用。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

比如工业生产流水线器件检测,交通航运领域的船舶、飞机检测,农业领域的农作物、果蔬检测,生物医学领域的细胞、组织检测,物流领域的货物检测,环境领域的野生动物监测等。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

现在,T-Rex2让通用物体检测又迈出了新的一步。iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

试玩链接:iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://deepdataspace.com/playground/ivpiMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
T-Rex2 API:https://github.com/IDEA-Research/T-RexiMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
论文链接:iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://arxiv.org/abs/2403.14610iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

— 完 —iMB速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:吉娃娃or松饼难题被解决!IDEA研究院新模型打通文本视觉Prompthttp://www.sushuapos.com/show-2-4433-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 一款手游有400+个AI角色!腾讯游戏新系统炸场GDC:训练成本大减90%

下一篇: GPT4单项仅7.1分,揭露大模型写代码三大短板,最新基准测试来了

热门资讯

  • 打造平台级AI 引领行业创新

    3月18日,荣耀在国内市场发布全新AI使能的全场景战略,推出平台级AI赋能、以人为中心的跨操作系统体验,以及与全球产业链共振创新的一系列智能设备。荣

  • 我国科学家在铁电隧道结存储器研究中取得新进展

    记者从中国科学院金属研究所获悉,该所沈阳材料科学国家研究中心胡卫进研究员与合作者,提出利用缓冲层定量调控薄膜应变,延迟铁电薄膜晶格弛豫从而增强

  • 监管AI,欧盟出手,美国掉队?

      监管AI,欧盟出手,美国掉队?  上个世纪,科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”,带来了对“机器人”与“规则”的美好幻想。  如今,伴随着ChatGPT、Sora的爆火,

  • 新AI系统可提供足球制胜战术

    未来的足球场,人工智能(AI)当“大脑”?《自然·通讯》19日发表一项来自谷歌深度思维的最新成果,研究团队报告了一个名为“TacticAI”的系统,能在足

  • 全国首个模拟验证机场开工

    记者日前获悉,位于四川成都未来科技城应用性科创区的民航科技创新示范区(B区)航站楼项目,近日取得施工许可证。这也意味着全国首个模拟验证机场开工。

  • 联想与英伟达推出全新混合AI解决方案

    在近日举行的全球AI盛会GTC(GPU Technology Conference)2024上,联想集团与NVIDIA(英伟达)宣布合作推出全新混合人工智能解决方案,帮助企业和云提供商获得

  • 多模态医疗大模型CARES Copilot 1.0发布 已面向香港神经外科医生开放使用

    记者3月21日获悉,由中国科学院自动化研究所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型——CARES Copilot 1.0日前在香

  • AI伴侣能否带来亲密关系

    自2023年以来,人工智能的“触角”已延伸到生活的方方面面。其中,“人工智能+情感”的赛道正悄然崛起。目前,国内外已经出现了多款较为成熟的AI伴侣应

  • “AI热潮”有人欢喜又有人忧:新兴市场遭资金外流!

      “AI热潮”有人欢喜又有人忧:新兴市场遭资金外流!  财联社3月20日讯(编辑 黄君芝)巴西亿万富翁、巴西金融公司Banco BTG Pactual SA创始人Andre Esteves表示,人工智能(AI

  • 30台发动机助进阶版“鹊桥”升空

      30台发动机助进阶版“鹊桥”升空  中新社西安3月20日电 (记者 张一辰)3月20日8时31分,长征八号遥三运载火箭在中国文昌航天发射场顺利升空,成功将“鹊桥二号”卫星送入

  • 首款骁龙8 Gen3折叠屏!vivo X Fold3图赏

    3月23日消息,vivo X Fold3系列将于3月26日正式发布,成为全球首款骁龙8 Gen3折叠屏电话。现在这款新机外观已经解禁,下面为大家带来图赏。vivo X Fold3提供

  • 第三颗“厦门造”卫星出征

    3月23日,“天卫科技03星”暨“华祥苑壹号”卫星在厦门举行出征仪式,这是由厦门本土企业天卫科技制造研发的第三颗服务当地建设的商业卫星,标志着厦门

推荐资讯

  • 日榜
  • 周榜
  • 月榜