设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

从“抠图”到“抠视频” Meta上新AI工具SAM 2

发布时间: 2024-08-02 14:51:49 来源:

21世纪经济报道记者孔海丽、实习生王甜 北京报道kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

继2023年4月首次推出SAM,实现对图像的精准分割后,Meta于北京时间7月30日推出了能够分割视频的新模型SAM 2(Segment Anything Model 2)。SAM 2将图像分割和视频分割功能整合到一个模型中。所谓“分割”,是指区别视频中的特定对象与背景,并可以追踪目标。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

SAM 2将图像分割能力泛化到了视频领域,其响应能力和准确度是一代的6倍,也是目前最优秀的视觉分割模型。Meta AI发布此版本时强调:“相信我们的数据、模型和见解将成为视频分割和相关感知任务的重要里程碑。”kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同日,扎克伯格在与黄仁勋的对谈中,透露出更多Meta 的AI进展,包括将推出一款基于Llama3.1模型构建的名为AI Studio的新工具,允许用户创建、分享和设计个性化的AI聊天机器人,用户还可以在社交媒体平台上分享他们的人工智能角色。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“细分一切”

SAM 2可以识别视频中的特定对象,并实时实现该对象的追踪与提取,在视频编辑与特效制作中,可以高效辅助工作。该模型也可以根据用户具体诉求,选择分割某个物体或某个区域,使控制更加精准。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

与其他模型不同的是,SAM 2拥有对不熟悉物体和图像的零样本泛化能力,无需额外训练,只需单击一帧视频中的任何物体,即可实现对目标对象的实时追踪,快速处理未来每一帧。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除此以外,该模型还可以集成到更大的系统中,它善于从其他智能系统中获取提示,使系统之间完成协作。例如,SAM 2能够在AR/VR穿戴式设备中选择用户注视对象,也可以读取分割对象的边界框提示,完成文本提示到视频图像分割的转化。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM


kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了训练SAM 2,Meta自己建构了一个数据引擎——SA-V数据集,有效收集大量多样化的视频分割数据集并利用其去迭代模型。SA-V数据集包含5.1万个视频和64.3万个时空分割掩码(即masklet),是迄今为止最大的数据集,收集了47个国家/地区地理分布各异的真实世界场景的视频。SAM 2就在Meta开源的SA-V数据集上进行训练,为SAM 2提供的注释包括整个物体、部分物体和物体被遮挡的情况。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

SAM 2模型辅助人类标注目标对象的掩码,与此同时,SAM 2将标注的掩码传播到视频其他帧,生成时空掩码,接受提示的SAM 2受益于对象在时间维度上的记忆,生成掩码预测。如此循环往复,使SAM 2得到不断更新。业内观点认为,SAM 2为视觉数据提供更快的注释工具,有望被用来训练下一代计算机视觉系统。
kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

对于视频中的动态物体,SAM 2如何精准识别呢?Meta为SAM引入了一种记忆机制。对于视频,记忆组件可以存储对象的有关交互信息和之前处理过的信息,使SAM 2能够在整个视频中实现预测行为。根据其提示式设计理念,如果在其他帧上提供了相关提示,SAM 2还可以根据存储的对象记忆上下文(前后帧)有效地纠正其预测,显著减少人工标注时间。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Meta官网提供了一个例子,目标对象被遮挡或从视野中消失。为了向模型解释这种新的模式,在SAM 2里新应用了“遮挡头”模型,用于预测当前帧中是否存在目标对象,判断物体是否可见,即使在物体暂时被遮挡时也有助于分割物体,使SAM 2能够有效地处理遮挡。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,当遇到长时间遮挡或者场景中有多个相似对象等情况时,SAM 2可能会丢失对物体的跟踪或是混淆物体。但同时,以上情况可以通过人为干预提供细化提示来解决。
kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

尽管Meta自曝了SAM 2的不足,用户对该模型的未来依然寄予厚望。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在以往的视频编辑技术中,视频抠图需要一帧一帧地编辑。比如,国内明星真人秀节目数次遇到的“因某明星个人危机,需重新剪辑全部画面”问题,可能不再需要视频剪辑通宵达旦、连续加班。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

SAM 2的应用范围广泛,在许多需要实时反馈的应用场景中将发挥其作用,包括自动驾驶、医学、视频拍摄剪辑、监控等。比如,捕捉动态对象实现实时交互,提高车载计算机视觉系统的敏锐性;在辅助医学治疗中,定位腹腔镜摄像机锚定的区域;在追踪摄影中,帮助无人机镜头跟随追踪濒危动物;在机场、车站人流密度大的区域实时监控人群,预警异常情况;也为视频内容博主提供了更多视频创意创作的可能性。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

更好的开源生态

SAM 2也为新模型的出现埋下伏笔。SAM 2的分割生成结果可以输出给其他AI系统(例如现代视频生成模型),SAM 2本身也可以接受其他AI系统的输入提示,实现与目标对象的实时交互,比如,应用于直播时的AI公众形象搭建,自动驾驶路况分析等。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了使学术界能够在目前的基础上继续研究,Meta公开发布了预先训练的SAM 2模型、SA-V数据集、演示和代码。值得注意的是,尽管需要巨大算力支持,SAM 2仍坚持开源,并允许广大用户免费使用(在Amazon SageMaker平台上托管)。这让Meta庞大的透明开源生态又添一员。
kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近期,扎克伯格多番强调了人工智能开源的意义,他曾撰写的长文中表示:“开源人工智能比任何其他现代技术都更具有潜力,可以提高人类的生产力、创造力和生活质量,同时还能加速经济增长并推动突破性的医学和科学研究。”kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“当今大多数领先的科技公司和科学研究都是建立在开源软件之上的。最重要的是,开源人工智能代表了世界上利用这项技术为每个人创造最大经济机会和安全的最佳机会。”扎克伯格补充说。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在与黄仁勋的对谈中,扎克伯格也再次表达了“希望下一代计算机发展回到开放生态系统获胜的局势”。kkv速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

随着历史的车轮驶入2024年,大模型、AIGC等话题引发广泛热议,云计算与AI技术展现出了前所未有的深度融合趋势,就如同寒武纪的生物大爆发,激发着各行各业的创新浪潮。新质生产力时代到来,政企用云进 3月18日,荣耀在国内市场发布全新AI使能的全场景战略,推出平台级AI赋能、以人为中心的跨操作系统体验,以及与全球产业链共振创新的一系列智能设备。荣耀CEO赵明表示,人工智能大模型时代,他们的AI战 记者19日从兰州大学获悉,天华肉羊通过国家畜禽遗传资源委员会审定鉴定,成为我国首个适应高寒气候的肉羊品种。该品种由兰州大学草地农业科技学院李发弟教授和乐祥鹏教授团队,联合甘肃省武威市天 记者3月17日从浙江大学获悉,该校医学院附属第二医院王良静教授团队、附属邵逸夫医院陈淑洁主任医师团队联合研究发现,一种肠道菌群产生的小分子代谢物吲哚丙酸,可以增强抗癌药物抗PD-1单抗对结 “截至2023年底,与2018年同期相比,京津冀治理区浅层地下水位平均回升2.59米,深层承压水水位平均回升7.06米。”3月22日世界水日到来之际,水利部水资源管理司副司长张鸿星21日接受科技日报记者采 3月19日,记者从中国科学院海洋研究所了解到,该所研究团队在国际上首次发布了银鲳的高质量染色体水平参考基因组。相关研究论文近日在线发表于《自然》子刊《科学数据》。银鲳广泛分布于西北太 。

本文链接:从“抠图”到“抠视频” Meta上新AI工具SAM 2http://www.sushuapos.com/show-2-7792-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 2024年的休闲对战游戏,仍是大DAU富矿?

下一篇: 北京中轴线申遗,数字技术参与深度前所未有

热门资讯

  • 未来,政企深度用云需要一朵怎样的“云”?

    随着历史的车轮驶入2024年,大模型、AIGC等话题引发广泛热议,云计算与AI技术展现出了前所未有的深度融合趋势,就如同寒武纪的生物大爆发,激发着各行各业

  • 活性氧响应性材料 向肠炎部位精准投药

    3月17日,记者从陆军军医大学西南医院获悉,该院消化内科教授陈磊团队联合陆军军医大学教授张定林首次提出,活性氧响应性纳米材料能够把程序性死亡配体-

  • 凌晨重磅!英伟达官宣最强AI芯片

    北京时间凌晨4点至6点,英伟达联合创始人兼CEO黄仁勋发表主题演讲《见证AI的变革时刻》,正式拉开了2024年英伟达GTC大会的序幕。黄仁勋宣布,正

  • Sora将如何影响科学与社会

    英国《自然》周刊网站3月12日刊登题为《OpenAI的文生视频工具Sora会如何改变科学——以及社会》的文章,作者为乔纳森·奥卡拉汉,内

  • “类脑”无线网络可处理数千微芯片数据

    美国布朗大学研究团队在最新一期《自然·电子学》上描述了一种无线通信网络。它可有效地传输、接收和解码来自数千个微电子芯片的数据。研究

  • 专家:警惕常见睡眠认知误区

    3月21日是世界睡眠日,中国主题为“健康睡眠 人人共享”。近日发布的《2023年中国居民睡眠白皮书》显示,我国居民平均睡眠时长6.75小时,平均在零点后入

  • 新型催化剂为国内柴油发动机尾气氮氧化物处理补短板

    记者3月19日从天津大学获悉,该校环境学院刘庆岭教授团队与吉林大学于吉红院士团队以及天津工业大学梅东海教授团队合作,证明了无有机模板剂合成的具

  • AI+智能家居赋能健康睡眠

    3月21日是第二十五个“世界睡眠日”,中国睡眠研究会联合慕思集团在北京正式发布《2024情绪与健康睡眠白皮书》(以下简称《白皮书》)。《白皮书》指出,

  • 探索土卫二的蛇形机器人问世

    美国加州理工学院喷气推进实验室的一个机器人专家团队,与卡内基梅隆大学机器人研究所科学家合作,开发出一种蛇形机器人,用于调查土星第六大卫星土卫二

  • GPU持续升级 如何应对算力“贫富差距”

    英伟达的GPU又升级了。3月19日,英伟达CEO黄仁勋发布了最新的B200算力芯片GPU,FP8精度下的训练性能是上一代的2.5倍,FP4精度下的推理性能更是达到了上

  • iPhone可能在国内设备使用百度AI技术:集成于iOS 18

    有消息称,iPhone在中国寻找本土生成式AI提供方,iPhone讨论了在中国的设备中使用百度的人工智能技术。据《华尔街日报》报道,iPhone与百度进行了谈判,以授权

  • 英媒:人工智能助力抗体设计

    据英国《自然》周刊网站3月19日报道,研究人员首次利用生成式人工智能(AI)制造出全新抗体。报道称,本周生物学预印本资料库中的一份预印本报告的原理验

推荐资讯

  • 日榜
  • 周榜
  • 月榜