设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

学者开源物理传热启发的视觉表征模型vHeat

2024-06-17 08:43:35 来源: 中国科学报

 vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

近日,鹏城实验室网络智能研究部视觉智能研究所与中国科学院大学电子电气与通信工程学院共同合作,分别在GitHub和OpenI启智社区开源了物理传热启发的高效视觉表征模型vHeat。vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  ?vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

vHeat与ViT核心算子计算复杂度对比。研究团队供图
vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究团队认为,CNN和ViT的卷积算子与自注意力算子都是特征内部的像素传播过程,分别是一种信息传递的形式,从而联想到物理领域的热传导,因此提出了基于热传导的视觉表征模型vHeat。vHeat将图片特征块视为热源,通过预测热扩散率,以物理学热传导原理来提取图像特征。vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

相比基于Attention机制的视觉模型,vHeat同时兼顾了低计算复杂度、全局感受野、物理可解释性等特性,计算复杂度降低为1.5次方。vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  ?vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

HCO与HCO Layer示意图。研究团队供图
vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究团队根据热传导方程,将视觉语义的空间传播和物理热传导建立联系,根据傅里叶变换求得通解,并依据通解进行离散化和通道维度扩展,提出了一种1.5次方计算复杂度的视觉热传导算子(Heat Conduction Operator,HCO)。vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,团队认为不同图像内容对应不同的热扩散率,提出了频率值编码(Frequency Value Embeddings,FVEs)来表示频率信息,并采用FVEs来预测热扩散率,使得HCO可进行非均匀、自适应的传导。vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  ?vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

用FVEs预测热扩散率,形成非均匀、自适应的传导。研究团队供图
vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

实验证明,vHeat在各种视觉任务中表现优秀。例如vHeat-T在ImageNet-1K上分类准确率达到82.2%,比Swin-T高0.9%,比Vim-S高1.7%。除性能优势之外,vHeat还拥有高推理速度、低GPU显存占用和低FLOPs等优点。在输入图像分辨率较高时,相比于Swin,base规模的vHeat模型达到3倍吞吐量,同时GPU显存占用为其1/4倍,FLOPs为其3/4倍。vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

vHeat这一创新性研究成果为视觉模型的发展提供了新的方向和思路。未来,研究团队将继续推进新型视觉模型研究,为模型在各行业、多领域的人工智能发展和应用贡献力量。vad速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:学者开源物理传热启发的视觉表征模型vHeathttp://www.sushuapos.com/show-11-7236-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 研究揭示口孵鱼类亲代抚育行为的遗传调控机制

下一篇: 外来入侵植物资源化利用研究获进展

热门资讯

推荐资讯

    SQL Error: select * from ***_ecms_news11 where id in(174,139,68,209,,118,85,233,39,228,201,204) limit 12
  • 日榜
  • 周榜
  • 月榜