设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

“复旦·眸思”助力视障者“看见”世界

发布时间: 来源: 复旦大学

 VFr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

日前,基于多模态大模型“复旦·眸思”(MouSi),复旦大学自然语言处理实验室(FudanNLP)为视障者量身打造的“听见世界”APP上线,将成为视障人士的生活助手与智能管家。

“眸思”与复旦自然语言处理实验室开发的MOSS同音,但和基于文本的MOSS不同,它能够理解并识别图片内容,致力于成为视障者的一双“眸”。
VFr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

团队从基于GPT3.5的文本模型转向围绕GPT4-v复现多模态大模型,对模型中的核心关键点开展研究,致力于提升单项任务的准确率和大模型的强化学习。在基于几亿张图片训练出的“眸思”大模型基础上,针对视障者提出的各类需求,团队使用上万张图片进行特殊样本训练,使“眸思”具备能够适配更多场景的能力。VFr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据了解,基于“眸思”的“听见世界”APP针对视障者日常生活需求,设计了3种模式:街道行走模式,“眸思”可以细致扫描道路情况并提示潜在风险,陪伴视障者安全通行;自由问答模式,不论是博物馆、艺术馆,还是公园,“眸思”能够捕捉四周景象的每个细节,用声音构建丰富的生活场景。VFr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

预计今年3月,“听见世界”APP将完成第一轮测试,在我国一、二线城市和地区同步开启试点,根据算力部署情况进行推广。更多模式也正在开发中,比如阅读模式,服务盲人朋友点菜、读书等场景,解说模式,承担无障碍电影解说员的工作。VFr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

图片均来源于计算机科学技术学院

今年上半年,团队将结合AR升级APP内的定位精度细化至亚米级别;下半年,团队希望将“眸思”升级到基于视频的判断。复旦大学自然语言实验室教授张奇表示:“人工智能发展日新月异,科技应该要改变更多人的生活,希望‘眸思’能够帮助视障人士走出家门,让他们可以尝试更多工作,为人生书写更多可能。”VFr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

12月13-14日,第15届中美绿色能源论坛在南京召开。论坛由中国电机工程学会、美中绿色能源促进会主办,以“碳中和实现路径与 12月16日,2023第二届可持续能源发展国际会议在北京开幕。此次会议以“零碳科技、创新未来”为主题,汇聚了来自全球多 近日发表于《睡眠医学》的一项研究表明,“夜猫子”动脉钙化的概率几乎是“早起鸟”的两倍。在心血管疾病的早期阶段, 科技日报北京12月29日电 (记者张佳欣)向人体运送药物的主要挑战是能不断将药物准确送达病灶位置,同时确保它们留在病灶 上海海事大学近日召开干部大会,宣读市委决定:初北平同志任上海海事大学党委副书记、校长。上海海事大学官网 图 2024年1 河南省科学技术厅关于2024年度河南省国际科技合作项目拟立项项目的公示 根据《河南省科技计划项目管理办法(试行)》 。

本文链接:“复旦·眸思”助力视障者“看见”世界http://www.sushuapos.com/show-11-3447-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 上海天文台牵头公布哈勃望远镜最深窄带巡天数据

下一篇: 微塑料多样性影响微生物网络复杂度和稳定性

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜