美国纽约大学研究人员开展了一项实验,他们通过一个孩子的眼睛和耳朵来训练多模式人工智能(AI)系统,使用的数据来自孩子6个月大到两岁生日期间的头戴摄像头的视频记录。发表在最新一期《科学》杂志上的这项研究表明,该模型或神经网络实际上可利用孩子经历的有限片段,学习大量的单词和概念。也就是说,视频只捕捉了孩子大约1%的清醒时间,但这对于真正的语言学习来说已经足够。
GPT-4等AI系统现在可学习和使用人类语言,但它们从海量的语言输入中学习,远比儿童在学习如何理解和表达语言时接受的要多。最好的AI系统训练的文本数量达到数万亿字,而儿童每年只能收到数百万字的文本。
由于数据存在巨大差距,研究人员一直怀疑AI的最新进展能否反映出很多有关人类学习和发展的信息。此次,研究团队从孩子6个月大开始,到25个月大结束,每周通过头戴式摄像机,捕获其第一视角视频并分析。他们共使用了超过60小时的视频素材,包含大约25万个单词实例(即所传达的单词数量,其中许多是重复的)。这些单词实例与孩子在说出这些单词时所看到的视频帧相关联,包括进餐、读书和玩耍等各种不同的活动。
经过训练后,团队对模型进行了测试。他们向模型提供目标单词和四个不同的图像,要求它选择与目标单词匹配的答案。结果表明,该模型不但能够学习孩子日常经历中存在的大量单词和概念,还可以将它们概括为视觉实例,哪怕实例与模型训练中看到的完全不同。
美国纽约大学研究人员开展了一项实验,他们通过一个孩子的眼睛和耳朵来训练多模式人工智能(AI)系统,使用的数据来自孩子6个月大到两岁生日期间的头戴摄像头的视频记录。发表在最新一期《科学》杂志上的这项研究表明,该模型或神经网络实际上可利用孩子经历的有限片段,学习大量的单词和概念。也就是说,视频只捕捉了孩子大约1%的清醒时间,但这对于真正的语言学习来说已经足够。
GPT-4等AI系统现在可学习和使用人类语言,但它们从海量的语言输入中学习,远比儿童在学习如何理解和表达语言时接受的要多。最好的AI系统训练的文本数量达到数万亿字,而儿童每年只能收到数百万字的文本。
由于数据存在巨大差距,研究人员一直怀疑AI的最新进展能否反映出很多有关人类学习和发展的信息。此次,研究团队从孩子6个月大开始,到25个月大结束,每周通过头戴式摄像机,捕获其第一视角视频并分析。他们共使用了超过60小时的视频素材,包含大约25万个单词实例(即所传达的单词数量,其中许多是重复的)。这些单词实例与孩子在说出这些单词时所看到的视频帧相关联,包括进餐、读书和玩耍等各种不同的活动。
经过训练后,团队对模型进行了测试。他们向模型提供目标单词和四个不同的图像,要求它选择与目标单词匹配的答案。结果表明,该模型不但能够学习孩子日常经历中存在的大量单词和概念,还可以将它们概括为视觉实例,哪怕实例与模型训练中看到的完全不同。
美国太平洋西北国家实验室的科学家设计了一种复合装饰材料,可以储存更多二氧化碳,提供了一种既符合建筑规范,又比标准复合饰面板便宜的“负碳”选择。研究人员于18日在美国化学会春季会议上公布 记者3月21日从中国科学技术大学获悉,该校物理学院张斗国教授课题组,提出并实现了一种基于矢量光场调控原理的动量空间偏振滤波器件。该滤波器件安装于传统无标记光学显微镜后,可采集到单个纳米 3月22日消息,中国互联网络信息中心(CNNIC)今天发布了《中国互联网络变化状况计算报告》。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12月新增网民2480万人,互联网普及率达77.5%。截 有消息称,iPhone在中国寻找本土生成式AI提供方,iPhone讨论了在中国的设备中使用百度的人工智能技术。据《华尔街日报》报道,iPhone与百度进行了谈判,以授权其型号。这可能是为了向中国的iPhone客户提 3月23日消息,vivo X Fold3系列将于3月26日正式发布,成为全球首款骁龙8 Gen3折叠屏电话。现在这款新机外观已经解禁,下面为大家带来图赏。vivo X Fold3提供了薄翼黑和轻羽白两种配色,后壳手感顺滑,触感 “人工智能作为数字新基建重点建设方向,前景广阔,大有作为。今年的政府工作报告更首次提出开展‘人工智能+’行动,无疑将为人工智能技术在国内各行各业的广泛应用开启新篇章。”3月22 。
本文链接:AI通过儿童眼睛和耳朵学习语言http://www.sushuapos.com/show-2-2668-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 首张人类细胞微管形成高清图绘出
下一篇: 压缩膨胀一体机样机研制成功