词汇数据库是心理语言学和认知神经科学研究的重要基础工具。然而,现有的汉语词汇数据库主要来源于成人文本、儿童读物及动画等输入性材料,难以客观反映学前儿童在自然交流场景中能产出的词汇类型及表达特征。学前阶段是儿童词汇量快速增长的关键时期,但儿童的表达性词汇与理解性词汇在规模与分布上存在明显差异。因此,构建基于儿童真实口语表达产出的专门数据库,对于深入探讨儿童语言发展规律与认知机制具有重要价值。
近日,中国科学院心理研究所研究团队,发布了汉语学前儿童口语词汇数据库(CPCSLD)。该数据库基于北京地区648名3至6岁儿童,在同伴对话情境中的自发言语构建,语料涵盖旅行、玩具、图书、动画、机器人、游乐园等贴近儿童日常生活的主题。该语料库共包含约120万词次、21372个不同词条、1147个带声调音节及400个不带声调音节,并按幼儿园小班(K1)、中班(K2)及大班(K3)三个年龄段分别构建了对应的子数据库。
该数据库系统性提供了词汇和音节两个层面的多维信息,涵盖词频、词长、词类、音节频率(带声调/不带声调)等多种指标,可支撑对学前儿童口语词汇结构特征和发展变化规律的精细刻画。分析结果显示,随着儿童年龄增长,其自发言语中多音节词占比呈逐步上升趋势,词汇结构日趋复杂,且不同词类在儿童表达性语言中的分布也呈现出年龄相关性发展规律。
为检验该数据库的心理语言学效度,研究团队进一步将CPCSLD与多个已有的汉语词汇数据库开展对比分析,并将其应用于学前儿童在语义判断任务与图片命名任务表现的预测。结果表明,CPCSLD在预测儿童图片命名反应和正确率方面具有明显优势,其预测效果优于基于成人语料或输入性儿童语料构建的数据库;而在以词汇理解为主的语义判断任务中,其预测优势相对有限。上述结果表明,基于儿童自发言语构建的词汇数据库,更能捕捉学前儿童言语产生过程中的关键统计特征。
CPCSLD是首个专门面向汉语学前儿童表达性词汇、基于自然口语产出构建的汉语词汇数据库,为儿童语言发展与言语产生研究提供了新的工具。同时,该数据库可用于探讨学前儿童词汇与言语产生的发展机制,并可服务于儿童语言评估、语言障碍早期筛查及教育干预等研究,为探索儿童心理词汇表组织结构、发展轨迹以及其神经基础,提供了重要的数据支撑。
相关研究成果发表在《行为研究方法》(Behavior Research Methods)上。研究工作得到国家自然科学基金委员会、中国科学院的支持。
论文链接
词汇数据库的构建流程
词频和音节频率的分布
“未来,创新驱动至关重要,要结合基础与应用研究,利用前沿科技推动产业升级。”11月8日,中国工程院院士、大连工业大学教授朱 11月6日,教育部党组书记、部长怀进鹏调研中国石油大学(北京)、中央财经大学,了解学校服务国家战略、培养拔尖创新人才、科学研究、学科建设、国际交流合作等情况。他强调,高校要瞄准国家重大战略发展需求,提升人才自主 中国教育报-中国教育新闻网讯(特约通讯员 苏勤)日前,内蒙古通辽市确定科尔沁区为全市首批深化新时代教育评价改革试点地区,通辽市第一中学等22所学校(幼儿园)为全市首批深化新时代教育评价改革试点 中国教育报-中国教育新闻网讯(记者 陈朝和)11月6日—7日,由教育部幼儿园园长培训中心、四川省教师发展中心主办的教育部新时代“双名计划”何云竹·陈宴名园长工作室联合研修活动暨第四届全国幼 中国教育报-中国教育新闻网讯(记者 程墨 通讯员 田寿永 陈灏)近日,2024年世界职业院校技能大赛总决赛医药卫生赛道康复治疗技术小组争夺赛在湖北职院举行,来自全国29个省、自治区、直辖市的58支 中国教育报-中国教育新闻网讯(记者 冯丽)近日,2024年世界职业院校技能大赛争夺赛(高职组)短视频创作与运营赛项在陕西职业技术学院落幕。来自全国31个省市的61支参赛队经过激烈角逐,苏州工艺美术职 。本文链接:基于大规模自发言语的汉语学前儿童词汇数据库发布http://www.sushuapos.com/show-12-2576-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 加大民族地区国家通用语言文字推广力度集中调研座谈会召开
下一篇: 科学家提出构建双活性位点仿酶催化策略