科学家在大模型少样本域适应方面取得进展

发布时间: 2024-08-19 07:34:56 来源：中国科学报

观看：158

近日，中国科学院软件研究所天基综合信息系统全国重点实验室研究团队提出了一种新颖的提示学习方法BayesPrompt，该方法通过探索以去偏方式近似下游任务的完整训练域，为预训练语言模型提供去歧义指导。相关论文被机器学习领域顶级学术会议ICLR 2024接收。

研究人员认为，学习范式长期存在的问题之一是下游域的训练样本中仅包含有限且离散的语义信息，无法较好地支持传统可训练提示获得足够监督，使得生成的提示对预训练语言模型的指导变得微乎其微。这个问题导致了预训练语言模型在下游域，尤其在少样本场景下性能的下降。

为此，研究团队从分布视角重新审视了预训练语言模型下游推理的原理，认为训练样本的有限会使得可训练提示只学习到目标域的有偏分布，而有偏分布仅包含部分信息且与目标域的实际分布不一致，这会引起协变量偏移问题，从而导致预训练语言模型产生知识歧义。

此次新提出的BayesPrompt旨在进行去偏域抽象，利用已知分布来近似下游域的去偏真实分布，再从近似分布中均匀采样代表性特征以生成对预训练语言模型（PLMs）的提示。研究团队通过进一步的理论验证，证明了与基准方法相比，BayesPrompt在预训练语言模型的下游推理上获得了更紧致的分类误差上界。此外，在少样本数据集设置下的实验结果进一步证明了BayesPrompt的有效性。

相关论文信息：https://arxiv.org/abs/2401.14166

代码地址：https://github.com/FF2127/bayesprompt

12月16-17日，北京大学经济学院举办第六届“中国百所大学经济学院院长论坛”暨“首届孙尚清发展知识研究与交流奖颁奖典礼一年前，美国国家点火装置（NIF）产生了一种聚变反应，其释放的能量超过消耗的能量，这种现象被称为点火。今年，NIF通过一次又一次今天上午，中国首家公办本科职业学校——南京工业职业技术大学与柬埔寨柬华理事总会合作共建的柬华应用科技大学成立揭牌图为在上海科技创新成果展上拍摄的科学刊物展台。新华社记者方喆摄一直以来，学者们向学术期刊投稿面临着激烈竞近日，“张雪峰称文科都是服务业”这一词条引发网友关注与热议。此前，“考研名师”张雪峰还说过，即使把孩子打晕，也 12月16日，在2023开放原子开发者大会上，腾讯云宣布将企业级分布式数据库TDSQL的社区发行版OpenTenBase 捐赠给开放原子。

本文链接：科学家在大模型少样本域适应方面取得进展http://www.sushuapos.com/show-11-10092-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：机器翻译有“偏见”，如何检测发现？

下一篇：守护水塔：“一原两湖三江”重大标志性科考活动启动

科学家在大模型少样本域适应方面取得进展

热门资讯

推荐资讯

科学最热文章