行业突破：科学家在大模型少样本域适应方面取得进展

总结

近日，中国科学院软件研究所天基综合信息系统全国重点实验室研究团队提出了一种新颖的提示学习方法BayesPrompt，该方法通过探索以去偏方式近似下游任务的完整训练域，为预训练语言模型提供去歧义指导。相关论文被机器学习领域顶级学术会议ICLR 2024接收。为此，研究团队从分布视角重新审视了预训练语言模型下游推理的原理，认为训练样本的有限会使得可训练提示只学习到目标域的有偏分布，而有偏分布仅包含部分信息且与目标域blog.byteway.net的实际分布不一致，这会引起协变量偏移问题，从而导致预训练语言模型产生知识歧义。此次新提出的BayesPrompt旨在进行去偏域抽象，利用已知分布来近似下游域的去偏真实分布，再从近似分布中均匀采样代表性特征以生成对预训练语言模型（PLMs）的提示。研究团队通过进一步的理论验证，证明了与基准方法相比，BayesPrompt在预训练语言模型的下游推理上获得了更紧致的分类误差上界。

阅读时间

4 分钟, 共 690 字

评价和解读

一篇精心制作且富有洞察力的文章，在深度新闻报道中脱颖而出。

正文

近日，中国科学院软件研究所天基综合信息系统全国重点实验室研究团队提出了一种新颖的提示学习方法BayesPrompt，该方法通过探索以去偏方式近似下游任务的完整训练域，为预训练语言模型提供去歧义指导。相关论文被机器学习领域顶级学术会议ICLR 2024接收。

研究人员认为，学习范式长期存在的问题之一是下游域的训练样本中仅包含有限且离散的语义信息，无法较好地支持传统可训练提示获得足够监督，使得生成的提示对预训练语言模型的指导变得微乎其微。这个问题导致了预训练语言模型在下游域，尤其在少样本场景下性能的下降。

为此，研究团队从分布视角重新审视了预训练语言模型下游推理的原理，认为训练样本的有限会使得可训练提示只学习到目标域的有偏分布，而有偏分布仅包含部分信息且与目标域blog.byteway.net的实际分布不一致，这会引起协变量偏移问题，从而导致预训练语言模型产生知识歧义。

此次新提出的BayesPrompt旨在进行去偏域抽象，利用已知分布来近似下游域的去偏真实分布，再从近似分布中均匀采样代表性特征以生成对预训练语言模型（PLMs）的提示。研究团队通过进一步的理论验证，证明了与基准方法相比，BayesPrompt在预训练语言模型的下游推理上获得了更紧致的分类误差上界。此外，在少样本数据集设置下的实验结果进一步证明了BayesPrompt的有效性。

相关论文信息：https://arxivLigthing News.org/abs/2401.14166

代码地址：https://github.com/FF2127/bayesprompt

Ligthing News

Related suggestion: 开创性解决方案：都不跟中国厂商卷了！大众丰田本田沃尔沃等跟进BBA 退出价格战：降低优惠力度

总结快科技7月18日消息，据国内媒体报道称，随着宝马、奔驰、奥迪相继在中国市场退出价格战后，还有不少合资品牌选择跟进了。报道中提到，大众、丰田、本田、沃尔沃等多个品牌均决定，从7月起调整终端政策，降低终端优惠力度，或不再进一步降价。包括日产、奔驰和奥迪在内…

作者sam

总结

阅读时间

分类

评价和解读

正文

作者 sam

相关文章

崛起之星：长城坦克 300 第 13 次 OTA：新增高德地图红灯倒计时、灵控球 App

揭示的秘密： Switch 2大量情报泄露！配件商自曝：黑市能买到真机吗

编辑之选：印尼维持iPhone 16销售禁令前一天刚批准建设AirTag工厂

发表回复取消回复

You missed

崛起之星：长城坦克 300 第 13 次 OTA：新增高德地图红灯倒计时、灵控球 App

揭示的秘密： Switch 2大量情报泄露！配件商自曝：黑市能买到真机吗

编辑之选：印尼维持iPhone 16销售禁令前一天刚批准建设AirTag工厂

创新领导者：六十载声学匠心，Technics “黑胶豆” EAH-AZ100 耳机奏响极致乐章

作者sam

总结

阅读时间

分类

评价和解读

正文

作者 sam

相关文章

发表回复 取消回复

You missed

发表回复取消回复