基于大语言模型和数据增强的通感隐喻分析
盛坤王中卿
苏州大学计算机科学与技术学院
摘要:中文通感隐喻分析任务是隐喻领域的一个特定细分任务。由于通感语料中感觉词的分布不均匀,中文通感隐喻数据集存在数据稀疏的问题。为解决这一问题,利用真实训练数据中的稀疏感觉词数据作为提示,并使用大语言模型生成额外的合成样本进行数据增强。为避免合成数据的引入造成的额外噪声影响模型性能,构建基于大语言模型的数据增强框架,并采用评分机制和标签误差优化机制减小合成数据和真实数据之间的分布差异。实验结果表明,所提框架可以生成高质量的合成数据来扩充数据集,在感觉词抽取和感觉领域分类任务上的总体F1值达到68.5%,比仅使用真实训练数据的基线模型T5(Text-To-Text Transfer Transformer)提升了2.7个百分点。
- 专辑:
电子技术及信息科学
- 专题:
计算机软件及计算机应用; 自动化技术
- 分类号:
TP391.1;TP18
引文网络
相关推荐
- 相似文献
- 读者推荐
- 关联作者
- [1]基于思维代码的大语言模型多工具协调调用提示方法[J]. 江志英,黄震宇,宋晨炜,张泽宇,韩众和,谷伟伟,龚启航,刘思叶,赵妍. 北京化工大学学报(自然科学版).
- [2]面向大语言模型的知识实践[J]. 吴冠军. 人民论坛·学术前沿. 2023(21)
- [3]大型语言模型:原理、实现与发展[J]. 舒文韬,李睿潇,孙天祥,黄萱菁,邱锡鹏. 计算机研究与发展. 2024(02)
- [4]针对大语言模型的偏见性研究综述[J]. 徐磊,胡亚豪,潘志松. 计算机应用研究. 2024(10)
- [5]面向高校图书馆智慧服务的大语言模型探索性研究——以命名实体识别任务为例[J]. 刘思得,李东升. 现代情报. 2024(12)
- [6]大语言模型在无锚题等值中的应用——以阅读素养测评为例[J]. 杜君磊,郑勤华,宋义深. 武汉大学学报(理学版).
- [7]基于大语言模型的语料库查询自动生成方法[J]. 张成辉,罗景,涂新辉,陈雨霖. 计算机工程.
- [8]基于大语言模型的人文社会科学汉英机器翻译研究[J]. 孙光耀,赵志枭,沈思,王东波. 数据分析与知识发现.
- [9]基于译文易错词纠正机制的大语言模型机器翻译[J]. 李博,季佰军,段湘煜. 计算机工程.
- [10]基于大语言模型微调的少样本方面级情感分析研究[J]. 朱侯,谭雅文,魏文韬. 现代情报.