计算机应用. 2025, 45 (03) 北大核心 CSCD

基于大语言模型和数据增强的通感隐喻分析

盛坤王中卿
Wangzq.antong@gmail.com

苏州大学计算机科学与技术学院

摘要：中文通感隐喻分析任务是隐喻领域的一个特定细分任务。由于通感语料中感觉词的分布不均匀，中文通感隐喻数据集存在数据稀疏的问题。为解决这一问题，利用真实训练数据中的稀疏感觉词数据作为提示，并使用大语言模型生成额外的合成样本进行数据增强。为避免合成数据的引入造成的额外噪声影响模型性能，构建基于大语言模型的数据增强框架，并采用评分机制和标签误差优化机制减小合成数据和真实数据之间的分布差异。实验结果表明，所提框架可以生成高质量的合成数据来扩充数据集，在感觉词抽取和感觉领域分类任务上的总体F1值达到68.5%，比仅使用真实训练数据的基线模型T5（Text-To-Text Transfer Transformer）提升了2.7个百分点。

关键词：

大语言模型; 数据增强; 通感隐喻; 数据稀疏; 数据合成;

专辑：
电子技术及信息科学
专题：
计算机软件及计算机应用; 自动化技术
分类号：
TP391.1;TP18

手机阅读

即刻使用手机阅读

第一步
扫描二维码下载

"移动知网-全球学术快报"客户端

第二步
打开“全球学术快报”

点击首页左上角的扫描图标

第三步
扫描二维码

手机同步阅读本篇文献
下载
- PDF
- CAJ
在线阅读
- HTML阅读
- 原版阅读
BETABETA英文HTML阅读（机翻）
AI辅助阅读

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示：阅读CAJ格式原文，请使用CAJ浏览器。

下载：380 页码：794-800 页数：7 大小：1550K

核心文献推荐

研究起点

因果关系
语言研究
心理因果性
第四范式
文献计量研究
本然性
数据密集型
前提性批判
“物”
ontological commitments

研究来源

前提性批判
理论意蕴
本体论承诺
隐喻研究

节点文献数据增强数据稀疏大语言模型通感隐喻数据合成隐喻分析

研究去脉

研究分支

引文网络

相关推荐

相似文献
读者推荐
相关法规
关联作者
批量下载

[1]基于思维代码的大语言模型多工具协调调用提示方法[J]. 江志英,黄震宇,宋晨炜,张泽宇,韩众和,谷伟伟,龚启航,刘思叶,赵妍. 北京化工大学学报(自然科学版).
[2]面向大语言模型的知识实践[J]. 吴冠军. 人民论坛·学术前沿. 2023(21)
[3]大型语言模型：原理、实现与发展[J]. 舒文韬,李睿潇,孙天祥,黄萱菁,邱锡鹏. 计算机研究与发展. 2024(02)
[4]针对大语言模型的偏见性研究综述[J]. 徐磊,胡亚豪,潘志松. 计算机应用研究. 2024(10)
[5]面向高校图书馆智慧服务的大语言模型探索性研究——以命名实体识别任务为例[J]. 刘思得,李东升. 现代情报. 2024(12)
[6]大语言模型在无锚题等值中的应用——以阅读素养测评为例[J]. 杜君磊,郑勤华,宋义深. 武汉大学学报(理学版).
[7]基于大语言模型的语料库查询自动生成方法[J]. 张成辉,罗景,涂新辉,陈雨霖. 计算机工程.
[8]基于大语言模型的人文社会科学汉英机器翻译研究[J]. 孙光耀,赵志枭,沈思,王东波. 数据分析与知识发现.
[9]基于译文易错词纠正机制的大语言模型机器翻译[J]. 李博,季佰军,段湘煜. 计算机工程.
[10]基于大语言模型微调的少样本方面级情感分析研究[J]. 朱侯,谭雅文,魏文韬. 现代情报.