基于译文易错词纠正机制的大语言模型机器翻译
李博季佰军段湘煜
苏州大学计算机科学与技术学院
摘要:大语言模型在机器翻译任务中已经展现出一定水平,通过提供翻译提示,模型能够生成译文。然而,受预训练语料质量和语言分布的限制,大语言模型生成的译文仍存在一些低质量翻译问题,如错译、漏译、幻觉和脱靶翻译等。为了减少大语言模型的低质量翻译,作者提出了译文易错词纠正机制的方法。首先使用原始训练集的模型译文和参考译文定义大语言模型在特定语向的译文易错词,然后根据译文中的易错词及其纠正词构建易错词纠正数据集,利用易错词纠正数据集微调另外一个小型预训练模型得到纠正模型。在推理阶段,使用纠正模型对大语言模型译文中的易错词进行纠正,纠正后再由大语言模型完成自回归解码,最终得到更高质量的译文。实验采用Llama2-7B模型,在WMT2022测试集的中?英、德?英和俄?英六个语向进行了验证。结果显示,与未经纠正的译文相比,X-英翻译语向的平均COMET和平均BLEU分别提高了1.87分和1.26分,英-X语向的平均COMET和平均BLEU分别提高了8.79分和7.67分,实验证明了易错词纠正机制能够有效提高文本翻译质量。
- DOI:
10.19678/j.issn.1000-3428.0069767
- 专辑:
电子技术及信息科学
- 专题:
计算机软件及计算机应用; 自动化技术
- 分类号:
TP391.2;TP18
中国知网独家网络首发,未经许可,禁止转载、摘编。
引文网络
相关推荐
- 相似文献
- 读者推荐
- 关联作者
- [1]基于大语言模型的人文社会科学汉英机器翻译研究[J]. 孙光耀,赵志枭,沈思,王东波. 数据分析与知识发现.
- [2]大语言模型在无锚题等值中的应用——以阅读素养测评为例[J]. 杜君磊,郑勤华,宋义深. 武汉大学学报(理学版).
- [3]基于大语言模型的语料库查询自动生成方法[J]. 张成辉,罗景,涂新辉,陈雨霖. 计算机工程.
- [4]基于思维代码的大语言模型多工具协调调用提示方法[J]. 江志英,黄震宇,宋晨炜,张泽宇,韩众和,谷伟伟,龚启航,刘思叶,赵妍. 北京化工大学学报(自然科学版).
- [5]基于大语言模型微调的少样本方面级情感分析研究[J]. 朱侯,谭雅文,魏文韬. 现代情报.
- [6]大语言模型的偏见挑战:识别、评估与去偏[J]. 徐月梅,叶宇齐,何雪怡. 计算机应用.
- [7]基于大语言模型和事件融合的电信诈骗事件风险分析[J]. 斯彬洲,孙海春,吴越. 数据分析与知识发现.
- [8]面向闭源大语言模型的增强研究综述[J]. 刘华玲,张子龙,彭宏帅. 计算机科学与探索.
- [9]大语言模型赋能“问题与方法”学术图谱构建与应用研究[J]. 刘启刚,王尹凡,牟立峰,徐伟,孙向阳. 数据分析与知识发现.
- [10]基于大语言模型的开源情报摘要生成研究[J]. 汪伦,艾斯卡尔·艾木都拉,张华平,耿国桐,吕雁飞,雷帅. 情报理论与实践.