文献知网节
(录用定稿)网络首发时间:2024-11-14 08:25:26

基于译文易错词纠正机制的大语言模型机器翻译

李博季佰军段湘煜

xiangyuduan@suda.edu.cn

  苏州大学计算机科学与技术学院  

摘要:大语言模型在机器翻译任务中已经展现出一定水平,通过提供翻译提示,模型能够生成译文。然而,受预训练语料质量和语言分布的限制,大语言模型生成的译文仍存在一些低质量翻译问题,如错译、漏译、幻觉和脱靶翻译等。为了减少大语言模型的低质量翻译,作者提出了译文易错词纠正机制的方法。首先使用原始训练集的模型译文和参考译文定义大语言模型在特定语向的译文易错词,然后根据译文中的易错词及其纠正词构建易错词纠正数据集,利用易错词纠正数据集微调另外一个小型预训练模型得到纠正模型。在推理阶段,使用纠正模型对大语言模型译文中的易错词进行纠正,纠正后再由大语言模型完成自回归解码,最终得到更高质量的译文。实验采用Llama2-7B模型,在WMT2022测试集的中?英、德?英和俄?英六个语向进行了验证。结果显示,与未经纠正的译文相比,X-英翻译语向的平均COMET和平均BLEU分别提高了1.87分和1.26分,英-X语向的平均COMET和平均BLEU分别提高了8.79分和7.67分,实验证明了易错词纠正机制能够有效提高文本翻译质量。 
  • DOI:

    10.19678/j.issn.1000-3428.0069767

  • 专辑:

    电子技术及信息科学

  • 专题:

    计算机软件及计算机应用; 自动化技术

  • 分类号:

    TP391.2;TP18

中国知网独家网络首发,未经许可,禁止转载、摘编。

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示:阅读CAJ格式原文,请使用CAJ浏览器

下载:645 页数:13 大小:970K

相关推荐
  • 相似文献
  • 读者推荐
  • 相关法规
  • 关联作者