文献知网节
(录用定稿)网络首发时间:2024-11-05 10:45:23

基于大语言模型的人文社会科学汉英机器翻译研究

孙光耀赵志枭沈思王东波

db.wang@njau.edu.cn

  南京农业大学信息管理学院    南京农业大学人文与社会计算研究中心    南京理工大学经济管理学院  

摘要:[目的]聚焦于人文社会科学领域,优化大语言模型在机器翻译中的实际应用价值。[方法]采用术语特征提取、数据扩充和指令微调的方法,选取Baichuan2-13B-Base和Qwen-14B作为基线模型,进行翻译效果评估实验。[结果]实验结果表明,大语言模型较之神经机器翻译模型显著优势,通过指令微调的方法将这个优势进一步扩大,微调模型比基线模型平均输出时间减少60%,指标表现高出1-9个百分点,且英译汉翻译任务较之汉译英翻译任务的大语言模型翻译指标增量大3-5倍。[局限]本研究主要处理蕴含深厚学科背景和社会文化信息的术语概念,未对人文社会科学领域的不同数据来源展开细分研究。[结论]本研究为优化大语言模型在专业领域上的应用提供了重要参考,也对促进跨语言文化交流起到重要推动作用。 
  • 专辑:

    电子技术及信息科学

  • 专题:

    计算机软件及计算机应用; 自动化技术

  • 分类号:

    TP391.2;TP18

中国知网独家网络首发,未经许可,禁止转载、摘编。

下载手机APP用APP扫此码同步阅读该篇文章

温馨提示:阅读CAJ格式原文,请使用CAJ浏览器

下载:2092 页数:18 大小:739K

相关推荐
  • 相似文献
  • 读者推荐
  • 相关法规
  • 关联作者