基于大语言模型的语料库查询自动生成方法
张成辉罗景涂新辉陈雨霖
武汉科技大学计算机科学与技术学院 智能信息处理与实时工业系统湖北省重点实验室 华中师范大学计算机学院
摘要:语料库查询语言(Corpus Query Language,CQL)是一种用于在语料库中进行检索和分析的查询语言,自然语言自动生成CQL指将用户以自然语言表达的查询需求自动转换为标准的CQL语句,从而大大降低了用户使用语料库的门槛。虽然大语言模型可以较好的完成自然语言生成任务,但是在CQL生成任务中效果还不是很理想。为此,提出一种基于大语言模型上下文学习的语料库查询自动生成方法T2CQL。首先,基于CQL的编写规则总结出一套简洁全面的Text-to-CQL语法知识,作为大语言模型实现Text-to-CQL的自动转换的基础,以弥补大语言模型在此领域知识储备的不足。然后,基于选定的嵌入模型,选取与当前自然语言查询最接近的前k个Text-CQL样本对,以帮助大语言模型理解语法知识并作为参照。最后, 采用生成结果校准策略来减轻大语言模型在生成CQL时的偏差,通过校准模型偏差以提升模型生成CQL的性能。实验使用多个大语言模型在包含1177条数据的测试集上进行测试。实验结果表明,T2CQL方法显著提升了大语言模型在完成Text-to-CQL自动转换任务时的性能,最优的EX达到了85.13%。
- DOI:
10.19678/j.issn.1000-3428.0070118
- 专辑:
电子技术及信息科学
- 专题:
计算机软件及计算机应用; 自动化技术
- 分类号:
TP18;TP391.1
中国知网独家网络首发,未经许可,禁止转载、摘编。
引文网络
相关推荐
- 相似文献
- 读者推荐
- 关联作者
- [1]大语言模型在无锚题等值中的应用——以阅读素养测评为例[J]. 杜君磊,郑勤华,宋义深. 武汉大学学报(理学版).
- [2]基于大语言模型的人文社会科学汉英机器翻译研究[J]. 孙光耀,赵志枭,沈思,王东波. 数据分析与知识发现.
- [3]基于译文易错词纠正机制的大语言模型机器翻译[J]. 李博,季佰军,段湘煜. 计算机工程.
- [4]基于思维代码的大语言模型多工具协调调用提示方法[J]. 江志英,黄震宇,宋晨炜,张泽宇,韩众和,谷伟伟,龚启航,刘思叶,赵妍. 北京化工大学学报(自然科学版).
- [5]基于大语言模型微调的少样本方面级情感分析研究[J]. 朱侯,谭雅文,魏文韬. 现代情报.
- [6]大语言模型的偏见挑战:识别、评估与去偏[J]. 徐月梅,叶宇齐,何雪怡. 计算机应用.
- [7]基于大语言模型和事件融合的电信诈骗事件风险分析[J]. 斯彬洲,孙海春,吴越. 数据分析与知识发现.
- [8]面向闭源大语言模型的增强研究综述[J]. 刘华玲,张子龙,彭宏帅. 计算机科学与探索.
- [9]大语言模型赋能“问题与方法”学术图谱构建与应用研究[J]. 刘启刚,王尹凡,牟立峰,徐伟,孙向阳. 数据分析与知识发现.
- [10]基于大语言模型的开源情报摘要生成研究[J]. 汪伦,艾斯卡尔·艾木都拉,张华平,耿国桐,吕雁飞,雷帅. 情报理论与实践.