李佳斌, 魏庭新, 曲维光, 李斌, 冯敏萱, 王东波
图书馆论坛. 2025, 45(3): 99-109.
古诗中典故、意象、专名等具有高语义复杂度的组块桎梏大众对古诗的语义理解。文章对古诗中的复杂语义组块进行梳理并分类;借助大语言模型的文本处理与信息抽取能力,对搜集到的各类词典知识进行整合处理,构建用于古诗笺注的知识库,并在古诗自动笺注和翻译任务中进行验证与应用。实验结果显示,构建的笺注知识库在古诗的五个关键组块笺注任务上,宏平均F1值达93.90%,优于现有的笺注方案。利用知识库再次预训练得到的古诗领域语言模型AnnoKB_GLM,在古诗机器翻译任务上的性能超越现有现代汉语通用大语言模型和古籍文本基座模型,验证了该笺注知识库的实用价值。