文玉锋, 林伟杰, 夏翠娟, 周文杰
图书馆论坛. 2025, 45(8): 52-60.
古籍文献是中华优秀传统文化的重要载体,对其内容结构进行有效揭示具有重要意义。大语言模型为古籍文献的“活化”提供了技术潜力,但其能力需通过科学严谨的测评加以验证。文章选取豆包、DeepSeek等14种大语言模型,以2022-2024年高考语文试卷文言文题目为语料,对古籍文献基础智能处理能力进行测评。由于知识图谱构建受基础能力的影响,基于测评结果,选择排名靠前的豆包和DeepSeek,以《史记·朝鲜列传》为语料,对两个大模型在知识图谱构建的信度、效度方面进行测评。研究发现,大语言模型具备基本古籍文献内容理解的能力,综合断句、逻辑判断、翻译和总结归纳四个维度,豆包与DeepSeek表现较为突出;豆包和DeepSeek的古籍文献知识图谱构建信效度检验结果显示,豆包大模型表现更优。