Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

历史信息学
正确的文章链接:

超越主题建模:使用大型语言模型进行历史文本分析

Kuznetsov Alexey Valer'evich

ORCID: 0000-0003-4755-250X

博士学位 历史

俄罗斯科学院通史研究所研究员

119334, Russia, Moscow, Leninsky ave., 32 a, office 1426

kuznetsovaleks@rambler.ru

DOI:

10.7256/2585-7797.2024.4.72560

EDN:

UOIKPJ

评审日期

03-12-2024


出版日期

10-12-2024


注解: 本文致力于研究大型语言模型在历史文本专题分析中的潜力。 Vologda高中学生Kirill Antonovich Berezkin的日记,涵盖1月至9月1849期间,被选为该研究的材料。 这本日记是研究十九世纪中叶俄罗斯省一个年轻人的日常生活,世界观和社会交往的独特来源。 K.Berezkin的着作涵盖了广泛的主题,从研究和家庭关系到对政治,宗教,文学和艺术的反思。 日记的分析让你沉浸在时代的氛围中,了解一个年轻贵族在成年门槛上的价值观和愿望,以及在历史背景的影响下追踪他个性的形成。 该研究使用Gemini1.5Pro模型,该模型能够处理大量文本数据。 对日记的文本进行了整体分析,并按个别月份进行了分析,从而可以确定内容的具体方面。 该研究的新颖之处在于应用现代大型语言模型分析俄语历史文本。 结果表明,Gemini1.5Pro能够有效地突出日记中的关键主题,提供可解释的结果。 该模型成功地确定了八个主要主题,反映了高中生生活的各个方面。 并行提示与每月文本拆分的使用使得能够识别在分析全文时被忽略的更具体的主题和细微差别。 该研究证实了大型语言模型分析历史来源的有效性,为自动化主题建模过程和识别大量文本数据中的隐藏模式开辟了新的机会。 然而,大型语言模型的随机性需要对结果进行反复分析和仔细解释,以及与传统历史分析方法的数据进行批判性比较。


出版日期:

大型语言模型, 主题建模, 日记, 历史渊源, 文本分析, 十九世纪, 数字历史, 工业工程, 人工智能, K.A.别列兹金