Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

历史信息学
正确的文章链接:

二十世纪初国家杜马逐字报告索引结构的动态:基于XML标记的文本语料库分析

Povroznik Nadezhda

博士学位 历史



614990, Russia, Permskii krai, g. Perm', ul. Bukireva, 15

povroznik.ng@gmail.com

DOI:

10.7256/2585-7797.2018.4.28053

评审日期

18-11-2018


出版日期

07-01-2019


注解: 该研究的主题是二十世纪初国家杜马会议逐字报告的个人字母索引。 个人字母索引对逐字报告的重要性在于,其内容以尽可能结构化的方式反映了杜马每个副手的活动,这使得可以在定量和定性方面评估议员的活动。 这篇文章追踪了发表关于议员个人特征和活动的资料的方法的变化,审查了资料来源的结构和内容的动态。 研究方法是基于XML标记技术对历史文本语料库的分析。 为了解决研究任务,专门开发和应用了索引文本的XML标记方案,其中提供了标签结构,用于描述源源元数据的主要参数,代表的个人特征以及俄罗斯议会i-IV会议期间代表的活动类型。 对标记标签的分析使我们能够提供代表活动描述的详细程度,以及所提供数据结构的变化,以识别来源中不断显示的代表信息和不同会议索引中变化的信息。 这项研究的结果使我们能够评估来源在其动态中的信息潜力,将来用成绩单中的信息填充数据的不完整性,以及分析标签的嵌套,以便根据活动特征对代表进行分类。


出版日期:

指标, 逐字报告, 国家杜马, XML标记, 历史建筑, 源结构, 代表的活动, XSD架构, 内容分析, 议会