历史信息学
正确的文章链接:
Lyagushkina, L. (2022). 用支持向量法对苏联被压抑者的社会地位进行分类的经验. 历史信息学, 1, 128–139. https://doi.org/10.7256/2585-7797.2022.1.37719
图书馆
|
你的个人资料 |
历史信息学
正确的文章链接:
Lyagushkina, L. (2022). 用支持向量法对苏联被压抑者的社会地位进行分类的经验. 历史信息学, 1, 128–139. https://doi.org/10.7256/2585-7797.2022.1.37719
用支持向量法对苏联被压抑者的社会地位进行分类的经验
DOI: 10.7256/2585-7797.2022.1.37719评审日期 20-03-2022出版日期 11-05-2022注解: 文章讨论了历史研究中职业分类的各种方法数据库"苏联政治恐怖受害者"的例子,由历史和教育协会"纪念馆"开发(承认为外国代理人并由法院判决清算)。 有必要总结被压抑者的职业和职业的分散数据。 文章简要概述了以前解决这个问题的方法:从手动将被压抑者的某些职业和职业归因于苏联1930中存在的不同社会群体,到全自动聚类。 接下来,提出了一种新的方法:应用机器学习"与老师"进行分类:使用先前研究框架内已经分成小组的记录来训练算法和随后的自动标记。 测试的方法中最好的是支持向量方法,它在测试样本上显示出95%的准确性。 考虑了这种分类的优点和局限性,其中主要的是一些社会群体系统地定义更差。 尽管如此,这种技术的使用使得能够以极快的速度从数据库中标记350千条新记录。 基于历史学家处理的"训练"数据的标记似乎是历史信息学的一个有希望的方法学方向。 出版日期: 历史数据库, 数据标记, 历史计算机科学, 国内历史, 苏联, 机器学习, 斯大林主义, 支持向量的方法, 政治镇压, 数据分类 |