Рус Eng Cn 翻译此页面:
请选择您的语言来翻译文章


您可以关闭窗口不翻译
图书馆
你的个人资料

返回内容

利特拉
正确的文章链接:

契诃夫数字项目:实现文本语义标记的任务和问题(以契诃夫的故事"官员之死"为例)

Severina Elena Mikhailovna

ORCID: 0000-0001-6518-2771

博士 哲学

南方联邦大学语文学、新闻与跨文化传播研究所教授

344006, Russia, Rostov-on-Don, Universitetskiy, 93

emkovalenko@sfedu.ru
Larionova Marina Chengarovna

ORCID: 0000-0002-2955-2621

博士 语言学



344006, Russia, Rostov-On-Don, 41 Chekhov str.

chengarovna@yandex.ru

DOI:

10.25136/2409-8698.2023.10.68862

EDN:

IHSMSE

评审日期

30-10-2023


出版日期

06-11-2023


注解: 本文考虑了契诃夫数字项目的机器可读(语义)文本标记的编写模型,以契诃夫的故事"官员之死"的个别重要元素的语言学解释为例,并根据数字出版物文本编码倡议(TEI/XML)的标准明确呈现这些信息。 已经确定了重要的实体来标记作者文本的语料库,但它们在文本中的代表性问题仍然相当复杂。 从TEI标记功能的角度对契诃夫的故事摘录中的"属性,状态和事件;字符特征"等方面进行了语言学检查,以机器可读格式保存语言学知识。 契诃夫数字项目的目标之一是超越简单的数字化文本,为研究人员提供有用的数字工具。 提出了机器可读标记的元素,使契诃夫文本中的重要实体能够通过作者文本的语料库组织语义搜索,并考虑了由于需要结合不同知识领域的专家的努力而在实施此类跨学科项目过程中出现的问题和研究任务。 该项目实施了开放研究数据的原则,其中最重要的任务是围绕数据创建科学社区。 该项目的工作促成了高等经济学院,UNC RAS和SFU研究人员之间的科学合作。


出版日期:

契诃夫数码计划, 数码版, 契诃夫, 语文考试, TEI, 机器可读标记, 语义搜索, 专家标记, 作者的技术, 自动文本处理