文章的正确链接:
Северина Е.М., Фёдоров Н.А..
Проект Chekhov Digital: семантическая разметка параллельного корпуса переводов художественной прозы А. П. Чехова на немецкий язык
// Филология: научные исследования. – 2024. – № 4.
– 和。 73-82.
DOI: 10.7256/2454-0749.2024.4.70560.
DOI: 10.7256/2454-0749.2024.4.70560
阅读文章
注释,注释: В статье рассматриваются вопросы разработки принципов семантически размеченного параллельного корпуса переводов художественной прозы А.П. Чехова на немецкий язык в рамках проекта Chekhov Digital цифрового академического издания собрания произведений писателя в формате TEI (Text Encoding Initiative). Проект параллельного корпуса ориентирован на создание цифровой инфраструктуры для изучения произведений писателя, позволяющей исследователям анализировать и сравнивать оригинальные тексты с их переводами. Были выявлены сложности, связанные с интерпретацией значимых элементов произведений писателя, спецификой их перевода на немецкий язык и семантической разметкой переводов художественной прозы, например, возникли сложности с определением границ и связей между элементами семантической разметки. Предложены пути их преодоления, включая использование цифровых методов и технологий обработки естественного языка. В проекте используются цифровые методы и технологии обработки естественного языка, стандарт цифровой публикации Text Encoding Initiative (TEI). Структура разметки текстов, основанная на стандарте TEI, делает документы машиночитаемыми, что позволяет разрабатывать инструменты сложного семантического поиска информации. Включение в проект Chekhov Digital параллельных корпусов переводов произведений А. П. Чехова на разные языки позволяет расширить исследовательские инструменты в области переводоведения, давая возможность сравнивать тексты переводов и оригиналов, обнаруживать сходства и различия в лексике, грамматике, стиле и культурных отсылках, а также автоматизировать рутинные процессы исследования, что делает значительно более эффективным поиск и анализ информации на больших объемах текстов. Результаты проекта будут вносить вклад в развитие цифровой гуманитарной среды, способствуя сохранению и популяризации литературного наследия А.П. Чехова. Создание семантически размеченного параллельного корпуса переводов будет иметь важное значение для литературоведов, лингвистов и переводчиков, позволяя им изучать специфику переводов произведений Чехова и развивать новые формы анализа и интерпретации текстов. Опыт, полученный в ходе проекта, будет ценным для будущих исследований и практических применений, демонстрируя эффективность цифровых технологий в гуманитарных исследованиях и образовании.
关键词: цифровые технологии, семантический поиск, машиночитаемая разметка, Text Encoding Initiative, параллельные корпусы, Чехов, цифровое издание, проект Chekhov Digital, автоматическая обработка текста, парсинг
参考书目:
Чехов А. П. Полное собрание сочинений и писем: В 30 т. / АН СССР. Ин-т мировой лит. им. А. М. Горького. М.: Наука, 1974-1983.
TEI Consortium, eds. TEI P5: Guidelines for Electronic Text Encoding and Interchange. Version 4.7.0. Last updated on 16th November 2023. TEI Consorti-um. URL: http://www.tei-c.org/Guidelines/P5/ (дата обращения: 24.03.2024).
Wikidata // URL: https://www.wikidata.org/wiki/Wikidata: Main_Page (дата обращения: 10.04.2024).
Северина Е. М., Бонч-Осмоловская А. А., Кудин А. М. Цифровые филологические практики: проект "Chekhov Digital" // Актуальные проблемы филологии и педагогической лингвистики. 2022. №2. С. 153-165.
Добровольский Д. О., Кретов А. А., Шаров С. А. Корпус параллельных текстов: архитектура и возможности использования // Национальный корпус русского языка: 2003–2005. М.: Индрик, 2005, 263-296.
Калинина Е. Э. Рамочная конструкция предложения как результат генезиса порядка слов индоевропейских языков // Международный научно-исследовательский журнал. 2017. №5-