Опыт синтаксической разметки тюркских языков

Авторы

  • Л. Алимтаева Казахский национальный университет имени аль-Фараби, Казахстан, г. Алматы https://orcid.org/0000-0002-6679-6174
  • Д. Токмырзаев Казахский национальный университет имени аль-Фараби, Казахстан, г. Алматы https://orcid.org/0000-0002-8679-9698
  • К. Пирманова Казахский национальный университет имени аль-Фараби, Казахстан, г. Алматы https://orcid.org/0000-0003-3783-3199

DOI:

https://doi.org/10.26577/EJPh202519932
        78 32

Аннотация

В статье рассматривается опыт описания синтаксической структуры тюркских языков с точки зрения формальной грамматики и на основе современных аннотационных моделей. Синтаксическая аннотация признаётся важным инструментом, позволяющим формально описать грамматическую систему языка и обеспечивающим возможность её автоматической обработки. В ходе исследования, опираясь на проекты «Universal Dependencies» (UD), «MaTT» (Multilingual Aligned Treebank of Turkic) и «Kazakh Dependency Treebank» (KazDT), были описаны морфологические и синтаксические особенности, характерные для тюркских языков.
Были проанализированы модели синтаксической разметки: «грамматика фразовой структуры», «смешанная» и «грамматика зависимостей» и др., их характеристики, различия, а также преимущества и недостатки для тюркских языков. В результате было доказано, что модель синтаксической аннотации, основанная на грамматике главно-зависимых отношений, позволяет эффективно описывать структуру тюркских языков.
Описаны теоретические основы грамматики зависимостей (главно-зависимых отношений), форматы и стандарты синтаксической аннотации. Рассмотрена адаптация агглютинативной природы и свободного порядка слов тюркских языков к универсальным проектам, таким как «UD» .

Кроме того, обозначены будущие направления, такие как совершенствование размеченных корпусов казахского языка, автоматический парсинг, интеграция в системы языкового образования. Статья ставит целью научное обоснование синтаксической аннотации как одного из важных шагов по введению казахского языка в цифровое пространство на основе опыта синтаксической разметки тюркских языков.

Ключевые слова: тюркские языки, синтаксическая аннотация, грамматика зависимостей, «UD» , «KazDT», формальные модели, парсинг.

Биографии авторов

Л. Алимтаева, Казахский национальный университет имени аль-Фараби, Казахстан, г. Алматы

Алимтаева Лаззат Тургыновна кандидат филологических наук, Казахский национальный университет имени аль-Фараби (Казахстан, г. Алматы, *e-mail: alimtayeva.lazzat@gmail.com).

Д. Токмырзаев, Казахский национальный университет имени аль-Фараби, Казахстан, г. Алматы

Токмырзаев Дархан Онталапулы IT-программист, Казахский национальный университет имени аль-Фараби (Казахстан, г. Алматы, e-mail: dark.han@mail.ru);

К. Пирманова, Казахский национальный университет имени аль-Фараби, Казахстан, г. Алматы

Пирманова Кунсулу Камбарбеккызы PhD, постдокторант, Казахский национальный университет имени аль-Фараби (Казахстан, г. Алматы, e-mail: kunsulu.pirmanova@mail.ru).

Загрузки

Как цитировать

Алимтаева, Л., Токмырзаев, Д., & Пирманова, К. (2025). Опыт синтаксической разметки тюркских языков. Eurasian Journal of Philology. Science and Education, 199(3), 17–29. https://doi.org/10.26577/EJPh202519932