Приемы разработки подкорпуса текста писателя: структура и функции метаразметки

Авторы

DOI:

https://doi.org/10.26577/EJPh.2024.v193.i1.ph2
        144 105

Аннотация

Цель статьи – предоставить образец оформления структуры и метаразметки подкорпуса текста писателя в составе национального корпуса казахского языка. Статья исследуется в рамках области компьютерной лингвистики в мировой лингвистике. Идея статьи заключается в совершенствовании подкорпусов национального корпуса казахского языка. Научное описание статьи представляет собой корпус языка, цифровизацию языкового языкознания, включая обеспечение теоретических основ стилистического анализа писательского текста, репрезентации личности писателя. Практическое описание статьи представляет собой представление моделей внедрения лингвистических учений в базу корпуса. В статье предлагается образец метаразметки, которая предназначена для каждого художественного произведения в подкорпусе писателя, и образец семантической разметки, которая передается каждому образному слову. Каждый текст корпуса сопровождается аннотацией или метаразметкой, то есть полным описанием автора и произведения. Методологией исследования являются программный пакет EXMARaLDA, программный метод HIAT, а также методы лингвистической стилистики, методы познания личности писателя. Основным результатом исследовательской работы является разработка моделя базы данных текстов в цифровом формате, дающая подробное описание прозаических и драматических произведений и позволяющая читать электронную версию произведения в режиме онлайн. Ценность статьи заключается в функциональности корпуса текстов писателей, помимо транскрипций, имеются различные возможности поиска и отбора эмпирических и статистических данных. Он оснащен метаразметками, включающим библиографические данные о каждом произведении и позволяющим социолингвистическую диверсификацию текстов. Результаты статьи определяется основным механизмом развития корпусной базы – отличием аннотации от семантических метаразметок. Статья написана на основе научного проекта «ИРН BR21882249».

Ключевые слова: подкорпус текста писателя, аннотационная метаразметка, семантическая метаразметка, модель, текстовая база, проза, драматургия.

Биографии авторов

A. Аmirbekova, Институт языкознания имени А. Байтурсынулы, Казахстан, г. Алматы

Aйгуль Амирбекова – кандидат филологических наук, Институт языкознания имени А. Байтурсынулы (Aлматы, Kaзахстан, email: marghan01@mail.ru);

G. Mamyrbek, Институт языкознания имени А. Байтурсынулы, Казахстан, г. Алматы

Гулфар Мамырбек – кандидат филологических наук, Институт языкознания имени А. Байтурсынулы (Aлматы, Kaзахстан, email: gulfar76@mail.ru);

G. Talgatqyzy, Институт языкознания имени А. Байтурсынулы, Казахстан, г. Алматы

Гулнара Taлгаткызы – докторант, Институт языкознания имени А. Байтурсынулы (Aлматы, Kaзахстан, email: gulalyzhan@mail.ru);

L. Yanch, Университет Акдениз, Турция, г. Анталья

Лаззат Уракова Янч – доцент, Университет Акдениз (Aнталья, Tурция, email: urakovayanc@gmail.com);

Загрузки

Как цитировать

Аmirbekova A., Mamyrbek, G., Talgatqyzy, G., & Yanch, L. (2024). Приемы разработки подкорпуса текста писателя: структура и функции метаразметки. Вестник КазНУ. Серия филологическая, 193(1), 13–24. https://doi.org/10.26577/EJPh.2024.v193.i1.ph2