Tүркі тілдерінің синтаксистік белгіленім тәжірибесі

Авторлар

DOI:

https://doi.org/10.26577/EJPh202519932
        78 32

Аннотация

Мақалада түркі тілдерінің синтаксистік құрылымын формалды грамматика тұрғысынан және заманауи аннотациялық модельдер негізінде сипаттаудың тәжірибесі қарастырылады. Синтаксистік аннотация тілдің грамматикалық жүйесін формалды түрде сипаттайтын және оны автоматты өңдеуге мүмкіндік беретін маңызды құрал ретінде танылады. Зерттеу барысында «Universal Dependencies» (UD), «MaTT» (Multilingual Aligned Treebank of Turkic) және «Kazakh Dependency Treebank» (KazDT) сияқты жобаларға сүйеніп, түркі тілдеріне тән морфологиялық және синтаксистік ерекшеліктер сипатталды. Синтаксистік белгіленім модельдері: «құрамдық», «аралас», «басыңқы-бағыныңқылық грамматикасы» т.б. тәсілдердің сипаты, ерекшеліктері, түркі тілдері үшін ұтымды тұстары мен кемшіліктері сараланды. Нәтижесінде басыңқы-бағыныңқы қатынастар грамматикасы негізінде жасалған синтаксистік аннотация моделі түркі тілінің құрылымын тиімді сипаттауға мүмкіндік беретіні дәлелденді. Басыңқы-бағыныңқы грамматикасының (басыңқы-бағыныңқы қатынастар) теориялық негіздері,  синтаксистік аннотацияның форматы мен стандарттары сараланды. Түркі тілдерінің жалғамалы табиғаты мен еркін сөз тәртібінің «UD»  сияқты әмбебап жобаларға бейімделуі талдауға түсті.

Сонымен қатар, қазақ тілінің аннотацияланған корпустарын жетілдіру, автоматты парсинг, тілдік білім беру жүйесіне енгізу секілді болашақтағы бағыттары көрсетілді. Мақала түркі тілдерінің синтаксистік белгіленім тәжірибесі негізінде қазақ тілін цифрлық кеңістікке енгізудің маңызды қадамдарының бірі ретінде синтаксистік аннотацияны ғылыми тұрғыда негіздеуді мақсат етті.

Түйін сөздер: түркі тілдері, синтаксистік аннотация, басыңқы-бағыныңқы грамматикасы, «UD» , KazDT, формалды модельдер, парсинг.

Авторлардың биографиясы

Л. Алимтаева, Әл-Фараби атындағы Қазақ ұлттық университеті, Алматы, Қазақстан

Алимтаева Лаззат Тургыновна – филология ғылымдарының кандидаты, Әл-Фараби атындағы Қазақ ұлттық университеті (Қазақстан, Алматы қ., *e-mail: alimtayeva.lazzat@gmail.com);

Д. Токмырзаев, Әл-Фараби атындағы Қазақ ұлттық университеті, Алматы, Қазақстан

Токмырзаев Дархан Онталапулы – IT бағдарламашы, Әл-Фараби атындағы Қазақ ұлттық университеті (Қазақстан, Алматы қ., e-mail: dark.han@mail.ru);

К. Пірманова, Әл-Фараби атындағы Қазақ ұлттық университеті, Алматы, Қазақстан

Пірманова Күнсұлу Қамбарбекқызы – PhD, постдокторант, Әл-Фараби атындағы Қазақ ұлттық университеті (Қазақстан, Алматы қ., e-mail: kunsulu.pirmanova@mail.ru).

Жүктелулер

Как цитировать

Алимтаева, Л., Токмырзаев, Д., & Пірманова, К. (2025). Tүркі тілдерінің синтаксистік белгіленім тәжірибесі. ҚазҰУ Хабаршысы. Филология сериясы, 199(3), 17–29. https://doi.org/10.26577/EJPh202519932