К вопросу о подготовке медиакорпуса Казахского языка
Аннотация
Особое место в современной корпусной лингвистике занимают медиа-корпусы. В базу медиатекстов включены на основе приема сплошной выборки новостные тексты, опубликованные в
средствах массовой информации. Безусловно, медиа-корпус является весьма ценным источником
по сбору, анализу какой-либо новостной информации для широкого круга потребителей, которые
могут задавать поиск по различным основаниям. Он может быть и обучающим инструментом для
будущих специалистов-журналистов, обозревателей, политиков, специалистов любой медиасферы.
Целью данной работы является разработка медиа-корпуса казахского языка на платформе
Казахского национального университета имени аль-Фараби. На настоящий момент фактические
данные для медиа-корпуса собираются с 44 казахоязычных сайтов, из них 10 порталов
по чрезвычайным ситуациям, 11 новостных порталов, 13 образовательных порталов, 10
развлекательных ресурсов. Разрабатываемый авторами медиа-корпус казахского языка
будет представлять собой публичный веб-портал, который станет новым инструментом для
исследования, анализа, изучения, преподавания казахского языка, предназначенный для
широкого круга потребителей на отечественной и мировой арене.