Сравнительный анализ просодических характеристик спонтанной и синтезированной речи (на видеоматериалах TED TALKS на казахском и английском языках)
DOI:
https://doi.org/10.26577/EJPh202520047Аннотация
Целью данного исследования заключается в осуществлении инструментально-сравнительного анализа просодических характеристик спонтанной (на материалах подкастов) и синтезированной речи на казахском и английском языках. В работе рассмотрены существующие исследовательские подходы к изучению просодии, а также выполнен акустический анализ основных просодических параметров (частоты основного тона, интенсивности и темпа) для указанных типов речевого материала. Для сравнительного анализа сформулирован корпус, включающий по 10 выступлений TED Talks на английском и казахском языках, которые далее транскрибированы и преобразованы в аудиофайлы с применением современных систем синтеза речи. Акустический анализ проводился программой Praat и нами разразботанной программой ProAG-2025 (с охраняемым документом № 58731 от «27» мая 2025 года). В данной статье формулируется гипотеза, согласно которой спонтанная речь характеризуется большей вариативностью просодических показателей, тогда как синтезированной речь отличается от естественной по статистически значимым акустико-просодическим признакам. Результаты инструментального анализа подтверждают, что синтезированная речь, несмотря на структурную нормативность, сохраняет комплекс параметров, позволяющих надёжно дифференцировать её от естественной: повышенную равномерность амплитудного и частотного контуров, отсутствие стохастических вариаций, а также упрощённый ритмико-паузовый рисунок. Полученные данные представляют практическую значимость для дальнейшего совершенствования алгоритмов синтеза речи, повышения степени её естественности и оптимизации коммуникативной эффективности медийных приложений.
Ключевые слова: спонтанная речь, синтезированная речь, просодика, акустические параметры, тональность, частота основного тона.
