Исследование межсловных пауз в текстах на русском языке по данным кейлоггера с использованием моделей гауссовой смеси
Регистрация нажатий клавиш с использованием специальных программ – кейлоггеров – это неинвазивная технология, которая стала золотым стандартом в моделировании процессов порождения текста. Особенно важными характеристиками в таком анализе являются длительности пауз, поскольку именно паузы рассматриваются как индикаторы базовых когнитивных процессов, лежащих в основе процесса порождения текста. Распространенным подходом является установление произвольных пороговых значений пауз, и разделение на их основе пауз на когнитивные, которые и используются для дальнейшего анализа, и некогнитивные, которые исключаются из дальнейшего анализа как незначимые. Однако такой подход имеет множество недостатков и не позволяет охватить сложность и индивидуальную вариативность когнитивных процессов, связанных с текстопорождением. В статье представлены результаты пилотного исследования, проведенного на основе данных кейлоггера в ходе порождения текстов на русском языке. В исследовании для кластеризации значений продолжительности пауз используются модели гауссовых смесей. Мы обнаружили, что паузы между словами не могут быть охарактеризованы одним распределением. Для описания межсловных пауз в текстах большинства наших участников лучше всего подходит двухкомпонентное распределение, отражающее, вероятно, лексический доступ и рефлексивные процессы. Мы обнаружили высокую индивидуальную вариативность пропорций для выявленных компонентов. В статье подчеркивается необходимость использования индивидуального подхода к установлению паузальных критериев, а также исследования пауз различной продолжительности в их совокупности и взаимосвязи на уровне отдельного текста.
Литвинова Т. А., Молчанова В. А. Исследование межсловных пауз в текстах на русском языке по данным кейлоггера с использованием моделей гауссовой смеси // Научный результат. Вопросы теоретической и прикладной лингвистики. 2024. Т. 10. № 4. C. 147-166.
Пока никто не оставил комментариев к этой публикации.
Вы можете быть первым.
Список использованной литературы появится позже.
Авторы благодарят за финансовую поддержку Министерство просвещения Российской Федерации (работа выполнена при финансовой поддержке Министерства просвещения Российской Федерации в рамках выполнения государственного задания в сфере науки, номер темы QRPK-2024-0011).