<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.2 20190208//EN" "http://jats.nlm.nih.gov/publishing/1.2/JATS-journalpublishing1.dtd">
<article article-type="research-article" dtd-version="1.2" xml:lang="ru" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><front><journal-meta><journal-id journal-id-type="issn">2313-8912</journal-id><journal-title-group><journal-title>Научный результат. Вопросы теоретической и прикладной лингвистики</journal-title></journal-title-group><issn pub-type="epub">2313-8912</issn></journal-meta><article-meta><article-id pub-id-type="doi">10.18413/2313-8912-2024-10-4-0-8</article-id><article-id pub-id-type="publisher-id">3679</article-id><article-categories><subj-group subj-group-type="heading"><subject>Языковое поведение в машинно-генерируемых средах</subject></subj-group></article-categories><title-group><article-title>&lt;strong&gt;Исследование межсловных пауз в текстах&amp;nbsp;на русском языке по данным кейлоггера с использованием моделей гауссовой смеси&lt;/strong&gt;</article-title><trans-title-group xml:lang="en"><trans-title>&lt;strong&gt;Investigating between-word pause duration&amp;nbsp;in Russian typed texts using mixture modeling based on keystroke data&lt;/strong&gt;</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><name-alternatives><name xml:lang="ru"><surname>Литвинова</surname><given-names>Татьяна Александровна</given-names></name><name xml:lang="en"><surname>Litvinova</surname><given-names>Tatiana A.</given-names></name></name-alternatives><email>centr_rus_yaz@mail.ru</email><xref ref-type="aff" rid="aff1" /></contrib><contrib contrib-type="author"><name-alternatives><name xml:lang="ru"><surname>Молчанова</surname><given-names>Виктория Александровна</given-names></name><name xml:lang="en"><surname>Molchanova</surname><given-names>Viktoriya A.</given-names></name></name-alternatives><email>zva0604@yandex.ru</email><xref ref-type="aff" rid="aff2" /></contrib></contrib-group><aff id="aff2"><institution>Воронежский государственный педагогический университет, Воронеж, Россия</institution></aff><aff id="aff1"><institution>Воронежский государственный педагогический университет, Россия</institution></aff><pub-date pub-type="epub"><year>2024</year></pub-date><volume>10</volume><issue>4</issue><fpage>0</fpage><lpage>0</lpage><self-uri content-type="pdf" xlink:href="/media/linguistics/2024/4/Research_Result_4-42-182-201.pdf" /><abstract xml:lang="ru"><p>Регистрация нажатий клавиш с использованием специальных программ &amp;ndash; кейлоггеров &amp;ndash; это неинвазивная технология, которая стала золотым стандартом в моделировании процессов порождения текста. Особенно важными характеристиками в таком анализе являются длительности пауз, поскольку именно паузы рассматриваются как индикаторы базовых когнитивных процессов, лежащих в основе процесса порождения текста. Распространенным подходом является установление произвольных пороговых значений пауз, и разделение на их основе пауз на когнитивные, которые и используются для дальнейшего анализа, и некогнитивные, которые исключаются из дальнейшего анализа как незначимые. Однако такой подход имеет множество недостатков и не позволяет охватить сложность и индивидуальную вариативность когнитивных процессов, связанных с текстопорождением. В статье представлены результаты пилотного исследования, проведенного на основе данных кейлоггера в ходе порождения текстов на русском языке. В исследовании для кластеризации значений продолжительности пауз используются модели гауссовых смесей. Мы обнаружили, что паузы между словами не могут быть охарактеризованы одним распределением. Для описания межсловных пауз в текстах большинства наших участников лучше всего подходит двухкомпонентное распределение, отражающее, вероятно, лексический доступ и рефлексивные процессы. Мы обнаружили высокую индивидуальную вариативность пропорций для выявленных компонентов. В статье подчеркивается необходимость использования индивидуального подхода к установлению паузальных критериев, а также исследования пауз различной продолжительности в их совокупности и взаимосвязи на уровне отдельного текста.



</p></abstract><trans-abstract xml:lang="en"><p>Keystroke logging is an objective and scalable methodology that has become the gold standard in writing research for modeling writing processes. A particularly significant aspect of this analysis is the examination of features such as pause duration, as pauses are regarded as indicators of underlying cognitive processes. Traditionally, arbitrary pause thresholds that are universally applied to all writers have been established to differentiate between cognitive and non-cognitive pauses. However, this approach presents considerable limitations and fails to account for the complexity and individual variability inherent in the cognitive processes involved in text production. Furthermore, different scholars employ varying approaches to the calculation of between-word pauses. This study is the first to analyze keystroke logs of Russian typed texts utilizing Gaussian mixture models (GMM) to cluster pause duration values at between-word boundaries. By employing keystroke logs collected from 50 university students who described the views from their home windows, we conducted a cluster analysis of pause duration values before words, after words, and between words separately. It was determined that the distribution of pauses between words cannot be characterised by a single distribution. For the majority of participants, two-component distribution provided the best fit for all three types of pauses. Additionally, we observed a high degree of individual variability in the mixing proportions of different components. This paper underscores the necessity of avoiding the imposition of fixed thresholds in pause analysis that are universally applicable to all writers and advocates for individualized and holistic approach to studying the writing process.



</p></trans-abstract><kwd-group xml:lang="ru"><kwd>Анализ нажатий клавиш</kwd><kwd>Кейлоггер</kwd><kwd>Пауза</kwd><kwd>Продолжительность пауз</kwd><kwd>Исследования письма</kwd><kwd>Процесс письма</kwd><kwd>Модели гауссовой смеси</kwd></kwd-group><kwd-group xml:lang="en"><kwd>Keystroke logging</kwd><kwd>Keystroke analysis</kwd><kwd>Pause</kwd><kwd>Pause duration</kwd><kwd>Writing research</kwd><kwd>Writing processes</kwd><kwd>Mixture modelling</kwd></kwd-group></article-meta></front><back><ack><p>Авторы благодарят за финансовую поддержку Министерство просвещения Российской Федерации (работа выполнена при финансовой поддержке Министерства просвещения Российской Федерации в рамках выполнения государственного задания в сфере науки, номер темы QRPK-2024-0011).</p></ack></back></article>