Индивидуальные различия в ассоциативном значении слова сквозь призму языковой модели и семантического дифференциала
Существованиеиндивидуальных различийв семантике слова признается многими исследователями. Однако установление и описание подобных различий представляет собой сложную научную задачу, связанную с необходимостью проведения трудоемкой семантической разметки и неизбежным субъективизмом исследователя. В настоящей работе нами предлагается метод выявления различий в индивидуальной семантике слов на основе автоматически рассчитанных оценок ассоциативного значения слова по шкалам семантического дифференциала. Используя дистрибутивную семантическую модель word2vec, обученную на многомиллионном корпусе текстов, и метод Concept Mover's Distance, мы получили для каждого ассоциативного ряда оценки по 18 шкалам семантического дифференциала. В нашей работе впервые данный метод, активно использующийся в новейших работах, рассматривающих текст как данные (преимущественно выполненных в русле computational social science), применяется по отношению к такому объекту анализа, как ассоциативный ряд, с целью описания индивидуальных различий в семантике слов. В качестве материала для исследования мы использовали специально созданный датасет, содержащий ассоциативные реакции к словам-стимулам, важным для русского языкового сознания, данные о психологических характеристиках респондентов (черты «Большой пятерки») и их эмоциональном состоянии в момент прохождения тестирования. Применяя комплекс методов анализа многомерных данных (метод главных компонент, факторный анализ, иерархическая кластеризация на главных компонентах), мы разделили слова-стимулы на группы в зависимости от выраженности индивидуальных различий в их семантике. Нами также была установлена связь эмоционально-психологических характеристик респондентов и автоматически рассчитанных оценок ассоциативного значения слов-стимулов по шкалам семантического дифференциала. Описанная методика анализа может применяться для получения оценок ассоциативных рядов (а также контекстов употребления слов в текстах) по любым семантическим оппозициям и предлагается как дополнение к традиционным методам выявления психологически реального значения слова. Используемый в работе датасет и код для воспроизведения полученных результатов на языке R доступны для исследователей.
Иллюстрации
Литвинова Т. А., Паничева П. В. Индивидуальные различия в ассоциативном значении слова сквозь призму языковой модели и семантического дифференциала // Научный результат. Вопросы теоретической и прикладной лингвистики. 2024. Т. 10. № 1. C. 61-93. DOI: 10.18413/2313-8912-2024-10-1-0-5
Пока никто не оставил комментариев к этой публикации.
Вы можете быть первым.
Глухов В. П. Основы психолингвистики: учебное пособие для студентов педвузов. М.: ACT: Астрель, 2005. 351 с.
Горошко Е. И. Интегративная модель свободного ассоциативного эксперимента. М.: ИЯ РАН; Харьков: РА-Каравелла, 2001. 320 с.
Зуева Е. А. Эмоции как объект лингвистических исследований // Иностранные языки в профессиональном образовании: лингвометодический контекст: материалы межвуз. науч.-практ. конф., Белгород, 17-18 мая 2006 г. / Белгор. ун-т потреб. кооперации. Белгород, 2006. С. 148-154.
Калугин А. Ю. Психометрика русскоязычной версии Big Five Inventory-2 / Калугин А. Ю., Щебетенко С. А., Мишкевич А. М., Сото К. Д., Джон О. // Психология. Журнал Высшей школы экономики. 2021. № 18 (1). С. 7-33.
Караулов Ю. Н., Коробова М. М. Индивидуальный ассоциативный словарь // Вопросы языкознания. 1993. № 5. С. 5–15.
Курганова Н. И. Ассоциативный эксперимент как метод исследования значения живого слова // Вопросы психолингвистики. 2019. № 3 (41). С. 24-37.
Литвинова Т. А., Заварзина В. А., Любова С. Г. База данных ассоциативных реакций, содержащая информацию о клавиатурном поведении респондентов // Известия Воронежского государственного педагогического университета. 2022. № 4 (297). С. 240–249.
Литвинова Т. А. Исследование значения слова в индивидуальном языковом сознании с использованием метода семантической проекции / Литвинова Т. А., Котлярова Е. С., Любова С. Г., Паничева П. В. // Russian Linguistic Bulletin. 2023. № 12 (48). URL: https://rulb.org/archive/12-48-2023-december/10.18454/RULB.2023.48.50 (дата обращения: 29.01.2024). https://doi.org/10.18454/RULB.2023.48.50
Литвинова Т. А., Любова С. Г. Разметка ассоциативных реакций по типам отношений «стимул-ассоциат» как этап создания аннотированного многокомпонентного корпуса ассоциативных реакций индивида // Проблемы изучения живого русского слова на рубеже тысячелетий: материалы XI Междунар. науч. конф. (г. Воронеж, 27–28 октября 2023 г.). Воронеж: Воронежский государственный педагогический университет, 2023. С. 49–58.
Новиков А. Л., Новикова И. А. Метод семантического дифференциала: теоретические основы и практика применения в лингвистических и психологических исследованиях // Вестник РУДН. Серия: Теория языка. Семиотика. Семантика. 2011. № 3. С. 63–71.
Петренко В. Ф. Основы психосемантики. 2-е изд., доп. СПб.: Питер, 2005. 480 с.
Серкин В. П. Методы психологии субъективной семантики и психосемантики: учебное пособие для вузов. М.: ПЧЕЛА, 2008. 382 с.
Сикевич З. В. Метод семантического дифференциала в социологическом исследовании (опыт применения) // Вестник СПбГУ. Серия 12. Социология. 2016. Вып. 3. С. 118–128.
Степыкин Н. И. Исследование динамики ментального лексикона по данным свободного ассоциативного эксперимента / Степыкин Н. И., Багана Ж., Слободова К. Н., Фуникова С. В. // Научный результат. Вопросы теоретической и прикладной лингвистики. 2023. № 2. С. 19–33. DOI: 10.18413/2313-8912-2023-9-2-0-2
Уфимцева Н. В. Образ мира русских: системность и содержание // Язык и культура. 2009. № 4 (8). С. 98-110.
Черкасова Г. А. Русский сопоставительный ассоциативный словарь. М.: ИЯ РАН, 2008. 194 с.
Abdi H., Williams L. J. Principal component analysis // Wiley Interdiscip. Rev. 2010. № 2. P. 433–459.
Arseniev-Koehler A., Foster J. G. Sociolinguistic Properties of Word Embeddings // Dehghani M., Boyd R. L. Handbook of Language Analysis in Psychology. New York: Guilford Press, 2022. P. 464-477.
Azucar D., Marengo D., Settanni M. Predicting the Big 5 personality traits from digital footprints on social media: A meta-analysis // Personality and Individual Differences. 2018. Vol. 124. P. 150-159.
Caliskan A., Bryson J. J., Narayanan A. Semantics derived automatically from language corpora contain human-like biases // Science. 2017. Vol. 356 (6334). P. 183–186.
Daenekindt S., Schaap J. Using word embedding models to capture changing media discourses: a study on the role of legitimacy, gender and genre in 24,000 music reviews, 1999–2021 // Journal of Computational Social Science. 2022. № 5. P. 1615–1636.
Eberhard C., Owens W. A. Word Association as a Function of Biodata Subgrouping // Developmental Psychology. 1975. Vol. 11 (2). P. 159–164.
Ellis N. C. Essentials of a Theory of Language Cognition // The Modern Language Journal. 2019. Vol. 103. P. 39–60.
Garg N., Schiebinger L., Jurafsky D., Zou J. Word embeddings quantify 100 years of gender and ethnic stereotypes // Proceedings of the National Academy of sciences of the United States of America. 2018. Vol. 115, iss. 16. P. E3635–E3644.
Grand G. et al. Semantic Projection Recovers Rich Human Knowledge of Multiple Object Features from Word Embeddings // Nat Hum Behav. 2022. Vol. 6 (7). P. 975–987.
Greenwald A. G., McGhee D. E., Schwartz J. L. K. Measuring Individual Differences in Implicit Cognition. The Implicit Association Test // Journal of Personality and Social Psychology. 1998. № 74. P. 1464–1480.
Hollis G., Westbury C. The principals of meaning: Extracting semantic dimensions from co-occurrence models of semantics // Psychonomic Bulletin & Review. 2016. Vol. 23. P. 1744–1756.
Husson F., Josse J., Pages J. Principal component methods-hierarchical clustering-partitional clustering: Why would we need to choose for visualizing data // Appl. Math. Dep. 2010. Vol. 17. P. 1–17.
Innes J. M. The relationship of word-association commonality response set to cognitive and personality variables // Br J Psychol. 1972. Vol. 63 (3). P. 421-428.
Iordan M. C., Giallanza T., Ellis C. T. et al. Context Matters: Recovering Human Semantic Structure from Machine Learning Analysis of Large-Scale Text Corpora // Cognitive science. 2022. № 46 (2), Article e13085.
Isen A. M. The influence of positive affect on the unusualness of word associations / Isen A. M., Johnson M. M., Mertz E., Robinson G. F. // J Pers Soc Psychol. 1985. № 48 (6). Р. 1413-1426.
Kassambara A., Mundt F. Factoextra: Extract and visualize the results of multivariate data analyses // R Package Version. 2017. № 1. P. 337–354.
Kozlowski A. C., Taddy M., Evans J. A. The Geometry of Culture: Analyzing the Meanings of Class through Word Embeddings // American Sociological Review. 2019. № 84 (5). P. 905–949.
Lê S., Josse J., Husson F. FactoMineR: An R package for multivariate analysis // J. Stat. Softw. 2008. № 25. P. 1–18.
Lenci A. Distributional Models of Word Meaning // Annual Review of Linguistics. 2018. № 4. P. 151–71.
Litvinova T. A. Mapping the field of word association research using text mining approach / Litvinova T. A., Zavarzina V. A., Kotlyarova E. S., Lyubova S. G. // 5th International Conference on Information Technology and Computer Communications (ITCC 2023), June 15–17, 2023, Tianjin, China. ACM, New York. NY, USA. P. 90–98.
Litvinova T. RusIdiolect: A New Resource for Authorship Studies // Lecture Notes in Networks and Systems. 2021. Vol. 186. P. 14-23.
Lukavsky J. Subjective valence of the test words an enhancement of the word association test // Ceskoslovenska Psychologie. 2004. № 48. Р. 203-214.
Matsui A., Ferrara E. Word Embedding for Social Sciences: An Interdisciplinary Survey. URL: https://arxiv.org/pdf/2207.03086.pdf (accessed 29.01.2024).
Merseal H. M. Free association ability distinguishes highly creative artists from scientists: Findings from the Big-C Project / Merseal H. M., Luchini S., Kenett Y. N., Knudsen K., Bilder R. M., Beaty R. E. // Psychology of Aesthetics, Creativity, and the Arts. 2023. Advance online publication. https://doi.org/10.1037/aca0000545
Merten T. Word association responses and psychoticism // Personality and Individual Differences. 1993. Vol. 14 (6). P. 837–839.
Mikolov T. Distributed Representations of Words and Phrases and Their Compositionality / Mikolov T., Sutskever I., Chen K., Corrado G. S., Dean J. // Proceedings of the 26th International Conference on Neural Information Processing Systems, vol. 2, Curran Associates Inc., NY: USA, 2013. P. 3111–3119.
Osgood C. E., Suci G. J., Tannenbaum P. H. The Measurement of Meaning. Chicago: University of Illinois Press, 1957. 342 p.
Pereira F., Gershman S., Ritter S., Botvinick M. A comparative evaluation of off-the-shelf distributed semantic representations for modelling behavioural data // Cognitive Neuropsychology. 2016. № 33. P. 175–190.
Schröder T., Hoey J., Rogers K. B. Modeling Dynamic Identities and Uncertainty in Social Interactions: Bayesian Affect Control Theory // American Sociological Review. 2016. № 81 (4). P. 828–855.
Stoltz D. S., Taylor M. A. Concept Mover's Distance: measuring concept engagement via word embeddings in texts // Journal of Computational Social Science. 2019. Vol. 2. P. 293–313.
Stoltz D. S., Taylor M. A. text2map: R tools for text matrices // Journal of Open Source Software. 2022. № 7 (72). P. 3741.
Taylor M. A., Stoltz D. S. Integrating Semantic Directions with Concept Mover's Distance to Measure Binary Concept Engagement // Journal of Computational Social Science. 2021. Vol. 4. P. 231–242.
Utsumi A. A Neurobiologically Motivated Analysis of Distributional Semantic Models // Proceedings of the 40th Annual Conference of the Cognitive Science Society (CogSci2018). Madison, WI, USA. P. 1147-1152.
Voyer A. From Strange to Normal: Computational Approaches to Examining Immigrant Incorporation Through Shifts in the Mainstream / Voyer A., Kline Z. D., Danton M., Volkova T. // Sociological Methods & Research. 2022. № 51 (4). P. 1540–1579.
Wulff D. U. Data From the MySWOW Proof-of-Concept Study: Linking Individual Semantic Networks and Cognitive Performance / Wulff D. U., Aeschbach S., De Deyne S., Mata R. // Journal of Open Psychology Data. 2022. № 10 (5). P. 1–8.
Исследование выполнено в Воронежском государственном педагогическом университет при поддержке гранта РНФ № 21-78-10148 «Моделирование значения слова в индивидуальном языковом сознании на основе дистрибутивной семантики».