16+
DOI: 10.18413/2313-8912-2024-10-1-0-5

Индивидуальные различия в ассоциативном значении слова сквозь призму языковой модели и семантического дифференциала

Существованиеиндивидуальных различийв семантике слова признается многими исследователями. Однако установление и описание подобных различий представляет собой сложную научную задачу, связанную с необходимостью проведения трудоемкой семантической разметки и неизбежным субъективизмом исследователя. В настоящей работе нами предлагается метод выявления различий в индивидуальной семантике слов на основе автоматически рассчитанных оценок ассоциативного значения слова по шкалам семантического дифференциала. Используя дистрибутивную семантическую модель word2vec, обученную на многомиллионном корпусе текстов, и метод Concept Mover's Distance, мы получили для каждого ассоциативного ряда оценки по 18 шкалам семантического дифференциала. В нашей работе впервые данный метод, активно использующийся в новейших работах, рассматривающих текст как данные (преимущественно выполненных в русле computational social science), применяется по отношению к такому объекту анализа, как ассоциативный ряд, с целью описания индивидуальных различий в семантике слов. В качестве материала для исследования мы использовали специально созданный датасет, содержащий ассоциативные реакции к словам-стимулам, важным для русского языкового сознания, данные о психологических характеристиках респондентов (черты «Большой пятерки») и их эмоциональном состоянии в момент прохождения тестирования. Применяя комплекс методов анализа многомерных данных (метод главных компонент, факторный анализ, иерархическая кластеризация на главных компонентах), мы разделили слова-стимулы на группы в зависимости от выраженности индивидуальных различий в их семантике. Нами также была установлена связь эмоционально-психологических характеристик респондентов и автоматически рассчитанных оценок ассоциативного значения слов-стимулов по шкалам семантического дифференциала. Описанная методика анализа может применяться для получения оценок ассоциативных рядов (а также контекстов употребления слов в текстах) по любым семантическим оппозициям и предлагается как дополнение к традиционным методам выявления психологически реального значения слова. Используемый в работе датасет и код для воспроизведения полученных результатов на языке R доступны для исследователей.

Иллюстрации

Количество просмотров: 696 (смотреть статистику)
Количество скачиваний: 1040
Полный текст (HTML)Полный текст (PDF)К списку статей
  • Комментарии
  • Список литературы
  • Благодарности

Пока никто не оставил комментариев к этой публикации.
Вы можете быть первым.

Оставить комментарий: