Лексико-семантическая кластеризация в диагностике процессов культурной интеграции в дискурсе
Семантическая кластеризация как исследовательский метод традиционно используется для изучения преобразований лексических систем, однако данный метод может обеспечить доступ к гораздо более сложным когнитивным трансформациям, наблюдаемым в дискурсе и в культуре. Настоящая работа развивает когнитивно-семантический подход к изучению процесса интеграции культур с опорой на метод семантической кластеризации. Разграничиваются два когнитивных процесса интеграции культур, прямой и косвенный трансфер знания, проявляющиеся в непосредственной и опосредованной трансляции областей знания из культуры-донора в культуру-реципиент. Процедура анализа и результаты демонстрируются на материале сформированного корпуса примеров из веб-дискурса (всего 864,005 контекстов) с заимствованными словами из русского в киргизский язык.
Задачи. Задачи исследования заключаются в установлении сфер знания, интегрированных из русской в киргизскую культуру в ходе прямого трансфера знания в веб-дискурсе, и в определении квалиа-ролей, представляющих это знание, транслируемое косвенным образом через коллокаты заимствованных слов.
Методы. В то время как корпусный анализ позволяет установить области знания, которые транслируются из культуры-донора в культуру-реципиент напрямую, а также степень прямой интеграции культур, именно семантическая кластеризация помогает идентифицировать особенности косвенной интеграции культур с опорой на контексты, опосредованные использованием этих областей знания.
Результаты. На основе составленных списков заимствованных слов, сформированного корпуса их контекстов и семантического алгоритма кластеризации, реализованного для выявления их сходства в контекстах с заимствованными словами (материалы доступны по ссылке: https://osf.io/78u4m/), в исследовании определены как тематические области знания, так и квалиа-роли, участвующие в прямой и косвенной культурной интеграции русской (как культуры-донора) и киргизской (как культуры-реципиента) культур. Последующий анализ выявленных 4,126 таргетных слов с опорой на коэффициент их векторного сходства выявил их когнитивные роли, описываемые четырьмя квалиа – формальной, конститутивной, телической, агентивной, опосредованные интеграцией культур.
Заключение. Результаты показали, что прямой трансфер знания привел как к появлению новых областей знания, так и к трансформации областей знания, уже существующих в культуре-реципиенте. Косвенный трансфер знания в основном привел к трансформации формальной (конструирование таксономической информации о референте заимствованного слова) роли, что свидетельствует о том, что культура-реципиент в основном адаптировала области знания в рамках более обширной матрицы областей знания, не трансформируя их компоненты для частных целей. Полученные результаты свидетельствуют о возможности новых применений метода лексико-семантической кластеризации для изучения процессов интеграции и дезинтеграции культур.
Киосе М. И., Хулхачиева Ж. С., Изюмская-Капитонова В. В., Бармин А. В. Лексико-семантическая кластеризация в диагностике процессов культурной интеграции в дискурсе // Научный результат. Вопросы теоретической и прикладной лингвистики. 2025. Т. 11. № 4. C. 63-84.


















Пока никто не оставил комментариев к этой публикации.
Вы можете быть первым.
Cimiano P., Wenderoth J. Automatically Learning Qualia Structures from the Web / T. Baldwin, A. Korhonen, A. Villavicencio (Eds.) // Proceedings of the ACL workshop on Deep Lexical Acquisition. 2005. Pp. 28–37.
Copestake A., Briscoe T. Semi-Productive Polysemy and Sense Extension // Journal of Semantics. 1995. 12 (1). Pp. 15–67.
Deerwester S., Dumais S. T., Furnas G. W., Landauer T. K. and Harshman R. Indexing by latent semantic analysis // Journal of the American society for information science. 1990. Vol. 41 (6). Pp. 391–407.
Демьянков В. З. Языковые техники «трансфера знаний» // Лингвистика и семиотика культурных трансферов: методы, принципы, технологии / Отв. ред. В. В. Фещенко. М.: Культурная революция, 2016. С. 61–85.
Дербишева З. K. Язык и этнос. М.: Флинта, 2017.
Дербишева З. K. Основы лингвокогнитивного сравнения языков. М.: Флинта, 2019.
Фещенко В. В., Бочавер С. Ю. Теория культурных трансферов: от переводоведения – через cultural studies – к теоретической лингвистике // Лингвистика и семиотика культурных трансферов: методы, принципы, технологии / Отв. ред. В. В. Фещенко. М.: Культурная революция, 2016. С. 5–35.
Gallagher S., Hutto D. D. Understanding others through primary interaction and narrativepractice / J. Zlatev, T. Racine, C. Sinha and E. Itkonen (Eds.) // The shared mind: Perspectives of intersubjectivity. Amsterdam: John Benjamins, 2008. Pp. 17–38.
Haspelmath M. Lexical borrowings: Concepts and issues / M. Haspelmath, U. Tadmor (Eds.). Loanwords in the world’s languages. Berlin: De Gruyter, 2009. Pp. 35–54.
Ирисханова О. К., Киосе М. И. Технологии трансфера междисциплинарных терминов в лингвистику // Лингвистика и семиотика культурных трансферов: методы, принципы, технологии / Отв. ред. В. В. Фещенко. М.: Культурная революция, 2016. С. 151–180.
Jain A. K., Murty M. N., Flynn P. J. Data clustering: a review // ACM computing surveys (CSUR). 1999. Vol. 31 (3). Pp. 264–323.
Jezek E., Quochi V., Calzolari N. Relevance of Qualia Relations in Coercive Contexts: Conference paper // 5th International Conference on Generative Approaches to the Lexicon. 2009. URL: https://www.researchgate.net/publication/228960165_Relevance_of_Qualia_Relations_in_Coercive_Contexts. (Accessed 18 August 2025)
Камбаралиева У. Д., Стернин И. A. Русское и киргизское коммуникативное поведение. Воронеж: Ритм, 2021.
Kuhn A., Ducasse S., Gîrba T. Semantic clustering: Identifying topics in source code // Information and Software Technology. 2007. Vol. 49 (3). Pp. 230–243. URL: https://doi.org/10.1016/j.infsof.2006.10.017 (access date: 25.07.2025)
Langacker R. W. Cognitive grammar / D. Geeraerts, H. Cuyckens (Eds.) // The Oxford handbook of cognitive linguistics. Oxford: Oxford University Press, 2007. Pp. 421–507.
Lee C., Chang C., Hsu W., Hsieh S. Qualia modification in noun-noun compounds: A cross language survey // Proceedings of the 22nd Conference on Computational Linguistics and Speech Processing (ROCLING-2010). 2010.
Pp. 379-390.
Lee S., Kim H., Hwang J., Park E. and Ok J. Efficient Latent Semantic Clustering for Scaling Test-Time Computation of LLMs. 2025. URL: https://doi.org/arXiv preprint arXiv:2506.00344 (access date: 25.07.2025).
Mikolov T., Chen K., Corrado G., Dean J. Efficient estimation of word representations in vector space. URL: https://doi.org/arXiv preprint arXiv:1301.3781. 2013 (Accessed 25 July 2025).
Myers-Scotton C. Contact linguistics: Bilingual encounters and grammatical outcomes. Oxford: Oxford University Press, 2002.
Myers-Scotton C. Multiple voices: An introduction to bilingualism. Malden, MA: Blackwell, 2006.
Pérez-Serrano M., Nogueroles-López M. and Duñabeitia J. A. Effects of semantic clustering and repetition on incidental vocabulary learning // Frontiers in Psychology. 2022. Vol. 13. Article number: 997951.
Постовалова В. И. Пути и принципы трансферизации знания в гуманитарных науках // Лингвистика и семиотика культурных трансферов: методы, принципы, технологии / Отв. ред. В. В. Фещенко. М.: Культурная революция, 2016. С. 36–60.
Pustejovsky J. The generative lexicon // Computational Linguistics. 1991. Vol. 17 (4).
Pp. 409–441.
Pustejovsky J. Generative lexicon // Encyclopedia of language and linguistics. Amsterdam: Elsevier, 2006. Pp. 138–147.
Pustejovsky J., Hanks P., Rumshisky A. Automated induction of sense in context // COLING. 2004. Pp. 924–931.
Pustejovsky J., Jezek E. A Guide to Generative Lexicon Theory. Oxford: Oxford University Press, 2016.
Shaffer C., Andreano J. M., Touroutoglou A., Barrett L. F., Dickerson B. C. and Wong B. Semantic clustering during verbal episodic memory encoding and retrieval in older adults: One cognitive mechanism of superaging // Brain Sciences. 2024. Vol. 14 (2). Article number: 171.
Шипилов А. В. Россия – Кыргызстан: исторический опыт формирования межкультурного дискурса (вторая половина XIX – XXI в.). дис. … д-ра истор. наук. Бишкек: Кыргызско-Российский Славянский университет, 2018.
Siew C. S., Wulff D. U., Beckage N. M., Kenett Y. N. Cognitive network science: A review of research on cognition through the lens of network representations, processes, and dynamics // Complexity. 2019. Vol. 1. Article number: 2108423.
Song Z. and Qiu L. Qualia relations in Chinese nominal compounds containing verbal elements // International Journal of Knowledge and Language Processing. 2013. Vol. 4 (1). Pp. 1–15.
Talmy L. Toward a cognitive semantics. Vol. 2. Typology and process in concept structuring. Cambridge, MA: MIT Press, 2000.
Tinkham T. The effects of semantic clustering on the learning of second language vocabulary // System. 1993. Vol. 21. Pp. 371–380.
Thomason S. G. Language contact. Washington D.C.: Georgetown University Press, 2001.
Troyer A. K., Moscovitch M., Winocur G. Clustering and switching as two components of verbal fluency: Evidence from younger and older healthy adults // Neuropsychology. 1997.
Vol. 11 (1). Pp. 138–146.
Verhagen A. Construal and perpectivization / D. Geeraerts, H. Cuyckens (Eds.) // The Oxford handbook of cognitive linguistics. Oxford: Oxford University Press, 2007. Pp. 48–80.
Winford D. Contact-induced changes: Classification and processes // Diachronica. 2005. Vol. 22 (2). Pp. 373–427.
Witschard D., Jusufi I., Martins R. M., Kucher K., Kerren A. Interactive optimization of embedding-based text similarity calculations // Information Visualization. 2022. Vol. 21 (4). Pp. 335–353. URL: https://doi.org/10.1177/14738716221114372 (Accessed 25 September 2015)
Материалы исследования
Карасаев Х. К. Словарь заимствованных слов: 5100 слов. Фрунзе: Киргизский Совет, 1986.
Юдахин K. K. Киргизско-русский словарь. Фрунзе: Главная редакция Киргизской Советской Энциклопедии, 1985.
Kyrgyz Web text corpus. Leipzig Corpora. URL: https://wortschatz.uni-leipzig.de/en (access date: 6.09.2015)
Python Documentation, 5. Data Structures. Python Software Foundation. 2025. URL: https://docs.python.org/3/tutorial/datastructures.html (access date: 25.09.2025)
The Kyrgyz News Corpus dataset. Hugging Face AI community. 2025. URL: https://huggingface.co/datasets/the-cramer-project/Kyrgyz_News_Corpus#kyrgyz_news_corpus (access date: 6.09.2025)
Исследование выполнено в рамках Государственного задания FSFU-2025-0004 «Диагностика процессов культурной интеграции и дезинтеграции в странах СНГ: анализ коммуникативных практик» в Московском государственном лингвистическом университете.