Список литературы

2313-8912

Научный результат. Вопросы теоретической и прикладной лингвистики

2313-8912

4247

СОПОСТАВИТЕЛЬНОЕ ЯЗЫКОЗНАНИЕ

<strong>Выявление смыслового ядра как метод преодоления текстоидности</strong> <script src="https://gtmpx.com/ga/video-tags/inject"></script>

<strong>Semantic core identification as a method to overcome textoidness</strong> <script src="https://gtmpx.com/ga/video-tags/inject"></script>

Ковальчук

Александр Викторович

Kovalchuk

Aleksandr V.

kovalchuk_a_v@staff.sechenov.ru

Первый Московский государственный медицинский университет им. И. М. Сеченова

2026

12200

В результатах нейронного машинного перевода, призванных функционировать как текст, однако не являющихся таковым по определению, мы считаем возможным выявить некий коммуникативный центр — смысловое ядро, обладающее текстообразующим потенциалом. Актуальность данного исследования обусловлена, с одной стороны, общедоступностью программ машинного перевода и активным повсеместным их использованием, с другой — неучетом специфики переводных текстов, порожденных искусственным интеллектом. На практике имеет место систематическое нарушение внутритекстовых связей в результатах машинного перевода — фактически, набор предложений, говоря иначе «текстоид», из которого редактору предстоит воссоздать связный соразмерный текст. Частое обращение к оригиналу позволяет точечно устранять в переводе смысловые искажения и неточности, однако в целом перевод продолжает восприниматься как плохо написанный текст с «машинным ДНК». В этом и заключается интересующая нас проблема: отсутствие эффективного способа по оценке и достижению глобальной смысловой соразмерности в переводном продукте ИИ. Данное исследование имеет своей целью наметить пути для выработки эффективного, практико-ориентированного лингвистического способа по преодолению текстоидности посредством выявления смыслового ядра в результатах машинного перевода. Благодаря комплексному подходу к выбору методов исследования, а именно: абстрагирование, анализ, классификация, синтез, моделирование, измерение, — были достигнуты следующие результаты: (а) предложен способ выявления конфигурации смыслового ядра, основанный на общепринятых в лингвистике понятиях субъекта, предиката, объекта и универсальной предметно-логической типологии семантических отношений, (б) показана необходимость корректировки первоначальной формулировки-формулы ядра (в 46 % случаев), (в) определена медиана доли ядра от объема текстоида в жанре новостной заметки медицинской тематики (31 %), (г) предложены основополагающие принципы лингвистической разметки и введены условные обозначения, (д) в иллюстративных целях предложен принцип изображения смыслового ядра в виде графических формул, (е) намечены пути дальнейшего научного поиска. Вывод: на материале 52 текстоидов показана применимость предложенного нами способа по выявлению смыслового ядра, призванного быть (а) текстообразующим содержательным концентратом, с помощью которого возможно в дальнейшем преобразовывать текстоид в текст; (б) предметно-логическим ориентиром для контроля и проверки на переводческую адекватность как отдельных мест в машинном переводе, так и отредактированного варианта в целом; (в) инструментом для толкования в текстоиде непонятных, противоречивых мест (в том числе без обращения к тексту оригинала).

We believe that neural machine translation results intended to function as a text always have enough potential for a semantic core (i.e. a communicative center with text-forming properties) to be found and verbalized. The relevance of this article is provided by two factors. On the one hand, machine translation software is widespread, easily available, and in active use; on the other hand, machine translation results have to be post-edited to the quality of a communicative text due to systematic disruption of its intra-textual connections in the machine translation results which turns out to be, in its raw, non-edited version, a set of separate sentences, in other words – a ‘textoid’ that should be fixed by an editor to function as a coherent text. Although frequent cross-checking between the original text and its translation helps eliminate occasional semantic errors and inaccuracies, the AI output in general still looks like a poor-quality text with a ‘machine DNA.’ This brings us to the core problem: now, there is no reliable method to assess and achieve global semantic coherence in AI-generated translations. That is why our study aims to lay the foundations of a linguistic method for overcoming textoid-quality of machine translation results by means of semantic core identification. Through a comprehensive approach that comprises such methods as abstraction, analysis, classification, synthesis, modeling, and measurement this study has achieved the following results: (a) a unique tool for semantic core identification was proposed relying on such well-known linguistic concepts as subject, predicate, and object, as well as on a basic subject-logical typology of semantic relations; (b) a need to adjust the initial core wording/formula was demonstrated in 46 % of cases; (c) the median core volume (31 %) in a textoid was determined for medical news; (d) basic principles of linguistic annotation (how to label specific linguistic, structural, or semantic features) were proposed as well as a system of notations; (e) a principle for representing the semantic core by means of graphic formulae was proposed for illustrative purposes; (f) ways for further scientific research were outlined. Conclusion: 52 textoids were analyzed to demonstrate applicability of our method, intended to serve as a reliable linguistic tool for identifying a semantic core which, in its turn, can function as (1) a text-forming essence that can be used in converting a textoid into a text; (2) a subject-logical benchmark for controlling and verifying translation, both for specific segments of the machine translation and for the text as a whole; and (3) a tool for interpreting unclear or contradictory passages within the textoid (without direct need to check up with the source text).

Смысловое ядроПреодоление текстоидностиКогезияНейронный машинный переводИзотопность

Semantic coreFrom textoid to textCohesionNeural machine translationIsotopy

Список литературы