DOI: 10.18413/2313-8912-2024-10-2-0-2

Машинный перевод вчера и сегодня

Виктория Викторовна Дёмочкина (Военный университет, Россия)
Дмитрий Юрьевич Груздев (Военный университет, Россия)
Елена Викторовна Лукьянова (Белгородский государственный национальный исследовательский университет)

Работа посвящена анализу ключевых проектов на всем треке развития машинного перевода (МП) и их роли в решение практических задач. На примере наиболее успешных инициатив установлено, что в период становления МП фактором, определяющим работоспособность систем, была энтропия текстов: чем меньше энтропия, тем выше предсказуемость, следовательно, выше эффективность технологии. Именно это объясняет успех Джорджтаунского эксперимента и проекта МЕТЕО-1, с помощью которой метеорологическая служба Канады четверть века обеспечивала автоматический перевод с английского языка на французский и обратно погодных сводок, благодаря высокой формализации текста. Доклад Консультативного комитета по автоматической обработке языка ALPAC, опубликованный в 1964 году, поставил под сомнение валидность полноценного машинного перевода, но не самой технологии, успехи которой отмечены в проектах при участии людей. Это направление, в частности, развилось в отдельную ветвь автоматизации перевода, так называемый накопительный перевод. Авторы отмечают цикличный характер развития методов и механизмов перевода с привлечением решений из области МП. Современная комбинация ресурсов и порядка их использования отличается немногим от представлений прошлого века. Разница заключается в возможностях технологий, которые проделали длинный путь от перевода, основанного на правилах и корпусе до современного статистического и нейронного перевода. Установлено, что для повышения качества последних требуется значительное увеличение объемов параллельных корпусов, должным образом обработанных, размеченных и подготовленных для автоматического обучения языковых моделей. С учетом прогресса и приобретенных преимуществ МП авторы моделируют базовые ситуации обработки текстов, в том числе с использованием ИИ. По результатам практической апробации различных методов работы с МП предложены дальнейшие пути совершенствования технологии в интересах профессиональных переводчиков, в том числе через самостоятельное обучение языковых моделей, развитие практики постредактирования (PEMT) и предредактирования для подготовки почвы для более глубоких трансформаций и достижения низких уровней эквивалентности. Массивы продолжают оставаться в центре внимания при обучении современных технологий МП. В этой связи выделяется два основных направления: совершенствование подготовки корпусов для восприятия компьютером посредством автоматизации основных типов разметки и повышение обеспеченности низкоресурсных языков.

Ключевые слова: Машинный перевод, Разметка, Аннотация, Качество МП, Энтропия, Постредактирование, Автоматизированный перевод.

Количество просмотров: 1082 (смотреть статистику)

Количество скачиваний: 1935

Полный текст (HTML)Полный текст (PDF)К списку статей

Информация для цитирования:

Дёмочкина В. В., Груздев Д. Ю., Лукьянова Е. В. Машинный перевод вчера и сегодня // Научный результат. Вопросы теоретической и прикладной лингвистики. 2024. Т. 10. № 2. C. 21-45. DOI: 10.18413/2313-8912-2024-10-2-0-2

Комментарии
Список литературы

Пока никто не оставил комментариев к этой публикации.
Вы можете быть первым.

Bharati, A., Chaitanya, V., Kulkarni, A. and Sangal, R. (2003). Anusaaraka: Machine Translation in Stages, ArXiv, cs.CL/0306130. (In English)

Brown, P. F., Della Pietra, S. A., Della Pietra, V. J. and Mercer, R. L. (1993). The Mathematics of Statistical Machine Translation: Parameter Estimation, Computational Linguistics, 19 (2), 263–311. (In English)

Costa-jussa, M., Escolano, C. and Fonollosa, J. (2017). Byte-based Neural Machine Translation, Proceedings of the First Workshop on Subword and Character Level Models in NLP, 154-158. DOI: 10.18653/v1/W17-4123 (In English)

Daems, J., Vandepitte, S., Hartsuiker, R. and Macken, L. (2017). Translation Methods and Experience: A Comparative Analysis of Human Translation and Post-editing with Students and Professional Translators, META, 62 (2), 245–270. https://doi.org/10.7202/1041023ar (In English)

Fumani, F. Q. and Reza, M. (2007). Ambiguity in Machine Translation, Ketabdari Va Etella'resaani, 9, 21-38. (In English)

Gashaw, I. and Shashirekha, H. L. (2019). Amharic-Arabic Neural Machine Translation, Computer Science & Information Technology (CS & IT), 55-68. https://doi.org/10.5121/csit.2019.91606(In English)

Gruzdev, D. Yu. and Kodzhebash, D. O. (2023). POS-powered queries for neat and lean concordances in ad-hoc corpora analysis, Teoreticheskaya i prikladnaya lingvistika [Theoretical and Applied Linguistics], 9 (4), 35‒48. https://doi.org/10.22250/24107190_2023_9_4_35(In English)

Hurskainen, A. (2018). Can machine translation assist in Bible translation?, SALAMA – Swahili Language Manager: Technical reports on LT, 62, Helsinki. (In English)

Hutchins, J. (2004a). Two precursors of machine translation: Artsrouni and Trojanskij, International Journal of Translation, 16 (1), 11-31. (In English)

Hutchins, J. (2004b). The first public demonstration of machine translation: the Georgetown-IBM system, 7th January 1954. (In English)

Volkart, L. and Bouillon, P. (2022). Studying Post-Editese in a Professional Context: A Pilot Study, Proceedings of the 23rd Annual Conference of the European Association for Machine Translation, Ghent, Belgium. European Association for Machine Translation, 71–79 (In English)

López, V. F., Corchado, J. M., De Paz, J. F., Rodríguez, S. and Bajo, J. (2010). A SomAgent statistical machine translation, Applied Soft Computing, 11 (2). https://doi.org/10.1016/j.asoc.2010.08.018(In English)

Nelyubin, L. L. (1975). Informacionno-statisticheskie i inzhenerno-lingvisticheskie osobennosti yazyka i teksta v usloviyah speckommunikacii [Information-statistical and engineering-linguistic features of language and text in conditions of special communication], D. Sc. Thesis, Applied linguistics, Leningrad. (In Russian)

Nelyubin, L. L. (1983). Translation and applied linguistics, Vysshaya Shkola Publishers, Moscow, USSR. (In Russian)

Névéol A., Dogan R. and lu Zh. (2010). Semi-automatic semantic annotation of PubMed queries: A study on quality, efficiency, satisfaction, Journal of biomedical informatics, 44. 310-8. DOI: 10.1016/j.jbi.2010.11.001. (In English)

Nirenburg, S. (ed.) (1993). Progress in machine translation, IOS Press, Amsterdam, Netherlands. (In English)

O'Brien, S. Balling, L. W., Carl, M., Simard, M. and Specia, L. (eds.) (2014). Post-editing of Machine Translation: Processes and Applications, Cambridge Scholars Publishing. (In English)

Oladosu, J., Esan, A., Adeyanju, I., Adegoke, B., Olaniyan, O. and Omodunbi, B. (2016). Approaches to Machine Translation: A Review, FUOYE Journal of Engineering and Technology, 1 (1), 120–126. https://doi.org/10.46792/fuoyejet.v1i1.26(In English)

Ornstein, J. (1955). Mechanical Translation: New Challenge to Communication, Science, 22 (3173), 745-748. DOI: 10.1126/science.122.3173.745 (In English)

Quach, K. (2016). Google's neural network learns to translate languages it hasn't been trained on: First time machine translation has used true transfer learning, The Register, available at: https://www.theregister.com/2016/11/17/googles_neural_net_translates_languages_not_trained_on/ (Accessed 10 June 2024). (In English)

Quintana, R. C. and Castilho, S. (2022). A review of the Integration of Machine Translation in CAT tools, Proceedings of the International Conference “New Trends in Translation and Technology NeTT 2022”, Rhodes Island, Greece, 214–221 (In English)

Tripathi, S. and Kansal, V. (2020). Machine Translation Evaluation: Unveiling the Role of Dense Sentence Vector Embedding for Morphologically Rich Language, International Journal of Pattern Recognition and Artificial Intelligence, 34 (1), 2059001. https://doi.org/10.1142/S0218001420590016(In English)

Schuster, M., Johnson, M. and Thorat, N. (2016). Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System, AI Blog, available at: https://ai.googleblog.com/2016/11/zero-shot-translation-with-googles.html (Accessed 10 June 2024). (In English)

Schuster M. Zero-Shot Translation with Google’s Multilingual Neural Machine

Suxia Lei and You Li. (2023). English Machine translation System Based on Neural Network Algorithm, Procedia Computer Science, 228, 409-420. https://doi.org/10.1016/j.procs.2023.11.047(In English)

Tomasello, L. (2020). Neural Machine Translation and Artificial Intelligence: What Is Left for the Human Translator?, Master’s degree theses, University of Padua, Italy. (In English)

Weaver, W. (1949). The Mathematics of Communication, Scientific American, 181 (1), 11-15. (In English)

Все журналы

Отправить статью

Научный результат. Вопросы теоретической и прикладной лингвистики включен в научную базу РИНЦ (лицензионный договор № 765-12/2014 от 08.12.2014).

Журнал включен в перечень рецензируемых научных изданий, рекомендуемых ВАК

Журнал индексируется следующими научными базами и платформами

Научный результат. Научный результат. Вопросы теоретической и прикладной лингвистики (ISSN 2313-8912)

The journal materials and website are licensed under Creative Commons «Attribution» 4.0 International.

Учредитель: федеральное государственное автономное образовательное учреждение высшего образования «Белгородский государственный национальный исследовательский университет» (НИУ «БелГУ»). Адрес: 308015, Белгородская область, г. Белгород, ул. Победы, 85.

Издатель: федеральное государственное автономное образовательное учреждение высшего образования «Белгородский государственный национальный исследовательский университет» (НИУ «БелГУ»). Адрес: 308015, Белгородская область, г. Белгород, ул. Победы, 85.

Редакция: главный редактор Ольга Витальевна Дехнич, e-mail: RR_Linguistics@bsuedu.ru, тел.: (4722) 301254.

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор)

Свидетельство СМИ

Устав редакции средства массовой информации «Научный результат. Вопросы теоретической и прикладной лингвистики»

Приказ № 636-ОД от 30.06.2023 "Об утверждении Уставов редакций средств массовой информации научных журналов НИУ «БелГУ»

Приказ № 1097-ОД от 15.11.2023 "Об утверждении Регламента издания научных журналов НИУ «БелГУ»"

Остались вопросы?
Можете написать нам:

✉ Ответственный cекретарь

✉ Администратор сайта

✉ Контент менеджер