DOI: 10.18413/2313-8912-2026-12-1-0-4

Автоматическое выделение ключевых выражений и аннотирование: современные теоретические подходы и практические решения для работы с текстом и речью

Дарья Дмитриевна Гусева (Санкт-Петербургский государственный университет, Санкт-Петербург, Россия)
Ольга Александровна Митрофанова (Санкт-Петербургский государственный университет, Санкт-Петербург, Россия)

Экспоненциальный рост объёмов текстовой и аудиовизуальной информации значительно повышает значимость задачи автоматического выделения ключевых выражений. В данной статье представлен всесторонний анализ современных теоретических подходов и практических решений для автоматического выделения ключевых выражений как в текстовой, так и в речевой модальностях. Основной вклад работы заключается в систематическом синтезе этих зачастую разрозненных направлений исследований в рамках единой аналитической структуры, демонстрирующей эволюцию области от статистических методов к большим языковым моделям и сквозной обработке речи. Мы рассматриваем этапы автоматического выделения ключевых выражений, характеристики ключевых выражений в письменной и устной речи, а также терминологические нюансы. Подробно обсуждаются и анализируются различные методы автоматического выделения ключевых выражений: статистические, гибридные, основанные на машинном обучении и структурные. В обзоре значительное внимание уделено новым парадигмам, включая генерацию ключевых выражений с использованием больших языковых моделей, а также представлен детальный обзор методологий и проблем автоматической аннотации корпусов. Кроме того, мы анализируем текущие направления и трудности, присущие задаче автоматического выделения ключевых выражений из устной речи, и сравниваем подходы, основанные на расшифровке и сквозном акустическом анализе. Этот синтез позволяет сделать вывод о переходе области к более интегрированной, контекстно-ориентированной парадигме. Дальнейший прогресс будет зависеть от решения ключевых задач, таких как нехватка данных для малоресурсных языков, эффективное мультимодальное объединение и тонкая оценка генеративных систем автоматического выделения ключевых выражений.

Ключевые слова: Автоматическое выделение ключевых выражений, Обработка устной речи, Суммаризация речи, Автоматическое аннотирование, Компьютерная лингвистика, Корпусная лингвистика.

Количество просмотров: 21 (смотреть статистику)

Количество скачиваний: 27

Скачать XML К списку статей

Комментарии
Список литературы
Благодарности

Пока никто не оставил комментариев к этой публикации.
Вы можете быть первым.

Все журналы

Отправить статью

Научный результат. Вопросы теоретической и прикладной лингвистики включен в научную базу РИНЦ (лицензионный договор № 765-12/2014 от 08.12.2014).

Журнал включен в перечень рецензируемых научных изданий, рекомендуемых ВАК

Журнал индексируется следующими научными базами и платформами

Научный результат. Научный результат. Вопросы теоретической и прикладной лингвистики (ISSN 2313-8912)

The journal materials and website are licensed under Creative Commons «Attribution» 4.0 International.

Учредитель: федеральное государственное автономное образовательное учреждение высшего образования «Белгородский государственный национальный исследовательский университет» (НИУ «БелГУ»). Адрес: 308015, Белгородская область, г. Белгород, ул. Победы, 85.

Издатель: федеральное государственное автономное образовательное учреждение высшего образования «Белгородский государственный национальный исследовательский университет» (НИУ «БелГУ»). Адрес: 308015, Белгородская область, г. Белгород, ул. Победы, 85.

Редакция: главный редактор Ольга Витальевна Дехнич, e-mail: RR_Linguistics@bsuedu.ru, тел.: (4722) 301254.

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор)

Свидетельство СМИ

Устав редакции средства массовой информации «Научный результат. Вопросы теоретической и прикладной лингвистики»

Приказ № 636-ОД от 30.06.2023 "Об утверждении Уставов редакций средств массовой информации научных журналов НИУ «БелГУ»

Приказ № 1097-ОД от 15.11.2023 "Об утверждении Регламента издания научных журналов НИУ «БелГУ»"

Приказ № 76-ОД от 10.02.2026 "Об утверждении состава редакционной коллегии журнала «Научный результат. Вопросы теоретической и прикладной лингвистики»"

Остались вопросы?
Можете написать нам:

✉ Ответственный cекретарь

✉ Администратор сайта

✉ Контент менеджер