<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.2 20190208//EN" "http://jats.nlm.nih.gov/publishing/1.2/JATS-journalpublishing1.dtd">
<article article-type="research-article" dtd-version="1.2" xml:lang="ru" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink"><front><journal-meta><journal-id journal-id-type="issn">2313-8912</journal-id><journal-title-group><journal-title>Научный результат. Вопросы теоретической и прикладной лингвистики</journal-title></journal-title-group><issn pub-type="epub">2313-8912</issn></journal-meta><article-meta><article-id pub-id-type="doi">10.18413/2313-8912-2023-9-2-0-5</article-id><article-id pub-id-type="publisher-id">3137</article-id><article-categories><subj-group subj-group-type="heading"><subject>ПРИКЛАДНАЯ ЛИНГВИСТИКА</subject></subj-group></article-categories><title-group><article-title>&lt;strong&gt;Языковая сложность русских юридических подстилей и жанров&lt;/strong&gt;</article-title><trans-title-group xml:lang="en"><trans-title>&lt;strong&gt;Language complexity across sub-styles and genres in legal Russian&lt;/strong&gt;</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author"><name-alternatives><name xml:lang="ru"><surname>Блинова</surname><given-names>Ольга Владимировна</given-names></name><name xml:lang="en"><surname>Blinova</surname><given-names>Olga V.</given-names></name></name-alternatives><email>o.blinova@spbu.ru</email><xref ref-type="aff" rid="aff1" /></contrib><contrib contrib-type="author"><name-alternatives><name xml:lang="ru"><surname>Тарасов</surname><given-names>Никита Андреевич</given-names></name><name xml:lang="en"><surname>Tarasov</surname><given-names>Nikita A.</given-names></name></name-alternatives><email>nkt.tarasov@yandex.ru</email><xref ref-type="aff" rid="aff1" /></contrib></contrib-group><aff id="aff1"><institution>Санкт-Петербургский государственный университет, Россия</institution></aff><pub-date pub-type="epub"><year>2023</year></pub-date><volume>9</volume><issue>2</issue><fpage>0</fpage><lpage>0</lpage><self-uri content-type="pdf" xlink:href="/media/linguistics/2023/2/Лингвистика_9_2_2023-73-96.pdf" /><abstract xml:lang="ru"><p>Цель статьи &amp;ndash; выяснить, каковы отличия в языковой сложности между юридическими документами, противопоставленными по областям права, подстилям и жанрам. Авторы рассматривают обширный и разнообразный корпус русских юридических текстов и сравнивают (1)&amp;nbsp;международные документы и документы национального права, (2)&amp;nbsp;документы трёх подстилей (административного, законодательного и юрисдикционного), а также (3)&amp;nbsp;тексты разных жанров внутри подстилей. Для получения оценок сложности используется автоматическая модель, модули которой способны предсказывать сложность либо с использованием дообученной языковой модели ruBERT, либо с использованием 133&amp;nbsp;языковых метрик, либо гибридным образом. Анализируется коллекция, состоящая из 43&amp;nbsp;804&amp;nbsp;документов и включающая 118&amp;nbsp;768&amp;nbsp;028&amp;nbsp;слов. Документы национального права классифицированы по&amp;nbsp;трём подстилям, каждый документ охарактеризован в&amp;nbsp;соответствии с&amp;nbsp;жанром и издавшим его органом. Таким образом выделены 68&amp;nbsp;жанров. Всем документам присвоены оценки сложности в&amp;nbsp;диапазоне от &amp;laquo;0&amp;raquo; до &amp;laquo;12&amp;raquo;. Выяснено, что подавляющее большинство всех документов оценивается как максимально сложные. Так, гибридная модель присваивает класс сложности &amp;laquo;12&amp;raquo; 97,1% документов административного, 94,5% документов законодательного и 99,7% документов судебного подстиля. По отношению ко&amp;nbsp;всем документам международного права доля документов с&amp;nbsp;уровнем сложности &amp;laquo;12&amp;raquo; составляет 94,1%. Набор текстов законодательного подстиля является самым разнообразным по&amp;nbsp;сложности. В&amp;nbsp;среднем самые сложные документы в&amp;nbsp;исследуемом наборе данных относятся к юрисдикционному подстилю. Лингвистические признаки успешно противопоставляют международные и национальные документы, а&amp;nbsp;также документы законодательного и юрисдикционного подстилей. При сравнении документов по&amp;nbsp;жанрам авторы интерпретировали средние значения 22&amp;nbsp;синтаксических метрик. В&amp;nbsp;целом сравнение жанровых групп показывает, что решающее значение для оценки сложности может иметь не собственно жанр, а издавший документ государственный орган.</p></abstract><trans-abstract xml:lang="en"><p>The purpose of the paper is to find out the differences in linguistic complexity between legal documents, opposed by domain, sub-style and genre. The authors explore the large and diverse corpus of Russian legal texts and compare (1)&amp;nbsp;international documents and documents of national law, (2)&amp;nbsp;documents of the three sub-styles (administrative, legislative and justiciary), and (3)&amp;nbsp;texts of different genres within sub-styles. To obtain complexity scores, an automatic model is used whose modules are capable of predicting complexity either by using the fine-tuned ruBERT model, or by using 133&amp;nbsp;language metrics, or in a hybrid way. The paper analyzes a dataset consisting of 43,804&amp;nbsp;documents, 118,768,028&amp;nbsp;words. National law documents are classified into&amp;nbsp;three sub-styles. In addition, each document is characterized according to the genre and to the issuing body. Thus, 68 genres were identified. All documents were assigned complexity scores ranging from &amp;ldquo;0&amp;rdquo; to &amp;ldquo;12&amp;rdquo;. The vast majority of all documents were scored as maximally complex. The hybrid model assigned a complexity level of &amp;ldquo;12&amp;rdquo; to 97.1% of administrative sub-style documents, 94.5% of legislative sub-style documents, and 99.7% of judicial sub-style documents of national law. For&amp;nbsp;all international law documents, the proportion of documents with a&amp;nbsp;level of complexity of &amp;ldquo;12&amp;rdquo; is 94.1%. The set of legislative sub-style texts is the most varied in&amp;nbsp;complexity. On average, the most complex documents in the dataset are of justiciary sub-style ones. Linguistic features successfully contrast international and national documents, as well as legislative and justiciary sub-styles. When comparing documents by genre, the authors interpreted only the average values of the 22&amp;nbsp;syntactic metrics. In general, a comparison of the genre-based document groups showed that it is not the genre itself that may be decisive for the complexity score, but the issuing body.</p></trans-abstract><kwd-group xml:lang="ru"><kwd>Языковая сложность</kwd><kwd>Русские правовые тексты</kwd><kwd>Модель оценки сложности</kwd><kwd>Подстили</kwd><kwd>Анализ жанров</kwd><kwd>Документы административного подстиля</kwd><kwd>Документы законодательного подстиля</kwd><kwd>Документы юрисдикционного подстиля</kwd></kwd-group><kwd-group xml:lang="en"><kwd>Language Complexity</kwd><kwd>Legal Russian</kwd><kwd>Complexity Assessment Model</kwd><kwd>Sub-styles</kwd><kwd>Genre Analysis</kwd><kwd>Administrative sub-style documents</kwd><kwd>Legislative sub-style documents</kwd><kwd>Justiciary Sub-style Documents</kwd></kwd-group></article-meta></front><back><ack><p>Исследование поддержано Российским научным фондом, проект №&amp;nbsp;19-18-00525 &amp;laquo;Понятность официального русского языка: юридическая и лингвистическая проблематика&amp;raquo;.</p></ack><ref-list><title>Список литературы</title><ref id="B1"><mixed-citation>Борисов&amp;nbsp;А.&amp;nbsp;Б. Большой юридический словарь. М.: Книжный мир, 2010. 848&amp;nbsp;с.</mixed-citation></ref><ref id="B2"><mixed-citation>Дмитриева&amp;nbsp;А.&amp;nbsp;В. &amp;laquo;Искусство юридического письма&amp;raquo;: количественный анализ решений Конституционного Суда Российской Федерации // Сравнительное конституционное обозрение. 2017. Т.&amp;nbsp;118, №&amp;nbsp;3. С.&amp;nbsp;125&amp;ndash;133.</mixed-citation></ref><ref id="B3"><mixed-citation>Додонов&amp;nbsp;В. и&amp;nbsp;др. Большой юридический словарь. М.: Научно-издательский центр ИНФРА-М, 2001. 780&amp;nbsp;с.</mixed-citation></ref><ref id="B4"><mixed-citation>Кожина&amp;nbsp;М.&amp;nbsp;Н., Дускаева&amp;nbsp;Л.&amp;nbsp;Р., Салимовский&amp;nbsp;В.&amp;nbsp;А. Стилистика русского языка. 4-е&amp;nbsp;издание. Москва: Флинта, Наука, 2011. 464&amp;nbsp;с.</mixed-citation></ref><ref id="B5"><mixed-citation>Кучаков&amp;nbsp;Р.&amp;nbsp;К., Савельев&amp;nbsp;Д.&amp;nbsp;А. Сложность правовых актов в России: Лексическое и синтаксическое качество текстов / под ред. Д.&amp;nbsp;Скугаревского. СПб.: Институт проблем правоприменения при Европейском университете в Санкт-Петербурге, 2018. 20&amp;nbsp;с.</mixed-citation></ref><ref id="B6"><mixed-citation>Савельев&amp;nbsp;Д.&amp;nbsp;А. Исследование сложности предложений, составляющих тексты правовых актов органов власти Российской Федерации // Право. Журнал Высшей школы экономики. 2020.&amp;nbsp;Т.&amp;nbsp;1. С.&amp;nbsp;50&amp;ndash;74.</mixed-citation></ref><ref id="B7"><mixed-citation>Савельев&amp;nbsp;Д.&amp;nbsp;А., Кучаков&amp;nbsp;Р.&amp;nbsp;К. Решения арбитражных судов субъектов Российской Федерации: лексическое и синтаксическое качество текстов: аналитическая записка / под ред. Д.&amp;nbsp;Скугаревского. СПб: Институт проблем правоприменения при Европейском университете в Санкт-Петербурге, 2019. 20&amp;nbsp;с.</mixed-citation></ref><ref id="B8"><mixed-citation>Сложность российских законов. Опыт синтаксического анализа / Кнутов&amp;nbsp;А.&amp;nbsp;В., Плаксин&amp;nbsp;С.&amp;nbsp;М., Григорьева&amp;nbsp;Н.&amp;nbsp;Л., Синятуллин&amp;nbsp;Р.&amp;nbsp;Х., Чаплинский&amp;nbsp;А.&amp;nbsp;В., Успенская&amp;nbsp;А.&amp;nbsp;М. М.: Издательский дом НИУ ВШЭ,&amp;nbsp;2020. 311&amp;nbsp;с.</mixed-citation></ref><ref id="B9"><mixed-citation>Солганик&amp;nbsp;Г.&amp;nbsp;Я. Стилистика текста: Учебное пособие. М.:&amp;nbsp;Флинта; Наука, 2000. 253&amp;nbsp;с.</mixed-citation></ref><ref id="B10"><mixed-citation>Солнышкина&amp;nbsp;М.&amp;nbsp;И., Соловьев&amp;nbsp;В.&amp;nbsp;Д., Гафиятова&amp;nbsp;Э.&amp;nbsp;В., Мартынова&amp;nbsp;Е.&amp;nbsp;В. Сложность текста как междисциплинарная проблема // Вопросы когнитивной лингвистики. 2022. Вып.&amp;nbsp;1. С.&amp;nbsp;18-39.</mixed-citation></ref><ref id="B11"><mixed-citation>Шварцкопф&amp;nbsp;Б.&amp;nbsp;С. Официально-деловой язык // Культура русской речи и эффективность общения / под ред. Л.&amp;nbsp;К.&amp;nbsp;Граудиной, Е.&amp;nbsp;Н.&amp;nbsp;Ширяева. М.:&amp;nbsp;Наука, 1996. С.&amp;nbsp;270&amp;ndash;281.</mixed-citation></ref><ref id="B12"><mixed-citation>Bhatia&amp;nbsp;V.&amp;nbsp;K. An applied discourse analysis of English legislative writing. Birmingham: University of Aston in Birmingham,&amp;nbsp;1983. 145&amp;nbsp;p.</mixed-citation></ref><ref id="B13"><mixed-citation>Bhatia&amp;nbsp;V.&amp;nbsp;K. Analysing Genre: Language use in Professional Settings. Applied linguistics and language study. London: Routledge, Taylor &amp;amp; Francis,&amp;nbsp;2013. 264&amp;nbsp;p.</mixed-citation></ref><ref id="B14"><mixed-citation>Blinova&amp;nbsp;O., Tarasov&amp;nbsp;N. A hybrid model of complexity estimation: Evidence from Russian legal texts. Frontiers in Artificial Intelligence. 2022. Vol.&amp;nbsp;5.</mixed-citation></ref><ref id="B15"><mixed-citation>Dell&amp;rsquo;Orletta&amp;nbsp;F., Venturi&amp;nbsp;G., Montemagni&amp;nbsp;S. Genre-oriented Readability Assessment: a Case Study // Proceedings of the Workshop on Speech and Language Processing Tools in Education. The COLING 2012 Organizing Committee, Mumbai, 2012. P.&amp;nbsp;91&amp;ndash;98.</mixed-citation></ref><ref id="B16"><mixed-citation>Durant&amp;nbsp;A., Leung&amp;nbsp;J.&amp;nbsp;H. Legal Genres // Language and Law: A Resource Book for Students, Routledge English Language Introductions. London: Routledge, Taylor &amp;amp; Francis, 2016. P.&amp;nbsp;11&amp;ndash;15.</mixed-citation></ref><ref id="B17"><mixed-citation>Goźdź-Roszkowski&amp;nbsp;S. Legal terms in context: phraseological variation across genres // Evidence-Based LSP: Translation, Text and Terminology, Linguistic Insights: Studies in Language and Communication. Bern: Peter Lang AG, 2007. P.&amp;nbsp;455&amp;ndash;470.</mixed-citation></ref><ref id="B18"><mixed-citation>Goźdź-Roszkowski&amp;nbsp;S. Patterns of Linguistic Variation in American Legal English: A Corpus-Based Study // Ł&amp;oacute;dź Studies in Language&amp;nbsp;22. Berlin, Peter Lang Verlag: 2012. 280&amp;nbsp;p.</mixed-citation></ref><ref id="B19"><mixed-citation>Howe&amp;nbsp;P.&amp;nbsp;M. The problem of the problem question in English for academic legal purposes // English for Specific Purposes. 1990. №&amp;nbsp;9. P.&amp;nbsp;215&amp;ndash;236.</mixed-citation></ref><ref id="B20"><mixed-citation>Iedema&amp;nbsp;R.&amp;nbsp;A.&amp;nbsp;M. Legal English: Subject Specific Literacy and Genre Theory // Australian Review of&amp;nbsp;Applied Linguistics. 1993. №&amp;nbsp;16. P.&amp;nbsp;86&amp;ndash;122.</mixed-citation></ref><ref id="B21"><mixed-citation>Korobov&amp;nbsp;M. Morphological Analyzer and Generator for Russian and Ukrainian Languages // Khachay&amp;nbsp;M.&amp;nbsp;Yu., Konstantinova&amp;nbsp;N., Panchenko&amp;nbsp;A., Ignatov&amp;nbsp;D., Labunets&amp;nbsp;V.&amp;nbsp;G. (ed.), Analysis of Images, Social Networks and Texts. AIST&amp;nbsp;2015. Communications in Computer and Information Science. Springer International Publishing, 2015. P.&amp;nbsp;320&amp;ndash;332.</mixed-citation></ref><ref id="B22"><mixed-citation>Kurzon&amp;nbsp;D. How Lawyers Tell their Tales: Narrative Aspects of a Lawyer&amp;rsquo;s Brief // Poetics. 1985. Vol.&amp;nbsp;14. P.&amp;nbsp;467&amp;ndash;481.</mixed-citation></ref><ref id="B23"><mixed-citation>Mart&amp;iacute;nez&amp;nbsp;E., Mollica&amp;nbsp;F., Gibson&amp;nbsp;E. Poor writing, not specialized concepts, drives processing difficulty in legal language // Cognition. 2022. Vol.&amp;nbsp;224.</mixed-citation></ref><ref id="B24"><mixed-citation>Mattila H.&amp;nbsp;E.&amp;nbsp;S. Comparative legal linguistics: language of law, Latin and modern lingua francas, 2nd ed. Farnham, Surrey: Ashgate Publishing, Ltd.,&amp;nbsp;2013. 504&amp;nbsp;p.</mixed-citation></ref><ref id="B25"><mixed-citation>Orts&amp;nbsp;M.&amp;nbsp;&amp;Aacute;. Power and Complexity in Legal Genres: Unveiling Insurance Policies and Arbitration Rules // International Journal for the Semiotics of Law - Revue internationale de S&amp;eacute;miotique juridique. 2015. Vol.&amp;nbsp;28. P.&amp;nbsp;485&amp;ndash;505.</mixed-citation></ref><ref id="B26"><mixed-citation>Straka&amp;nbsp;M., Strakov&amp;aacute;&amp;nbsp;J. Universal Dependencies 2.5 Models for UDPipe. URL:&amp;nbsp;http://hdl.handle.net/11234/1-3131 (accessed 15.01.2023).</mixed-citation></ref><ref id="B27"><mixed-citation>Swales&amp;nbsp;J.&amp;nbsp;M. Genre Analysis: English in Academic and Research Settings. Cambridge, Cambridge University Press:&amp;nbsp;1990. 274&amp;nbsp;p.</mixed-citation></ref><ref id="B28"><mixed-citation>Tessuto&amp;nbsp;G. Investigating English Legal Genres in Academic and Professional Contexts. Cambridge: Cambridge Scholars Publishing, 2012. 315&amp;nbsp;p.</mixed-citation></ref><ref id="B29"><mixed-citation>Tiersma&amp;nbsp;P.&amp;nbsp;M. The Language of Offer and Acceptance: Speech Acts and the Question of Intent // California Law Review. 1986. Vol.&amp;nbsp;74. P.&amp;nbsp;189&amp;ndash;232.</mixed-citation></ref><ref id="B30"><mixed-citation>Trosborg&amp;nbsp;A. An analysis of legal speech acts in English Contract Law. &amp;ldquo;It is hereby performed.&amp;rdquo; // HERMES - Journal of Language and Communication in Business. 1991. Vol.&amp;nbsp;4. P.&amp;nbsp;65&amp;ndash;90.</mixed-citation></ref><ref id="B31"><mixed-citation>Trosborg&amp;nbsp;A. Statutes and contracts: An analysis of legal speech acts in the English language of the law&amp;nbsp;// Journal of Pragmatics. 1995. Vol.&amp;nbsp;23. P.&amp;nbsp;31&amp;ndash;53.</mixed-citation></ref><ref id="B32"><mixed-citation>Venturi&amp;nbsp;G. Investigating legal language peculiarities across different types of Italian legal texts: an NLP-based approach // IALF Porto. 2012. P.&amp;nbsp;138&amp;ndash;156.</mixed-citation></ref><ref id="B33"><mixed-citation>Wang&amp;nbsp;W. Text analysis // McKinley J., Heath R. (ed.), The Routledge Handbook of Research Methods in Applied Linguistics. London: Routledge,&amp;nbsp;2019. P.&amp;nbsp;453-463.</mixed-citation></ref></ref-list></back></article>