16+

ЭВОЛЮЦИЯ ЕСТЕСТВЕННОГО ЯЗЫКА: МЕХАНИЗМЫ ДИССИПАЦИИ И САМООРГАНИЗАЦИИ

Aннотация

В статье предложен взгляд на естественный язык как на диссипативную самоорганизующуюся систему. Диссипация подразумевает, что информационная энтропия языка может снижаться – в частности, при преодолении системой состояния динамического хаоса с последующим изменением её эволюционной парадигмы. Диссипативные механизмы играют роль как в синхроническом функционирования языковой системе, так и в процессе её диахронического развития, причём в последнем случае их роль может оказаться решающей, как показано на примере английского языка. На разных уровнях языковой системы действуют разные диссипативные механизмы, что обусловливает разный уровень неопределённости языковых знаков. Так, развитая морфологическая система (и, соответственно, согласование как основной тип синтаксической связи) понижают уровень энтропии. Снижение же числа морфологически выраженных категорий ведёт хотя и не к пропорциональному, но заметному увеличению количества энтропии. Отсутствие пропорционального роста степени неопределённости объясняются механизмами языковой компенсации, в частности – возрастающей ролью порядка слов и служебных лексем.


Язык, как известно, не является простым набором знаков, употребляемых для передачи информации, а представляет собой систему. Соответственно, как и в любой системе, особая роль в функционировании и развитии языка отводится принципу взаимодействия элементов при объединении их в последовательно укрупняемые структуры. Во-первых, как и всякая открытая система, действующая продолжительное время, язык подвержен эволюции (см., напр., [7], [10]). Во-вторых, взаимодействие элементов детерминировано, в связи с чем возникает идея формального описания системы. Формальное описание, в свою очередь, сулит перспективы в разработке средств машинного перевода, создания структурированных баз данных и, вполне возможно, разработке искусственного интеллекта. Поэтому попытки формализовать язык предпринимались и предпринимаются, несмотря на целый ряд сложностей, с которыми сталкиваются исследователи.

Одна из первых попыток дать языку формальное описание была предпринята представителями Копенгагенской лингвистической школы (глоссематика). Процитируем в этой связи главу школы Л. Ельмслева (выделено автором): «Анализ текста в целом примет, таким образом, форму процедуры, состоящей из продолженного деления или комплекса делений, в котором единичная операция представляет собой единичное минимальное деление. В данной процедуре каждая операция служит предпосылкой для последующих операций и сама обусловлена предшествующей операцией.

Точно так же если процедура является комплексом делений, то каждое исчерпывающее деление, входящее в комплекс, будет служить предпосылкой для других исчерпывающих делений или само будет следствием предпосылки других исчерпывающих делений, входящих в комплекс. Между сегментами процедуры существует детерминация, поэтому последующие сегменты всегда вытекают из предыдущих, но не наоборот: как детерминацию между определениями, так и детерминацию между операциями можно рассматривать либо как селекцию, либо как спецификацию. Подобную процедуру в целом мы назовём дедукцией, а формально определим дедукцию как продолженный анализ или как комплекс анализов с детерминацией между анализами, входящими в него» [3, с. 157].

Закончив цитату, зададим себе вопрос: если анализ языковой системы (у Л. Ельмслева – текста) детерминирован, в нём каждая операция обусловливает последующие операции и, в свою очередь, обусловлена определёнными предпосылками, то как может быть недетерминированной сама система языка? Безусловно, в языке можно выделить причинно-следственные связи, управляющие системой и связывающие её с другими системами. Но в таком случае почему же эффективных формальных моделей языка до сих пор нет? Почему, например, электронные переводчики не просто уступают переводчику-человеку, но и в ближайшей перспективе не могут рассчитывать на какую бы то ни было конкуренцию?

Для ответа на эти вопросы попытаемся выяснить, каким образом причинно-следственные связи участвуют в функционировании системы языка (особенно синтаксиса), как эти связи переходят из системы языка в речь, и главное – в какой степени детерминирована сама система языка и в частности синтаксис.

Методы

При работе над данной статьёй использовались методы расчёта информационной энтропии, основанные на формальном описании энтропии, предложенной К. Шенноном и дополненные авторами применительно к естественным языкам.

Основная часть

Сначала коротко рассмотрим детерминированность и упорядоченность на примере более низких, по сравнению с синтаксисом, уровнях языковой структуры.

В структурализме сложился особый взгляд на причины языковых изменений, получивший довольно широкое распространение. Согласно этому взгляду, фонетические изменения происходят под давлением системы, т.е. в связи со стремлением системы языка к внутренней логической организации. Иными словами, источник изменения системы – это сама система. Такой взгляд представляется не вполне оправданным, особенно если учесть, что язык здесь рассматривается как саморазвивающаяся, самодовлеющая и даже самодостаточная сущность, в отрыве от носителей языка, то есть социума.

Если язык представляет собой действительно самостоятельную систему и развивается по собственным законам, то из этого следует, что он не зависит от своих носителей и, следовательно, строго объективен. Но тогда как быть, например, с так называемыми «мёртвыми» языками – они что, тоже продолжают саморазвиваться?

Очевидно, что только движением языковой системы, в отрыве от носителей языка и от окружающей действительности вообще, причины фонетических изменений объяснить невозможно (точнее, возможно, но такое объяснение вряд ли будет корректным).

     С другой стороны, можно ли связать все изменения фонетической системы только с потребностями носителей и изменениями социальной среды? Ведь если бы язык непосредственно, хотя бы не всеми своими уровнями, а только фонетическим, воспринимал абсолютно любые изменения в общественной жизни носителей, то в силу слишком высокой гибкости он едва ли смог бы удовлетворять потребность людей в обмене информацией.

Иными словами, язык – это система, которая, наряду с изменчивостью, обладает и значительной устойчивостью. Как отмечает В.В. Иванов, «… в языке одновременно действуют три связанные между собою «силы»: во-первых, стремление носителей языка … к экономии произносительных усилий, т.е. к облегчению работы органов речи при образовании звуков…; во-вторых, стремление к расширению возможностей языка для обеспечения постоянно растущих потребностей коммуникации…; в-третьих, стремление к сохранению устойчивых противопоставлений фонологических … единиц…» [4, c. 67 – 68].

Подобная трактовка представляется нам вполне приемлемой, поскольку в ней учтены факторы двух основных порядков: собственно языковой системы и среды. При этом надо отметить, что первые две «силы», названные В.В. Ивановым, являются внешними по отношению к системе языка. Собственно лингвистическим фактором здесь признаётся лишь третья «сила» – стремление языка к сохранению симметричности фонемных противопоставлений. При такой схеме получается, что фонологические изменения происходят не  под давлением системы языка, а под давлением внешних, экстралингвистических сил (стремление к экономии и растущие потребности общества в передаче знаний) и в том случае, если система допускает данные изменения.

Таким образом, роль причинной обусловленности фонетических изменений, как в историческом, так и в синхроническом аспекте, можно считать очень высокой, однако следует ли из этого, что вся система языка строго детерминирована и начисто исключает любую случайность? Обратим внимание на более высокие уровни.

В начале 1970-х гг. М. Халле [6] предложил морфологическую модель из трех компонентов:

  • список морфем;
  • правила формирования слов;
  • фильтр для слов-исключений.

Построение всех допустимых слов данного языка задаётся первым и вторым компонентами. Фильтр исключений нужен для того, чтобы отсекать морфологически недопустимые производные слова, что может быть связано, например, с особенностями семантики производящих основ. Всем морфологически потенциальным, но не существующим в реальности словам фильтр исключений приписывает признак «отрицательной лексической единицы» [- lexical item].

Второй компонент модели М. Халле, как видно, строится на основе принципа причинно-следственной связи. В частности, правила формирования слов – это не что иное, как каузальный атрибут, допускающий сочетания определённых морфем друг с другом. Возьмём такой элемент, как глагольная основа: она определяет тот набор суффиксов и окончаний, который допустим в каждом конкретном случае. Например, английский глагол believe потребует для третьего лица единственного числа настоящего времени окончания –s, для причастия – окончания -ing и т.д. Возможно прибавление суффикса –er для образования существительного believer. Однако эта глагольная основа не допустит, скажем, суффикс причастия *believely. Но вот работа «фильтра исключений» уже не настолько детерминирована, поскольку отсекает такие морфологические конструкции, которые формально допустимы, но в действительности не встречаются: reversal, recital, proposalreversion, recitation, proposition; но refusal, rehearsal, acquittal, arrival*refusation, *rehearsion, *acquitation, *arrivation или derivation, description, conversion, confusion*derival, *describal, *conversal, *confusal.

Переходя к синтаксической системе, можно предположить, что детерминизм ещё менее строг, нежели в морфологии. Рассмотрим это на примере устойчивых (а следовательно, и более детерминированных) синтаксических сочетаний неидиоматического характера, которые являются повторяющимися и идентифицируются носителями каждого конкретного языка как соответствующие определенным правилам организации. Подобные сочетания принято называть коллокациями. Отмечается, что зачастую знания одного языка не способствуют (или мало способствуют) обнаружению параллельных коллокаций в системе другого языка. В частности, английскому выражению administeranoath соответствуют фр. faireprêterserment, исп. hacerprestarjuramento, нем. denEidabnehmen, рус. привести к присяге и т.д. [5].

В отличие от свободных  сочетаний коллокации обладают достаточно жесткой структурой и лимитированным набором компонентов. По сравнению же с идиоматическими единицами они всегда мотивированы, не содержат аллегорий, а их структура (как семантическая, так и синтаксическая) достаточно прозрачна и определяется особенностями грамматического строя и правилами лексической сочетаемости каждого конкретного языка. Отсюда можно предположить, что коллокации занимают промежуточное положение между свободными сочетаниями и идиомами.

Таким образом, с грамматической точки зрения коллокации – это, по сути, дистрибуции частей речи и морфологических форм, устойчиво повторяющиеся в определенных сочетаниях. Безусловно, роль принципа причинности в построении коллокаций существенно выше, чем при свободных сочетаниях. Сопоставим некоторые такие коллокации в русском и английском языках.

Так, устойчивые сочетания с предлогами могут обнаруживать явный параллелизм, т.е. употребление предлогов, соответствующих друг другу по значению. Так, английскому выражению relyon соответствует русское полагаться на, где предлоги on и на эквивалентны. Оба выражения являются коллокациями, поскольку глаголы rely и полагаться требуют наличия после себя существительного с определенным предлогом, как, например, IrelyonyourexperienceЯ полагаюсь на ваш опыт. Выбор предлогов в таких конструкциях также бывает крайне ограничен, в данном случае – всего одним предлогом на (on). В частности, фразы  типа *Я полагаюсь к вашему опыту или *Irelytoyourexperience в обоих языках неприемлемы. Другими примерами параллельных предложных коллокаций являются взывать к – appealto, обращаться к – turnto, защита от (против) protectionfrom (against) и пр. Обратим внимание, что в последней паре примеров уже допустимы два предлога, т.е. обусловленность менее строгая.

Во многих случаях предложные коллокации в двух языках обнаруживают существенные расхождения. На наш взгляд это связано отнюдь не с тем, что сам по себе набор предлогов в одном языке беднее (богаче), чем в другом (неважно, в русском или английском). На самом деле система предлогов в английском языке развита не меньше, чем в русском, просто сам характер употребления предлогов различен. Это заключается хотя бы в том, что английские предлоги, как правило, бывают задействованы лишь в управлении средствами примыкания, тогда как русские предлоги обычно связаны с согласованием. Кроме того, предлоги, хотя и являются служебной частью речи, обладают определенным набором значений, т.е. в большинстве своем полисемичны. А полисемия одного языка, как правило, не совпадает с полисемией другого, что опять же не способствует установлению строгих и однозначных  соответствий.

Примерами несоответствий русских и английских предложных коллокаций могут служить следующие выражения: зависеть от – dependon, лекарство от – curefor, ссылаться на – referto и пр. Русские выражения *все зависит на него, *лекарство для гриппа, *я сослался к работе Хомского столь же некорректны, как и английские *everythingdependsfromhim, *thecurefromflu, *IreferredonChomskyswork.

Как видим, даже в устойчивых синтаксических сочетаниях допускается определённая степень свободы, не допускающая их абсолютной предсказуемости. Ну а коллокации, в основе которых лежат правила лексической сочетаемости, гораздо чаще бывают произвольны и, соответственно, непредсказуемы. В частности, в английском языке есть коллокации commitfraud и perpetratefraud, однако из комбинаций commitsuicide и *perpetratesuicide допускается лишь первая. Соответственно, для разбора лексических коллокаций конкретного языка требуется большее количество фильтров, отсекающих недопустимые конструкции.

Действительно, в этом легко убедиться, если попытаться предсказать предложения хотя бы даже в монологическом выступлении. Вряд ли удастся добиться высокой точности предсказания, если не ознакомиться с текстом речи предварительно.

Таким образом, исследуя роль принципа причинности в развитии и функционировании системы языка, мы должны чётко представлять, что данная система изменяется и действует не только под влиянием внутренних, но и внешних, экстралингвистических моментов, и помимо упорядоченности этой системе в определённой степени присущ беспорядок. Степень этого беспорядка можно выразить через величину информационной энтропии системы (само понятие информационной энтропии было введено в обиход мАтематиком Клодом Шенноном в середине ХХ века [8], подробнее об информационной энтропии языка см., напр., [1], [2]). Это означает, что в системе языка постоянно присутствует элемент динамического хаоса, способный порождать явления разной степени сложности с труднопредстказуемым результатом (о динамическом хаосе в системах разных типов см., напр., [9]).

Если на уровне лексики значение энтропии вычислить сравнительно несложно (достаточно подсчитать значение слов и их значений по словарю), то с синтаксическими структурами всё обстоит несколько сложнее, поскольку на уровне синтаксиса есть определённые трудности с установлением количества планов содержания. Здесь нередки случаи гомоморфизма, который в чём-то сродни лексической омонимии. Причина этого – положительная энтропия синтаксической системы. Так, в большинстве случаев при лексическом наполнении глубинных структур происходит дивергенция: на основе одной и той же тектограмматической структуры мы получаем множество N фенограмматических форм. Но вследствие положительной энтропии возможна и конвергенция синтаксических структур, когда при определённом лексическом заполнении две различные тектограмматические структуры дают нам идентичные фенограмматические формы. Рассмотрим в этой связи пару английских предложений с предлогом with:

We discussed the movie with Bruce Willis.

I saw the man with my binoculars.

В данных образцах мы имеем 2 плана выражения на 4 плана содержания, причём ни в одном из приведённых примеров нет случаев лексической омонимии – корни слов, входящих в состав всех этих предложений, сохраняют своё значение. Конвергенция в данном случае заключается в том, что без анализа всей ситуации мы не можем определить функцию существительного с предлогом: то ли оно употребляется атрибутивно и относится к дополнению (the movie with Bruce Willis и the man with my binoculars), то ли это обстоятельство и входит в состав предиката (discussed … with Bruce Willis и saw … with my binoculars).

При переводе первого предложения на русский язык конвергенция сохраняется: мы обсудили фильм с Брюсом Виллисом; непонятно, то ли Б. Виллис сыграл роль в фильме, то ли участвовал в обсуждении. А вот при переводе двух толкований второго предложения конвергенция исчезнет и мы получим два отдельных высказывания: я видел человека с моим биноклем и я видел человека в свой бинокль. Другими словами, уровень энтропии (применительно только к данным примерам) для русского языка по сравнению с английским будет 1,5/2. Конечно, это не означает, что в английском языке уровень энтропии ровно на треть выше, чем в русском, но то, что он в целом выше – безусловно. Причиной этого является разница в числе морфологически выражаемых категорий. Ведь морфологический маркер сам по себе является дополнительным планом выражения. Разумеется, в языках, близких к изолирующему типу, отсутствие или недостаточность морфологически маркированных категорий компенсируется другими способами – порядок слов, служебные единицы (глаголы, частицы и пр.), однако полной такая компенсация быть не может.

В целом можно констатировать, что чем сильнее в том или ином языке развита морфология (а вместе с ней – и согласование как основной тип синтаксической связи), тем ниже уровень энтропии его синтаксической системы. Напротив, сокращение числа морфологически маркированных категорий ведёт к увеличению количества энтропии, хотя увеличение это не будет прямо пропорциональным. Включаются своего рода «компенсирующие механизмы», которые не позволяют энтропии языка достичь такого уровня, когда практически любое предложение получает два, а то и более, возможных толкований. Самый распространённый из таких механизмов – возрастающая роль порядка слов и служебных частей речи.

Есть все основания рассматривать язык как диссипативную самоорганизующуюся систему, которая при формальном описании может быть смоделирована как динамическая. Во-первых, язык представляет собой открытую систему, он не замкнут на себе, непрерывно взаимодействует с обществом, с человеком – своим творцом и носителем, а отдельные языки также постоянно взаимодействуют и друг с другом. Во-вторых, язык состоит из неограниченного множества элементов – в самом деле, нельзя сказать даже для отдельного языка, какое количество морфем, слов или синтагм составляют верхнюю границу. В-третьих, язык – система нелинейная: даже зная точное состояние системы того или иного языка в данный момент, невозможно абсолютно точно предсказать его дальнейшее развитие. Наконец, в-четвёртых, в развитии языка можно проследить смену устойчивых и неустойчивых состояний.

Повышение энтропии системы может привести её в состояние бифуркации, переходу от устойчивого состояния системы к неустойчивому, которое представляет собой режим с обострением. В режиме с обострением система становится чувствительна к малым флуктуациям и для выведения системы на тот или иной эволюционный путь в момент обострения достаточно незначительных воздействий. В качестве примера такой бифуркации с последующей сменой пути развития (и языкового типа в целом) удобно рассмотреть английский язык.

Выбор именно английского языка неслучаен и обусловлен одной важной особенностью, для рассмотрения которой необходим небольшой экскурс в историю этого языка. Изменения грамматического строя английского языка, связанные с разрушением некогда стройной флективной системы ознаменовали переход от древнеанглийского к новоанглийскому периоду. Быстрая, даже скачкообразная смена синтетического строя на аналитический явилась, пожалуй, беспрецедентным случаем в истории не только английского, но и германских языков в целом. По времени эти изменения совпадают с  завоеванием Британии викингами (преимущественно датчане и норвежцы) и следуют непосредственно за этим завоеванием. Именно в этот период (IX – XI вв.) английский язык утрачивает большую часть флексий, в нем разрушаются системы рода и падежа, исчезает согласование прилагательного с существительным.

На наш взгляд, источник столь радикальных изменений следует искать в сочетании двух факторов: ослабление артикуляции флексии и взаимодействие близкородственных (конкретно – скандинавских) языков. Именно близкородственных, поскольку, например, французский язык, занявший впоследствии господствующее положение в английском обществе, все же не оказал существенного влияния на грамматический строй английского языка, хотя и сильно обогатил его лексический состав.

Со скандинавским языком ситуация была иной. Процент скандинавских заимствований (по сравнению с французскими) относительно невелик. Это объясняется не только тем, что язык викингов не стал господствующим в Англии, но и большим количеством общих корней слов. Корень, как известно, является наиболее стабильным элементом морфологической системы языка, флексия же, напротив, наименее устойчива. При наложении английского и скандинавского языков часто возникали слова со сходными или даже общими корнями, но разными окончаниями, которые к тому же слабо артикулировались. Различия между флексиями в сочетании с их ослабленной артикуляцией оказались губительными для всей флективной системы языка, что и повлекло столь кардинальную смену его строя.

Для сравнения любопытно привести пример с нидерландским языком, сложившимся приблизительно в тот же период (IX – XI вв.) на основе нижнефранкского, но под влиянием саксонских и фризских диалектов. Условия здесь примерно те же, что и в английском: взаимодействие близкородственных языков на фоне ослабления флексии. Результаты также поразительно совпадают: в обоих языках отсутствует система падежей существительного, нет согласования, два падежа (субъектный и объектный) у личных местоимений, и в итоге – аналитический строй. И все это при том, что и в нижнефранкском, и в саксонском, и во фризском языках были хорошо развитые флективные системы!

Таким образом, причину разрушения системы флексий в английском языке в IX – XI вв. и перехода к аналитизму следует, видимо, искать не в отдельных факторах (контакт языков или перенос ударения на начало слова), а в их взаимодействии.

Разумеется, было бы слишком поспешным утверждение о том, что только рассмотренные два факта в совокупности обусловили переход системы английского языка в режим с обострением, из которого он вышел радикально изменившимся – возможно, свою роль сыграли какие-то ещё, неучтённые здесь, факторы. Но то, что ломка синтетической системы и создание принципиально иной, аналитической системы – это результат нарастания энтропии с последующей бифуркацией и переходом на новый эволюционный путь подтверждается как принципиальной разницей строя древнеанглийского и среднеанглийского языка, так и временем, которое занял этот переход. Ведь примерно 200 лет – это совсем немного по меркам исторического развития языка.

Заключение.

Обобщая изложенное, можно сказать, что конец древнеанглийского периода ознаменовался нарастанием энтропии в системе языка, что повлекло переход к состоянию неустойчивого равновесия (бифуркация), выход из которого на новый этап развития был обусловлен «ослаблением контроля» над языком в связи с Норманнским завоеванием Англии (флуктуация). Самоорганизация языка нового типа происходила уже не на морфологической основе – в качестве аттракторов служили синтаксические структуры, но это уже отдельная история. Мы же, исходя из вышесказанного, имеем достаточно оснований считать, что язык вполне подпадает под определение самоорганизующейся системы, в нём происходят диссипативные процессы, он может быть формализован, и абстрактная количественная модель может адекватно описывать пусть не все, но очень многие процессы, происходящие в естественных языках.

Как ни парадоксально это может прозвучать, но самоорганизация языка может проходить не вопреки стремлению к беспорядку, а как следствие его нарастания. Неравновесный порядок может существовать только в диссипативных системах при «подпитке» энергией извне. Для подержания порядка требуется компенсировать потери, которые неизбежно возникают в ходе диссипации при нарастании энтропии. В физике диссипативными называют обычно потери, связанные с перетеканием тепла или массы, поскольку их физическая сущность – рассеяние (диссипация) энергии. В условиях диссипации, традиционно воспринимаемой как проявление распада структур, их неустойчивости, возникает порядок! Применительно к языку диссипация означает «выброс вовне» изживших себя элементов и структур, которые, при наличии «внешних поступлений», заменяются на новые.

Список литературы

  1. Аматов, А.М. К вопросу машинного перевода: энтропия языковой системы и способы ее преодоления // Вестник Ленинградского государственного университета им. А.С. Пушкина. No 2 (13). СПб: ЛГУ, 2008. С. 71 – 91.
  2. Аматов, А.М. Структурно-парадигматические механизмы изменения уровня энтропии в системе естественного языка // Языковые измерения: пространство, время, концепт. Мат-лы IV Международной научной конференции. Т.1. М.: Книга и бизнес, 2010. С. 15 – 24.
  3. Ельмслев, Л. Пролегомены к теории языка // Зарубежная лингвистика. I. М.: Прогресс, 1999.
  4. Иванов, В.В. К проблеме причинно-следственных отношений в развитии звуковой системы языка // Филологические науки. Научныедокладывысшейшколы, 1995. №1.
  5. Benson, M., E. Benson, R. Ilson. The BBI Combinatory Dictionary of English. Amsterdam – Philadelphia: John Benjamins Publishing Company, 1986.
  6. Halle, M. Prolegomena to a Theory of Word Formation // Linguistic Inquiry, 1973. Vol. 4(1).
  7. Martinet, A. Éléments de linguistique générale. Russian edition, Moscow: Editorial URSS, 2004. 224 p.
  8. Shannon, C.E. A Mathematical Theory of Communication // Bell System Technical Journal. Champain, Illinois: University of Illinois Press, 1998. Pp. 379 – 423 and 623 – 656.
  9. Strogatz, S. Non-linear Dynamics and Chaos: With applications to Physics, Biology, Chemistry and Engineering. Cambridge: Perseus Books, 2000. 498 p.
  10. Wildgen, W. The Evolution of Human Languages. Scenarios, Principles, and Cultural Dynamics // Series: Advances in Consciousness Research. Amsterdam: Benjamins, 2004. 236 p.