Большая Советская Энциклопедия (цитаты)

Математическая лингвистика

Математическая лингвистика (далее М), математическая дисциплина, разрабатывающая формальный аппарат для описания строения естественных и некоторых искусственных языков. Возникла в 50-х годах 20 века в связи с назревшей в языкознании потребностью уточнения его основных понятий. В М используются по преимуществу идеи и методы алгебры, алгоритмов теории и автоматов теории. Не являясь частью лингвистики, М развивается в тесном взаимодействии с ней. М называют иногда лингвистические исследования, в которых применяется какой-либо математический аппарат.

  Математическое описание языка основано на восходящем к Ф. де Соссюру представлении о языке как механизме, функционирование которого проявляется в речевой деятельности его носителей; ее результатом являются "правильные тексты" — последовательности речевых единиц, подчиняющиеся определенным закономерностям, многие из которых допускают математическое описание. Изучение способов математического описания правильных текстов (в первую очередь предложений) составляет содержание одного из разделов М — теории способов описания синтаксической структуры. Для описания строения (синтаксической структуры) предложения можно либо выделить в нем "составляющие" — группы слов, функционирующие как цельные синтаксические единицы, либо указать для каждого слова те слова, которые от него непосредственно зависят (если такие есть). Так, в предложении "Лошади кушают овес" при описании по 1-му способу составляющими будут: все предложение , каждое отдельное слово и словосочетание С = "кушают овес" (рис. 1; стрелки означают "непосредственное вложение"); описание по 2-му способу дает схему, показанную на рисунке 2. Математические объекты, возникающие при таком описании структуры предложения, называются деревом составляющих (1-й способ) и деревом синтаксического подчинения (2-й способ).

  Другой раздел М, занимающий в ней центр, место, — теория формальных грамматик, возникшая главным образом благодаря работам Н. Хомского. Она изучает способы описания закономерностей, которые характеризуют уже не отдельный текст, а всю совокупность правильных текстов того или иного языка. Эти закономерности описываются путем построения "формальной грамматики" — абстрактного "механизма", позволяющего с помощью единообразной процедуры получать правильные тексты данного языка вместе с описаниями их структуры. Наиболее широко используемый тип формальной грамматики — так называемая порождающая грамматика, или грамматика Хомского, — упорядоченная система G = <, , , R>, где: и — непересекающиеся конечные множества; — элемент ; R — конечное множество правил вида j®y, где j и y — цепочки (конечные последовательности) элементов и . Если j®y правило грамматики G и w 1, w 2, — цепочки из элементов и , то говорят, что цепочка w 1yw 2 непосредственно выводима в G из w 1jw 2. Если x0, x1, …, xn — цепочки и для каждого i= 1, ..., n цепочка xi, непосредственно выводима из xi-1, то говорят, что xn выводима из x0 в G. Множество цепочек из элементов , выводимых в G из , называется языком, порождаемым грамматикой G. Если все правила грамматики G имеют вид A®y, где А — элемент , G называется бесконтекстной, или контекстно-свободной. В лингвистической интерпретации элементы чаще всего представляют собой слова, элементы — символы грамматических категорий, — символ категории "предложение". В бесконтекстной грамматике вывод предложения дает для него дерево составляющих, в котором каждая составляющая состоит из слов, "происходящих" от одного элемента , так что для каждой составляющей указывается ее грамматическая категория. Так, если грамматика имеет в числе прочих правила ® x, у, им y, y ® tyx, y` вин, мyж, ед, вин ® овес, жен, мн, им ® лошади, tмн ® кушают, где y означает категорию "группа глагола в числе у", ty — "переходный глагол в числе y", x,y,z — "существительное рода х в числе у и падеже z", то приведенное выше предложение имеет вывод, показанный на рис. 3, где стрелки идут из левых частей применяемых правил к элементам соответствующих правых частей. Формальные грамматики используются для описания не только естественных, но и искусственных языков, в особенности языков программирования.

  М изучает также аналитические модели языка, в которых на основе тех или иных данных о речи, считающихся известными (например, множества правильных предложений), производятся формальные построения, дающие некоторые сведения о структуре языка. Приложение методов М к конкретным языкам относится к области лингвистики (см. Языкознание).

  Лит.: Хомский Н., Синтаксические структуры, в сборнике: Новое в лингвистике, в. 2, М., 1962; Гладкий А. В.. Мельчук И. А., Элементы математической лингвистики, М., 1969; Маркус С., Теоретико-множественные модели языков, перевод с английского, М., 1970; Гладкий А. В., Формальные грамматики и языки, М., 1973.

  А. В. Гладкий.



Для поиска, наберите искомое слово (или его часть) в поле поиска


Новости 22.04.2024 15:58:29