Метод структурного анализа текста

Цель настоящего изложения – описать метод правильного структурного анализа текста (далее — АТ).

Основная задача АТ – работа со смыслами текстов.

Анализ должен показывать смысл текста – как явный, т.е. высказанный в словах, так и неявный, т.е. подразумеваемый автором или даже не осознаваемый им, но вкладываемый в текст подсознательно.

Показать – буквально – значит, выделить те слова, словосочетания и фразы, в которых содержится основной смысл.

1.0. Как это достигается.

Метод основан на оценке статистического распределения знаков разных видов и групп по тексту. Мы исходим из следующего утверждения: если рассматривать текст как сумму разнообразных сигналов о состоянии некоего объекта и об изменениях этого состояния, то изменения параметров этих сигналов должно как-то коррелировать с содержанием и со смыслом (в частности – функцией, задачей) текста.

Иными словами, мы утверждаем, что если, например, в одной части текста много длинных слов (и мало коротких), а в другой – много коротких (и мало длинных), то эти части содержательно и функционально отличаются друг от друга. Или если в одной части текста много шипящих согласных и мало звонких, а в другой наоборот, то эти части также отличаются друг от друга: семантически и функционально. То же самое можно сказать применительно ко всем мыслимым параметрам, которые можно отыскать в тексте.

Подчеркнем: мы констатируем отличие, а не строим никаких психосемантических, психофизических и нейрофизиологических спекуляций. Не делаем выводов, а пока только разрезаем текст и отмечаем связи.

Проще говоря, мы используем принципы метода «черного ящика», и применяем их в данном случае к тексту (как образцу поведения человека).

2.0. Многоуровневый и многофакторный анализ

Вот не абсолютно полный, но достаточный перечень параметров, которые рассматриваются нами:

1) консонанты или согласные, разделенные на 6 групп в соответствии со шкалой сонорности Есперсена; их количество в каждой строке

2) сонанты или гласные, разделенные на 3 группы по критерию переднеязычности-заднеязычности и на 3 группы по критерию верхнеязычности-нижнеязычности; их количество в каждой строке

3) количество отрицаний в данном сегменте текста;

4) количество личных местоимений в данном сегменте текста;

5) количество знаков препинания в строке;

6) отношение количества знаков в строке к количеству слов в строке;

7) количество подчинительных союзов в данном сегменте текста.

Считаются также и производные параметры, например, отношение количества отрицаний к количеству личных местоимений в данном сегменте и т.п.

Считаются и вторичные производные, например, отношение отношения количества отрицаний к количеству личных местоимений в данном сегменте к отношению подчинительных союзов в сегменте к количеству знаков препинания.

Так же как по изменению температуры, пульса или ЭКГ мы можем определять изменения состояния человека, так и по изменению, например, количества взрывных смычных или сонорных согласных мы можем определять изменение содержания текста, движения его смысла. Разумеется, если мы будем использовать только оценку динамики консонант, то такое утверждение будет безусловным преувеличением. Но мы рассматриваем все множество параметров, оценивая их изменения по мере разворачивания текста (ось абсцисс — строки, ось ординат — количество данной характеристики, данного параметра).

Результатом такого многомерного анализа будет целый комплекс различных схем структуры текста и всевозможных связей между ними. Особенно интересны и важны для нас связи между теми участками текста, структуры которых в той или иной степени сходны друг с другом. Поскольку явление повторности – основа для возможности содержательной оценки закономерностей, принципов данного текста.

С подобными моделями хорошо знакомы аналитики фондового рынка, метеорологи и другие эксперты, имеющие дело со большими, сложными и многоуровневыми системами. Их задача – попытаться предсказать поведение системы по данным колебаниям параметров. Им, например, хорошо понятно, что обычные суточные колебания цен (температур) становятся доминантой – вполне внятно организованной – при отсутствии иных сильных сигналов. Но эта четко структурированная доминанта превращается в трудно интерпретируемый шум при возникновении массивов сильных и внеплановых событий. Поэтому для работы с такими системами надо стараться не просто учитывать все параметры, но и строить модели их взаимовлияний. Другими словами, определять меру воздействия определенных композиций факторов на четкость и/или нечеткость общих закономерностей.

3.0. К вопросу об информации и содержании.

Наиболее важная идея, которая активно мешает широко понимаемой аналитике выполнять свою непосредственную задачу, анализ, может быть сформулирована примерно следующим образом: считается, что информация – т.е. сведения, содержания, факты и т.п. – бесконечно разнообразна. А помимо того, что информации много, ее с каждым следующим мгновением становится еще больше.

Коме того, считается, что в своих текстах люди сообщают друг другу эту информацию и, вдобавок, понимают ее.

Нам представляется, что это совершенно не так, что информация принципиально унитарна, а бесконечным разнообразием обладает лишь множество способов ее инфляции.

Владимир Пропп, который сформулировал схему содержания волшебной сказки, пытался показать в своей следующей книге («Исторические корни волшебной сказки»), что эту схему можно экстраполировать и на более разнообразные культурные объекты. Схема довольно проста: некий герой, культурный или, в русской традиции, просто дурак, должен восстановить целостность мироздания. Пусть даже и в виде отдельно взятой царской семьи. И предпринимает для этого всяческую суету – куда-то движется, что-то делает. Возможно, убивает дракона. Возможно, соблазняет секретаршу Кощея. Главное, что достигает заданной цели. После чего он возвращается с победой. Вот, собственно, весь сказ до копейки.

Все тексты мира написаны и рассказаны об этом. Об одном и том же. О путешествии к вдохновению и обратно. Пропп нашел это в сказках про иванов-дураков. Иванов и Топоров – в мифе о громовержце и змее. Другие структуралисты и семиотики выявили точно такую же композицию в описаниях шаманского путешествия.

Любой физиолог скажет, что удовлетворение какой-либо физиологической потребности – сексуальной, пищевой и т.п. – описывается примерно такой же схемой.

Сформулируем иначе, потому что лингвисты традиционно нервно реагируют на Проппа, шаманское путешествие и идею основного мифа: им, почему-то, кажется, что после множества заведомо неудачных и неумелых попыток универсализировать пропповскую схему, она должна относиться к разряду узкоспециальных.

Так вот, скажем в других терминах: существует сложная система, которая, как и полагается таким системам, обладает центром и периферией. Вполне развитыми, с многоуровневыми прямыми и обратными связями. И вот эта система настолько развилась, что вступает в ситуацию утомления: сигналы начинают тормозить и спотыкаться об информационный шум. Периферия перестает адекватно реагировать на координирующие и управляющие сообщения. Необходимо восстановить целостность системы. Для этого приходится выработать новый тип связи и утвердив его приоритетным для всех элементов, «прозвонить» всю систему на максимальной скорости и нагрузке.

Коллизия, ничем не отличающаяся от историй об умирающем и воскресающем боге, о правильном жертвоприношении и прочих подобных. Эту коллизию можно описать и в других терминах: скажем, применительно к человеческому организму придется говорить об утомлении, возбуждении, структурном следе адаптации и т.п. Суть от этого не меняется: схема Проппа, она же схема основного мифа (ОМ) есть та унитарная информация, которая содержится во всех, без исключения человеческих текстах. Просто она бывает написана разными знаками, символами, словами. И исполняется с помощью разного количества разномасштабных повторов.

Что же касается разнообразия информации, то оно возникает за счет инфляции значений слов (знаков).

4.0. Содержание и смысл

Большинство когнитологов говорит о смысле/семантике слова или высказывания. Т.е. фразы, предложения, порой словосочетания. Генезис этого, безусловно, понятен и объясним – предшественники когнитологов брали образцы для оценки семантики (а также ее истинности и/или ложности) в формулировках силлогизмов, часто даже частей силлогизмов, оторванных от всей конструкции.

По нашему убеждению, корректно (и продуктивно) говорить лишь о смысле текста. Сообщения. Развернутого высказывания, которое включает в себя как минимум тезис, антитезис и шум, т.е. «бессмысленную», «мусорную» информацию. Синтезис и, если это необходимо, антисинтезис можно добыть и из этой «мусорной» части. Любой меньший объект не может обладать собственной семантикой, поскольку лишен контекста.

4.1. Смысл.

Смысл – самая непростая функция речи/текста, большинство дискуссий о смысле как начались более 100 лет назад, так и не завершились до сих пор.

Мы полагаем, что следует говорить о двух смыслах.

Первый смысл любого текста – это информация о его устройстве. Строго говоря, это логика его структуры, взаимосвязи между различными структурными планами текста и их иерархия. Разумеется, у каждого текста свое уникальное устройство, хотя можно выделить ограниченное количество типов (классов) подобных устройств. И своя уникальная логика, хотя и составленная из набора стандартных конструкций.

Вот пример сопоставления таких устройств.

Возьмем запись из дневников К.Чуковского, от 27 июня 1924 года

27 июня. В Сестрорецке. В пустой даче Емельяновой за рекой. <…> В курорте лечатся 500 рабочих — для них оборудованы ванны, прекрасная столовая (6 раз в день — лучшая еда), порядок идеальный, всюду в саду ящики «для окурков», больные в полосатых казенных костюмах — сердце радуется: наконец-то и рабочие могут лечиться (у них около 200 слуг). Спустя некоторое время радость остывает: лица у большинства — тупые, злые. Они все же недовольны режимом. Им не нравится, что «пищи мало» (им дают вдвое больше калориев, чем сколько нужно нормальному человеку, но объем невелик); окурки они бросают не в ящики, а наземь и норовят удрать в пивную, куда им запрещено. Однако это все вздор в сравнении с тем фактом, что прежде эти люди задыхались бы до смерти в грязи, в чаду, в болезни, а теперь им дано дышать по-человечески. Был с Лидой у Ханки Белуги, заведующей школьным районом: шишка большая. Спорили с нею о сказках. Она сказки ненавидит и говорит: «Мы тогда давали детям сказки, когда не имели возможности говорить им правду».
Читаю Фрейда — без увлечения.
Мура говорит: большой мяч познакомился под столом с маленьким.
Глядя на «Дома для детей», на «Санатории для рабочих», я становлюсь восторженным сторонником Советской власти. Власть, которая раньше всего заботится о счастьи детей и рабочих, достойна величайших похвал.

С точки зрения модели Проппа или ОМ – это одночастная конструкция, в которой герой, после недолгого пути, сталкивается в битве с антагонистом-змеем (в данном случае – гигантской реликтовой рыбой) и терпит поражение. После чего исполняет предписанные Белугой действия: читает не-сказки (Фрейда) и фальшиво хвалит Советскую власть. Таким образом, текст можно представить в виде одночастной трехэлементной конструкции: АВС.

Рассмотрим теперь фонетическую структуру (все данные по количеству согласных, а также графики распределения их по строкам – см. Приложение 1). Мы – для большей объективности – будем оценивать два варианта ее схемы: при разбиении текста на 23 строки и на 32 (более короткие) строки. В обоих вариантах главным центром схемы является следующий фрагмент текста: «норовят удрать в пивную, куда им запрещено».

Другие (локальные) центры больших фрагментов (возьмем только разбиение на 23 строки) – строка 8 и ее аналог, строки 17-18. Соответственно, содержательно это: «тупые, злые. Они все же недовольны режимом. Им не нравится» (8) и «Мы тогда давали детям сказки, когда не имели возможности говорить им правду» (17-18).

Параллель между рабочими, которые не хотят жить в сказке санатория со «слугами», а стремятся к правде в пивной и Ханкой Белугой, которая ненавидит уже непосредственно литературные сказки (а Чуковский – типичный представитель племени изготовителей этих сказок), более чем внятна.

Вот схема повторов сходных строчных фонетических сумм по трем группам в тексте Чуковского (разбиение на 23 строки):

A Aa B C B B B Ac B A O B C Bb A B Cc Cc A A A Bc B (где O – равное количество всех трех типов согласных; Aa, Bb и Cc – равное количество двух типов согласных). Мы видим два отчетливо подобных друг другу фрагмента; их центральные области – строки [5,6,7] и строки [19,20,21]. Еще два подобных друг другу фрагмента: [9,10] и [15,16]. Далее, центральносимметричный (ЦС) фрагмент [12-16], центр – 14, небольшое искажение (ВС отображено на АВ), и ЦС-фрагмент [15-21], центр – 17-18.

В отмеченных фрагментах находим центры, записываем текст, соответствующий этим зонам в числовом виде (каждой согласной присваивается определенное число от 1 до 6, которое соответствует ее разряду по шкале сонорности; выписываются только согласные; так, слово «согласные» будет записано следующим образом: 23625) и сравниваем их между собой. Также сравниваем краевые части повторов (ЦС-фрагментов). Находим повторяющиеся группы чисел (обозначающих согласные), находим такие же группы, но с инверсиями, с включениями и делециями. Сравниваем их между собой, выявляем наиболее распространенные типы искажений. И т.д., и т.п.

В результате (подробное описание анализа мы не будем здесь приводить) получаем несколько схем разнообразных связей между частями текста, несколько списков так или иначе подобных фрагментов текста и перечень трансформаций (искажений), которые наиболее часто обнаруживаются при сравнениях нечетких подобий. Вот две из наиболее типичых перестановок, которые есть в тексте Чуковского: 123 – 132 и 123 – 312. Иногда они встречаются в следующем виде: 1231 – 1321 и 1123 – 1312. Вот выжимка из текста – те слова и словосочетания, которые чаще всего попадают в подобные друг другу фрагменты. А также те слова, которые можно обнаружить в этих фрагментах, пользуясь наиболее типичными перестановками. Курсивом выделены найденные таким образом «скрытые» слова, в скобках рядом с ними – те фрагменты, где эти слова «найдены».

Рабочих для

Лучшая еда

Для них

идеальный                 подарок (порядок)

ящики

радость

лгу (слуг)

богу (раБочие моГут)

мне (иМ Не Нрав…)

пищи мало

им вдвое боль[ше]

запрещено

это все

эти люди

в грязи

в ящики

наземь

дура (пРавДу)

смерти

теперь

ханка                          быдло (заДыхаЛись Бы До; БыЛ с ЛиДой)

шишка

с нею

безда[р] (фРейДа — БеЗ)

давали детям

им правду

подлост (ПоДСТоЛом)

Если суммировать все наши находки и попытаться интерпретировать содержание текста в соответствии с их смыслом, то мы можем сказать, что Корней Иванович крайне негативно относится к Ханке Белуге, не понимающей – как надо учить и воспитывать детей; раздражен скотским стремлением рабочих к пьянству и грязи – от чистоты санатория и приличной еды (особенно неприятно, что самому Чуковскому еды достается явно меньше) и наконец, мучается от того, что вынужден лгать о своей любви к Советской власти

5.0 Как проводится оценка изменений в структуре текста: вопросы технологии

Повторим, задача нашего анализа структуры текста – поиск изменений, поиск принципа трансформации основных закономерностей, который позволит увидеть механизм работы устройства данного текста.

Вот порядок действий.

Во-первых, составляется схема: для удобства работы аналитика-человека – в виде графика, для машинной обработки – числовая таблица.

Чуть подробнее.

Считается количество элементов данных параметров в строках (заданной длины), потом строится профиль всего текста, показывающие минимумы и максимумы присутствия тех или иных параметров.

После того как текст обсчитывается по всем возможным параметрам, мы получаем несколько новых объектов для работы. Эти объекты могут быть двух видов: либо линейная последовательность цифр («алфавит» из 6 цифр – каждая обозначает тип согласного по Есперсену), либо последовательность групп цифр в виде 2, 3, 4, 5 или 6-ти столбцовых таблиц. Соответственно и «алфавиты» 2,3,4,5 и 6-значные.

Для удобства аналитика-человека – повторим – эти объекты могут быть представлены в виде графиков.

Во-вторых, проводится поиск и анализ подобий (соответствий) между различными конфигурациями распределений концентраций избранных для данной схемы параметров.

Иными словами, полученные объекты – графики и числовые таблицы (последовательности) – тщательно и всесторонне исследуются на предмет нахождения внутренних симметрий (и их искажений), повторов, подобий, преобразований и т.п., а также нечетких форм всего вышеназванного.

Считается также повторность периферий вокруг повторных участков, находятся искажения в этих повторах, строятся иерархии и взаимозависимости этих искажений.

Тут надо отметить, что в текстах практически не встречается строгих симметрий (или повторов). Все они в той или иной степени искажены, нарушены. Но нас как раз интересуют эти искажения, поскольку в них, как правило, находятся такого рода включения, которые являются элементами другой симметрической конструкции.

После обнаружения всех видимых повторов и составления схемы их взаимосвязи, должны быть выстроены траектории мутаций их искажений: кратчайшие траектории, наиболее родственные друг другу, связанные кросс-мутациями и т.п.

Главная сложность: надо проверять разные сочетания корреляции тех или иных параметров, тех или иных ограничений (фильтров, весовых коэффициентов).

В итоге получается схема общей структуры симметрий текста. После чего наиболее значимые области (центры симметрий, которые чаще всего соответствуют содержательным центрам текста, и периферии симметрий) исследуются на предмет поиска анаграмм скрытых или явных слов.

6.0 Предварительное (частичное) резюме описания метода анализа текста (АТ)

АТ – как метод оценки содержимого «черного ящика» – должен выполнять несколько функций.

Первая.

Он должен разделять текст на кусочки – на содержательно различающиеся фрагменты. Вроде как абзацы, только не авторские, а, скажем так, истинные. Собственные абзацы текста. Эта функция исполняется с помощью различения тех участков текста, где присутствуют более длинные слова от тех, где более короткие. С помощью других различений: на участки где больше знаков препинания и где меньше; на участки, где больше отрицаний, где меньше; участки, где больше местоимений, где меньше; где больше служебных (подчинительных) союзов («как», «кто», «что», «куда», «потому» и т.п.), где меньше. Есть и еще различения.

Так вот, некоторое наложение границ этих участков (по суммам различений) и их пересечений дает искомое новое разделение текста на собственные абзацы.

Вторая функция.

АТ должен собирать и запоминать все получаемые варианты разбиений Текста, не только использованные для действительного разделения на собственные абзацы, но и те, которые оказались излишними, невостребованными. Кроме того, АТ должен провести несколько других разбиений Текста, уже не на абзацы, но на сходные, подобные друг другу, симметричные участки.

Эти разбиения необходимы для формирования путей (траекторий) которыми будут образовываться новые связи между участками Текста и которыми будут находиться важные для Текста (по смыслу) слова. Также они нужны для выстраивания схемы внутренней идиоматики Текста.

Третья функция.

АТ должен находить центры симметрических групп, находить зоны искажений этих симметрий и находить генетическую связь между разными искажениями (разных уровней). Принцип этой взаимосвязи должен стать некой матрицей расшифровки, формулой – по которой будут интерпретироваться скрытые в тексте анаграммы ненаписанных (несказанных), но подсознательно подразумеваемых автором слов.

Дополнение

Анаграммы и «скрытые» слова

В нашем методе анаграммам отведено достаточно существенное место. Но наше отношение к этому понятию несколько отличается от общепринятого.

Объяснимся.

Теория анаграмм, намеченная де Соссюром, предполагала, что между аллитерационными (ассонансными) связями слов в тексте (в стихе, гимне и т.п.) и между анаграмматическими есть существенная разница. Более того, многочисленные позднейшие работы, анализирующие повторяющиеся фонетические конструкции в архаических гимнах, загадках, стихах, регулярно подводят к выводу, что анаграммы есть, скорее, результат сознательной творческой активности, тогда как аллитерации (равно как и анафоры с ассонансами) – скорее, бес (или полу) сознательны.

В.Топоров в статье «К исследованию анаграмматических структур» (сб. «Исследования по структуре текста», Наука, 1987) пишет: «анаграмма ищет и формирует… смысл там, где он отсутствует и вообще не предусмотрен структурой языка», «анаграмма обращена к содержанию,… но выражается это содержание […] как бы случайно выбранными точками текста в его буквенно-звуковой трактовке…». Топоров подчеркивает, что «анаграммирование в загадке не может быть явлением случайным или объясняющимся лишь внешними обстоятельствами».

Приведем еще одно свидетельство. С.Муравьев в работе «Скрытая гармония» (сб. «Палеобалканистика и античность», Наука, 1989) отмечает: «[анаграммам] трудно подобрать какую-либо функцию кроме либо игровой…, либо эзотерической…, либо сакральной… Но какова бы она ни была, она сама по себе недостаточна, чтобы выделить анаграмму, если автор сам об этом не позаботился». И еще важный фрагмент: «в процессе создания любого текста неизбежно время от времени в полном согласии со статистикой возникают случайные фонические повторы. Но если текст создается… с установкой на фонику, на звукопись, такие случайные повторы либо элиминируются… как противоречащие замыслу, либо включаются в «фонограмму»… В отсутствии же установки на фонику, они либо малозаметны…, либо также подлежат устранению как противоречащие замыслу. Иными словами, случайные и малозаметные фонические повторы возможны лишь изредка в текстах, где художественная организация фонемного уровня отсутствует или сведена до минимума».

Современные ученые-лингвисты не отступили от позиции своих старших коллег и подобная точка зрения на анаграммы (и фонические повторы вообще) и по сей день является господствующей.

Мы не согласны с этой точкой зрения.

Отметим сразу: мы полагаем, что сознательный момент в формировании анаграмм (а также ассонансов, аллитераций, анафор, рифм и т.п.) является факультативным. Не существенным. По крайней мере, нас совершенно не интересует анаграмма как элемент литературной игры.

Мы считаем, что любые звуковые повторы есть составляющая часть языка и речи, которая неотделима от них и возникает вполне естественно и постоянно. Что, впрочем, не отменяет возможности сознательного усилия в ряде случаев формирования анаграмм.

Равным образом, мы полагаем, что ничего случайного в появлении фонических повторов нет и не может быть. Поскольку они есть имманентная составляющая речи, поскольку именно явление фонических повторов стоит у истоков формирования языка, поскольку они есть само основание речеговорения вообще.

Так, если даже не рассматривать генезис литературы, и путь от бесконечных буквальных повторов в шумерских мифологических текстах до современной стилистической нормы, которая полагает буквальные повторы одной из стилистических ошибок, а обратиться к другому свидетельству, к разнообразным афазиям и алалиям, которые являются рецидивами устойчивых архаических (еще палеолитических) вариантов защитного поведения – с помощью формального непонимания, то можно отметить следующий примечательный факт. Такие нейропсихические отклонения как афферентная моторная афазия или литеральная парафазия характеризуются заменой части звуков на максимально близкие им по способу произнесения (м – б, л – н и т.п.) или составляющие пары «звонкий-глухой» (с – з, б – п, т – д и т.п.). Иными словами, мы видим, что в архаике «фонические повторы» играли роль не случайных или сознательных явлений (отклонений от нормы), а были основой самой ткани речевого взаимодействия. Отметим сразу, чтобы предупредить возможные возражения, что такие феномены как афазии кажутся нам одними из множества форм разнообразных психических отклонений; между тем, периоды, когда та или иная афазия были господствующей нормой защитного речевого поведения, могли длиться не одну сотню или тысячу лет. С некоторой долей преувеличения можно сказать, что, например, эхолалия – есть мать поэзии. А поскольку эхолалия была одной из нормальных и самых распространенных форм защитного непонимания, то – утрируя – на языке скальдов, на языке Эвтерпы и Каллиопы в доисторические времена разговаривали практически все. И лишь потом начали прогрессировать до уровня Журдена.

Это, конечно, своего рода гипербола, но по сути – технологически – абсолютно верная. Впрочем, подробнее о генезисе речи лучше читать у Б.Поршнева, в книге «О начале человеческой истории».

Повторим еще раз: в основе чередований и перестановок (метатез) согласных, с которыми постоянно имеют дело компаративисты, этимологи и вообще, все языковеды, сталкивающиеся с необходимостью исторических языковых реконструкций, лежит не вполне языковой, а в большей степени социальный и психический феномен защитного поведения, которое условно можно определить как «непонимание». Период его начального и активнейшего влияния на язык лежит за пределами каких бы то ни было реконструкций и относится к временам палеолита. Непонимание защитное, непонимание естественное, связанное с несовершенством вокального и слухового аппаратов, наконец, их порождение – непонимание ритуальное, попадающее уже во вполне исследуемую зону человеческой истории. Современные нам наиболее частые случаи непонимания (в частности, детские искажения восприятия и воспроизведения звукослоговой структуры слова) относятся уже скорее к области психиатрии – тем не менее, такие патологии как различные афазии и алалии, есть, повторим, случаи отображения филогенеза в онтогенезе.

Возвращаясь к явлению анаграмматизма – как в его сознательном, так и в бессознательном исполнении – отметим: мы рассматриваем его как производное. Если угодно, можно говорить о нем как проявление более широкого и масштабного явления чередований и перестановок согласных в корнях слов (мы говорим сейчас об индоевропейской, если угодно – ностратической ветви).

Но строго говоря, идея сознательного/бессознательного анаграмматизма вообще порочна по своей сути. Точно так же, как порочны многие образы, активно использующиеся в семиотике и структуралистские: сукцессивное восприятие и симультанное, идеи нарратива и дискурса, знака и означающего и т.п. Фактически, это есть именования сложных, многосторонних явлений терминами, которые отражают лишь одну из многих граней.

Да, анаграммы были, есть и будут возникать в результате сознательного усилия. Точно так же они были, есть и будут возникать в результате усилия несознательного (или бессознательного). И точно так же, они существуют вообще вне зависимости от усилий (говорящего или пишущего). Скажем даже больше, анаграммы – т.е. распределенные в тексте «зашифрованные» слова, а точнее, не зашифрованные слова, а их части, элементы, разбросанные по тексту – есть там, где их не сможет обнаружить ни один самый пытливый литературовед. Все человеческие тексты пронизана широко понимаемыми анаграммами (или – фоническими, звуковыми повторами), вопрос только в том – как их отождествлять, как интерпретировать и как оценивать.

По нашему убеждению, для этого необходимо задать несколько модельных иерархий: иерархию извлекаемости, иерархию актуальности, иерархию укорененности (связанности). И выработать технологию их применения. Что мы и постарались исполнить.

Надо отметить, что принцип анаграмматизма – в его бессознательной ипостаси – как инструмент анализа активно использовал еще Зигмунд Фрейд (см. «Остроумие и его отношение к бессознательному», «Психопатология обыденной жизни»). Но хотя его данные вполне правомочны, они все-таки были получены в процессе заведомо направленных исследований.

Поэтому, по нашему мнению, актуальность и правомерность анаграмматического подхода для оценки восприятия речи, а равно и текста, могла бы быть и должна быть основана прежде всего на обширных и многолетних экспериментальных данных физиологов.

Как показали исследования ленинградских акустиков Павловского физиологического института, восприятие речи (текста) начинается с кратковременной фазы редуцированного воспроизведения «про себя» услышанных или прочитанных слов (гипотеза была высказана философом и психологом П.П. Блонским и филологом О. Есперсеном независимо друг от друга еще в 1920-х, подтверждена впоследствии многолетними лабораторными исследованиями физиологов школы Г.В. Гершуни, в частности, Л.А. Чистович и рядом других физиологов). При этом артикуляционное редуцированное воспроизведение (с задержкой в 15 миллисекунд) наслаивается на акустическое восприятие следующих слов. В сущности, данные физиологов-акустиков позволяют говорить о том, что процесс восприятия речи (текста) есть многоступенчатое отображение воздействия речи (текста), во время которого происходит наслоение новых сигналов на уже сформированные фонематические образы.

Соответственно, дальнейшая речь (текст) может активировать эти наслоения с той или иной интенсивностью, в зависимости от количества фонических повторов, и смысловой нагруженности.

Отметим, кстати, что эта модель восприятия нисколько не противоречит психоаналитической, а дополняет ее и подтверждает. Принципы вытесненных и прикрывающих воспоминаний хорошо согласуются с разработанной физиологами-акустиками схемой механизма восприятия речи.

Добавим также, что принципы работы с анаграммами используются в многочисленных трудах по теории структуры текста (анализ анаграмм в архаических гимнах, загадках и т.п.), в методах компаративистики и в частности, советской школой этимологии, и в работах сотрудников института славяноведения АН (анализ анаграмм в русских фольклорных текстах). Больше того, даже такие фундаментальные гипотезы как индоевропейские реконструкции В.В. Иванова и Т.В. Гамкрелидзе, используют эти принципы в своих опытах воссоздания основных и.-е.-терминов.

Но, вместе с тем, надо отметить, что какой-либо стройной системы, позволяющей выстроить ряд закономерностей, обуславливающих функциональное использование анаграмм, нет. И не существует целостной теории, которая сводила бы воедино гигантский экспериментальный материал, собранный физиологами и многочисленные филологические исследования, связанные с анаграммами. Строго говоря, даже блестящий анализ гимна Агни, исполненный Топоровым и Елизаренковой, есть ни что иное как алхимия, любительщина, и его эвристическая ценность объясняется лишь безусловным талантом исследователей, но совсем не строгостью метода.

Мы полагаем, что, хотя большой и развитой теории пока нет (разработаны только ее начала), предложенная нами формализация поиска анаграмм с помощью набора групп перестановок и подстановок имеет полное право на существование, даже будучи весьма косвенно связанной с постулатами Гримма, Вернера etc. И пусть пока данных для четкой и окончательной концепции недостаточно, дальнейшие исследования с помощью разработанного метода, воплощенного в программные средства, смогут закрыть этот вопрос.

Дополнение 2

В АТ используются не звуки, но буквы. Которые, соответственно, считаются согласными или гласными. Это, разумеется, неправильно. Надо признать, что авторы метода изначально работали именно с фонетическими записями текстов, но столкнувшись с проблемой формализации, решили пойти по самому простейшему пути. Ведь если рассматривать буквенную запись, то количество фонетических ошибок окажется вполне счетным. А значит, это можно принять как один из вариантов искажения.

Вообще, метод АТ предполагает целый ряд допущений, использование приблизительных, огрубленных значений и так далее. Мы полагаем, что многократные проверки одних данных с помощью других, позволяют элиминировать влияние этих допущений. По крайней мере, именно так всегда работала человеческая мысль в естественных науках и в технологиях.

Еще одно, вполне стандартное возражение, формулируется примерно так: вы, дескать, используете в качестве одного из параметров буквы, которые разделяете на группы по степени сонорности. Но это неверно, ведь в фонетической записи вместо букв должны быть звуки, довольно часто относящиеся к другой группе. Вы считаете длины слов, но в реальной речи словораздел далеко не всегда выделяется паузой; вы делите гласные на разные группы, но строго говоря, это можно делать только с ударными, а безударные практически все сводимы к одному нечеткому и краткому «э» (шва), и так далее. Иными словами, это обвинение в некорректности критериев выбора параметров.

Это, безусловно, справедливо. Мы действительно допускаем целый ряд «неточностей» с точки зрения идеально мыслимой строгой фонологии. Но, повторим первый аргумент: нас оправдывает то, что мы перепроверяем наши данные с помощью множества различных параметров. И в конце концов, если уж говорить всерьез – не существует ни одной системы измерений, которая была бы имманентна измеряемым объектам (сущностям).