Коротко о методе: как LUS.sense понимает тексты

Любой текст состоит из гласных, согласных, знаков препинания. Все они как-то распределены и образуют скопления, назовем их так. В одном куске текста много звонких – ‘б’, ‘д’, ‘г’ и ‘з’. А в другом, наоборот, скопились шипящие – ‘щ’, ‘ш’. В одном много длинных слов, в другом много коротких.

Считать можно все что угодно, но зачем изобретать колесо, если такие счетные единицы уже есть: гласные, согласные (звонкие, глухие), длина слова, отрицания, знаки препинания.

Отрицания тоже можно разделить на группы – с ‘не’ и с ‘ни’. Скажем, «небольшой» и «никакой».

Важно тут вот что. Нам абсолютно безразличен смысл слов. Нас интересует только количество этих ‘ш’, ‘з’, ‘у’, ‘не’ и ‘ни’.

Посчитали звонкие и глухие – построили график, на котором видно, где сколько чего.

Посчитали сонорные (‘м’, ‘л’, ‘н’, ‘р’) – построили график. Отрицания – новый график.

Дальше берем, например, личные местоимения (я, ты, он, мы, они…) Видим, что здесь получились свои скопления – в начале текста много местоимений, потом дырка, вообще их нету, в конце опять есть.

Берем новый объект для счета…

И еще один, и еще.

А теперь нас уже интересует, чем эти графики между собой похожи и чем отличаются. Не забываем, что никакого смысла, кроме поиска подобий (пускай и довольно сложного) мы не ищем. Идеи, что ‘о’ круглое, милое и солнечное, а ‘ш’ плохое, змеиное и агрессивное, оставим поэтам-песенникам. Это наука, а не игра в ассоциации.

Итак, нашли мы повторы, искажения, полные симметрии и нарушенные симметрии. Нашли центры и окраины, увидели, как этот конкретный текст «себя строит». Да, у текста, как и у человека, есть своя, только ему присущая «походка», «жесты», «болезни» – есть свой личный генокод.

Когда мы его вскрыли, можно «перетасовывать» текст в соответствии с его личным кодом. В сущности, похоже на любую расшифровку – если знаешь код, прочтешь сообщение. Суть в том, что в каждом тексте такой код всегда есть. И скрыть его невозможно, как ни старайся.

Эта перетасовка – поиск скрытых слов, или, как их называют, анаграмм.

Русская народная загадка: «ЧЕРный КОнь прыГАет в огонь». Классический — уже более 100 лет — пример фольклорной анаграмматической «шифровки/дешифровки». Из коня – КО, из черный – ЧЕР, из прыгает – Га. Вот и кочерга. Как видим, анаграммы можно делать и специально, осознанно. Важнее, однако, то, что их нельзя осознанно НЕ делать.

В итоге получаем новый текст.

Он может не сильно отличаться от исходника, так обычно бывает, когда человек пишет без особых эмоций на тему, которая ему хорошо известна. Что думал, то и написал.

А может отличаться очень сильно, если автор взволнован, неуверен в том, что он излагает. И уровень его писательского мастерства здесь никакой роли не играет. Все тревоги, недосказанности и намеренная ложь, как бы глубоко они не таились – а очень часто автор и сам не отдает себе отчет в том, что он думает на самом деле – непременно обнаружат себя. Вот такие дела.

Это первый, элементарный, уровень анализа. Так что, to be continued…