Длинные ответы на короткие вопросы

Что такое смысловые центры?

Смысловой центр текста – это слова, которые содержат самую важную часть соообщения, его основное событие. Так, в пятиминутном предложении руки и сердца самым важным будет словосочетание «выходи за меня». В сцене утопления Герасимом Муму таким центром LUS.sense определит фрагмент «отвернулся, зажмурился и разжал руки».
Но только в очень коротком тексте (фраза) смысловой центр (СЦ) может быть один. Как правило, их несколько. И они функционально разные. Первый тип мы только что описали. Он содержит информацию о сути события в концентрированном виде (в случае «Муму» это описание момента утопления, в случае любовного объяснения — приглашение к результирующему действию). Второй тип СЦ – содержит важные дополнительные сведения: отношение к основному событию текста, описание обстоятельств этого события, описание участников (в том числе и объектов) этого события.
Например, в том же отрывке из «Муму» второй СЦ – слова «тяжкого всплеска воды для него», еще один – слова «было залито водой».
(Подробнее об основных типах смысловых центров – см. ссылка)
(разбор утопления Герасимом Муму — см.: как топили Муму)

Как находятся смысловые центры?

Человек находит смысловые центры, ориентируясь на собственные интуитивные предпочтения или собственное понимание сути сообщения. Но у каждого человека может быть свое представление о смысле. И что важнее – формализовать такой выбор нельзя. Даже с помощью длительного обучения.
Существующие программные средства работают со словарями и грамматикой. Они тоже могут выделять основные смысловые фрагменты текста, но у них есть одно жесткое ограничение: они работают со статистикой, которая, во-первых, ставит жесткое ограничение по минимальному объему и, во-вторых, без обучения находит только смысловые центры второго типа, т.е. может разглядеть лишь самые часто встречающиеся в тексте слова, называя их почему-то ключевыми.
Обучение позволяет построить систему фильтров, за счет чего можно, во-первых, определять тематику текстов, во-вторых, в сходных текстах одной тематики находить смысловые центры первого типа. Но и это только на больших текстах, вдобавок – с низкой степенью достоверности (не более 60% вероятности правильного определения).
Есть другой способ, именно его используем мы. Это метод сопоставления подобных паттернов структуры текста. (Подробнее – см. текст «Краткое описание метода«)