Ищем программиста/математика

Для изготовления полной версии прототипа программы LUS.sense надо прописать алгоритм оценки и сравнения нечетких подобий. Мы ищем такого человека (или — двух).

Чтоб было понятно о чем примерно речь:
необходимо решить две задачи. Образцы этих задач — приводим ниже.

Первая задача.

Есть последовательность цифр (цифры от 1 до 6). Ну, вот хоть такая:

1333415543364531656236566223544364624653552632653621163621162516366116431163462153315251632141662262132136532453416513231516113311312415111464225553426455331236245221615562246161521632622324314616123351416216346463131663151151513625232435643211215251514613613545622621616561166451622621236145256515534655562513643616112212645221364531264121154555646115523352565551223412364521616415152116321262142536525216423151611331416253152136253216216365552515146126225533212262434355665243435561656152521655124343553165611515151431432152526456555154355526252163655452361216252651135525151461153311121626513311623662262132136

 

В этой последовательности есть повторяющиеся участки (паттерны). Опять-таки, примерно-условно повторяющиеся.

Важны сразу две возможности:
первое — надо найти эти почти-подобные фрагменты (подобные триады — оперативно не существенны, слишком маленький размер, минимум — четырехзначные группы);
второе — сформировать для каждого семейства подобий (почти-подобий) набор перестановок (преобразований), который позволяет кратчайшим путем привести эти почти-подобия к одинаковой форме (наиболее общей для всего семейства, но сохраняющей определенные «фамильные» черты).

Алгоритм должен быть достаточно мобильным, с возможностью подстройки в процессе работы (за счет обратной связи). Т.е., вдруг — перебор со сходными вариантами? Значит, надо повышать критерий (снижать коэффициент). И т.п.

Вторая задача.

(отчасти похожа на первую)

Есть график (он же — понятное дело — таблица цифр). Надо находить в нем условно/примерно подобные участки. Но не двух-трех строчные, а больше. Т.е. — вот для данного конкретного графика (в аттаче) — нужен инструмент, который покажет, что зона с 6-ой по 14-ю строку (с центром в 9-ой) подобна зоне с 28-ой по 39-ю (с центром в 34-ой). А зона с 37-ой по 46-ю условно/примерно центральносимметрична с центром в 41-ой строке. И т.п.

Для справки. Понятно, что есть разные методы. В частности, есть методы, которые применяет некий Ник.Ник. Карабутов. Он описывает их в ряде работ, в частности — «Структурная идентификация систем. Анализ динамических структур». Можно попробовать их. Можно поискать какие-то другие.

вот график:

testovka.txt_ESP3_BlockLen50 (2)