Программа построения робастных деревьев решений и случайных лесов для сложных данных

11 Июня 2026
34
Инновации
Программа построения робастных деревьев решений и случайных лесов для сложных данных

Новая программа помогает строить модели ИИ там, где данных мало, они шумные и противоречивые, — то есть в самых трудных, но типичных для бизнеса условиях.

В Санкт Петербургском политехническом университете Петра Великого разработали программу для построения деревьев решений и случайных лесов, рассчитанную на работу с «трудными» табличными данными — когда наблюдений немного, классы перемешаны, а измерения неточны. В таких условиях классические алгоритмы машинного обучения часто теряют устойчивость и дают нестабильные результаты. Новая программа позволяет получать более надежные модели и применять ИИ там, где «по учебнику» данных вроде бы недостаточно.

Разработка ориентирована на практические задачи, где решения принимаются по таблицам с признаками. В банках это оценка риска и выявление подозрительных операций, в промышленности и энергетике — прогноз отказов оборудования по показаниям датчиков, в медицине — классификация пациентов по результатам обследований, у телеком операторов и в маркетинге — прогноз оттока клиентов. Во всех этих случаях выборки часто невелики, данные могут быть шумными, а цена ошибки модели высока — от финансовых потерь до угрозы для надежности и безопасности.

Ключевая особенность программы в том, что при построении дерева решений или случайного леса она учитывает контекст за пределами текущего узла и использует технику контролируемого «зашумления», чтобы не «зацикливаться» на случайных выбросах. Благодаря этому дерево формирует более устойчивые разбиения, а модели сохраняют стабильность на новых данных. Пользователь может построить дерево или «лес», выполнить прогноз, сохранить результат; подбор оптимальных параметров программа выполняет автоматически на основе перекрестной проверки.

Подробнее — в опубликованном патенте № 2026664169 на сайте ЦИСиТТ.