В левом меню вы можете скачать Decision tree with Time limit 1.5 бесплатно, без регистрации и ввода смс. Ссылка на скачивание прямая, поэтому вам не придется ожидать, загрузка Decision tree with Time limit начнется сразу же автоматически, без перехода на другую страницу. Размер программы составляет 1000 Кб
Decision tree with Time limit - программа, позволяющая строить деревья решений для задач классификации. Результат программы в виде Pascal кода, который может быть легко адаптирован под любые универсальные языки программирования (php, C++, C#, JavaScript и т.п.). Отличительная особенность - возможность влиять на "стоимость" результирующего дерева.
Дерево принятия решений - один из мощных средств для анализа больших данных. Деревья предназначены для задач классификации. И с этим справляются иногда лучше, чем нейросети.
Программа "Дерево решений с ограничением по времени" дает возможность создать (обучить) такое дерево на основе данных из CSV файла. Входной файл для программы должен быть в текстовом виде.
Что такое "с ограничением по времени"?
Очень часто получение каких-то параметров более затратное, стоит больше. Яркий пример - постановка медицинского диагноза. Врач (по сути) имеет дерево решений в своей голове. Он начинает опрос с более простых вопросов, которые можно быстро получить (мало затрачивается времени). И только в случае проблем с диагностикой на более поздних стадиях обследования назначаются анализы. Начинают с более быстрых-дешевых. Подобная ситуация возникает и в других случаях. Например при анализе фотографий какие-то характеристики считаются очень быстро и именно с них нужно начинать анализ.
В данной версии не реализовано:
- многопоточность;
- нет проверки на тестовых данных (нет возможности проконтролировать переобучение);
- не реализовано отсечение ветвей (pruning);
- 64-битность;
- пропущены некоторые проверки (в частности не контролируются AbsMinTreeRecords, MinTreeRecords).
Требования к данным
Информация об объектах, которые необходимо классифицировать, должна быть представлена в виде конечного набора признаков (колонок), каждый из которых имеет числовое значение. Такой набор атрибутов назовём примером (строка). Для всех примеров количество колонок и их состав должны быть постоянными. Множество классов, на которые будут разбиваться примеры, должно иметь конечное число элементов, а каждый пример должен однозначно относиться к конкретному классу. Число классов не более 256 (нумерация от 0 до 255). Для случаев с нечёткой логикой, когда примеры принадлежат к классу с некоторой вероятностью, программа неприменима. В обучающей выборке количество примеров должно быть значительно больше количества классов, к тому же каждый пример должен быть заранее ассоциирован со своим классом.