<<
>>

Алгоритм построения новых ветвей.

Пусть S — полное множество примеров (экземпляров) из некоторого класса эквивалентности. Далее операторы о из множества О будем называть элементами (примеров).

Шаг 1. Выполнить поиск «лучшего» элемента од

Шаг 2.

Произвести расщепление множества S на подмножества 5і, So,..., Sn, так чтобы все примеры из подмножества Sj имели одинаковые элементы Oj.

Шаг 3. Для каждого множества Sj, если все примеры в Sj принадлежат одному и тому же классу (имеющему ту же метку класса), создать лист дерева решений и пометить меткой этого класса. Иначе перейти к 1, положив S = Sj. Алгоритм заканчивает работу, когда все подмножества помечены, либо отсутствуют элементы, разделяющие непомеченные множества.

Что же такое «лучший» элемент?

Лучшим элементом естественно считать такой элемент, на котором некоторая функция даёт лучшую оценку. Основное требование к такой функции — выбор элемента 0{ должен увеличивать (по сравнению с исходной ситуацией) информацию о классах, помечающих обучающие выборки при разбиении рассматриваемого множества S на подмножества S\, So, • •., Sn в соответствии с элементом Од

Эта функция реализуется некоторой индуктивной процедурой. Общая цель этих действий состоит в том, чтобы построенное дерево было минимальным, насколько это возможно без потери точности. Одна из таких функций подсчитывает количество классов Сд в каждом из подмножеств, порождённых различными элементами. Можно использовать также информационную функцию полезности. Опишем её.

Таким образом, алгоритм TDIDT выглядит следующим образом.

1. Использовать значение энтропии для поиска оптимального расщепления для каждого элемента.

2. Определить такой элемент, расщепление посредством которого максимизирует энтропию при делении множества примеров на два подмножества.

3. Если критерий окончания не выполняется, повторить процедуру для каждого из подмножеств.

<< | >>
Источник: Назаренко Г. И., Осипов Г. С.. Основы теории медицинских технологических процессов. Ч. 2. Исследование медицинских технологических процессов на основе интеллектуального анализа данных. - М.: ФИЗМАТЛИТ,2006. - 144 с.. 2006

Еще по теме Алгоритм построения новых ветвей.:

  1. Лучевое и ВКБ приближения в обратных задачах
  2. МОДЕЛИРОВАНИЕ ПРОЦЕССА ДИАГНОСТИКИ РАССЕЯННОГО СКЛЕРОЗА
  3. ОПРЕДЕЛЕНИЕ КЛИНИЧЕСКОЙ ИНФОРМАТИКИ И ЕГО ОБОСНОВАНИЕ
  4. ОГЛАВЛЕНИЕ
  5. Алгоритм TDIDT.
  6. Алгоритм построения новых ветвей.
  7. 1. Построение экземпляров МТП
  8. Автоматизация анализа микроскопических изображений нейронов и их отростков
  9. Использование новейших технологий в поиске биомаркеров, ассоциированных с опухолями яичников
  10. Модель формирования функциональных систем с учетом врожденных способностей и приобретенных знаний
  11. Обзор математических методов принятия врачебных решений с учетом специфики легочных заболеваний
- Акушерство и гинекология - Анатомия - Андрология - Биология - Болезни уха, горла и носа - Валеология - Ветеринария - Внутренние болезни - Военно-полевая медицина - Восстановительная медицина - Гастроэнтерология и гепатология - Гематология - Геронтология, гериатрия - Гигиена и санэпидконтроль - Дерматология - Диетология - Здравоохранение - Иммунология и аллергология - Интенсивная терапия, анестезиология и реанимация - Инфекционные заболевания - Информационные технологии в медицине - История медицины - Кардиология - Клинические методы диагностики - Кожные и венерические болезни - Комплементарная медицина - Лучевая диагностика, лучевая терапия - Маммология - Медицина катастроф - Медицинская паразитология - Медицинская этика - Медицинские приборы - Медицинское право - Наследственные болезни - Неврология и нейрохирургия - Нефрология - Онкология - Организация системы здравоохранения - Оториноларингология - Офтальмология - Патофизиология - Педиатрия - Приборы медицинского назначения - Психиатрия - Психология - Пульмонология - Стоматология - Судебная медицина - Токсикология - Травматология - Фармакология и фармацевтика - Физиология - Фтизиатрия - Хирургия - Эмбриология и гистология - Эпидемиология -