Классификация математических методов диагностики и прогнозирования заболеваний
В различных сферах человеческой деятельности используется множество методов классификации, которое постоянно растет [12. 16, 17, 62, 90]. В медицинских приложениях используют методы классификации, основанные на различных подходах и на различных способах представления знаний.
Выделяют интенсиональные представления - схемы связей между атрибутами (признаками) и экстенсиональные представления - конкретные факты (объекты, примеры) [53, 54].Различают большой класс статистических методов, в которых объекты классификации рассматриваются как многомерные случайные величины, распределенные по определенному закону. Среди них широко известны методы диагностики, построенные по схеме Байеса, согласно которой определяют отношения правдоподобия в различных областях многомерного пространства ИП.
В байесовской схеме диагностики заболеваний вероятность заболевания пациента рассчитывается по классической формуле Байеса
где pj- вероятность j-ой болезни пациента, πj- доля больных болезнью jсреди больных диагностируемыми болезнями; q (aQi) - вероятность того, что i-й ИП примет значение a0iпри наличии j-ой болезни- произведение всех
i-ых признаков от 1 до т. В знаменателе сумма таких произведений для всех диагностируемых болезней j(от j = 1 до j = n).
Если при обследовании пациента величина i-го ИП равна a0ι, то по
известному распределению вероятностей находится плотность распределения непрерывного ИП (или вероятность дискретного ИП) q, соответствующая величине a0i. Формула (1.1) рассчитывает вероятности болезней исходя из соотношения плотностей (вероятностей) распределения всех ИП в совокупности.
Для учёта динамики ИП в работе [1] было предложено считать каждый анализ, выполненный с определенным лагом относительно предшествующего, новым ИП. По каждому, полученному таким образом, дополнительному ИП с использованием формулы (1.1) вычислялась вероятность неблагоприятного исхода. Затем по итерационному алгоритму, сходимость которого была доказана, определялась вероятность неблагоприятного диагноза. Преимущество предложенного алгоритма состоит в том, что он позволяет найти вычислить риск заболевания при меньшем объеме вычислений [1].
Формула (1.1) используется для независимых ИП. Если в нее входят два взаимозависимых ИП, то вместо вероятности второго должна быть указана вероятность второго ИП относительно первого. Если два ИП абсолютно зависимы, условная вероятность равна единице, и нужно указывать только вероятность первого ИП. Сумма вероятностей определенных согласно (1.1) по всем диагнозам, в том числе "здоров", равна единице.
Если вероятность одного диагноза превышает установленный заранее «пороговый уровень», то выбор делается в пользу этого диагноза. Если же диагноз неопределенный, то есть классификатор отказывается сделать выбор в пользу исследуемого диагноза и требует дополнительных данных. Такой подход к классификации позволяет перевести часть неправильно поставленных диагнозов в область неопределенных ответов. Однако и часть правильно поставленных диагнозов также становятся неопределенными. Если важнее сделать меньше ошибок в диагнозе, то большему числу пациентов ставится неопределенный диагноз. В работе [1] приведены результаты диагностики по указанному методу.
В большинстве известных классификаторов вероятности болезней вычисляют по одномерным распределениям, хотя переход к многомерным
распределениям значительно упростил бы процесс принятия решений. Такой переход целесообразен при диагностике по схеме Байеса. Диагностические признаки заболевания обычно взаимозависимы, но выявить эти зависимости опираясь на статистические данные сложно, из-за того, что объем статистических данных недостаточен.
Поэтому при расчетах по формуле Байеса ИП считаются независимыми, хотя в едином организме независимость признаков нет [1].Среди методов, базирующихся на предположениях о классе решающих функций, наиболее распространенными являются методы, представляющие решающие функции в виде линейных и обобщенных нелинейных полиномов вида:
Решающее правило для определения принадлежности неизвестного объекта Xkк одному из двух классов ωγи записывает как
и в процессе обучения минимизируют функционал качества классификации, который связан с ошибкой классификации.
В распознавании образов основными являются операции определения сходства и различия объектов, играющих роль диагностических прецедентов - экстенсиональные методомы. Одним из наиболее простых экстенсиональных методов является метод сравнения с прототипом. Обычно в качестве точки - прототипа выбирается центр геометрической группировки класса (или ближайший к центру объект), определяемый, как
где Ni- количество объектов в классе ωi [62, 119].
Для классификации неизвестного объекта Х находится ближайший к нему прототип, и объект относится к тому же классу, что и этот прототип.
В методе к - ближайших соседей при классификации неизвестного объекта X = {x1,...,xn} находится заданное число к геометрически ближайших к нему в пространстве ИП объектов с известной принадлежностью к распознаваемым классам. Решение может приниматься путем простого подсчета голосов [1, 2, 62].
В практических приложениях решение задач автоматизированной диагностики осложняется различными факторами, к которым, прежде всего, относится отсутствие полного статистического материала о классифицируемых объектах [51].
В этих условиях наиболее адекватными являются технологии нечеткого логического вывода [33, 34, 45, 46, 51]. Однако использование их в области интеллектуальной поддержки диагностических решений вызывает ряд проблем, связанных с получением результатов, не соответствующих существу решаемой задачи [51, 53, 54, 56].Наиболее известными технологиями нечеткого логического вывода являются Мамдани-Заде и Такаги-Сугено-Канага. В соответствии с этими алгоритмами базы знаний систем поддержки принятия решений состоят из совокупности нечётких продукционных правил (нечётких импликаций) вида:
где A и Bs- нечёткие переменные, определяемые соответствующими функциями принадлежностипричём Aопределяется
многомерной функцией принадлежностей
размерность вектора X); s- номер нечёткого продукционного правила. Часть X ЭТО Aназывают условием (предпосылкой), а часть z ЭТО Bs- следствием (заключением) [75, 91].
Если функции принадлежности, входящие в одно решающее правило, агрегируются с помощью операции нечеткое «И» (min), а полученные результирующие функции принадлежности для различных правил агрегируются с помощью операции нечеткое «ИЛИ» (тах), то такой алгоритм поиска при заданных функциях принадлежности в части заключения называют алгоритмом Мамдани - Заде. Если в части заключения вместо функции принадлежности используется обычная чёткая функция видато алгоритм поиска
значений zназывают алгоритмом Такаги - Сугено - Канага (TSK) [75].
Другой подход к нечеткому логическому выводу был предложен Е. Шортлифом специально для медицинских приложений [ 126, 139].
Этот подход базируется на использовании коэффициентов уверенности (КУ) в исследуемых гипотезах ωi. Логические и вычислительные процедуры Е. Шортлифа построены на основании глубокого изучения большого эмпирического материала и в определённом смысле моделируют врачебную логику принятия решений.В основе подхода Е. Шортлифа лежит предположение о том, что два подкрепляющих друг друга свидетельства должны усиливать доверие к заключению (прогнозу, диагнозу), возможно давая более высокую степень истинности, чем средняя или даже максимальная. С другой стороны, несколько свидетельств, указывающих в одном направлении, не могут быть полностью компенсированы свидетельством, указывающим в обратном направлении [62]. Уверенность в принимаемом решении ωi,определяемой через соответствующий коэффициент уверенности КУ :
где МД^ - мера доверия к решению (к классификации ω();
МНДω- соответствующая мера недоверия.
В свою очередь каждая из составляющих определяется итерационными выражениями вида:
где j - номер итерации, часто совпадающие с номерами признаков и (или) частных (промежуточных) коэффициентов уверенности;мера доверия к ωiот
вновь поступившего свидетельства (признака, комбинированного показателя и т.д) Yiк моменту когда для всех предыдущих свидетельствуже
определена;- мера недоверия от вновь поступившего свидетельства
Y ■
В медицинской практике эксперты часто в качестве признаков и (или) используют только такие, анализ которых свидетельствует в пользу класса ωl.
Например, шкала артериального давления (АД) может использоваться для свидетельства о степени артериальной гипертензии или гипотензии.Тогда, если в составе информативных признаков отсутствуют признаки опровергающие версию ωi, то = 0, формула (1.7) модифицируется до
выражения:
где-коэффициент уверенности в ωj,от одного свидетельства (фактора)
Y- ■
В (1.9) порядок следования Y.не имеет значения и движение к определенности KYoi(МД или МНД) производится по мере накопления подкрепляющих свидетельств. МД и МНД не являются вероятностными мерами и им нельзя дать статистическую интерпретацию [51, 91].
Логика Е. Шортлифа легко воспринимается врачами - экспертами, часто соответствует существу решаемой задачи, однако её логические возможности уступают логике Л. Заде [33, 34, 51, 61, 91]. Повысить гибкость и мощность логики Е. Шортлифа, сохранив простоту синтеза соответствующих правил принятия решений, можно объединив определённым образом эти два направления нечёткой логики. Предпосылкой такого объединения может послужить то, что функция принадлежности μ (Yi) к классу ω(с базовой переменной Yможет рассматриваться как мера соответствия (доверия) нечёткому множеству, определяемому как класс coι [19]. В свою очередь, значениевычисленное в конкретной точкеможно рассматривать как
коэффициент уверенности в гипотезе ωiдля свидетельства (информативного признака) Yi.
При такой интерпретации функций принадлежности выражение (1.9) модифицируется в выражение:
В этом выражении и далее при расчёте значений коэффициента уверенности имеется в виду, что μ (Yi) рассчитывается для конкретного значения Yi* базовой переменной Y.
Таким образом, выражение (1.10) является объединяющим для двух подходов теории нечеткой логики принятии решений. Такое объединение позволяет расширить границы применимости каждого из них при выполнении перечисленных выше ограничений [33, 34, 51, 54, 91].
Одним из способов уменьшения доли субъективизма при синтезе нечётких решающих правил является использование методов разведочного анализа, в ходе которого производится изучение структуры пространства признаков и исследуемых классов состояний человека [2, 3, 51, 91]. Полученная информация о
структуре данных позволяет логически и структурно обоснованно выбирать функции принадлежностей, меры доверия и недоверия к принимаемым решениям, которые соответствуют специфике решаемых задач. Получаемые при этом функции принадлежности обладают свойствами соответствующих мер доверия и недоверия принятыми в логике Е. Шортлифа. В таком варианте синтеза учитывается не только мнение экспертов, но и объективные свойства данных решаемых задач, что расширяет практические возможности нечёткой логики принятия решений [51, 91].
1.5
Еще по теме Классификация математических методов диагностики и прогнозирования заболеваний:
- СПИСОК ЛИТЕРАТУРЫ
- Прогнозирование послеоперационных осложнений
- БИБЛИОГРАФИЧЕСКИЙ СПИКОК
- БИБЛИОГРАФИЧЕСКИЙ СПИСОК
- Список литературы
- Факторыи оценка риска появления и развития профессиональных заболеваний у водителей транспортных средств, работающих в структуре МЧС
- Список использованной литературы
- 1.3. Методы распознавания образов и нечеткая логика в задачах прогнозирования и медицинской диагностики
- 2.1. Объект, методы и средства исследования.
- 4.3. Экспериментальная проверка математических моделей прогнозирования и ранней диагностики заболеваний работников агропромышленного комплекса, контактирующих с ядохимикатами.
- библиографический список.
- Модели и методы оценки состояния организма и его систем по электрическим характеристикам биологически активных точек