Обзор математических методов прогнозирования, особенности использования нечеткой логики принятия решений при мочекаменной болезни
В настоящее время насчитываются сотни математических методов, нашедших успешное применение в медицинских исследованиях [1, 2, 3, 9, 11, 13, 14, 16, 19, 20, 21, 25, 31, 33, 36, 42, 43, 44, 45, 46, 49, 52, 55, 60, 64, 68, 69, 74, 80, 81, 86, 88, 91, 98, 102, 106, 108, 115, 119, 130, 132, 137, 138, 146, 147, 160, 168, 169, 170, 171, 172, 173, 177, 178].
Значительное место в решении медицинских задач занимает теория распознавания образов [3, 17, 18, 22, 24, 34, 72, 73, 82, 186, 187, 188, 189, 193, 199]методами которой решаются задачи прогнозирования.Как показано в первом разделе, прогнозирование возникновения МКБ и её рецидивов сложно и мало результативно. В основном при прогнозировании МКБ используют результаты исследования биохимического анализа мочи, структуры камня.
Для этого также нужно получить химический состав мочи, представить химические реакции в организме в алгебраической форме, разработать систему уравнений для расчета равновесного состава мочи.
Однако результаты такого моделирования не учитывают другие факторы камнеобразования в организме человека и технически трудновыполнимы. А от выбора конкретных методов прогнозирования зависит результат моделирования, адекватность синтезированной модели реальному процессу.
Насчитываются сотни методов прогнозирования, имеющие свои достоинства и недостатки. В зависимости от степени однородности их возможно разделить на простые (однородные по содержанию) и комплексные методы. По характеру используемой информации все методы, также возможно разделить на фактографические (основываются на фактической информации о развитии прогнозируемого объекта), экспертные (методы, основанные на обобщении мнений экспертов о поведении объекта) и комбинированные методы [1, 19, 32, 34, 37, 45, 102, 103, 106, 107, 132].
Экспертные методы уступают по точности прогнозирования, но являются предпочтительными при неопределенности в исходной информации.
Использование экспертных методов прогнозирования предпочтительно при отсутствии статистических данных, либо, когда статистическая информация имеется, но существуют сомнения в её достоверности, не поддается прогнозу группа факторов, влияющих на развитие прогнозируемого процесса, когда часть информации о прогнозируемом объекте не поддается количественному измерению, а также, если получение статистической информации требует значительных ресурсных или финансовых затрат.
Экспертные методы также целесообразно использовать при долгосрочном прогнозировании динамично изменяющегося процесса, поскольку в данном случае снижается достоверность статистических методов [12, 16, 27, 33, 103, 106, 109, 118, 189].К наиболее широко распространенным методам прогнозирования количественных показателей сложных систем возможно отнести [9, 31]:
1. Экспоненциальное сглаживание, используемое для краткосрочных, а также среднесрочных прогнозов. Данный метод отличается простотой, ясностью математических формулировок, а также при использовании данного метода объем данных не имеет значения. К недостаткам метода необходимо отнести отсутствие гибкости, а также требуемая тонкая настройка сглаживающих функций, что само по себе является достаточно сложной задачей;
2. Регрессионные методы, используемые для среднесрочного прогнозирования. Достоинствами данного метода является простота, а также быстрота получения результата. Однако, данный метод обладает низкой адаптивностью линейных моделей и сложностью определения вида функциональной зависимости, также невозможностью произвести моделирование нелинейных процессов.
3. Авторегрессионные методы используются в среднесрочном прогнозировании. К достоинствам данного метода возможно отнести простоту реализации, однако он обладает низкими адаптационными свойствами, линейностью. При использовании данного метода невозможно моделировать нелинейные процессы. Затруднения использования вызывает также большое
число параметров модели, идентификация которых неоднозначна и ресурсоемка.
4. Нейросетевые методы обладают возможностью моделирования нелинейных процессов, высокими адаптационными свойствами, а также масштабируемостью. К недостаткам можно причислить отсутствие гибкости, сложность выбора архитектуры нейронной сети, высокие требования к непротиворечивости обучающей выборки, невозможность добавления нейронов в процессе самообучения нейронной сети, неясность в выборе числа слоев и элементов в слое, а также и ресурсоемкость процесса обучения;
5.
Экспертный подход обладает неограниченным сроком прогнозирования, возможностью прогнозирования в условиях наличия неопределенности в исходной информации, возможностью причинного анализа. Однако, субъективное мнение отдельного эксперта или небольшой группы экспертов может оказать влияние на общее мнение и привести к ошибочному прогнозу, отрицательное влияние на решение экспертной группы в отдельных случаях может оказать количество замечаний «за» и «против».6. Прогнозирование по аналогии применяется для установления качественной и количественной аналогии с целью изучения опыта, результатов и т.п. при краткосрочном и среднесрочном прогнозировании. Данный метод отличается лингвистической простотой реализации, а также резким ухудшением результатов в случае нелинейности. Имеется вероятность возникновения ситуации, когда отсутствует аналог;
7. Комбинированные методы применяются для любого срока прогнозирования и определяются методами, входящими в состав комбинированной системы.
Реальные системы обладают значительной сложностью, что делает невозможным учесть влияние некоторых факторов, а также не всегда возможно получить точные результаты измерений, что приводит к появлению некоторой степени неопределенности. Становится целесообразным использование аппарата теории не
четких множеств, таких как методы нечеткого регрессионного и авторегрессионного анализа, нечеткого нейросетевого анализа и анализа нечетких тенденций.
Нечеткая логика является обобщением классической формальной логики и теории множеств и была предложена Л. Заде для приближенного и нечеткого описания процессов и систем [36, 37, 51, 56, 57, 98, 107, 128, 129, 130, 137, 138, 146, 160, 177, 178, 194, 195, 202, 203].
В качестве элементов нечеткого множества А выступают некоторые числовые переменные х и характеристические функции μ.∖(X), характеризующие в интервале [0,1] степень принадлежности (соответствия) х нечеткому множеству А. В современной литературе функцию цА(х) называют функцией принадлежности х к А.
Иными словами нечеткое множество А на множестве Х (где Х - универсальное множество) есть совокупность упорядоченных пар вида А={цА(х),х} , где х€Х, а цА: Х → [0,1]. Функция принадлежности в этом случае отображает элементы любого универсального множества Х в интервал [0,1][36, 98, 130, 146, 202, 203].Функции принадлежности выражаются либо числами в интервале [0,1], либо в виде лингвистических переменных [37, 130, 146].
Существенное отличие методов теории нечеткой логики, как отмечают специалисты в области нечеткой логики и системного анализа, от методов теории вероятности состоит в том, что неопределенность связана не со случайностью, а с имеющимися неточностями и размытостями, и функция принадлежности при этом выражает субъективную возможность наличия у элемента х свойств, позволяющих отнести его к множеству А [130, 146].
Как и для обычных множеств, для нечетких множеств определены основные логические операции, такие как объединение и пересечение, рассматриваемые как обобщение обычных множеств [37, 107, 108, 146].
Существуют различные виды форм кривых для задания функций принадлежности. Наиболее популярными являются: треугольная, трапецеидальная и гауссова формы кривых для функций принадлежности [129, 146].
Функции принадлежности составляют основу построения нечетких правил логического вывода. Операции нечеткого логического вывода определяются сводом
правил, содержащих нечеткие высказывания в форме «Если - то» и функции принадлежности для соответствующих лингвистических термов.
Базовое правило типа «если - то» называется нечеткой импликацией (продукцией), принимающей форму [107, 128, 129, 146, 177, 178, 194, 195]:
ЕСЛИ (х это А) ТО (у это В), (1.1)
где: А и В - это лингвистические выражения, идентифицированные нечетким образом через соответствующие функции принадлежности для переменных х и у.
Важной задачей теории нечетких множеств в прикладных областях является построение соответствующих операторов агрегирования нечеткой информации и анализ их семантик.
При реализации нечеткого логического вывода могут решаться задачи оценки уровня подготовленности спортсменов, состояния их здоровья и т.д.
В ходе логического вывода для конкретных значений вектора Х=Хо определяется конкретное значение У0.
В общем виде алгоритм логического вывода реализуется за четыре основных шага [128, 175, 176, 192, 193].
1. Для четко заданных входных значений Хо определяются значения функций принадлежности к отдельным термам. Эта операция вводит нечет-кость в решение (операция фаззификации).
2. Для каждого правила выполняют операцию импликации для конкретных
значений(определяют минимальное значение функций принадлежности, входящих в предпосылку правилаДалее объединяются результат
объединения функций принадлежности предпосылки с функцией принадлежности заключения
3. Выполняется нечеткая композиция путем объединения всех результирующих функций принадлежности
По максимальной величине результирующей функции принадлежности можно делать выводы о предпочтительной классификации состояния объекта исследования.
4. При необходимости преобразовать выходную функцию принадлежности Цо(у) в четкое число Уо производится операция приведения к четкости (дефаззифи- кация). На практике используют различные методы дефаззи-фикации. Наиболее распространена дефаззификация центроидного типа, когда Уо определяется на оси У как координата «центра тяжести» фигуры μ0(γ).
В общем виде при центроидной дефаззификации вычисление z0осуществляется по формуле:
В силу вычислительной сложности на практике формула (1.5) заменяется на формулы приблизительного суммирования.
Кроме центроидного метода при определении Уо используют: координату начала максимального участка функции принадлежности, координату конца макси-
22 мального участка функции принадлежности, координату «центра» максимального участка функции принадлежности и т.д.
Описанный алгоритм логического вывода в специальной литературе называют алгоритмом Мамдани-Заде [129, 177, 178].
Алгоритм Такаги-Сугено-Канага реализуется аналогично алгоритму Мамдани- Заде, но без четвертого пункта, а величина Уо определяется выражением [129, 194, 195]:
где: qs- результат нечеткой импликации (пункт 2 алгоритмов Мамдани-Заде и Такаги-Сугено-Канага); а8 - константы заключения правила (1.5).
Специалисты решающие практические задачи использования нечеткой логики Л. Заде при оценке состояния сложных систем отмечают, что при достаточно мощных математических возможностях возникают значительные сложности получения нечетких многомерных моделей адекватных реальным объектам исследования. Нетривиальными задачами являются как выбор форм и параметров первичных функций принадлежности, так и способы их агрегации в модели, адекватно описывающие состояния исследуемых объектов [51, 56, 57, 129, 137, 160].
Специально для медицинских приложений Е. Шортлифом была разра-ботана теория уверенностей основной целью, которой было моделирование клинической логики принятия решений, в соответствии с которой последо-вательно поступающая информация приводит к уточнению исследуемых гипотез ωs, [130, 160, 189].
Одной из базовых формул Е. Шортлифа является выражение для расчета коэффициента уверенности в гипотезе - КУ(юе/Х), который определяется как раз
ность между двумя мерами где:- уверенность в диагностической гипотезе ωeс учетом наличия при-
знака(ов) Х;
МД( ωf,/ Х) - мера доверия к ωf, с учетом признаков Х;
МНД( ωs,/ Х) - мера недоверия к гипотезе ωtс учетом признаков Х.
Коэффициент уверенности (КУ) меняется от -1 - абсолютная ложь, до +1 - абсолютная истина, принимая все промежуточные значения, причем 0 - означает полное незнание [51, 129, 160, 189].
Значения МД (мера доверия) и МНД (мера недоверия) меняются от 0 до 1. В связи с этим, КУ представляет собой меру взвешивания свидетельств «за» и «против» [51, 129, 160, 189].
При поступлении новой информации (новое свидетельство х) значения МД и МНД меняются, поэтому для уточнения значений МД и МНД применяют формулы:
Запятая между Х и х указывает на то, что значение информативного признака х поступает для анализа после поступления и анализа вектора признаков Х.
Суть данных формул заключается в том, что эффект нового значения информативного признака х за гипотезу ωs,при уже известных признаках Х сказывается на смещении МД или МНД в сторону полной определенности на расстояние, зависящее от нового информативного признака [129, 160, 189].
Если в принятии классификационных решений участвуют только признаки, анализ которых увеличивает доверие гипотезе ωf,, выражение (1.7) трансформируется в решающее правило типа:
где р - номер итерации при расчете КУ ωf,(р); Zs- базовая переменная, по которой строятся диагностические или прогностические заключения.
В частном случаеВ комбинированном варианте, где совместно исполь
зуются функции принадлежности и коэффициенты уверенности выражения (1.10) трансформируются в выражение [51, 56, 57]:
Природа нечетких временных рядов (ВР) обусловлена использованием экспертных оценок, присущая неопределенность которых относится к классу нечеткости. В отличие от стохастической неопределенности нечеткость затрудняет или даже исключает применение статистических методов и моделей, но может быть использована для принятия предметно-ориентированных решений на основе приближенных рассуждений человека. Формализация интеллектуальных операций, моделирующих нечеткие высказывания человека о состоянии и поведении сложных явлений, образует сегодня самостоятельное направление научно-прикладных исследований, получившее название «нечеткое моделирование». Указанное направление включает комплекс задач, методология решения которых опирается на теорию нечетких множеств, нечеткой логики, нечетких моделей (систем) и гранулярных вычислений [9].
При прогнозировании BP неопределенность поведения моделируется в рамках стохастических моделей на основе представления BP, как реализации случайного процесса. Однако неопределенность поведения в организационно-технических системах не всегда может быть адекватно смоделирована методами теории случайности, если [9]:
1. Неизвестны вероятностные характеристики стохастического процесса, генерирующего BP;
2. Имеется неопределенность и неполнота в исходной информации о функционировании системы;
3. Нелинейный характер искомой зависимости;
4. Малое количество наблюдений.
В этом случае находят применение интеллектуальные методы анализа BP, активно использующие знания экспертов.
При анализе BP эксперт обычно представляет свои суждения с помощью нечетких оценок, относящихся ко многим объектам [9]:
• временные области: интервалы времени (несколько дней), абсолютная или относительная позиция на временной шкале (близкое будущее), периодические или сезонные интервалы (неделя до Рождества);
• ранг значений BP (высокая цена, очень низкий уровень производства);
• набор паттернов BP (быстро растущий, слегка выпуклый);
• набор BP, их атрибутов, как элементов системы (фондовый индекс новой компании);
• набор отношений между BP, атрибутами или элементами (тесно связанный);
• множество значений возможности или вероятности (непохоже, очень возможно).
Упорядоченная во времени последовательность таких оценок представляет собой временной ряд, характерной особенностью которого является нечеткость его значений, вытекающая из природы экспертных оценок, поэтому такой временной ряд относится к классу нечетких временных рядов [ 9].
На рис. 1.1 изображен абстрактный нечеткий временной ряд, каждой нечеткой метке xiсоответствует нечеткое множество, задаваемое функцией принадлежности
Рисунок. 1.1 - Абстрактный нечеткий временной ряд
Прикладной аспект проблематики анализа нечетких временных рядов определяется возможностью расширения множества задач обработки BP, множества технологий их решения за счет оперирования не только количественной, но и качественной информацией [9].
Проанализировав достоинства и недостатки существующих методов классического и нечеткого прогнозирования мы пришли к выводу, что наиболее адекватным математическим аппаратом для решаемых в работе задач является методология синтеза гибридных нечетких решающих правил, разработанная на кафедре биомедицин-
ской инженерии ЮЗГУ [51, 56, 57, 62, 63, 74, 77], опирающаяся на методы разведочного анализа [1, 2, 3, 4, 81], нечеткую логику Л. Заде [36, 37, 202, 203], нечеткие модификации метода группового учета аргументов [68, 77] и теории измерения латентных переменных [59, 75, 76, 141, 143, 145].
Теоретические основы и примеры успешного использования методологии синтеза гибридных нечетких решающих правил в задачах медицинской диагностики и прогнозирования сходных по структуре данных с задачами решаемыми в диссертационной работе приведены в работах [11, 14, 21, 42, 49, 55, 60, 64, 69, 70, 71, 88, 91, 92, 108, 115, 119, 140, 142, 143, 144, 145, 147, 151, 152, 170, 171, 172, 173].
Успешное применение элементов методологии синтеза гибридных нечетких решающих правил в урологии описано в работах [38, 39, 40, 41, 78, 79, 122, 125, 134].
В этих же работах показано, что кроме традиционно используемых в медицине признаков для повышения качества принимаемых решений целесообразно использовать энергетические характеристики биологически активных точек (БАТ). Теория биофизики акупунктуры, способы синтеза нечетких решающих правил и примеры успешного применения БАТ в медицине представлены в работах [50, 53, 54, 58, 65, 66, 72, 73, 149, 150, 152, 153, 154, 155].
На кафедре биомедицинской инженерии разработаны математические методы при мочекаменной болезни (Коцарь А.Г., Стародубцева Л.В., Цуканова М.Н.) [78, 79, 124, 133], но следует отметить, что в работах Коцаря А.Г. [78, 79] сообщается о математических методах прогнозирования результатов лечения МКБ разными способами, разработанные прогностические признаки МКБ и схемы профилактики многочисленны, не всегда применение их можно адекватно оценить их наличие у конкретного больного и многие признаки требуют пересмотра. Математические модели, синтезированные М.Н. Цукановой, предназначены для прогнозирования результативности литокинетической терапии у больных с сахарным диабетом [133]. В этих работах мало внимания уделено разработкам математических моделей для прогнозирования возникновения и рецидива мочекаменной болезни. Но, исходя из приведенного обзора математических методов, используемых для решения задач про
гнозирования и медицинской диагностики можно сделать вывод о том, что современная математическая теория дает в руки разработчиков мощный и разнообразный аппарат, позволяющий решать задачи практически любой сложности при грамотном и адекватном его использовании.
1.3.
Еще по теме Обзор математических методов прогнозирования, особенности использования нечеткой логики принятия решений при мочекаменной болезни:
- Оглавление
- Обзор математических методов прогнозирования, особенности использования нечеткой логики принятия решений при мочекаменной болезни
- БИБЛИОГРАФИЧЕСКИЙ СПИКОК