<<
>>

Нейросетевая модель распознавания

Современные компьютерные томографы (ΚΤ) имеют возможность производить снимки с высоким пространственным разрешением. Время такого обследования занимает считанные минуты.

Однако процесс обработки и анализа снимков, а также получение заключения требуют гораздо больше времени. Более того, анализ изображения компьютерного томографа требует высокой квалификации врача.

В связи с этим становится актуальной задача повышение качества и скорости проведения обследований путем автоматизации процесса анализа изображений ΚΤ с помощью программного комплекса.

Первоочередной задачей алгоритмизации процесса распознавания состояний физиологических объектов является определение их нормального строения, а также возможных вариантов отклонения от нормы.

Изображение органов на снимках компьютерного томографа представляется в виде участков низкой плотности (темный цвет) и участков высокой плотности (светлый цвет).

Анализ изображения позволяет выделить обследуемый орган, а также сосуды, мышечную и костную ткань (рисунок 3.1).

В настоящий момент уже проведена обширная работа по разработке ал­горитмов и методик обработки изображений для явного выделения отличительных признаков, характерных для пациентов [58, 59].

Рисунок 3.1 - Снимок человека, сделанный с помощью компьютерного томографа

Тем не менее, все эти процессы связаны со значительными затратами времени и усилий. Для дальнейшего повышения точности предсказаний требуются огромные объемы маркированных данных. Обработка изображений и выделение отличитель­ных признаков в наборах данных изображений - весьма сложный и длительный процесс.

Интерпретация рентгеновских снимков для диагностики патологий легких - достаточно трудоемкий процесс, вследствие чего в диагнозах часто бывают раз­ночтения.

Поэтому возникла идея создания алгоритма машинного обучения, способного ставить точные диагнозы на основе сотен тысяч изученных снимков [60].

Рентгенография грудной клетки в настоящее время является лучшим доступ­ным методом диагностики пневмонии [61], которая играет значительную роль в клинической помощи [62] и эпидемиологических исследованиях [63]. Однако обна­ружение пневмонии на рентгеновских снимках грудной клетки является сложной задачей, которая зависит от наличия экспертов-радиологов.

Выявление какой-либо закономерности в расположении того или иного рисунка исследуемого органа является главной задачей процесса диагностики.

Возникновение пневмонии в рентгеновских снимках часто расплывчато, может перекрываться с другими диагнозами, и может имитировать многие другие доброкачественные аномалии. Эти особенности вызывают значительные расхождения среди радиологов в диагностике пневмонии [68].

Алгоритм сверточной нейронной сети Chexnet, разработанный учеными из Стэнфордского университета, локализует патологии, идентифицируя их с помощью карт активации класса, которые выделяют области на снимке наиболее важные для классификации конкретных патологий [6]. CheXnet правильно обнаруживает пневмонию, а также локализует области изображения, наиболее показательные для патологии.

Модель ChexNet представляет собой свернутую нейронную сеть на 121 слой, которая получает снимок грудной клетки и выводит вероятность пневмонии с теп­ловой картой, локализующая области изображения, наиболее показательные для пневмонии.

Использовались методы глубокого обучения и пакетной нормализации. Суть метода состоит в том, что некоторым слоям нейронной сети на вход подаются дан­ные, которые предварительно обработаны и имеют нулевое математическое ожидание и единичную дисперсию[65, 66].

Выборку из 420 снимков из ChestX-ray14 анализировали 4 высококвалифицированных радиолога и разработанная нейронная сеть. У радиологов был опыт 4, 7, 25 и 28 лет соответственно. Радиологи не имели доступа к какой-либо информации о пациенте или информации о распространенности заболевания в данных.

Обнаружение пневмонии при рентгенографии грудной клетки сильно затруднительно для радиологов.

Было установлено, что алгоритм превышает среднюю эффективность радиолога в задаче обнаружения пневмонии. Также был проведен анализ сравнения CheXNet с другими алгоритмами по диагностике на основе базы снимков ChestX- ray14. Сравнение на основе метрики F-меры [67], которая основана на точности и полноте оцениваемой модели, приведено в таблице 3.1. CheXNet достигает значения F-меры 0,435 (95% CI I 0.387, 0.481), что выше, чем средний радиолог 0,387 (95% CI I 0.330, 0.442).

Нейросеть DenseNet, на основе которой построена CheXNet, улучшает поток информации и градиентов через сеть, делая оптимизацию очень глубоких сетей. Да­лее производится замена полносвязного слоя на тот, у которого есть один выход, после чего применяется сигмоидная нелинейность. Весы сети инициализируются весом от модели, предварительно рассчитанной на ImageNet [69]. Обучение сети происходит с помощью метода стахостической оптимизации Адам со стандартными параметрами (β1 = 0,9 и β2 = 0,999) [70] и использованием мини-групп из 16 снимков. Начальная скорость обучения устанавливается - 0,001, которая уменьша­ется в 10 раз каждый раз, когда возникают потери на данном этапе, и выбирается модель с наименьшей ошибкой.

Таблица 3.1 - Сравнение радиологов и сверточной нейронной сети CheXNet по F-мере

F-мера (95 % CI)
Радиолог 1 0.383 (0.309, 0.453)
Радиолог 2 0.356 (0.282, 0.428)
Радиолог 3 0.365 (0.291, 0.435)
Радиолог 4 0.442 (0.390, 0.492)
Средний показатель радиологов 0.387 (0.330, 0.442)
CheXNet 0.435 (0.387, 0.481)

Для обучения использовался набор из данных ChestX-ray14, созданный Wang в 2017 году, который содержит 112120 снимков с 30805 уникальными пациентами.

Wang анализирует каждое изображение на предмет 14 различных патологий с использованием методов автоматического извлечения данных на радиологических отчетах [64].

Затем устанавливаются снимки, на которых пневмония является одной из ан­нотированных патологий, в качестве положительных примеров, а все другие изображения обозначаются, как отрицательные примеры.

Для задачи обнаружения пневмонии случайным образом разбивается набор данных на обучение (28744 пациентов, 98637 изображений), подтверждения (1672 пациента, 6351 изображение) и теста (389 пациентов, 420 изображений). Между наборами нет пересечения пациентов. Прежде чем вводить изображения в сеть, они были уменьшены до размера 224?224 пикселя и нормализовались в зависимости от среднего и стандартного отклонения изображений в наборе обучения ImageNet. Данные обучения были дополнены случайными горизонтальными пе­реворачиванием снимков. Β таблице 3.2 приведены результаты исследований, подтверждающие, что CheXNet превосходит лучшие опубликованные результаты по всем 14 патологиям в наборе данных ChestX-ray14 [64].

Таблица 3.2 - Результаты исследований

Паталоги Сеть, раз­работанная Ванг и другими Сеть, раз­работанная Яо и другими CheXNet
Ателектаз 0.716 0.772 0.8094
Кардиомегалия 0.807 0.904 0.9248

Продолжение таблицы 3.2

Плевральный выпот 0.784 0.859 0.8638
Инфильтрация 0.609 0.695 0.7345
Опухоль 0.706 0.792 0.8676
Узлообразование 0.671 0.717 0.7802
Пневмония 0.633 0.713 0.7680
Пневмоторакс 0.806 0.841 0.8887
Консолидация тканей 0.708 0.788 0.7901
Эдема 0.835 0.882 0.8878
Эмфизема 0.815 0.829 0.9371
Фиброз 0.769 0.767 0.8047
Плевральное

утолщение

0.708 0.765 0.8062
Грыжа 0.767 0.914 0.9164

На графике, изображенном на рисунке 3.5, показатели качества диагностики четырёх отдельных врачей представлены оранжевыми крестиками, их усреднённый результат - зеленым крестиком, а результаты ChexNet - синей кривой, отображаю­щей изменение пороговых значений, используемых для диагностики.

Рисунок 3.5 - Сравнение результатов выполнения алгоритма CheXNet

и радиологов

Были определены два ограничения для этого сравнения. Во-первых, только фронтальные рентгенограммы были представлены радиологам и нейронной сети.

Во время диагностики было установлено, что до 15% точных диагнозов требуют бокового снимка; поэтому ожидается, что эта настройка обеспечивает заниженную оценку производительности. Во-вторых, ни нейронной модели, ни радиологам не разрешалось использовать историю болезни, которая, как было показано ранее, снижает диагностическую эффективность радиолога при интерпретации рент­генограмм грудной клетки (например, при легочной аномалии с лихорадкой и кашлем пневмония была бы более подходящей, чем инфильтрация или консолидация тканей) [71, 73].

Возникла идея разработки подобного механизма анализа снимков на основе более современных рентгеновских снимки органов - снимков компьютерной томографии, которые получают с помощью сложного программно-технического комплекса, имеющего сверхчувствительные детекторы для регистрации рент­геновского излучения, рентгеновские излучатели, обширный пакет программного

обеспечения, позволяющий получить снимки с высоким пространственным разре­шением [150].

За основу был взят алгоритм сверточной сети Densenet, глубина которого составляет 201 слой. Β него были внесены изменения в виде применения функции активации ReLU (сокращение отангл.Tedified linear unit), которая позволяет существенно ускорить процесс обучения и одновременно с этим значительно упростить вычисления (за счёт простоты самой функции). По состоянию на 2017 год эта функция и её модификации (Ndisy ReLU, Leaky ReLU и другие) являются наиболее часто используемой функцией активации в глубоких нейросетях, в частности, в свёрточных.

Также, для обеспечения максимального потока информации между слоями в сети, были соеденены все слои напрямую друг с другом (с соотвествующими разме- рыми карт харатерных признаков). Важным отличием от DensNet также является то, что переда передачей в следующий слой не происходит объединения признаков по­средством сумммирования, а происходит объединенния посредством соединения их.

Рисунок 3.6 - 5-слойный dense блок со скоростью роста k = 4.

Следовательно, слой lthимеет lвходов, состоящий из карт признаков всех предыдущих сверточных блоков.

Его собственные карты свойств передаются всем

последующим слоям. Это приводит к

L( L +1)

2

соединениям в L-слойной сети, вме­

сто Lсоединений, как в традиционной архитектуре.

Возможно, нелогичным эффектом Dense-соединений является то, что требует­ся меньше параметров, чем в традиционных сверточных сетях, поскольку нет необ­ходимости переобучать карты признаков. Традиционные архитектуры прямой связи можно рассматривать как алгоритмы с состоянием, которое передается от слоя к слою. Каждый уровень считывает состояние с предыдущего уровня и записывает на последующий уровень. Он изменяет состояние, но также передает информацию, ко­торую необходимо сохранить. Некоторые варианты DenseNets показывают, что мно­гие слои вносят очень небольшой вклад и фактически могут быть случайно отбро­шены во время обучения. Это делает состояние DenseNets схожим с (развернутыми) рекуррентными нейронными сетями, но число параметров DenseNets существенно больше, поскольку каждый слой имеет свои веса. Предлагаемая модифицированная архитектура DenseNet четко различает информацию, которая добавляется в сеть, и информацию, которая сохраняется. В архитектуре DenseNet были установлены уз­кие слои (например, 12 фильтров на слой). При этом, добавляя лишь небольшой набор карт характеристик к «коллективным знаниям» сети и оставляя неизменными карты характеристик, окончательный классификатор принимает решение на основе всех карт принзнаков в сети. Помимо лучшей эффективности параметров, одним большим преимуществом модифицированной DenseNets является улучшенный по­ток информации и градиентов по всей сети, что облегчает их обучение. Каждый слой имеет прямой доступ к градиентам из функции потерь и исходного входного сигнала, что ведет к неявному глубокому надзору.

Рисунок 3.6 иллюстрирует компоновку модифицированной DenseNet. Следо­

вательнослой получает карты признаков всех предыдущих уровней х0,...,хмв

качестве входа:

(26)

где, [χ01...,χ1] относится к объединению карт объектов, созданных в слоях

0,..., l-1.

Композитная функция. Определение H1происходит, как составная функция трех последовательных операций: пакетная нормализация (batch normalization (BN)), применение функции ReLU (rectified linear unit) и свертки 3x3(Conv).

Слои пулинга. Операция конкатенации, используемая в формуле (26) не явля­ется жизнеспособным, когда размер карт характеристик изменяется. Однако суще­ственной частью сверточных сетей являются слои понижающей дискретизацию, ко­торые изменяют размер карт признаков. Для облегчения понижающей дискретиза­ции в модифицированной архитектуре, сеть разделяется на несколько dense-блоков - рисунок 3.7.

Рисунок 3.7 - Пример модифицированной DenseNet с тремя Dense блоками. Слои между двумя смежными блоками называются переходными слоями и изменяют раз­меры карты объектов посредством свертки и объединения

Оои между блоками называются переходными слоями, которые выполняют свертку и объединение. Переходные слои, используемые в алгоритме диагностики, состоят из пакетного нормализационного слоя и сверточного слоя 1 x1, за которым следует средний пулирующий слой 2x2.

Скорость роста. Если каждая функция H1предоставляет kкарт признаков, то отсюда следует, что Ithслой имеекарт признаков, где k0- количество

каналов во входном слое. Важным отличием модицифированного DenseNet является то, что он может имеет очень узкие слои, например, k = 12. Параметр k называется скоростью роста сети. Относительно небольшая скорость роста достаточна для по­лучения достоверных результатов. Одним из объяснений этого является то, что каж­дый уровень имеет доступ ко всем предшествующим картам характеристик в своем блоке и, следовательно, к «коллективным знаниям» сети. Можно рассматривать кар­ты признаков как глобальное состояние сети. Каждый слой k добавляет к этой карте свои собственные карты объектов. Скорость роста определяет, сколько новой ин­формации каждый слой вносит в глобальное состояние. После однократного запи­сывания глобального состояния, к нему можно получить доступ из любой точки се­ти,и, в отличие от традиционных сетевых архитектур, нет необходимости копиро­вать его из слоя в слой.

Свертка. Чтобы еще больше улучшить компактность модели, требуется уменьшить количество карт признаков на переходных слоях. Если dense блок со­держит mкарт признаков, то следующему переходному слою необходимо сгенери­ровать выходные θmкарты признаков, где 0

<< | >>
Источник: Васильченко Владислав Алексеевич. ИНТЕЛЛЕКТУАЛИЗАЦИЯ ПРОЦЕССОВ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ В РАМКАХ БИОТЕХНИЧЕСКОЙ СИСТЕМЫ ДИАГНОСТИКИ И ЛЕЧЕНИЯ ПУЛЬМОНОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ. Диссертация на соискание ученой степени кандидата технических наук. Воронеж - 2019. 2019

Еще по теме Нейросетевая модель распознавания:

  1. Результаты и обсуждение
  2. МОДЕЛИРОВАНИЕ ПРОЦЕССА ДИАГНОСТИКИ РАССЕЯННОГО СКЛЕРОЗА
  3. Введение
  4. Список литературы
  5. Применение математических методов в задачах прогнозирования появления и развития заболеваний
  6. Список использованной литературы
  7. библиографический список.
  8. Список литературы
  9. Список литературы
  10. Оценка состояния здоровья на основе математических методов.
  11. СОДЕРЖАНИЕ
  12. ВВЕДЕНИЕ
  13. Нейросетевая модель распознавания
  14. СПИСОК ЛИТЕРАТУРЫ
- Акушерство и гинекология - Анатомия - Андрология - Биология - Болезни уха, горла и носа - Валеология - Ветеринария - Внутренние болезни - Военно-полевая медицина - Восстановительная медицина - Гастроэнтерология и гепатология - Гематология - Геронтология, гериатрия - Гигиена и санэпидконтроль - Дерматология - Диетология - Здравоохранение - Иммунология и аллергология - Интенсивная терапия, анестезиология и реанимация - Инфекционные заболевания - Информационные технологии в медицине - История медицины - Кардиология - Клинические методы диагностики - Кожные и венерические болезни - Комплементарная медицина - Лучевая диагностика, лучевая терапия - Маммология - Медицина катастроф - Медицинская паразитология - Медицинская этика - Медицинские приборы - Медицинское право - Наследственные болезни - Неврология и нейрохирургия - Нефрология - Онкология - Организация системы здравоохранения - Оториноларингология - Офтальмология - Патофизиология - Педиатрия - Приборы медицинского назначения - Психиатрия - Психология - Пульмонология - Стоматология - Судебная медицина - Токсикология - Травматология - Фармакология и фармацевтика - Физиология - Фтизиатрия - Хирургия - Эмбриология и гистология - Эпидемиология -