БЕЙЕСА ПРАВИЛО

Категория :

Описание

БЕЙЕСА ПРАВИЛО (Т. Bayes, шотландский математик 18 века) — теорема теории вероятностей, позволяющая уточнить вероятность наступления некоторых событий на основании дополнительной информации о проявлении характеризующих их признаков. Вероятности, подлежащие уточнению, называются априорными; вероятности, определяемые с помощью Бейеса правила после получения дополнительной информации, — апостериорными. Бейеса правило применяется с целью выяснения максимальной вероятности осуществления ряда взаимоисключающих событий. Теорема доказана Т. Бейесом.

На основе Бейеса правила может осуществляться конструирование диагностических систем, дающих возможность определить вероятность того или иного заболевания у конкретного больного.

Хотя в традиционной статистике Бейеса правило не получило распространения, опубликованы работы, демонстрирующие перспективность использования Бейеса правила для принятия решения в процессе диагностики, при выборе наиболее подходящего метода лечения для конкретного больного, а также для оценки данных, полученных в результате обследований с целью максимально возможного исключения субъективных ошибок.

Для решения диагностических задач с применением Бейеса правила необходимо знать количественные значения вероятностей проявления признака или комплекса признаков при данном диагнозе и априорной вероятности самого диагноза (то есть первоначальной вероятности, что у поступившего больного имеется некоторое заболевание, хотя характерный для этого заболевания комплекс признаков еще не выявлен).

Математически вероятность диагноза при наличии комплекса признаков P (Di|K) определяется на основе формулы Бейеса, которая принимает вид:

где P (Di) — априорная вероятность диагноза Di (частота встречаемости больных с диагнозом Di) в общей структуре заболеваемости или в материалах, которыми располагает исследователь на момент постановки эксперимента; P (K|Di) — вероятность проявления комплекса признаков К при диагнозе Di; P(К) — вероятность того, что у больного имеется данный комплекс симптомов К.

Вероятность симптома kj при данном заболевании определяется по формуле:

где nij — количество больных с диагнозом Di, имеющих симптом kj; ni — общее количество больных с диагнозом Di, обследованных по данному признаку.

Величина P (kj|Di) выражает вероятность того, что симптом kj будет обнаружен, если заболевание Di имеет место.

Значения вероятностей отдельных признаков лежат в пределах от 0 до

1. Признак kj будет абсолютно достоверным, если при данном заболевании он встречается в 100% случаев (например, белок в моче при остром нефрите и т. п.). Вероятность такого признака принимается за единицу.

Значения P (kj|Di) могут быть получены из данных медицинской статистики, литературных источников, результатов обработки архивных материалов или собственных наблюдений, а также при помощи вычислений на так называемой статистической модели.

При этом в ряде случаев выборка может быть не репрезентативной и оценка значения P (kj|Di) разными специалистами не одинакова, так как не имеется данных относительно значений P (kj|Di) для большинства заболеваний. Эдвардс, Линдман и Саведж (W. Edwards, H. Lindman, L. Savage, 1963) показали возможность использования заключений квалифицированных специалистов для оценки значений P (kj|Di) при отсутствии документированных статистически достоверных данных.

Величина P (Di) — априорная вероятность диагноза до того, как собраны сведения о клинических проявлениях заболевания. Значение величины P (Di), как и P (kj|Di), в большинстве случаев определяется на основании оценки имеющегося документированного опыта; в отдельных случаях могут использоваться клинические суждения компетентных специалистов. В отличие от значений P (kj|Di), эмпирически или статистически определяемые значения P (Di), полученные для одних и тех же диагнозов в зависимости от использованных материалов различных клинических учреждений или суждений специалистов, могут значительно разниться. Поэтому необходимость оценки величины P (Di) может явиться источником противоречий и трудностей при применении Бейеса правила в медицинской диагностике. Ледли и Ластед (R. Ledlay, L. Lusted, 1961) видят причину относительного постоянства величины P (kj|Di) для каждого конкретного диагноза в том, что эта условная вероятность в известной степени независима (по терминологии Ледли и Ластеда) от «местных окружающих факторов» (географический район, время года и т. п.) и в первую очередь выражает «физиолого-патологические аспекты самого заболевания». На формирование значений величины P (Di), напротив, в значительной степени влияют «местные факторы». Вместе с тем Мостеллер и Уоллес (F. Mosteller, D. Wallace, 1964) установили, что нек-рая неопределенность значений величины P (Di) не оказывает существенного влияния на конечный результат.

Практическое применение Бейеса правила в диагностике требует составления диагностических таблиц (или так называемой медицинской памяти диагностических систем), содержащих значение вероятностей проявления признаков для данной группы заболеваний (табл. 1).

При применении Бейеса правила в медицинской диагностике необходимо, чтобы заболевания были взаимоисключающими; различные признаки (симптомы) рассматриваются как независимые при условии заболевания Di (так называемый принцип условной независимости признаков), так как невозможно вычислить вероятность комбинаций заболеваний по данным о частотах симптомов для каждого из заболеваний в отдельности. Хотя симптомы любого заболевания находятся в прямой или опосредованной причинно-следственной зависимости, принцип условной независимости признаков, обеспечивающий возможность использования Бейеса правила, в большинстве случаев не вносит существенного искажения в конечный результат. Это, в частности, подтверждается исследованиями Уорнера (H. Warner, 1961), Лодвика (G. Lodwick, 1965) и математически доказано М. Л. Быховским (1967). Если обратиться к примеру, приведенному в таблице 1, то в соответствии с принципом условной независимости признаков

Принцип расчета не меняется при отсутствии одного из признаков.

Результаты расчета примера, рассмотренного в таблице 1, при наличии

Подставляя в приведенные формулы численные значения из таблицы 1, получаем значения P(KiDi) и

P (К) при наличии всех признаков:

Далее определяем вероятность диагнозов D1, D2, D3 по формуле Бейеса

всех признаков и при отсутствии одного из них приведены в таблицы 2. Сумма всех вероятностей равна единице.

Для диагностики по Бейеса правилу используются не только простые, но и сложные (многоразрядные) признаки (например, систолическое артериальное давление: нормальное, повышенное, пониженное).

На основе Бейеса правила в СССР и за рубежом разработаны диагностические системы, в частности в СССР — диагностическая система Института сердечно-сосудистой хирургии АМН СССР им. А. Н. Бакулева. Бейеса правило может использоваться при диагностике с помощью цифровых и электронных вычислительных машин (см. Диагностика машинная).

См. также Вероятностей теория.


Таблица 1. СХЕМА ДИАГНОСТИЧЕСКОЙ ТАБЛИЦЫ (по Т. Б. Постновой, 1972)

Диагноз

Априорная

вероятность

диагноза

Вероятности признаков

цианоз

усиление

легочного

рисунка

акцент II тона

право-

грамма

Di

P (Di)

P (Κ1|Di)

P (K2|Di)

P (K3|Di)

P(K4|Di)

D1 — тетрада Фалло

0,35

0,9

0

0,05

0,6

D2— дефект межпредсердной перегородки

0,15

0,15

0,8

0,8

0,8

D3 — незаращение артериального протока

0,5

0,1

0,95

0,9

0,1


Таблица 2. ВЕРОЯТНОСТИ ДИАГНОЗА ПРИ РАЗЛИЧНЫХ КОМБИНАЦИЯХ ПРИЗНАКОВ

Диагноз

При наличии всех четырех признаков

При отсутствии одного из признаков

цианоз (К J

усиление

легочного

рисунка

(К2)

акцент II тона (К3)

правограмма (К4)

D1 — тетрада Фалло

0

0

0,75

0

0

D2— дефект межпредсердной перегородки

о

-J

СМ

0,63

0,23

0,36

0,07

D3 — незаращение артериального протока

0,25

0,37

0,02

0,64

0,93


Библиогр.: Ластед Л. Б. Введение в проблему принятия решений в медицине, пер. с англ., М., 1971, библиогр.; Лед-ли Р. М. и Ластед Л. Медицинская диагностика и современные методы выбора решения, в кн.: Математические пробл. в биол., под ред. Р. Беллмана, пер. с англ., с. 141, М., 1966, библиогр.; Постно-в а Т. Б. Информационно-диагностические системы в медицине, М., 1972, библиогр.

Я. А. Коган, А. М. Сточик.