РАСПОЗНАВАНИЕ ОБРАЗОВ
Описание
РАСПОЗНАВАНИЕ ОБРАЗОВ — установление принципов (алгоритмов) обучения классификации (распознаванию) различных ситуаций, создание технических устройств (обычно программ для ЭВМ), имитирующих процесс классификации, обучение этих устройств классификации нужных ситуаций (образов) и использование их для решения практических задач.
Впервые задача обучения Р. о. была сформулирована в 1957 г. амер. физиологом Розенблаттом (F. Rosenblatt). Им была построена физическая модель существовавшей в физиологии гипотетической схемы восприятия (так наз. персептрон), с помощью к-рой была продемонстрирована способность машины имитировать процесс выработки понятий у живых существ. Математический анализ построенной Розенблаттом модели и явился началом последующих исследований в области обучения Р. о.
В основе теории обучения Р. о. лежит идея, что любая ситуация, подлежащая распознаванию (узнаванию), может быть стандартным образом представлена в виде набора чисел (вектора) х1, х2, х3,..., хn. Этот набор чисел надо отнести к одному из к возможных классов, т. е. поставить в однозначное соответствие вектору х — (х1,..., хn) число ω = f(х), принимающее одно из значений (1,2,..., k).
Считается, что каждая ситуация может быть верифицирована, т. е. для каждого вектора х может быть установлена истинная классификация со*. Необходимо, используя I случайно выбранных примеров (обучающую последовательность) х1, ω1 ,..., хl ωl, в заданном множестве функций {f(х)}, принимающих к значений, найти функцию f (х), гарантирующую наименьшую вероятность ошибочных классификаций.
Т. о., при решении задач обучения распознаванию образов возникают две проблемы: как представить в виде вектора возникающие ситуации; как по выборочным данным x1, ω1,..., xl, ωl восстановить интересующую нас закономерность (функцию).
Первая проблема для каждой конкретной задачи Р. о. решается по-своему. Так, напр., при получении вектора описания рентгенограммы используются принципы, отличные от принципов, лежащих в основе описания метеорологических ситуаций. Принцип задания ситуации (выбор пространства признаков, или выбор рецептивного поля) устанавливается для каждой конкретной задачи, к к-рой применяются методы распознавания образов (см. Пространство признаков).
Вторая проблема является общей для всех задач Р. о. Это — проблема восстановления функциональной зависимости по значениям функции в I случайно выбранных точках. Решение этой проблемы и составляет математическую теорию задачи обучения Р. о.
Возможны три группы методов обучения Р. о.: методы дискриминантного анализа; итерационные (адаптивные) методы минимизации риска; методы минимизации эмпирического риска. В каждой из этих групп методов могут быть получены различные алгоритмы обучения Р. о. Наибольшую известность в первой группе методов получили Бейесовы алгоритмы, алгоритмы линейного и квадратичного дискриминантного анализа, во второй группе — персептронные алгоритмы и в третьей группе — алгоритмы обобщенного портрета. Однако все эти алгоритмы, основанные на классических статистических моделях, могут гарантировать получение удовлетворительного решения лишь при условии достаточно больших объемов выборки.
Основные проблемы, возникающие при создании методов обучения Р. о., связаны с исследованием возможности обучения в условиях ограниченной (малой) выборки I.
Согласно методу обучения по ограниченной выборке при поиске функциональной зависимости следует выбирать не ту функцию, к-рая наилучшим образом классифицирует элементы обучающей последовательности, а ту, к-рая удовлетворяет определенному соотношению между величинами, характеризующими ее сложность, долю векторов обучающей последовательности, безошибочно распознанных с помощью этой функции, и величину объема выборки. С помощью этого метода, в частности, может быть определено наилучшее для заданного объема выборки описание ситуации (так наз. наиболее информативное пространство признаков).
Другое направление исследований связано с поиском новых постановок задач, более точно отражающих требования практики. В частности, получили развитие две постановки: восстановление значений функции в заданных точках; отыскание среди заданного множества точек на и лучшей точки.
В первом случае, т. е. при восстановлении значений функции в заданных точках (х1 , ..., хp ), требуется не восстанавливать функцию, как в общей задаче распознавания образов, а классифицировать заданные точки, используя обучающую последовательность. Эта задача проще поиска функциональной зависимости, с помощью к-рой можно определять значение функции в любой точке, и поэтому может быть решена при достаточно малых объемах выборки.
Еще более простая задача состоит в том, чтобы, используя обучающую последовательность, указать среди заданного множества точек (х1, ..., хp ) точку, в к-рой с наибольшей вероятностью неизвестная функция принимает наибольшее значение. При решении этой задачи не нужно устанавливать значения функции в точках x1,..., xp , и поэтому она может быть решена даже в том случае, когда для удовлетворительного решения задачи восстановления значений функции не хватает информации. Задача определения наилучшей точки множества очень важна в практическом отношении. С ее помощью, в частности, решается проблема выбора наилучшего для клин, испытаний лекарственного препарата.
Применение алгоритмов обучения распознаванию образов
Выделяют два типа задач Р. о.: задачи, связанные с классификацией естественной для человека информации, т. е. такой информации, к-рая возникала в процессе его фило- и онтогенеза (напр., классификация зрительных образов, классификация звуков речи и т. д.); задачи, связанные с классификацией не естественной для человека информации, т. е. не встречавшейся в фило- и онтогенезе (напр., задачи технической и медицинской диагностики, задачи прогнозирования и т. п.).
Для решения задач первого типа пока не удается построить устройство, работающее с той же точностью, что и человек, тогда как при решении задач второго типа технические устройства, как правило, проводят классификацию точнее человека.
Работы по внедрению методов Р. о. ведутся для обоих типов задач. Так, на принципе Р. о., связанных с классификацией естественной для человека информации, разрабатываются устройства автоматического чтения печатного и машинописного текстов, что позволяет непосредственно вводить документы в ЭВМ. Разработаны читающие автоматы. Ведутся работы по созданию устройств для подачи ЭВМ команды голосом, обмена с нею информацией голосом (автоматический синтезатор звуков речи уже создан), построения автоматического стенографического устройства и т. д.
Созданы устройства, способные различать до 100 слов, что достаточно, чтобы задавать машине голосом программу действий.
Еще более успешно применяются методы Р. о. для решения задач второго типа (т. е. классификация не естественной для человека информации). Так, методы распознавания широко используются в геологии при принятии решений о наличии полезных ископаемых по результатам комплексного обследования региона (напр., при поиске нефти распознавание нефтеносных пластов), в метеорологии при составлении по синоптической информации прогнозов гололеда, шквалов, заморозков и т. д. Имеется опыт применения методов Р. о. для организации неразрушающего контроля качества продукции. Так, по особенностям работы электронных приборов в различных режимах судят об их долговечности.
Применение методов распознавания образов в медицине
Методы Р. о. нашли практическое применение в медицине, многие узловые проблемы к-рой связаны с вопросами классификации и прогнозирования. К основным задачам медицины, решаемым с помощью методов распознавания, относятся следующие.
1. Задачи медицинской дифференциальной диагностики. Для многих групп заболеваний со сходной симптоматикой удается построить решающие правила, с помощью которых диагностика проводится с высокой точностью. 2. Прогноз осложнений при лечении. Для той или иной схемы лечения строятся решающие правила, позволяющие для каждого больного определить особенность протекания лечения (лечение пройдет без осложнений, с осложнением типа 1, типа 2 и т. д.). 3. Прогноз отдаленных результатов лечения. Для каждого больного при заданной схеме лечения прогнозируется один из возможных исходов лечения. В случае нескольких альтернативных схем лечения на основе результатов прогноза для каждой из них можно выбрать для данного больного прогностически наиболее благоприятную схему. 4. Выделение групп людей повышенного риска. Строится правило, с помощью к-рого по индивидуальным особенностям человека, характерным для него привычкам, особенностям среды, в к-рой он проживает, прогнозируется возможность заболевания конкретной болезнью. Лица с неблагоприятным прогнозом объединяются в группу риска. Оказалось, что в выделенной группе риска концентрация людей с определенной патологией в десятки раз превосходит концентрацию аналогичных больных в контрольной группе.
Большие работы по применению методов Р. о. проводятся в теоретической медицине. Напр., создаются комплексные тесты, позволяющие судить о наличии конкретного заболевания не по одному специфическому тесту, а по набору неспецифических тестов. Методами Р. о. может быть решена одна из наиболее важных задач — задача выбора целесообразного для клин, испытаний препарата. Так, в мировой онкологической клин, практике апробировано менее 100 противоопухолевых препаратов, в то же время в поисках эффективных лекарств синтезируются сотни новых противоопухолевых средств. Эти новые лекарственные средства проверяются на различных моделях опухолей (в т. ч. и на опухолях животных). Однако эффективность препарата на моделях еще не гарантирует его эффективности в клинике. Проблема состоит в том, чтобы, имея информацию о клин. активности апробированных препаратов и информацию об активности этих же препаратов на различных моделях, выбрать по результатам испытания на моделях среди вновь синтезированных препаратов наиболее активный в клинике.
Развитие методов Р. о. на практике связано с созданием автоматизированных систем управления (см.), и в частности таких систем, которые позволяют накапливать большое количество информации — банки данных. Используя эти банки, можно в режиме диалога с машиной строить решающие правила, рассчитанные на имеющуюся в данный момент информацию, оценивать точность проводимой с помощью построенного правила классификации, определять необходимые дополнительные элементы описания ситуации для увеличения точности классификации и т. д. Создание таких систем позволит использовать ЭВМ на всех уровнях принятия альтернативных решений.
См. также Прогнозирование, Решающее правило, Электронная вычислительная машина.
Библиография: Вапник В. Н. Восстановление зависимостей по эмпирическим данным, М., 1979; Вапник В. Н. и Червоненкис А. Я. Теория распознавания образов, М., 1974; Вапник В. H., Глазкова Т. Г. и Миллер И. Ранжирование препаратов для клинических испытаний, в кн.: Эксперим. оценка противоопухолевых препаратов в СССР и США, под ред. 3. П. Софьиной и др., с. 184, М., 1980; Глазкова Т. Г. и Гурарий К. Н. Применение математических методов в онкоэпидемиологических исследованиях, Эпидемиология в странах СЭВ, М., 1979; Гублер Е. В. Вычислительные методы анализа и распознавания патологических процессов, JI., 1978; Распознавание образов и медицинская диагностика, под ред. Ю. И. Неймарка, М., 1972.
В. Н. Вапник.