ИНФОРМАЦИОННО-ПОИСКОВЫЙ ЯЗЫК

Категория :

Описание

ИНФОРМАЦИОННО-ПОИСКОВЫЙ ЯЗЫК — искусственный язык, предназначенный для описания смыслового содержания текстов, а также для выражения смыслового содержания информационных запросов с целью реализации информационного поиска в информационнопоисковой системе. Любой абстрактный И.-п. я. задается следующими тремя компонентами: алфавитом (набором исходных символов), правилами образования и правилами интерпретации. Правила образования определяют процедуры построения слов и выражений данного И.-п. я. В соответствии с правилами интерпретации этим словам и выражениям приписывается определенный смысл, т. е. задается двуязычный словарь, в к-ром каждой лексической единице И.-п. я. ставится в соответствие слово или выражение естественного языка и наоборот.

И.-п. я. строится на базе того или иного естественного языка. При этом устраняется семантическая неоднозначность словарного состава, так что в И.-п. я. каждое понятие выражается одним и только одним словом, а каждое слово в свою очередь выражает одно и только одно понятие. Грамматика И.-п. я. строится строго формально, чтобы каждое выражение И.-п. я. допускало лишь одно толкование. Такое построение языка делает его удобным для алгоритмического сопоставления и отождествления записей основного смыслового содержания текстов документов и смыслового содержания информационных запросов. При разработке конкретного И.-п. я. учитывается специфика отрасли, для к-рой этот язык создается, характер информационных потребностей, для удовлетворения которых разрабатывается данная информационно-поисковая система (см.), а также особенности текстов, образующих ее поисковый массив.

Используются три основных типа И.-п. я.: библиотечно-библиографические классификации, алфавитнопредметные классификации и языки дескрипторного типа (см. Дескриптор). Первые два типа И.-п. я. не обеспечивают возможности поиска сведений по любому, заранее не заданному сочетанию признаков (характеристик). Поэтому с начала 50-х гг. широкое распространение получили дескрипторные И.-п. я. Их основу составляет метод координатного индексирования, который базируется на представлении, что основное смысловое содержание документа и информационного запроса может быть с достаточной степенью точности и полноты выражено списком дескрипторов.

Одна из основных трудностей, с к-рыми приходится иметь дело при информационном поиске, заключается в переводе запросов потребителей на И.-п. я. Эта трудность обусловлена неадекватностью словесного выражения потребностей запрашивающего; она может быть значительно уменьшена, если создать словарь, который бы позволял по смыслу запроса находить слова (дескрипторы), необходимые для выражения смысла. Такие словари получили название тезаурусов. Тезаурус — это словарь-справочник, отражающий семантические связи между лексическими единицами И.-п. я. При этом в нем произведена систематизация дескрипторов по смыслу и указаны все смысловые связи между ними.


Библиография: Блохин Ю. И. Классификация и кодирование технико-экономической информации, М., 1976; Копылов В. А. Построение автоматизированных информационно-поисковых систем, М., 1974; Михайлов А. И., Чeрный А. И. и Г и л я p e в с к к й P. С. Основы информатики, М., 1968, библиогр.; они ж е, Научные коммуникации и информатика, М., 1976; М о с к о в и ч В.А. Информационные языки, М., 1971, библиогр.

Л. Микулич.