Большая Советская Энциклопедия (цитаты)

Индексирование

Индексирование (далее И) процесс выражения главного предмета или темы текста какого-либо документа в терминах информационно-поискового языка. Применяется для облегчения поиска необходимого текста среди множества других. Проводится И как целого документа, так и его части. Для И нередко используются заглавия текстов. При И опускаются сопутствующие предметы или темы. Это служит причиной того, что при поиске не найденными остаются тексты, для которых предмет или тема информационного запроса является не главной, а сопутствующей. Различают 2 основных типа И - классификационное и координатное. При классификационном И, или классифицировании, тексты в зависимости от их содержания включаются в соответствующий класс (один или несколько), в котором собираются все тексты, имеющие в основном одинаковое смысловое содержание. Каждому такому тексту присваивается индекс этого класса, служащий далее его поисковым образом. При координатном И основное смысловое содержание текста выражается перечнем полнозначных слов, выбираемых либо из самого текста или его заглавия, либо из специального нормативного словаря. В первом случае такие лексические единицы называются ключевыми словами, а во втором - дескрипторами. Каждое ключевое слово или дескриптор обозначает класс, в который потенциально входят все тексты, где в выражения основного смыслового содержания входит это слово. Логическое произведение классов, которые обозначены всеми словами, выражающими в совокупности основное смысловое содержание текста, как бы образует некоторый сложный класс. Построенный таким способом сложный класс обозначается перечнем ключевых слов или дескрипторов, и этот перечень служит поисковым образом данного текста или выражением на информационно-поисковом языке смыслового содержания запроса. Таким образом, при координатном И смысловое содержание текста выражается как бы указанием его координат в некотором n-мерном смысловом пространстве. Разновидностью координатного И является пермутационное, или циклическое, И, которое основано на использовании ключевых слов заглавия текста и заключается в том, что все ключевые слова заглавия вместе с контекстом поочередно выводятся в поисковую колонку. В этой колонке ключевые слова даются в алфавитном порядке. На основе координатного И созданы и более сложные информационно-поисковые языки. Основное преимущество координатного И перед классификационным заключается в том, что координатное И не создает никаких затруднений при поиске текстов по любому, заранее не предусмотренному сочетанию признаков. Особым типом И следует считать раскрытие смыслового содержания текста через приводимую вместе с ним библиографию - имена авторов и библиографические описания их работ, на которые ссылается автор данного текста. Такое И служит основой для составления указателей цитированной литературы - весьма эффективного инструмента не только для поиска документов, но и для решения других задач (науковедческих, прогностических и т. д.).

  Лит.: Михайлов А. И, Черный А. И, Гиляревский Р. С., Основы информатики, 2 изд., М., 1968, с. 179-222, 244-515: Sharp J. R., Some fundamentals of information retrieval, L., 1965, p. 11-120, 156-203; Stevens М. E., Automatic indexing: a state-of-the-art report, Wash., 1965 (National Bureau of Standards, Monograph 91).

  А. И Черный.


Для поиска, наберите искомое слово (или его часть) в поле поиска


Новости 28.03.2024 12:01:19