ИНФОРМАЦИОННЫЕ РЕСУРСЫ. СОКОЛОВА Ж.В. ОТРАСЛЕВОЙ РУБРИКАТОР КАК ИНСТРУМЕНТ ИНДЕКСИРОВАНИЯ ДОКУМЕНТОВ И ПОИСКА ИНФОРМАЦИИ ПО ПРОБЛЕМАТИКЕ АПК В БАЗЕ ДАННЫХ «АГРОС»

  Введение. База данных «АГРОС» (БД «АГРОС») является основным информационным продуктом Федерального государственного бюджетного научного учреждения «Центральная научная сельскохозяйственная библиотека» (ЦНСХБ). Это крупнейшая в мире русскоязычная база данных по вопросам АПК и смежным с ним отраслям знаний. БД «АГРОС» включает документные массивы широкого тематического диапазона и при этом ориентирована на обслуживание достаточно детальных информационных запросов пользователей. Тематический охват БД «АГРОС» определяется границами Отраслевого рубрикатора по сельскому хозяйству и продовольствию (ОР) и максимально полно отражает проблематику АПК и смежных с ним областей.

   Для быстрого и эффективного тематического поиска информации по проблематике АПК в автоматизированных информационно-поисковых системах (ИПС) и БД в ЦНСХБ осуществляется индексирование входящего потока документов, то есть процесс выражения и описания содержания документа с помощью информационно-поисковых языков (ИПЯ). В ЦНСХБ для выражения смыслового содержания документов используются предкоординатные и посткоординатные ИПЯ. К предкоординатным (классификационным) языкам относятся: Универсальная десятичная классификация и Отраслевой рубрикатор по сельскому хозяйству и продовольствию. К посткоординатным ИПЯ относятся дескрипторный язык, основным инструментом которого является информационно-поисковый тезаурус (ИПТ), и язык ключевых слов.

   Целью исследования является анализ особенностей индексирования документов и поиска информации по проблематике АПК на примере защиты растений в БД «АГРОС» с использованием отраслевого рубрикатора.

    Содержание работы. Использование методик индексирования на различных ИПЯ способствует унификации обработки документов, гарантирует отнесение документов одной тематики в одно место, способствует преодолению субъективизма в определении места документа в ИПЯ, способствует точности, полноте и однозначности отображения информации в БД. Именно от точности и единообразия описания исходной информации языковыми средствами зависит релевантность (степень соответствия содержания документа, найденного при поиске, содержанию информационного запроса) и полнота поиска. [2, с. 15-19].

  ОР представляет собой иерархически построенный словарь рубрик, предназначенный для формирования фондов, информационных продуктов и поиска информации. Рубрикатор – это классификация научных знаний в структурированном и формализованном виде. Он разработан на основе базового Государственного рубрикатора научно-технической информации (ГРНТИ), максимальная глубина классификации – 5 уровней.

  К основным функциям ОР относятся следующие: определение тематического охвата БД; индексирование документов и поиск их по рубрикам; структурирование и систематизация документального потока; формирование и структурирование информационных массивов печатных и электронных продуктов БД в различных целях; создание единого информационного пространства в рамках АПК и смежных отраслей (БД, информационных служб, библиотек и т. п.).

  Рубрики состоят из кодов и их текстовых наименований. Код представляет собой цепочку пар арабских цифр (в зависимости от уровня иерархии), разделенных знаком «.» (точка). При рубрике может быть примечание, уточняющее вопросы, которые она отражает в связи с другими рубриками, а также система ссылок (См. и См. также) к другим разделам ОР и ГРНТИ и обратных ссылок от них (Отс. от и См. также). Такие ссылки облегчают понимание тематического охвата рубрик и поиск рубрики, необходимой для индексирования конкретного документа. [1, с.16-20].

  Проиллюстрируем это на фрагменте рубрикатора:

     68.37 Защита растений

Примечание. В рубрике отражаются вопросы защиты растений от вредителей, болезней, сорняков, в т.ч. вопросы защиты растений от неблагоприятных метеорологических факторов.

    Защита леса

    см. 68.47.37 Защита леса от болезней и вредителей

     Оценка сортов и селекция с.-х. растений на устойчивость к вредителям и болезням

     см. 68.35.03 Селекция и семеноводство с.-х. растений

               68.37.13 Методы защиты растений от вредителей, болезней и сорняков

               См. также: 68.31.21 Орошение с.-х. земель

               68.37.31 Болезни растений и борьба с ними

               68.37.31.21 Непаразитарные болезни растений

                                  Нарушение водного режима у растений

                                   см. 68.03.03.21.13 Водный режим с.-х. растений

                 68.37.31.21.05 Генетические болезни растений

                  Отс. от 68.03.03.17 Генетика с.-х. растений

   Для отражения основных аспектов содержания документу приписывается цифровой код одной или нескольких рубрик (но не более трех). Отнесение документа к рубрике – ответственный момент индексирования. Код рубрики определяет место данного документа в информационном массиве БД, издания, релевантность поиска по запросу пользователей. Отметим, что многоаспектный документ может быть отнесен одновременно к разным рубрикам, если его содержание удовлетворяет содержанию этих рубрик [2, с.11-12].

    Рассмотрим особенности индексирования документов и поиска информации по защите растений в БД «АГРОС» с использованием отраслевого рубрикатора на конкретных примерах.

   Пример: Документ «Полифункциональное действие энтомопатогенных микроорганизмов: оценка инсектицидной и антифунгальной активности Bacillus thuringiensis и Beauveria bassiana в отношении личинок колорадского жука и возбудителя ризоктониоза картофеля Rhizoctonia solani соответственно».

  Документ, несомненно, должен быть отнесен к рубрикам 68.37.29.49.17 Насекомые ‑ вредители картофеля и 68.37.31.49.19 Грибные болезни картофеля, так как содержит информацию о двух объектах, вредящих картофелю. Но, кроме того, в источнике рассмотрены результаты использования полезных микроорганизмов в качестве агентов биологической борьбы с вредными организмами. Поэтому, данный документ должен быть отнесен также к рубрике 68.37.13.17 Биологический метод борьбы с вредителями, болезнями растений и сорняками для наиболее полного раскрытия его содержания.

  Поиск документов по кодам ОР позволяет найти в БД большой объем документов по крупным блокам тематической информации, в частности по защите растений, не прибегая к помощи терминов ИПТ или в дополнение к нему.

          Пример: Пользователь обращается к ИПС БД «АГРОС» с запросом Интегрированный метод борьбы с вредителями, болезнями растений и сорняками, выраженным посредством соответствующей рубрики 68.37.13.23 (рисунок 1 и 2).

 

Рисунок 1 – Выбор рубрики в рубрикаторе

 

Рисунок 2 – Параметры поиска

  Поисковая система обрабатывает запрос и выдает результат – достаточно большой массив документов (1098) по искомой теме (рисунок 3). Пользователь анализирует полученную информацию и использует для нужных ему целей.

 

Рисунок 3 – Результаты поискового запроса

  Аналогичным образом можно осуществлять поиск информации по любым рубрикам тематической области Защита растений и других областей знаний в БД «АГРОС». Это отвечает задачам формирования, как правило, больших информационных массивов с фиксированной тематикой, которые могут быть полезны информационным центрам, библиотекам и научным учреждениям. Индивидуальный пользователь также может найти в ОР рубрики, адекватно отражающие нужную ему информацию, и сформулировать запрос только кодами рубрик. Следует, однако, иметь в виду, что такой поиск дает значительные по величине массивы документов, часть которых может иметь слишком общий характер. Чтобы исключить их придется использовать другие ИПЯ. В этом и состоит одна из разнообразных стратегий поиска – на первом этапе используется классификационный язык (рубрикатор), на последующих – языки координатного индексирования (дескрипторный язык и язык ключевых слов) [3].

   Выводы. Отраслевой рубрикатор является одним из инструментов индексирования документов и поиска информации по защите растений и другим отраслям знаний в БД «АГРОС». С его помощью можно формировать информационные массивы, которые могут использоваться как индивидуальными пользователями, так и информационными центрами, библиотеками, научными учреждения для различных целей: создание тематических БД, структурированных электронных и печатных изданий (библиографические указатели, навигаторы по информационным ресурсам и т.д.). 

Список источников

  1. 1. Индексирование документов базы данных ЦНСХБ. Методические указания // состав. Пирумова Л.Н., Харченко Л.Т. – Москва, 1995. – 35 с.
  2. 2. Пирумова Л.Н., Харченко Л.Т. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в БД АГРОС. (Методические материалы) – Москва, 2001. – 70 с.
  3. 3. Харченко Л.Т., Климова Е.В. Оптимизация стратегии поиска в базе данных "Агрос" // Библиотечное дело – 2005: деятельность библиотек и развитие информационной культуры общества / Моск. гос. ун-т культуры и искусств. – Москва, 2005. – С. 172-173.

 

Сведения об авторе

Соколова Жанна Владимировна, старший научный сотрудник отдела аналитико-синтетической обработки документов и лингвистического обеспечения Федерального государственного бюджетного научного учреждения «Центральная научная сельскохозяйственная библиотека»

Рецензент

Цветкова Валентина Алексеевна - доктор технических наук, профессор, заместитель главного редактора журнала

 

К оглавлению выпуска

31.05.2021, 755 просмотров.