Научные коммуникации и информационно-аналитическое обеспечение науки. СОКОЛОВА Ж.В. ОСОБЕННОСТИ ИНДЕКСИРОВАНИЯ ДОКУМЕНТОВ В OPAC-GLOBAL: ПРОБЛЕМЫ И ВОЗМОЖНОСТИ

Введение. Автоматизированная библиотечно-информационная система (АБИС) обеспечивает функционирование библиотеки в современных условиях. Она включает электронные информационные ресурсы, программные и лингвистические средства их обработки, формирования, структурирования и поиска в них. Программные средства АБИС обеспечивают все технологические процессы библиотеки. Поэтому АБИС объединяет в себе функции автоматизированной системы для управления работой библиотеки и инструменты для создания информационных ресурсов и организации доступа к ним. Наличие АБИС является сегодня обязательным условием продуктивной работы библиотеки, а умение работы в АБИС стало неотъемлемой частью списка профессиональных компетенций библиотечного специалиста [1]. С 2023 г. Федеральное государственное бюджетное научное учреждения «Центральная научная сельскохозяйственная библиотека» (ЦНСХБ) перешла с программных средств АБИС собственной разработки на единую платформу на основе веб-технологий – АБИС OPAC-Global. АБИС OPAC-Global предназначена для создания «Электронных библиотек без границ» за счет предоставления пользователям Интернет собственных и импортируемых информационных ресурсов через стандартные браузеры в системе национальных форматов RUSMARC на основе гибкой системы санкционированного доступа. Система позволяет осуществлять каталогизацию документов в режиме реального времени, использовать национальные и собственные авторитетные и справочные файлы в качестве информационно-поисковых языков (ИПЯ) в единой программной среде, создавать массивы полнотекстовых цифровых документов, поиск которых возможен через поиск связанных с ними библиографических записей, осуществлять электронную доставку документов [4].

 В ЦНСХБ была проведена работа по внедрению и адаптации АБИС OPAC-Global к технологическим процессам библиотеки. Хотелось бы остановиться на одном их них – индексировании документов.

 Для обеспечения быстрого и эффективного тематического поиска информации по проблематике агропромышленного комплекса (АПК) в электронном каталоге и базе данных (БД) собственной генерации «АГРОС» в ЦНСХБ осуществляется индексирование входного документопотока, т. е. процесс выражения и описания содержания документа с помощью ИПЯ, специально разработанных для поиска в автоматизированных системах [3, с. 4]. В ЦНСХБ для выражения смыслового содержания документов используются следующие ИПЯ: Информационно-поисковый тезаурус по сельскому хозяйству и продовольствию (ИПТ), язык ключевых слов, Универсальная десятичная классификация (УДК) и Отраслевой рубрикатор по сельскому хозяйству и продовольствию (ОР) [5, с. 13-15]. В процессе научной обработки документа создается библиографическая запись, в том числе библиографическое описание, аннотация, реферат, формируются другие элементы библиографической записи [2, c. 20].

Целью исследования является анализ особенностей индексирования документов по проблематике АПК в АБИС ЦНСХБ OPAC-Global.

   Отделом Аналитико-синтетической обработки документов и поддержки лингвистических средств осуществляется семантическая обработка документов по проблематике АПК, заключающаяся в научном анализе и оценке, отборе, сопоставлении, обобщении и преобразовании наиболее ценной информации в более сжатые формы. В процессе аналитико-синтетической обработки документа происходит раскрытие его смыслового содержания и свертывание информации, содержащейся в нем, до аннотации и/или реферата на русском языке, перевод информации с естественного языка на ИПЯ.

  Библиографические записи создаются в Российском коммуникативном формате представления библиографических записей в машиночитаемой форме (RUSMARC) [6]. Используемый формат определяет содержание, форму и структуру записи.

 Существующая в ЦНСХБ технология раздельного ввода информации о документе (создание библиографической записи) сотрудниками разных подразделений библиотеки включена и адаптирована в АБИС OPAC-Global. Если ранее создание библиографической записи на книги и статьи происходило в разных автоматизированных программах (на книги – в MARC SQL, а на статьи в автоматизированной системе АСАРД на программных средствах собственной разработки), то в АБИС OPAC-Global это происходит на единых программных средствах.

 После всестороннего анализа документа (статьи из журнала или сборника, книги) индексатором необходимо перейти к заполнению полей формата, раскрывающего его содержание. В АБИС OPAC-Global для этого нужно перейти в модуль «Каталогизация» и осуществить поиск нужного документа любым удобным способом: по штрих-коду, шифру хранения, инвентарному номеру, заглавию и т. д. (рисунок 1, 2).

Рисунок 1 ‑ Поиск документа в модуле «Каталогизация»

Рисунок 2 – Результат поиска в модуле «Каталогизация»

 После нахождения необходимого документа, например, статьи из журнала, переход в него осуществляется после активации кнопки Редактировать (рисунок 3).

Рисунок 3 – Выбор конкретной статьи

 Для дальнейшей работы со статьей необходимо ее локализовать, чтобы добавить необходимые для заполнения поля формата (рисунок 4).

Рисунок 4 ‑ Добавление полей формата

 Остановимся подробнее на полях формата RUSMARC, которые необходимо заполнить. Для раскрытия смыслового содержания документа используются маркеры записей: 3 ‑ Блок примечаний, 6 ‑ Блок анализа содержания и библиографической истории. Маркер записей 9 ‑ Блок локального использования ‑ для служебных пометок.

Поле 330 Резюме или реферат может содержать текст аннотации или реферата к данному ресурсу, является факультативным, повторяющимся, если, например, необходимо привести реферат на разных языках. Имеет подполя $a Текст примечания, $8 Язык текста (для рефератов), $9 Реферат.

 Проиллюстрируем заполнение поля 330 на примере (рисунок 5).

Рисунок 5 – Заполнение поля 330

В данном случае в поле 330 добавляется краткая аннотация для уточнения некоторых аспектов документа. При индексировании документов на иностранных языках аннотация на русском языке обязательна, так как помогает пользователю понять основное содержание работы, а также дает дополнительные возможности для поиска.

Поле 600 Имя лица как предмет может содержать имя лица, являющегося одним из объектов рассмотрения в ресурсе, представленное в форме точки доступа. Поле является факультативным, повторяющимся. Имеет подполя $a Начальный элемент ввода (часть имени, используемая как начальный элемент ввода), $b Часть имени, кроме начального элемента ввода (остаток имени от начального элемента ввода – фамилии или родового имени), $2 Источник данных.

Проиллюстрируем заполнение поля 600 на примере (рисунок 6).

Рисунок 6Заполнение поля 600

В поле 600 вводятся фамилия и инициалы лица, являющегося объектом рассмотрения в документе. Поле неконтролируемое, поэтому в качестве источника данных используется нестандартный список кодов.

Поле 606 Наименование темы как предмет должно содержать слово или словосочетание, отражающее содержание ресурса, представленное в форме точки доступа. Поле содержит данные, записываемые в соответствии с правилами, принятыми в системе индексирования. В поле могут быть записаны названия объектов, продуктов, растений, животных, абстрактные понятия и т. д. Поле является факультативным, повторяющимся. Имеет подполя $a Наименование темы (дескриптор в форме, определяемой используемой системой индексирования), $2 Источник данных (код системы предметных рубрик или тезауруса, по правилам которой построены предметная рубрика/дескриптор), $3 Идентификатор связанной авторитетной записи.

Проиллюстрируем заполнение поля 606 на примере (рисунок 7).

Рисунок 7 – Заполнение поля 606

В поле 606 записываются дескрипторы (разрешенные для индексирования термины) ИПТ, максимально конкретно выражающие смысловое содержание документа. Дескриптор выбирается из авторитетной записи посредством строгого поиска или поиска с усечением окончаний слов или словосочетаний. Строгий поиск предполагает написание слов или словосочетаний без усечения. Особенностью заполнения данного поля является то, что терминов тезауруса может быть довольно много (в отдельных случаях до 10-15), а каждое введенное понятие после выбора из авторитетной записи должно быть связано с библиографической записью посредством активации кнопки Связать. Здесь было бы уместнее иметь возможность связывать все выбранные понятия активацией одной кнопки, что значительно сократило бы время на обработку документа.

Поле 607 Географическое наименование как предмет может содержать название географического объекта, являющегося одним из предметов рассмотрения в ресурсе, представленное в форме точки доступа. Поле является факультативным, повторяющимся. Имеет подполя $a Географическое наименование (географическое понятие в форме, определяемой используемой системой индексирования), $2 Источник данных (код системы предметных рубрик или тезауруса, по правилам которой построены предметная рубрика/дескриптор), $3 Идентификатор связанной авторитетной записи.

Проиллюстрируем заполнение поля 607 на примере (рисунок 8).

Рисунок 8 – Заполнение поля 607

В поле 607 записываются географические объекты (страны, области и зоны Российской Федерации, названия гор, рек, озер, равнин и т. д.). Данные понятия выбираются из тезауруса.

Поле 610 Неконтролируемые предметные термины может содержать в форме точки доступа предметные термины, заимствованные не из контролируемых списков предметных рубрик или дескрипторных словарей. Поле является факультативным, повторяющимся. Имеет подполе $a Предметный термин (ключевые слова).

Проиллюстрируем заполнение поля 610 на примере (рисунок 9).

Рисунок 9 – Заполнение поля 610

В поле 610 вводятся ключевые слова – понятия, отсутствующие в тезаурусе, но необходимые для использования при индексировании документов.

Поле 615 Предметная категория должно содержать вышестоящий уровень предметной категории в текстовой и/или кодированной форме. Поле является факультативным, повторяющимся. Имеет подполя $a Начальный элемент ввода вышестоящей предметной категории в текстовой форме (термин в форме, предписываемой используемой системой индексирования), $n Начальный элемент ввода вышестоящей предметной категории в кодированной форме (кодированное представление предметной категории), $2 Источник данных (код системы, являющейся источником предметной категории), $3 Идентификатор связанной авторитетной записи.

Проиллюстрируем заполнение поля 615 на примере (рисунок 10).

Рисунок 10 – Заполнение поля 615

В поле 615 записываются цифровые коды одной или нескольких рубрик (но не более трех) ОР для отражения основных аспектов содержания документа. Коды выбираются из авторитетной записи посредством строгого поиска или поиска с усечением. Строгий поиск предполагает написание рубрик без усечения.

Поле 675 Универсальная десятичная классификация (УДК) должно содержать классификационный индекс, присвоенный ресурсу в соответствии с УДК, с указанием используемого издания. Поле является факультативным, повторяющимся. Имеет подполя $a Индекс (классификационный индекс согласно таблицам УДК), $v Издание (номер издания, из которого взят индекс).

Проиллюстрируем заполнение поля 675 на примере (рисунок 11).

Рисунок 11 – Заполнение поля 675

Особенность заполнения поля 675 заключается в том, что индексы УДК прописываются вручную, а не выбираются из авторитетной записи, так как в АБИС OPAC-Global нет возможности для составления сложных индексов.

В практике индексирования документов в ЦНСХБ смысловое содержание документов детально выражается индексами УДК путем комбинирования нескольких индексов.

Готовая библиографическая запись, созданная индексатором в формате RUSMARC, выглядит следующим образом (рисунок 12).

Рисунок 12 – Готовая библиографическая запись в формате RUSMARC

Индексирование книг, а также статей из журналов и сборников в АБИС OPAC-Global осуществляется одинаковым образом за исключением локализации документа. В случае индексирования книг при локализации выбирается лист ввода для разных видов документов: монография, том, часть, продолжающее издание, автореферат, электронный ресурс (рисунок 13).

Рисунок 13 – Выбор листов ввода для книг

Преимуществом АБИС OPAC-Global является создание библиографических записей в формате RUSMARC, что позволяет связывать записи с авторитетными данными (тезаурусом, рубрикатором) за исключением таблиц УДК из-за сложности составления индексов. Недостатками системы являются слишком трудоемкий процесс заполнения некоторых полей формата, в частности поля 606, а также невозможность составления комбинированных индексов УДК. Кроме того, интерфейс системы предполагает отображение на экране большого количества служебных знаков (#, $ и др.), которые не требуются для работы индексатора и затрудняют восприятие значимой информации в листе ввода.

Выводы. Индексирование документов в АБИС OPAC-Global позволяет формировать библиографические записи в формате RUSMARC с использованием авторитетных данных, таких как тезаурус и рубрикатор, что необходимо для адекватного раскрытия смыслового содержания документов и их дальнейшего поиска в электронном каталоге и БД «АГРОС». Процесс индексирования документов в данной системе выстроен логично и в целом соответствует заявленным задачам, но не совсем удобен в практической работе и имеет ряд недостатков, требующих исправления и доработок.

Список источников

  1. 1. Грибов В. Т. Библиотека и АБИС: нам не жить друг без друга? // Университетская книга. – 2022. – № 9. – С. 59–63.
  2. 2. Зупарова Л. Б., Зайцева Т. А., Сазонова Л. И. Библиотечная обработка документа : учеб. – метод. пособие. – Москва : Либерея, 2003. – 208 с.
  3. 3. Индексирование документов базы данных ЦНСХБ. Методические указания // состав. Пирумова Л. Н., Харченко Л. Т. – Москва, 1995. – 35 с.
  4. 4. Логинов Б. Р. Новая технология OPAC-Global для глобальных онлайновых электронных библиотек // Электронные библиотеки. – 2001. – Т. 4, № 3. – С. 10.
  5. 5. Пирумова Л. Н., Харченко Л. Т. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в БД АГРОС. (Методические материалы) – Москва, 2001. – 70 с.
  6. 6. Российский коммуникативный формат представления библиографических записей в машиночитаемой форме: (российская версия UNIMARC) / М-во культуры Рос. Федерации, Рос. библ. ассоц. – URL: http://rusmarc.ru/rusmarc/format.html (дата обращения: 20.12.2023).

Сведения об авторе

Соколова Жанна Владимировна - старший научный сотрудник отдела аналитико-синтетической обработки документов и лингвистического обеспечения Федерального государственного бюджетного научного учреждения «Центральная научная сельскохозяйственная библиотека»

К оглавлению выпуска

21.02.2024, 235 просмотров.