ИНФОРМАЦИОННЫЕ РЕСУРСЫ. АНДРЕЕВА Е. В. ПРОБЛЕМЫ ФОРМИРОВАНИЯ МИКРОТЕЗАУРУСА ПО МЕХАНИЗАЦИИ СЕЛЬСКОГО ХОЗЯЙСТВА
Основной информационный продукт Федерального Государственного бюджетного научного учреждения «Центральная научная сельскохозяйственная библиотека» (ЦНСХБ) – база данных (БД) «АГРОС», в которой отражается вся информация об источниках, поступивших в ЦНСХБ. БД «АГРОС» – самая крупная русскоязычная БД по проблематике АПК. Ее объем составляет более 2,2 млн. записей. Она существует с 1985 г., включает максимально полно информацию о книжном и статейном материале по всем отраслям АПК (и смежным с ними) на 40 языках мира, начиная с 1992 г. Для этой БД отбираются и аналитически расписываются статьи из периодических и продолжающихся отечественных и иностранных изданий. Ежегодное пополнение составляет более 40 тыс. записей. Как и в большинстве зарубежных отраслевых БД информационных продуктов, в БД «АГРОС» включается не только библиографическая, но и реферативная, и полнотекстовая информация. Благодаря специально разработанным в ЦНСХБ лингвистическим средствам («Отраслевой рубрикатор по сельскому хозяйству и продовольствию», разработанный на основе Государственного рубрикатора научно-технической информации (ОР), и «Информационно-поисковый тезаурус по сельскому хозяйству и продовольствию» (ИПТ)) обеспечиваются унифицированное качественное индексирование и представление в информационных массивах, релевантность и полнота тематического поиска. БД «АГРОС» используется также для различных библиометрических исследований и анализа документных потоков по отдельным тематическим областям АПК [1, с. 69-70].
Для ежегодного пополнения БД «АГРОС» в ЦНСХБ проводится научная обработка документов, включающая обработку книг и статей, которая осуществляется с использованием метода раздельной обработки и ввода информации специалистами Отдела аналитико-синтетической обработки документов и лингвистического обеспечения (АСОД) и специалистами Отдела комплектования и библиотечной обработки документов (ОКБОД). Для сокращения ручного труда систематизаторов и каталогизаторов на этапе создания библиографических записей (аналитический уровень) специалистами ЦНСХБ в свое время были разработаны программные средства и создана Автоматизированная система аналитической росписи документов (АСАРД). Данная система состоит из нескольких технологических блоков и отдельных подсистем, в том числе подсистема формирования оглавлений журналов и сборников, подсистема автоматического формирования записей для электронного каталога и БД, подсистема формирования и ведения ИПТ и др. АСАРД позволяет осуществлять постатейную роспись периодических и продолжающихся изданий. Система удобна в использовании, имеет дружественный интерфейс и снабжена встроенными лексическими средствами: ИПТ, ОР, таблицы УДК, что позволяет осуществлять поиск в них необходимых для научной обработки документов дескрипторов тезауруса, рубрик и кодов и автоматически добавлять их в соответствующие поля формата представления данных (RUSMARC). В системе предусмотрена функция формально-логического контроля (сверка с ИПТ, ОР дескрипторов и кодов, выбранных индексатором и введенных в поля формата) и интерактивного контроля орфографии (аннотации, рефераты). АСАРД дает возможность проставлять соответствующие пометы для отнесения документа в информационные продукты ЦНСХБ: реферативные журналы, указатели и проблемно-ориентированные БД. Система позволяет осуществлять большое количество операций над первичным документом, что значительно сокращает сроки обработки документов. Работа по актуализации и пополнению ИПТ и ОР ЦНСХБ также проводилась в системе АСАРД [2].
В 2023 г. ЦНСХБ перешла на новое программное обеспечение ‑ АБИС OPAC-Global. OPAC-Global – централизованная полнофункциональная автоматизированная библиотечно-информационная система, предназначенная для автоматизации как отдельных библиотек, так и группы библиотек, на основе корпоративной работы в режиме реального времени через стандартные веб-браузеры. С 2023 г. вся научная обработка литературы – формирование библиографических записей – осуществляется в новой программе, в новую систему загружены лингвистические средства индексирования, в том числе ИПТ по сельскому хозяйству и продовольствию и микротезаурусы (тезаурусы по отдельным отраслям сельского хозяйства). В связи с этим возникала необходимость проанализировать визуализацию и структуру словарных статей, изучить полноту и корректность загрузки контентов ИПТ и микротезауруса. Рассмотрим пример представления словарных статей лексических единиц по микротезаурусу «Техника в сельском хозяйстве» в АСАРД и АБИС OPAC-Global. Нужно отметить, что в обеих системах термины микротезауруса можно вывести на экран полностью в алфавитном порядке (рисунки 1 и 2).
Рисунок 1 –Алфавитный список терминов микротезауруса «Техника в сельском хозяйстве» в АСАРД
Рисунок 2 – Алфавитный список терминов микротезауруса «Техника в сельском хозяйстве» в OPAC-Global
Сравнение объемов, представленных в АСАРД и загруженных в АБИС OPAC-Global, показало незначительные расхождения: если в АСАРД представлено 1431 записи, то в OPAC-Global 1434. Таким образом, можно говорить о полноте загрузки микротезауруса «Техника в сельском хозяйстве» из АСАРД в OPAC-Global.
Рассмотрим отображение связанных данных на примере термина Бороны в этих системах. В АСАРД этот термин в микротезаурусе представлен в следующем виде (рисунок 3).
Рисунок 3 – Представление термина Бороны в системе АСАРД
Термин представлен с указанием рубрики ГРНТИ или ОР, УДК, иноязычного эквивалента, вышестоящих (В) и нижестоящих терминов (Н) и ассоциативной связи (А). Нажимая курсором на соответствующие подрубрики (Н1), можно получить более детальное значение соответствующих терминов с данными УДК, а также ссылки, или пояснения, данным по этим терминам при их наличии. Например, кликнув на термин Дисковые бороны, получаем результат (рисунок 4).
Рисунок 4 – Переход к нижестоящему термину в системе АСАРД
В АБИС OPAC-Global этот же термин представлен в микротезаурусе в следующем виде (рисунок 5).
Рисунок 5 – Представление термина Бороны в АБИС OPAC-Global
Термин представлен во взаимосвязи с более узкими терминами, ассоциациями. Но в отличие от АСАРД на этом этапе в OPAC-Global не представлены индексы УДК и ОР. Чтобы увидеть вышестоящий термин, необходимо под словом Бороны кликнуть на «Более широкий термин» и получим следующую страницу (рисунок 6).
Рисунок 6 – Представление термина Бороны с более широким термином.
Либо кликнуть на термин Бороны и получить следующую информацию и здесь уже появляются связанные данные с ОР и УДК (рисунок 7).
Рисунок 7 – Термин Бороны со всеми связями (английский эквивалент, верхний, нижние уровни, ассоциации, ОР и УДК).
Для получения информации по конкретной бороне необходимо нажать на этот термин в списке нижнего уровня, например, дисковые бороны. Результат будет представлен в следующем виде (рисунок 8).
Рисунок 8 – Представление термина Дисковые бороны
И тогда получаем иностранный эквивалент, более широкий термин, индексы ОР и УДК, т. е. полную словарную статью термина, как она представлена в микротезаурусе.
В процессе исследования было установлено, что при автоматическом переводе контента из системы АСАРД в OPAC-Global у терминов по строительству в сельском хозяйстве (ГРНТИ раздел 67) их коды были перенесены из поля ГРНТИ формата ввода данных в поле Ссылочного примечания, что произошло из-за того, что в АСАРД рубрики ОР имели пять уровней, а в OPAC-Global – три уровня. Система не распознала их и перевела в другие поля. После ввода в раздел ГРНТИ рубрик пятого уровня возможно автоматическое переиндексирование и уточнение нужных полей. Также выявлена проблема: термины микротезауруса оказались связаны не с теми кодами ОР и ГРНТИ, что потребует ручную корректировку. Установили, что у некоторых терминов микротезауруса не представлены английские эквиваленты, что также возможно потребует ручной ввода и/или редакции. Таким образом, в системе OPAC-Global проводится как бы формально-логический контроль, выявляющий ошибки индексатора.
Отдельно хочется отметить, что представление терминов-синонимов в АСАРД однозначное и точное. Пример представлен на рисунке 9. В словарной статье синонима дана отсылка, из которой понятно, что вместо термина Приспособления технические нужно использовать термин Устройства (Приспособления технические – смотри – устройства).
Рисунок 9 – Словарная статья синонима Приспособления технические в БД АСАРД
В OPAC-Global это выглядит следующим образом (рисунок 10).
Рисунок 10 – Представление синонима Приспособления технические в АБИС OPAC-Global
В данном представлении непонятно, какой из терминов является синонимом другого термина и какой из терминов нужно использовать.
Отдельным вопросом стоит работа по пополнению ИПТ новыми терминами. Если в АСАРД для ввода термина нужно лишь нажать мышкой одну кнопку «включить корректировку», которая находится внизу правой части экрана (см. рисунки 3 и 4) и ввести новые данные с последующим их сохранением (занимает несколько минут), то в OPAC-Global это очень длительная и многооперационная процедура, занимающая много времени, внимания и усилий работника. Для ввода или поиска термина необходимо выбрать меню «Ведение авторитетных файлов» и выбрать тезаурус. Перед нами открывается окно, в котором можно посредством поискового запроса осуществить проверку наличия в БД тезаурус нужной нам авторитетной записи. Если такой записи не существует, то нужно выбрать команду Новая запись. Затем выбирается значение Тезаурус (Дескриптор). Открывается окно программы с рабочим листом. Выбирается поле 250 (Принятая точка доступа – наименование темы) и вводится в него значение термина. Затем заполняется поле 675 (УДК), устанавливаются связи термина с индексом УДК, выбирая команды и поля Редактировать, Связи, Добавить,Сохранить и Записать. В процессе этих операций всплывают специальные окна и списки для выбора данных, в которых необходимо выбирать соответствующие поля. Далее выбираем БД ГРНТИ, находим соответствующую эквивалентную термину код рубрики, кликаем на нее, связываем данные и записываем их. Далее подбирается эквивалент термина в международном тезаурусе по сельскому хозяйству CABI. При этом может возникнуть необходимость добавления к термину синонимов на латинском и русском языках, а также англоязычного эквивалента, которые тоже потребуют определенный порядок ввода и сохранения данных. Хочется отметить, насколько работа по созданию новых терминов сложна и трудоемка и требует большой концентрации внимания, так как все процессы взаимосвязаны и идут в определенной последовательности, малейшее отклонение от которой может привести к нарушению логики и ошибкам.
Итак, с переходом на программные средства OPAC-Global ЦНСХБ получила современную, основанную на веб-технологиях АБИС. В процессе ее адаптации под технологию формирования ИПТ и микротезаурусов выявлены проблемы интеграции данных из АСАРД, что требует сверки, проверки, редакции и корректировки не только новых, но и уже имеющихся в микротезаурусах и ИПТ терминов и словарных статей. Установили, что при переносе данных произошли некоторые потери, которые нужно будет исправлять как автоматически, так и ручным способом. OPAC-Global система достаточно точная и четкая. Однако многооперационная технология поиска терминов, синонимов, а особенно ввода новых терминов требует много времени, точности, усердия и внимания.
Список источников
1. Пирумова Л. Н. Возможности и инструменты ЦНСХБ для научных редакторов и ученых. Научный редактор и издатель. 2023;8(1 Suppl) : S67–S76. [Электронный ресурс]. – URL: https://doi.org/10.24069/SEP-23-07 (дата обращения: 06.09.2024 г.)
2. Соколова Ж. В. Цифровые технологии в научной обработке литературы о проблематике АПК // Культура: теория и практика. Электрон. науч. журн. – 2020. – Вып. 5(38). [Электронный ресурс]. –URL: http://theoryofculture.ru/issues/116/1398/ (дата обращения: 06.09.2024 г.)
Сведения об авторе
Андреева Елена Владимировна - старший научный сотрудник ФГБНУ "Центральная научная сельскохозяйственная библиотека"
информационная культура, библиографическая культура
25.07.2024, 17 просмотров.