ИНФОРМАЦИОННЫЕ РЕСУРСЫ. КЛИМОВА Е.В. ИНФОРМАЦИОННАЯ СИСТЕМА AGRIS И ТЕЗАУРУС AGROVOC КАК ПРИМЕРЫ УСПЕШНОГО МЕЖДУНАРОДНОГО СОТРУДНИЧЕСТВА В ОБЛАСТИ РАСПРОСТРАНЕНИЯ ЗНАНИЙ ПО СЕЛЬСКОМУ ХОЗЯЙСТВУ

В современном мире остро стоит проблема обеспечения населения планеты качественным продовольствием в необходимых объемах. С 1945 г. при Организации Объединенных Наций существует Продовольственная и сельскохозяйственная организация ФАО (FAO ‑ Food and Agriculture Organization), глобальной задачей которой является борьба с голодом. ФАО активно содействует развитию мирового сельского хозяйства, улучшению питания населения Земли и решению проблемы продовольственной безопасности, в том числе распространяя знаний о передовых способах ведения сельского хозяйства и путях обеспечения устойчивого развития.

Под эгидой ФАО с 1975 г. функционирует AGRIS (Agricultural Research Information System) – международная информационная система по сельскому хозяйству и смежным с ним отраслям. Концептуально AGRIS строится на принципах доступности, полезности и применимости информации. Участники системы бесплатно поставляют в нее информацию и свободно пользуются информацией, предоставленной другими участниками; поступающие сведения должны быть результатом многолетних исследований и представлять научный и практический интерес для мирового сообщества. На сегодняшний день AGRIS – крупнейший отраслевой информационный ресурс; содержит информацию о приблизительно 9,67 млн. библиографических записей (по состоянию на февраль 2019 г.), пополняется 8-10 раз в год, примерно на 0,5 млн. записей ежегодно.

На всех этапах существования системы специалисты AGRIS использовали для распространения информации самые передовые из доступных на тот момент технических возможностей. По мере развития Интернета и интернет-технологий появилось понимание, что международный обмен информацией может стать невозможным без обеспечения совместимости данных. Были разработаны общие критерии интероперабельности и несколько соответствующих им форматов метаданных, среди которых наиболее широкое распространение получил формат AP AGRIS. Он предусматривает наличие ряда обязательных полей, позволяющих однозначно идентифицировать описываемый документ, но допускает наличие множества других полей, дополняющих сведения о документе. Метаданные могут быть созданы в любых программных продуктах, как в локальных, так и в сетевых, импортированы из них в виде XML-файла и в таком же виде загружены в AGRIS. Такой подход позволяет относительно просто интегрировать с AGRIS крупные массивы данных, созданные ранее на других платформах, например, DOAJ (Directory of Open Access Journals), SciELO (The Scientific Electronic Library Online), Chinese Agricultural Science and Technology Literature and Information Service platform.

В настоящее время основным способом распространения информации AGRIS является Интернет (сайт http://agris.fao.org). В январе 2016 г. его ежемесячная посещаемость оценивалась примерно в 300 тыс. визитов, к январю 2019 г. она возросла до 600 тыс. визитов. География пользователей охватывает 200 стран. Студенты, ученые-исследователи и библиотекари в совокупности составляют около 82% пользователей.

Система хранит всю загруженную в нее информацию, но формат ее вывода периодически меняется командой технической поддержки AGRIS в соответствии с развитием технологий и актуальными потребностями. Например, сейчас реализованы технологии поиска похожих статей, автоматического перевода, возможности поделиться результатом поиска в социальных сетях.

Базисным для AGRIS является и принцип децентрализации: поставлять информацию могут как крупные, так и относительно небольшие организации из разных стран мира. Организации могут быть правительственными, научно-исследовательскими, издательскими и т.п. Основные поставщики информации ‑ национальные центры AGRIS, которые, как правило, имеются в странах-членах ФАО, а также ряд международных центров. По состоянию на январь 2019 г. в AGRIS было зарегистрировано около 400 поставщиков информации из 145 стран мира. Стоит отметить, что наиболее весомый вклад в информационное наполнение AGRIS вносит Национальная Сельскохозяйственная Библиотека (National Agricultural Library) при Министерстве сельского хозяйства США (United States Department of Agriculture). В этой организации создано около 5,68 млн. записей, что составляет свыше половины (58%) всех записей AGRIS. Благодаря наличию необходимых ресурсов, этот центр в состоянии обрабатывать большую часть поступающих в фонд библиотеки изданий, в т.ч. опубликованных не только на территории США, но и во многих других странах мира, т.е. фактически он является международным, а не национальным. В информационном наполнении AGRIS активно участвуют Италия (385 тыс. записей), Франция (348 тыс.), ФРГ (278 тыс.), Япония (255 тыс.), Великобритания (233 тыс.), Нидерланды (203 тыс.), Бельгия (197 тыс.), Швеция (111 тыс.), Бразилия (121 тыс.), Китай (103 тыс.), Испания (97 тыс.), Таиланд (64 тыс.), Индия (60 тыс.), Латвия (45  тыс.). Вклад Российской Федерации составляет около 26 тыс. записей, Белоруссии – 17 тыс.

Функции национального центра AGRIS в России с 2007 г. выполняет Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека» (ФГБНУ ЦНСХБ); за время существования центра его специалистами было подготовлено и отправлено в AGRIS свыше 9000 библиографических записей.

В качестве языков поискового интерфейса AGRIS используются официальные языки ФАО ‑ английский, испанский, французский, арабский, китайский и русский. Большая часть информации представлена на английском языке, поэтому поиск (создание запросов) на нем наиболее эффективен, однако часть информации, продублированная на национальных языках, тоже может быть успешно найдена. В целом реализация концепции многоязычности является одним из приоритетов развития AGRIS.

Для индексирования информации в AGRIS используется Тезаурус AGROVOC. Он был специально разработан для содержательной обработки и поиска информации по сельскому хозяйству и смежным отраслям, имеет статус международного терминологического стандарта, обеспечивает возможность унифицированного индексирования документов в национальных центрах обработки и ввода информации.

AGROVOC первоначально (в 1982 г.) был создан на английском языке, чуть позже дополнен версиями на испанском и французском языках, а со временем - и на остальных официальных языках ФАО. С 2000 г. AGROVOC представлен в многоязычной электронной версии. Наиболее детально проработана информация на 19 языках: английском, турецком, испанском, французском, немецком, чешском, португальском, китайском, японском, арабском, итальянском, русском, хинди, польском, тайском, словацком, венгерском, фарси/персидском и лао. Активно ведутся разработки версий тезауруса на корейском, грузинском, телугу (один из индийских языков), румынском/молдавском и украинском языках. В той или иной степени тезаурус доступен на 33 языках. Объем базовой (англоязычной) версии составляет свыше 45 тыс. лексических единиц, среди которых выделяются т.н. концепты, т.е. рекомендуемые для использования термины (около 36 тыс.) и альтернативные термины (около 9,5 тыс.). В турецкой версии содержится около 48 тыс. лексических единиц, но среди них меньше концептов (около 34 тыс.). Русскоязычная версия AGROVOC создана в 2007-2010 гг. силами специалистов ФГБНУ ЦНСХБ, она насчитывает свыше 28 тыс. лексических единиц. С 2017 г. AGROVOC обновляется ежемесячно, в среднем на несколько тысяч лексических единиц.

Версии AGROVOC на официальных языках ФАО распространяются в соответствии с лицензией Creative Commons Attribution License (CC-BY IGO 3.0).

Базовый доступ к поиску и навигации по AGROVOC предоставляется через сайт проекта (http://agrovoc.uniroma2.it/agrovoc/agrovoc/en/), но возможен доступ через несколько самостоятельных веб-сервисов; по запросу могут быть предоставлены файлы для загрузки локальной версии.

Для терминов, входящих в AGROVOC, прорабатываются их семантические связи, которых существует свыше 100 типов, но наиболее часто используется только 22. Часть терминов сопровождается развернутым определением. Все это позволяет использовать AGROVOC не только для индексирования документов, но и как самостоятельную систему знаний. Посредством технологии связанных открытых данных AGROVOC может сопрягаться с другими тезаурусами по сельскому хозяйству, в т.ч. с национальными тезаурусами, переведенными на английский язык. Уже проведено частичное сопоставление концептов AGROVOC с 18 локальными многоязычными системами знаний по сельскому хозяйству.

ФАО поддерживает разработку технических средств для развития AGROVOC. В конце 2018 г. запущен принципиально новый программный продукт VocBehch3, позволяющий эффективно находить, редактировать и добавлять лексические единицы, а также устанавливать семантические связи между ними.

25-26 июня 2018 г. в г. Утрехт (Нидерланды) состоялась рабочая встреча редакторов AGROVOC, в ходе которой кураторы проекта со стороны ФАО и остальные члены сообщества установили личные контакты, обменялись информацией о состоянии работ в своих странах и организациях, наметили направления дальнейшего развития. Кураторы тщательно анализируют опыт разных организаций по совершенствованию AGROVOC и по возможности стараются распространять наиболее интересные и полезные технологии.

Таким образом, AGRIS и AGROVOC можно считать успешными примерами того, как консолидация усилий специалистов разных стран позволяет эффективно систематизировать, накапливать и распространять научную информацию, в данном случае ‑ в области сельского хозяйства, продовольствия и смежных отраслей.

Сведения об авторе

Климова Елена Владимировна - кандидат биологических наук, Ведущий научный сотрудник отдела аналитико-синтетической обработки документов; глава AGRIS-центра Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека» 

kev@cnshb.ru; elenakl@yandex.ru

К оглавлению выпуска

06.02.2019, 100 просмотров.