Е.В.Климова, С.А.Орлова, Е.А.Голубева ИЗМЕНЕНИЕ ПОДХОДА К ОБРАБОТКЕ ИНФОРМАЦИИ ДЛЯ МЕЖДУНАРОДНОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ AGRIS В СВЯЗИ С РАЗВИТИЕМ ИНТЕРНЕТ-ТЕХНОЛОГИЙ

AGRIS (Agricultural Research Information System) - Международная информационная система по сельскому хозяйству и смежным с ним отраслям. Система начала развиваться в 1970-е годы под эгидой ФАО - Международной организации по сельскому хозяйству и продовольствию при ООН. Основными поставщиками информации в AGRIS являются национальные центры стран-членов ФАО и ряд международных центров. По состоянию на январь 2016 г. эта сеть объединяет более 150 AGRIS-центров, работающих в 65 странах мира. Функции национального центра AGRIS в Российской Федерации с 2007 г. выполняет Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека» (ФГБНУ ЦНСХБ). За 2007-2015 гг. специалистами ЦНСХБ подготовлено и отправлено в AGRIS более 4800 библиографических записей, из которых около 99% сопровождены рефератом на английском языке и около 70% - рефератом на английском и русском языках.

С начала своего существования AGRIS строилась на принципах доступности, полезности и применимости информации. Участники системы бесплатно поставляют туда свою информацию и так же бесплатно пользуются информацией, предоставленной другими участниками. Базисным является и принцип децентрализации как при подготовке данных, так и при пользовании ими. В 2009 г. AGRIS вошла в глобальное движение CIARD (Coherence in Information for Agricultural Research for Development – Согласованность в Информации о Сельскохозяйственных Исследованиях в Целях Развития). Поставщики информации для AGRIS стали участниками CIARD RING, т.е. веб-сервиса и базы данных, собирающей сведения о различных организациях, имеющих отношение к распространению информации по сельскому хозяйству и позволяющей выходить на контакт с ними. Это могут быть не только крупные корпоративные научные и информационные центры, но и отдельные учреждения. На январь 2016 г. в CIARD RING была зарегистрирована 561 организация.

Для подготовки информации для AGRIS была разработана и широко применялась программа WEBAGRIS Ver. 2.1 (WA). В 2005 г. было выпущено подробное руководство по пользованию этой программой и стандартам, которых следует придерживаться при подготовке записей. Программа работала через веб-интерфейс, но требовала установки на сервер поставщика информации.

В 2013 г. сопровождение AGRIS передали на аутсорсинг в греческую компанию Agroknow, существующую с 2008 г. Эта компания поставила перед собой задачу реализовать новое стратегическое видение развития AGRIS, в частности упростить пользователям доступ к полным текстам статей, охватить более широкий спектр видов изданий, преодолеть возможные ограничения в распространении информации. В 2014 г. пользователям был предоставлен обновленный интерфейс поиска, разработанный с учетом нового видения. В нем существенно изменился формат вывода статей, в частности, в итоговой записи перестали выводиться некоторые поля, используемые при поиске. Информация о наличии у документа ссылки на полный текст стала доступна уже на стадии вывода оглавления, а не отдельной записи. Наличие ссылки на полный текст показывается иконкой, вид которой соответствует формату файла (PDF, HTML и т.п.), статью можно открыть непосредственно из оглавления. Таким образом, доступ к полному тексту действительно существенно упростился.

К 2014 г. специалисты Agroknow прекратили техническое сопровождение программы WA, но подтвердили, что будут принимать созданные в ней файлы к загрузке в AGRIS неограниченно долго. Вместе с тем они рекомендовали использовать для подготовки записей несколько существующих программных продуктов сторонних производителей (в частности AgriDRUPAL и AgriOcean), а также программу AgriMetamaker (AMM), разработанную ими и ориентированную на новый формат вывода данных. Доступ к АММ осуществляется через сайт ФАО после прохождения процедуры регистрации в качестве поставщика информации для AGRIS.

В ЦНСХБ было проведено сравнение полей WA и AMM и возможностей, которые предоставляют эти программы для адекватного описания первоисточников. Для примера был взят вид документа, наиболее часто описываемый для AGRIS – журнальная статья. Установлено, что при разработке АММ стояла задача максимально упростить создание записей и сократить количество полей в библиографическом описании. Обязательных для заполнения полей осталось всего 5: это название документа, язык текста, авторы, дата публикации и термины тезауруса AGROVOC. По всей видимости, предполагалось, что остальные необходимые сведения пользователь самостоятельно получит из полного текста. В документации к АММ подчеркивается, что наличие полного текста чрезвычайно важно для пользователя, хотя ссылка на полный текст и не является обязательной. Вместе с тем, АММ предоставляет возможность заполнить большинство полей, которые присутствовали в WA: название статьи на языке оригинала, название журнала, подробные выходные данные (год, том, номер, номера страниц и т.п.), предметную рубрику, ссылку на полный текст статьи, реферат (на нескольких языках). В АММ утрачены имевшиеся в WA поля «номер записи» (по умолчанию названия статей выводятся в порядке, обратном времени их создания), «статус записи» (признак ее готовности к выгрузке), «место работы авторов», их e-mail, ссылка на номер журнала в целом, место хранения первоисточника. Эти поля предусмотрены форматом базы, но пока используются как служебные. Вероятно, возможность их вывода будет учтена разработчиками базы в будущем. Однако в АММ имеется большое поле «примечание», в которую можно занести любую текстовую информацию, относящуюся к статье.

В WA имелась возможность создания словарей корпоративных авторов и заглавий журналов, а также списка конференций (последний редко использовался на практике). АММ позволяет создавать словари корпоративных авторов, заглавий журналов и авторов. Более того, словарь авторов создается принудительно, т.е. информацию об авторе можно занести только с помощью словаря. В словаре авторов предусмотрена возможность указать разные варианты опечаток при написании фамилии автора. Вероятно, эта функция будет полезна при поиске. Словарь заглавий журналов также более тщательно разработан по сравнению с аналогичной версией в WA: предусмотрены поля для указания ISSN не только печатной версии, но и электронной; можно указать издателя и место издания.

Индексирование документов AGRIS обеспечивается за счет использования многоязычного тезауруса AGROVOC, который содержит около 40 тыс. терминов на 23 языках мира. Перевод AGROVOC на русский язык был выполнен специалистами ЦНСХБ, в 2011 г. русскоязычный AGROVOC был интегрирован в комплекс программных средств лингвистического обеспечения ЦНСХБ. Полная версия AGROVOC доступна как для работы в режиме on-line, так и для загрузки и установки на локальные компьютеры. В WA индексирование велось на английском языке, но введенные термины автоматически переводились на французский и испанский языки. AMM предусматривает индексирование исключительно на английском языке. При наборе нескольких начальных символов появляется список терминов, начинающихся на эти символы, и можно выбрать нужный из списка. Недостатком является то, что при наборе невозможно увидеть иерархические связи этих терминов. Количество используемых терминов не ограничивается, но места под них разработчиками предусмотрено явно недостаточно. В WA невозможно было ввести не существующий в AGROVOC термин (появлялось сообщение об ошибке), в АММ имеется предупреждение, что отсутствующий термин будет заменен на существующий, максимально близкий к нему. Термины на русском языке при индексировании использовать нельзя, они могут отображаться лишь при выводе результатов поиска, если выбрать русский как язык интерфейса. При этом в поисковом запросе термины AGROVOC в любом случае следует набирать по-английски.

В WA записи можно было создавать в т. ч. и путем копирования, в АММ эта полезная возможность отсутствует.

Если в WA существовало 3 стандартных вида документов (статья из журнала, книга, статья из книги), то в AMM как самостоятельный вид документа выделяются брошюра, материалы конференции, отдельный номер журнала, рукопись, веб-сайт и др. Некоторые документы можно классифицировать более детально, например, можно отдельно описать главу из книги или, как вариант, из материалов конференции выбрать постер или презентацию.

Руководство пользователя AMM существует и доступно в электронном виде, но оно предоставляет лишь общую информацию и пока не дает разъяснений по различным нюансам оформления текста. Единственная конкретная рекомендация – название статьи давать в переводе на английский язык, а не в транслитерации.

То, что предоставление простого доступа к полным текстам стало одним из приоритетов развития AGRIS, облегчает работу по обработке документов для базы данных. Теперь создатель записи самостоятельно принимает решение о степени полноты представления библиографической информации. Однако нужно помнить, что чрезмерное упрощение (исключение из описания ряда полезных сведений) не только обедняет базу данных, но и вредит авторам статей, в частности не предоставляет им возможности установления прямых контактов с зарубежными коллегами. Единицей информации в AGRIS по-прежнему является именно статья, а не выпуск журнала, поэтому редакциям журналов, заинтересованных в размещении в базе данных своих материалов, следует размещать на своих сайтах в интернете тексты отдельных статей. При этом сайт должен быть общедоступным (т.е. для доступа к нему не требуется регистрация или какая-либо оплата), а вся относящаяся к статье информация должна находиться непосредственно при статье (а не в конце журнала). Наиболее значимую информацию рекомендуется размещать перед статьей, а не после. Ссылки следует давать непосредственно на текст статьи, а не на какие-либо промежуточные страницы для последующей загрузки.

Таким образом, сравнение WA и AMM показало, что каждая из программ имеет свои особенности. AMM позволяет создавать как минимальные, так и достаточно развернутые библиографические описания. Идеология разработки АММ в полной мере отражает сложившийся на сегодняшний день подход к предоставлению пользователям информационного продукта (простота создания информации и практическое отсутствие контроля ее качества). В WA лучше реализован формально-логический контроль, показаны связи между терминами тезауруса, что позволяет обеспечить более высокое качество индексирования. Однако оба продукта позволяют адекватно предоставлять пользователям информацию о результатах наиболее значимых научных исследований по сельскому хозяйству. Объем и качество этой информации в полной мере будут зависеть от квалификации поставщика информации. ЦНСХБ как национальный центр AGRIS в Российской Федерации может гарантировать достоверность и качество предоставляемой информации.

Сведения об авторе

  1. КЛИМОВА Елена Владимировна, канд. биол. наук, ведущий научный сотрудник отдела аналитико-синтетической обработки документов, ОРЛОВА Светлана Анатольевна, научный сотрудник отдела аналитико-синтетической обработки документов, ГОЛУБЕВА Елена Анатольевна, научный сотрудник отдела аналитико-синтетической обработки документов, Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека» (ФГБНУ ЦНСХБ)

К оглавлению выпуска

конференции

23.04.2016, 544 просмотра.