Научные коммуникации и информационно-аналитическое обеспечение науки. ТИМОФЕЕВСКАЯ С.А. ОСНОВНЫЕ ПРИНЦИПЫ И НЕКОТОРЫЕ ОСОБЕННОСТИ ИНДЕКСИРОВАНИЯ ДОКУМЕНТОВ ПО ЖИВОТНОВОДСТВУ

Введение. Животноводство является одной из основных отраслей сельского хозяйства, обеспечивающих продовольственную безопасность страны. Научные исследования в области животноводства направлены на увеличение объема производства животноводческой продукции и улучшение ее качества, что достигается внедрением новых технологий, оптимизацией кормления, содержания и разведения сельскохозяйственных животных, повышением устойчивости животных к болезням, использованием современных знаний в области физиологии и генетики животных, применением цифровизации в различных производственных процессах. Эффективность научных исследований в любой области во многом зависит от доступности знаний и разработок по исследуемой тематике. Наука – это система коммуникации, в которой необходим поиск нужной информации. Важно обеспечить быстрый и релевантный поиск информации в автоматизированной информационно-поисковой системе (ИПС) и базах данных (БД). Для повышения качества информационного обслуживания Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека» (ФГБНУ ЦНСХБ) перешла на новое программное обеспечение автоматизированной библиотечно-информационной системы (АБИС) OPAC-Global на основе веб-технологий. Основным источником научной информации для специалистов и научных работников в области животноводства является БД «АГРОС», которая представляет собой главный информационный продукт ФГБНУ ЦНСХБ. Главная задача библиотеки – отбор, подготовка (научная обработка) и представление в удобной форме актуальной, достоверной информации. Перспективные направления развития информационного обслуживания пользователей библиотека видит в формировании и развитии связанных данных, позволяющих создавать качественно новую аналитическую информацию, в предоставлении доступа к интегрированной информации через единое окно; формировании единого отраслевого пространства знаний, создании и предоставлении открытых данных [2, с. 24]. В целях повышения эффективности поиска информации в БД «АГРОС» все документы проходят семантическую обработку и индексирование (выражение содержания документа или смысла информационного запроса лексическими единицами информационно-поискового языка – ИПЯ), создается поисковый образ документа (ПОД), отражающий основное смысловое содержание документа и включающий важные для поиска признаки его содержания и вида, т. е. координаты поиска. Работа выполняется специалистами в соответствии с различного рода нормативными документами (стандарты, рубрикаторы, классификации, словари, методические разработки, инструкции и т. п.), регламентирующими процесс многоаспектной обработки информации. Этот момент особенно важен, поскольку использование унифицированных средств и приемов описания документов сглаживает индивидуальные особенности восприятия информации специалистами, обеспечивая согласованное, однозначное и точное ее отображение. Успех поиска информации зависит во многом от квалификации индексаторов, от того, насколько полно будут раскрыты ими проблемы, отраженные в первичном документе, и насколько правильно они будут переведены с естественного языка на формализованный язык ИПС [4, с. 9]. В БД «АГРОС» используется несколько ИПЯ, каждый из которых выполняет свои функции в технологическом процессе обработки документов. Индексирование входного документопотока в ЦНСХБ осуществляется с помощью специально разработанных ИПЯ, которыми являются Информационно-поисковый тезаурус по сельскому хозяйству и продовольствию (ИПТ), Отраслевой рубрикатор по сельскому хозяйству и продовольствию (ОР), Универсальная десятичная классификация и язык ключевых слов. ИПТ представляет собой структурированный словарь нормативной лексики, в котором определены основные семантические (смысловые) отношения (эквивалентности, иерархии, ассоциации) между терминами естественного языка. Все термины ИПТ нормализованы, т. е. проходят специальную лингвистическую экспертизу и обработку. Понятия из текста документа, не включенные в тезаурус, но, с точки зрения индексатора, также важные для создания ПОД, т. е. являются ключевыми словами и включаются в качестве таковых в соответствующее поле формата АБИС. ОР – это иерархическая классификация, созданная на базе Государственного рубрикатора научно-технической информации (ГРНТИ), и является выборкой из него рубрик 3-го уровня с развитием до 5-го уровня рубрик по сельскому хозяйству. С помощью рубрикатора осуществляется структурирование и систематизация информации на тематические области, т. е. разделение единого документального потока на отдельные более или менее мелкие части с заранее фиксированной тематикой. Комбинирование ИПЯ делает поиск более технологичным и эффективным, чем использование только какого-либо одного ИПЯ [4, с. 19-21].

Целью исследования является описание и выявление особенностей процесса индексирования документов, относящихся к области животноводства, в ЦНСХБ на ИПЯ, специально разработанных для автоматизированного поиска информации: ОР, ИПТ и языка ключевых слов.

Содержание работы. Индексирование документопотока по животноводству подчиняется правилам индексирования документов для БД «АГРОС», подробно описанных в методических указаниях «Индексирование документов базы данных ЦНСХБ», созданных на основе различных нормативных документов: ГОСТы, ОР, ИПТ, методические материалы и инструкции по индексированию. При обработке документов соблюдаются общие требования индексирования: объективность, полнота и точность рассмотрения, единообразие отображения сходных документов. При этом индексатор должен знать структуру и тематический охват БД «АГРОС», принципы поиска информации, запросы пользователей. Рассмотрим особенности индексирования материалов по животноводству с использованием ИПТ и ОР.

Для обработки документопотока в ЦНСХБ с 2023 г. используется централизованная полифункциональная АБИС OPAC-Global с встроенными электронными версиями ИПТ и ОР ЦНСХБ.

При создании ПОД с помощью ИПТ необходимо максимально точно использовать лексический состав тезауруса и связи между терминами, отражать аспекты содержания документа достаточным количеством дескрипторов (разрешенных для индексирования терминов – лексических единиц ИПТ), используя при этом как можно более специфичные дескрипторы или подбирая близкие по смыслу. В словарной статье дескриптора отражены его иерархические, ассоциативные отношения и отношения синонимии (условной эквивалентности). Кроме ИПТ, отражающего все отрасли агропромышленного комплекса, в ЦНСХБ разработан микротезаурус по животноводству. В отличие от ИПТ микротезаурус является таблицей соответствия 3 ИПЯ: каждому дескриптору в нем приписан подобранный в УДК и ОР эквивалент.

Пометка о вхождении в микротезаурус «Животноводство» говорит о специфичности термина. Микротезаурус по животноводству, являясь словарем нормативной лексики в данной отрасли знаний, представляет собой отдельный сегмент ИПТ и позволяет вести мониторинг отраслевой терминологии. Например, дескриптор «стимуляция охоты» имеет вышестоящий термин «регулирование процессов размножения» и ассоциативные отношения с дескрипторами «стимуляция» и «стимуляция эструса».

СТИМУЛЯЦИЯ ОХОТЫ

УДК:

636.082.451

Входит в микротезаурус:

Животноводство; Ветеринария

Верхний уровень

РЕГУЛИРОВАНИЕ ПРОЦЕССОВ РАЗМНОЖЕНИЯ

Ассоциация

СТИМУЛЯЦИЯ

СТИМУЛЯЦИЯ ЭСТРУСА

См. также

68.39.13.39 : Регулирование процессов размножения сельскохозяйственных животных (GRNTI)

См. также на параллельном языке:

rut stimulation, heat stimulation.

Источник информации:

ЦНСХБ, 2022

Использование только дескрипторов при индексации позволяет точнее отражать тематику, а использование ассоциативных отношений облегчает работу индексатора, помогая найти подходящие по смыслу понятия и полнее отразить содержание документа.

ОР представляет собой классификацию научных знаний в структурированном и формализованном виде. Рубрики состоят из кодов и наименований. Код представляет собой цепочку пар арабских цифр (в зависимости от уровня иерархии), разделенных знаком «.» (точка). При рубрике может быть примечание, уточняющее вопросы, которые она отражает в связи с другими рубриками, а также система ссылок (См. и См. также) к другим разделам отраслевого рубрикатора и ГРНТИ и обратных ссылок от них (Отс. от и См. также). Такие ссылки облегчают понимание тематического охвата рубрик и поиск рубрики, необходимой для индексирования конкретного документа [5].

Пример фрагмента рубрикатора в печатном варианте:

68.03.05 Биология сельскохозяйственных животных

Примечание: В рубрике собирается материал по общей биологии сельскохозяйственных животных

Биология отдельных видов сельскохозяйственных животных

см. 68.39.хх.05 Биология отдельных видов сельскохозяйственных животных

отс. от: 68.41.51.29 Повреждающее действие ионизирующей радиации на животных

отс. от 68.39. Животноводство

отс. от 68.41. Ветеринария

Примеры фрагментов ОР в автоматизированной системе обработки литературы:

БИОХИМИЯ КРУПНОГО РОГАТОГО СКОТА. ОБМЕН ВЕЩЕСТВ

УДК:

636.22/.28:612.015

Примечание:

В рубрике собирается материал о биологической роли отдельных веществ, обмене веществ и энергии у крупного рогатого скота, химическом составе организма в целом

Дерево

-68.39.29.05.29

Гормоны и их роль в обмене веществ у крупного рогатого скота

68.39.29.05.53 : Физиология, биофизика и биохимия эндокринной системы крупного рогатого скота (GRNTI)

Тканевое дыхание и окислительные процессы в тканях

68.39.29.05.45 : Физиология, биофизика и биохимия органов дыхания крупного рогатого скота (GRNTI)

См. также более широкое понятие:

68.39.29.05 : Биология крупного рогатого скота (GRNTI)

Источник информации:

ЦНСХБ, 2022

БИОЛОГИЯ СЕЛЬСКОХОЗЯЙСТВЕННЫХ ЖИВОТНЫХ

УДК:

636:611/612

Примечание:

В рубрике собирается материал по общей биологии сельскохозяйственных животных. Биология отдельных видов сельскохозяйственных животных см. 68.39.xx.05 Биология отдельных видов сельскохозяйственных животных

Дерево

-68.03.05

ассоциация

Биологические основы ветеринарии

68.41 : Ветеринария (GRNTI)

Биологическое действие радиации на животных

68.41.51.29 : Повреждающее действие ионизирующей радиации на животных (GRNTI)

Биологические основы животноводства

68.39 : Животноводство (GRNTI)

См. также более узкое понятие:

68.03 : Сельскохозяйственная биология (GRNTI)

Процесс индексирования документов включает несколько основных этапов, которые осуществляются последовательно: анализ содержания документа; выбор понятий, отражающих его основное содержание; выбор элементов индексирования (дескрипторов, ключевых слов, рубрик) для обозначения понятий; формирование поискового образа документа (ПОД) из терминов индексирования [5]. Задача специалиста, занимающегося индексированием – тщательно проанализировав документ, правильно отразить содержащуюся в нем информацию. Для этого просматриваются титульный лист (для определения места издания и вида документа), заглавие; реферат или аннотация; оглавление; предисловие (введение); ключевые слова; схемы, таблицы и подписи под ними; и т. п.; выводы; список литературы. При обработке документов по сельскому хозяйству существует определенная схема выделения понятий, подлежащих индексированию [3]. При индексировании любого вида документа (монография, сборник, статья и др.) по животноводческой тематике с помощью ИПТ и ОР рекомендуется придерживаться следующей схемы выделения понятий, подлежащих индексированию:

  1. Объект исследования: вид животного, порода животного, производственно-продуктивная группа и т. п. Термины, отражающие объект исследований, рекомендуется записывать в ПОД первыми.
  2. Действие и/или его агент: технологические процессы, т. е. кормление, системы содержания, вид корма, кормовые добавки, микроклимат, плотность размещения поголовья и т. п.
  3. Условия действия или условия исследования (полевые опыты, лабораторные исследования, опыты in vitro и др.
  4. Цель действия или исследования (увеличение продуктивности с.-х. животных, получение высококачественной продукции животноводства, улучшение условий содержания, воздействие на физиологические показатели и благополучие животных и т. п.).
  5. Методы и методика исследований, если работа носит методический характер, описывается новый метод исследования или новая область применения известного метода.
  6. Время воздействия на объект, время его действия или время исследования (сезон, время года, год).
  7. География объектов, процессов, исследований (страны, области и зоны России, климатические зоны и т.п.).

Все понятия, полно описывающие документ, индексируются, т. е. к ним подбираются дескрипторы, наиболее точно отражающие выбранные понятия. Для индексирования одного документа по животноводству с использованием ИПТ требуется в среднем от 5 до 10 дескрипторов, но в зависимости от содержания документа их может быть меньше или больше. Отобранные для индексирования термины располагают в логической последовательности, чтобы смысловое содержание документа было понятно даже без прочтения его заглавия. Если нужное понятие является аскриптором (запрещенным к использованию термином), необходимо воспользоваться ссылкой на нужный дескриптор. Когда выбранное понятие относится к нескольким областям знаний, у термина в ИПТ будет пометка «используй альтернативно», например: вместо «охота» надо выбрать более конкретный дескриптор из предложенных – «охота (промысел)», «половая охота» или «спортивная охота», который соответствует содержанию документа. Как уже отмечалось, специфические термины, новые понятия, не представленные в ИПТ, но имеющие важное значение при составлении ПОДа, используются в качестве ключевых слов. Но при этом обязательно надо выбрать из ИПТ и более широкое понятие [4, с. 65]. При индексировании материалов по животноводству и создании ПОДа в системе OPAC-Global выбирать термины из электронного ИПТ можно, связывая каждый термин по отдельности или целым блоком. В последнем случае возможна автоматизированная замена синонима на дескриптор, т. е. синоним «районирование» заменится на дескриптор «зонирование», синоним «кровность» на дескриптор «породность». Это очень удобно при индексировании документов по рыбному хозяйству, где названия многих рыб вводятся на латыни. Если введен синоним на русском языке, программа автоматически заменит его на латинское название, например, если при индексировании ввести термин «лососевые», в ПОДе документа будет «Salmonidae». Дескрипторы можно вводить в усеченном виде. При запуске создания ПОДа и связывании дескрипторов, при наличии ошибки или неточности программа укажет на это и позволит исправить. При индексировании документов дескрипторами тезауруса следует выражать содержание документа во всей полноте. При этом не должно быть противоречий с ПОДом, выраженным с помощью кодов рубрик ОР. Отнесение документа к рубрике (т. е. присвоение ему цифрового кода) ОР, точно отражающей его содержание – ответственный момент индексирования. Код рубрики определяет «место» данного документа в информационном массиве БД [1, с. 11]. Каждому документу по животноводству присваивается цифровой код ОР, определяя его расположение в БД «АГРОС». Поиск по кодам ОР позволяет найти большой объем документов по определенной тематике, не используя термины ИПТ или в дополнение к ним. В классификационной таблице ОР животноводство имеет код 68.39. Рубрики третьего уровня обозначают материалы по частному животноводству (68.39.29 Молочное и мясное скотоводство; 68.39.31 Овцеводство; 68.39.33 Козоводство и т. д.). Для более детальной характеристики материалов рубрики частного животноводства имеют коды 4-го и 5-го уровней. Однотипность кодов рубрик с аналогичным содержанием помогает ориентации в разделах ОР и запоминанию кодов.

Рассмотрим особенности индексирования документов по животноводству средствами ИПЯ на нескольких примерах.

Пример 1. Статья «Частота встречаемости комплексных генотипов молочных белков каппа-казеина и бета-казеина у коров холмогорской породы».

Просматривая и анализируя содержание документа, установили, что речь идет об отборе коров данной породы по качеству молока. Формулируем понятия для индексирования: коровы, холмогорская порода, разведение животных, отбор, генотипы, белки молока, частота встречаемости, Архангельская область. Подбираем соответствующие дескрипторы: коровы; холмогорская порода скота; генотипы; частота встречаемости; аллели; белки молока; отбор; Архангельская обл. Выбирая рубрику ОР 68.39.29.13 Разведение крупного рогатого скота, видим отсылку: «Генетические основы разведения крупного рогатого скота см. 68.39.29.05.17 Генетика крупного рогатого скота. Генетические основы разведения крупного рогатого скота», что соответствует содержанию данного документа. Следовательно, документу присваиваем рубрику 68.39.29.05.17.

ПОД выглядит следующим образом:

Термины ИПТ: коровы; холмогорская порода скота; генотипы; частота встречаемости; аллели; белки молока; отбор; Архангельская обл

Код ОР: 68.39.29.05.17

Пример 2. Статья «Влияние пробиотика Лактобифадол Форте на развитие цыплят-бройлеров и качество получаемой продукции».

ПОД выглядит следующим образом:

Термины ИПТ: цыплята-бройлеры; кормовые добавки; пробиотики; живая масса; динамика; мясо птицы; химический состав.

Код ОР: 68.39.37.15.27; 65.59.03

Данному документу присвоены две рубрики (первая 68.39.37.15.27 Кормление бройлеров. Откорм и вторая 65.59.03 Состав, свойства и методы исследования мяса и мясных продуктов), так как в статье большое внимание уделено влиянию добавки на состав и качество мяса цыплят-бройлеров. Последовательность рубрик соответствует их значимости по тексту данной статьи.

Пример 3. Автореферат диссертации «Продуктивные и некоторые биологические особенности овец разных племенных стад советской мясо-шерстной породы (кавказский тип) в условиях горно-отгонного содержания».

ПОД выглядит следующим образом:

Термины ИПТ: овцы; советская мясо-шерстная порода; племенные животные; отгонно-пастбищное содержание; горные условия; физиологические показатели; продуктивность; диссертации; Ставропольский край

Код ОР: 68.39.31.17.21

В данном случае в терминах ИПТ отражен вид документа (автореферат диссертации).

Пример 4. Автореферат диссертации «Продуктивные и биоморфологические качества помесей коз русской белой и зааненской пород».

ПОД выглядит следующим образом:

Термины ИПТ: молочные козы; зааненская порода; русская белая порода коз; межпородные скрещивания; помеси; морфология животных; экстерьер; молочная продуктивность; воспроизводительные качества; диссертации

Код ОР: 68.39.33.13

При индексировании данного документа названия пород являются важными, но термина «русская белая порода коз» нет в ИПТ. Вводим его в качестве ключевого слова, указав вышестоящий термин «молочные козы».

Выводы. Поиск и предоставление нужной пользователю и релевантной его запросу информации во многом зависит от специалистов, занимающихся индексированием документов, знания ими специфической терминологии животноводческой отрасли и нормативной лексики в микротезаурусе по животноводству и соответствующем сегменте ИПТ, понимания структуры и функций ОР, знания индексатором структуры БД «АГРОС» и ее поисковых возможностей. Свертывание информации из документов входного документопотока и представление ее в виде дескрипторов, ключевых слов и кодов ОР позволяет унифицировать и оптимизировать процесс индексирования, адекватно раскрывать содержание документа, обеспечивая тем самым релевантность и полноту поиска информации. Постоянное и своевременное пополнение и актуализация контента микротезауруса по животноводству и терминологической области «животноводство» в ИПТ обеспечивают необходимое качество индексирования документов и эффективность поиска необходимой информации.

 Список источников

  1. 1. Индексирование документов базы данных ЦНСХБ. Методические указания // состав. Пирумова Л. Н., Харченко Л. Т. – Москва, 1995. – 35 с.
  2. 2. Пирумова Л.Н. Оптимизация технологий информационного обслуживания в Центральной научной сельскохозяйственной библиотеке / Л. Н. Пирумова. ‑ Текст : непосредственный // Труды ГПНТБ СО РАН : научно-практический журнал. –   –  № 3. –  С. 24‑30. ‑ Библиогр.: с. 29‑30 (13 назв.).
  3. 3. Пирумова Л.Н., Соколова Ж.В. Научная обработка документов: вчера, сегодня, завтра // Научные аграрные библиотеки в современных условиях: проблемы, перспективы, инновации, технологии. – Москва,С69‑81.
  4. 4. Пирумова Л.Н., Харченко Л. Т. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в БД АГРОС. (Методические материалы) – Москва, 2001. – 70 с.
  5. 5. Соколова Ж.В. Особенности индексирования документов по растениеводству // Культура: теория и практика : электрон. науч. журн. ‑ ‑ Вып. 2 (53). ‑ URL: http://theoryofculture.ru/issues/130/1603/.

 

Сведения об авторе

Тимофеевская Светлана Алексеевна – старший научный сотрудник отдела аналитико-синтетической обработки документов и лингвистического обеспечения, Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека»

К оглавлению выпуска

Год литературы

20.08.2025, 20 просмотров.