НАУЧНЫЕ КОММУНИКАЦИИ И ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ НАУКИ. ТИМОФЕЕВСКАЯ С.А. К ВОПРОСУ ОБ АКТУАЛИЗАЦИИ МИКРОТЕЗАУРУСА ПО ЖИВОТНОВОДСТВУ

  Введение. Самой крупной в мире русскоязычной базой данных (БД) по проблемам АПК является политематическая БД «АГРОС» ‑ основной информационный продукт Федерального Государственного бюджетного научного учреждения «Центральная научная сельскохозяйственная библиотека» (ЦНСХБ). Данная БД существует с 1992 г., объем ее – около 2 млн. записей, которые включают библиографическое описание, аннотации, рефераты, полные тексты документов. БД содержит информацию о книгах, брошюрах, авторефератах диссертаций, трудах научных учреждений, материалах конференций, нормативно-технических документах, переводах, статьях из журналов, сериальных изданий и сборников [3]. К данной БД обращаются специалисты АПК, в том числе работающие в области животноводства, за информацией о новейших достижениях и разработках в данной отрасли. Наиболее востребованными документами являются статьи, составляющие основной информационный массив БД и поступающие в нее в результате так называемой аналитической росписи, т. е. отбора и индексирования отдельных статей из периодических изданий и сборников. Ежегодно расписывается свыше 2 тыс. экземпляров отечественных и иностранных периодических и продолжающихся изданий [4]. Для поступления в БД все документы (статьи, книги, авторефераты и др.) проходят семантическую обработку и индексирование, в результате чего создается поисковый образ документа (ПОД), который позволяет эффективно проводить тематический поиск информации. Создается ПОД путем перевода содержания документа с естественного языка на информационно-поисковые языки (ИПЯ): Информационно-поисковый тезаурус по сельскому хозяйству и продовольствию (ИПТ), Отраслевой рубрикатора по сельскому хозяйству и продовольствию (ОР) и Универсальная десятичная классификация для АПК (УДК) [4].

  Для обработки литературы по отдельным отраслям АПК удобно пользоваться микротезаурусами (МТЗ), которые являются словарями нормативной лексики, а также лингвистическим инструментом описания отдельных предметных отраслей, т.е. позволяют определить по наличию и количеству терминов степень разработанности той или иной области. МТЗ являются составной частью базового ИПТ, представляющей отдельный отраслевой его сегмент, и позволяют вести мониторинг терминологии по отдельной теме и отрасли, редактировать, выявлять лакуны в терминологическом ряду. В то же время МТЗ является самостоятельным уникальным лингвистическим средством, таблицами соответствия трех ИПЯ, что позволяет облегчать процесс индексирования. Создаются МТЗ по специально разработанной в ЦНСХБ методике.

  Целью работы является актуализация контента МТЗ по животноводству (МТЖ).

 Результаты исследований. Разработка МТЖ была начата 2011 г., но работа по полнению контента проводится ежегодно. Как и с любым другим МТЗ, работа с МТЖ ведется с целью обеспечения эффективности тематического поиска в БД «АГРОС», поэтому МТЖ, являясь сводом нормативной лексики, определяет правила индексирования документов и стратегию их поиска. МТЖ представляет собой таблицы соответствия, т.е. является оригинальным продуктом, сочетающим в себе три ИПЯ: УДК, ОР и ИПТ. Поскольку для поиска информации в первую очередь используются ключевые слова документа, ставшие дескрипторами, важно, чтобы нормативная лексика МТЖ отражала новые понятия и термины, используемые в актуальных публикациях. В настоящее время МТЖ содержит 3738 лексических единиц (ЛЕ) и продолжает пополняться. Термины, входящие в МТЖ, относятся к таким областям знаний, как технология животноводства, анатомия, генетика, биохимия, физиология животных, кормление, разведение животных, охотничье хозяйство, пчеловодство, рыбохозяйственный комплекс, молочная и мясная промышленность. Основная часть ЛЕ, представленных в МТЖ, имеет все выявленные на момент работы с ними связи с терминами ИПТ из других областей знаний. Анализ статистических данных показал, что за последние три года в МТЖ было введено около 100 новых ЛЕ. Большая часть введенных за последнее время ЛЕ относится к области разведения и кормления сельскохозяйственных и домашних животных. Это наименования новых пород животных и птицы, понятия, отражающие технологию воспроизводства стада, подготовки кормов к скармливанию, новые кормовые средства. Работа по пополнению контента МТЖ ведется в соответствии с ГОСТ 7.25-2001 состав и форма [1] и ГОСТ 7.0.91-2015(ИСО 25964-1:2001) [2], а также в соответствии с методическими рекомендациями по разработке микротезаурусов по отдельным областям знаний, разработанными в ЦНСХБ.

  Отбор новых терминов и понятий в МТЖ проводится при семантической обработке документов и в процессе аналитической росписи на основе анализа научных публикаций и выявления тенденций научных исследований в области животноводства и смежных с ним отраслей. Основное внимание уделяется специальным терминам, составляющим семантическое ядро каждого отраслевого МТЗ. При этом устанавливается частотность упоминания нового термина в отечественных и зарубежных публикациях. При достаточной частотности термин проходит лексикографическую и семантическую обработку, в ходе которой строятся иерархические связи, выявляется синонимический ряд и вводятся в словарную статью синонимы термина, устраняются неоднозначные термины, устанавливаются ассоциативные связи между терминами. Затем начинается работа по сопоставлению статуса и места термина в каждом из ИПЯ и подбора его эквивалента в других ИПЯ, создание таблиц соответствия. Каждому термину подбираются рубрики ОР, индексы УДК, иноязычный (английский) эквивалент термина. Термин может принадлежать к разным областям знаний и входить помимо МТЖ в другой МТЗ. В этом случае он будет иметь несколько индексов УДК и несколько значений рубрик ОР, соответствующих различным областям знаний.

Например:

ОТХОДЫ МЯСНОЙ ПРОМЫШЛЕННОСТИ

Рубрика: 65.59.91; 68.39.01.91
УДК: 636.087.62; 637.6
Иноязычный эквивалент: meat industry waste
Входит в микротезаурус: Ветеринария; Животноводство; Пищевая промышленность

РЕГУЛИРОВАНИЕ ЧИСЛЕННОСТИ ПОПУЛЯЦИЙ

Рубрика: 68.03.05.81; 68.37.29.13
УДК: 632.9; 636.082.451
Иноязычный эквивалент: population regulation; regulation of population numbers; regulation of population size

Входит в микротезаурус: Животноводство; Защита растений

 

КОРОВНИКИ

Рубрика: 67.29.55.39.29; 68.39.29.17.13
УДК: 631.223.23
Иноязычный эквивалент: cattle barn

Входит в микротезаурус: Ветеринария; Животноводство; Техника в сельском хозяйстве

  • B1 ЖИВОТНОВОДЧЕСКИЕ ПОМЕЩЕНИЯ
  • При вводе новых ЛЕ и установлении статуса нового термина, построении его иерархических деревьев может происходить редактирование парадигматических связей других терминов, с ним связанных, замена ассоциативных отношений в целях рационального расширения ПОД, ввод комментариев к сложным и неоднозначным понятиям.

    Например:

     

    ИСКУССТВЕННОЕ ВОСПРОИЗВОДСТВО

    Примечание: Получение потомства и выращивание молоди рыб (личинок), а также других гидробионтов (кормовых и пищевых беспозвоночных, водорослей и др.) на предприятиях с управляемыми условиями среды и выпуск их в водные объекты рыбохозяйственного значения

     

    ПОЛОВОЙ ДИМОРФИЗМ

    Рубрика: 68.03; 68.03.03.13; 68.03.03.21.15; 68.03.05.21; 68.37.29.03
    УДК: 575.18; 581.162; 581.4; 632.6/.7; 636.082.4
    Примечание: Фенотипические различия мужских и женских особей раздельнополых видов

    Иноязычный эквивалент: SEX DIMORPHISM; sexual dimorphism

    Эквивалентный термин в другом тезаурусе: Sexual dimorphism

    Входит в микротезаурус: Генетика и селекция; Животноводство; Защита растений

    Отмечено, что ЛЕ, входящие в несколько МТЗ, могут иметь неполные словарные статьи, в которых недостает данных в таблицах соответствия, т.е. могут быть не проставлены рубрики ОР или индексы УДК, поэтому актуализация МТЖ подразумевает также и редактирование уже имеющихся ЛЕ и их словарных статей. Редактирование проводится чаще всего при вводе новых терминов, особенно относящихся к смежным отраслям знаний и случайном выявлении ошибок разного характера. При такой работе словарные статьи у ЛЕ могут пополниться синонимами, примечаниями, изменениями иерархических и ассоциативных связей, могут быть исправлены, дополнены или проставлены индексы УДК и рубрики ОР, подобраны новые англооязычные эквиваленты.

    Выводы. Контент МТЖ пополняется достаточно медленно, так как обработка ЛЕ для МТЖ (составление словарной статьи) требует большого количества времени, поскольку необходима тщательная проверка научности вводимого термина, частоты его употребления, необходимости ввода из-за его исключительности, сверки англоязычного эквивалента. Поскольку МТЖ является динамичным средством структурирования и классификации понятий, специфичных для данной отрасли знаний, особо важна его актуализация и своевременное пополнение контента с целью осуществления эффективного тематического поиска информации в БД, а также обеспечения полноты представления в МТЗ и ИПТ терминологии из области животноводства. Таким образом, являясь частью ИПТ, МТЖ позволяет решать проблемы актуализации и его данных.

    Список источников

    1. 1. ГОСТ 7.25-2001 Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления: издание официальное: введ. 01.07.2002. М. : Изд-во стандартов, 2001. – 18 с.
    2. 2. ГОСТ 7.0.91-2015. Тезаурусы для информационного поиска: национальный стандарт Российской Федерации: издание официальное: введ. 01.07.2016. – М.: Стандартинформ, 2016. – Ш, 93 с.
    3. 3. Пирумова, Л. Н. База данных "АГРОС": структура, формирование и актуализация / Л. Н. Пирумова // Научно-техническая информация. Серия 1: Организация и методика информационной работы. – 2018. – № 12. – С. 14-20.
    4. 4. Тимофеевская С.А. Специфика аналитической росписи документов по животноводству [Электронный ресурс] // Электронный научный журнал «Культура: теория и практика» . – 2019. – № 6 (33). – URL: http://theoryofculture.ru/issues/111/1311/ (дата обращения: 14.09.2021 г.).

     

    Сведения об авторе

    Тимофеевская Светлана Алексеевна, Федеральное государственное бюджетное научное учреждение «Центральная научная сельскохозяйственная библиотека», старший научный сотрудник отдела аналитико-синтетической обработки документов и лингвистического обеспечения.

    E-mail:

К оглавлению выпуска

21.12.2021, 561 просмотр.