Язык. Знание. Аналитика. СОКОЛОВА Ж.В. ОСОБЕННОСТИ НАПИСАНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ НАУЧНЫХ СТАТЕЙ ПО ПРОБЛЕМАТИКЕ АПК

Введение. Одним из требований международных баз данных, Высшей аттестационной комиссии Министерства науки и образования России к научной публикации является наличие ключевых слов (КС), отражающих ее основные темы. В условиях постоянно увеличивающегося потока научной информации, появления все новых текстовых массивов на первый план выходит проблема систематизации научных текстов в информационном пространстве и оптимизации их поиска (7). КС служат важным элементом упорядочивания всего массива научной информации, каким является научный журнал или же целая база данных научных статей (1).

  КС – это информативные слова, выбираемые из текста, отражающие основные темы документа и несущие наибольшую смысловую нагрузку его содержания (9 с. 21). Понятие КС как носителей наиболее существенной информации о тексте было введено в информатике и используется для задач обработки и извлечения информации в поисковых системах (5). На этом понятии основан метод координатного индексирования, предполагающий, что основное содержание документа может быть с достаточной степенью точности и полноты выражено соответствующим набором КС, которые отражают его тему (3 с. 58; 6 с. 270). КС – это лексические единицы искусственного информационно-поискового языка (языка КС), используемого для составления информационных запросов и ведения тематического поиска в автоматизированных информационно-поисковых системах.

  Каждая статья в определенной предметной области исследований имеет КС и словосочетания, с помощью которых другие авторы находят ее. От того, насколько правильно составлены КС, зависит успешность поиска и полезность информации при ознакомлении с содержанием работы.

  Целью работы является разработка рекомендаций по написанию (отбору) ключевых слов из тестов научных статей по проблематике АПК.

  Содержание работы. Как известно, не все слова в тексте статьи равнозначны. Есть слова, которые позволяют представить текст в свернутом виде, при этом такое представление достаточно точно отражает содержание исходного текста. Как правило, к каждому развернутому научному тексту можно составить целый набор КС различного объема (от 5 до 15 слов). Но вообще количество КС может варьироваться в широких пределах. Самым оптимальным является небольшой набор КС и словосочетаний – 7-10 слов. (2). В ГОСТ 7.0.7-2021 «Система стандартов по информации, библиотечному и издательскому делу. Статьи в журналах и сборниках. Издательское оформление» говорится, что КС (словосочетаний) не должно быть меньше 3 и больше 15.

   Основными критериями отбора КС из текста статьи являются: частота употребления термина, полезность его для поиска информации, наличие в авторитетных справочниках, точность и однозначность, краткость и понятность (4, с. 20). При составлении списка КС нужно помнить, что они должны выражать основные темы документа; информация, не имеющая непосредственного отношения к теме исследования, не отражается.

  В качестве КС могут использоваться термины из названия статьи, аннотации к статье, вступительной и заключительной части текста статьи.

  У КС есть множество вариантов использования при поиске, классификации и оценке информации. Поэтому при их составлении важно применять несколько основных правил, которые помогут наиболее точно и адекватно выразить суть научной статьи.

  При выборе лексической формы КС следует отдавать предпочтение форме, наиболее часто встречающейся в отечественной научной литературе и отвечающей требованиям краткости, точности и однозначности.

  В качестве КС могут быть использованы одиночные слова (имена существительные), словосочетания, аббревиатуры. Имена существительные приводятся в форме именительного падежа, исчисляемые – обычно во множественном числе (тракторы, крупы, яблоки), неисчисляемые – в единственном (труд, гетерозис, интродукция). Не рекомендуется использование в качестве ключевых слов прилагательных, причастий и т.д. Не допускается использование слов, обозначающих общие понятия («задачи», «проблемы», «вопросы»), так как они не информативны, поиск по ним не обеспечивает полноты и релевантности (8).

  Остановимся более подробно на использовании словосочетаний. Помимо одного слова в качестве КС можно использовать словосочетания. Это может существенно сузить смысл искомого понятия и позволит легче и быстрее найти нужное. Но в этом случае необходимо соблюдать определенные правила и рекомендации, без которых использование словосочетаний может не облегчить, а затруднить поиск нужных статей.

   В качестве КС можно использовать словосочетания, если:

 словосочетание является лексически нерасторжимым и при разбиении его на отдельные компоненты теряется первоначальный смысл (носогубное зеркало, парниковый эффект, задержание последа);

  словосочетание является географическим названием (Западная Сибирь, Нижнее Поволжье, Забайкальский край);

   в словосочетание входит имя собственное (болезнь Марека, лиственница Сукачева, борщевик Сосновского);

   словосочетание является устойчивым и необходимо для разграничения предметных категорий (болезни растений, болезни животных, защита растений, пищевая промышленность);

   словосочетание обозначает наименование химических веществ, сельскохозяйственных культур, пород сельскохозяйственных животных и т.д. (гемиоксид азота, зернобобовые культуры, голштино-фризская порода).

  В словосочетаниях, как правило, используется прямой порядок слов. Словосочетания, содержащие прилагательные, обычно начинаются с них (декоративные растения, зерновые культуры, летучие соединения). В названиях растений на первое место ставится существительное в именительном падеже, а на второе – прилагательное (костер безостый, марь белая, сосна обыкновенная).

  В качестве КС могут использоваться общепринятые аббревиатуры в случае написания наименований организаций или стран (ФАО, ООН, США, ЮАР), а также длинных и сложных названий методов или процессов (QTL-анализ, ИФА, СВЧ-обработка).

  Ошибочным и неполезным является использование в качестве ключевых слов длинных текстовых конструкций, являющихся фразами или сложными словосочетаниями, приближающимися по своей структуре к предложениям.

 В КС необходимо отразить: объект исследования (сельскохозяйственные культуры, сельскохозяйственные животные, тип почвы, объекты защиты растений и ветеринарии, сельскохозяйственная техника, продукты питания, объекты окружающей среды и т.д.); действие, процесс (борьба с сорняками, предпосевная обработка семян, основная обработка почвы); цель исследований (создание устойчивых сортов, очистка сточных вод); методы или методика и т.д. (газожидкостная хроматография, спектральный анализ, статистические методы). Проще говоря, правильно составленные КС должны отвечать на вопрос, о чем идет речь в данной работе и в чем ее главная задача.

 Не рекомендуется использовать слишком сложные слова. Словосочетания, в которых используется больше трех слов, чаще всего можно разбить на несколько КС. Например, вместо фразы «технология возделывания пропашных культур» лучше указать такие КС: пропашные культуры, технологии возделывания.

  Нежелательно использование слов в кавычках. Даже если употребляемый в статье термин может оказаться спорным, абстрактным или еще не «устоявшимся», лучше указать его без кавычек. Например, «ведьмины метлы», «электронный нос», «умное сельское хозяйство». Используемые различными тестовыми редакторами кавычки могут быть разными. В результате одинаковые КС окажутся оторванными одно от другого и будут иметь низкую эффективность при поиске.

 Не рекомендуется использовать слова с запятыми. Это связано с тем, что в библиотечных и других поисковых системах КС разделяются именно этими знаками препинания. Если использовать слово с запятой, то, скорее всего, осмысленный термин будет разбит на несколько бессмысленных и неэффективных в плане поиска частей. Например, вместо словосочетания «белки, связанные с патогенезом» лучше написать «патогенезозависимые белки».

 КС следует отделять друг от друга запятыми. Большинство систем обработки текстов воспринимают именно запятую как разделитель между КС. Использование запятых при оформлении списка КС поможет сэкономить время при разметке статьи перед внесением в базу данных.

 Нельзя ставить точку в конце списка КС. Точка случайно может быть добавлена к последнему КС, из-за чего оно потеряет поисковую эффективность.

 Не рекомендуется указывать первое слово в списке КС с заглавной буквы. При обработке такое слово может быть учтено как самостоятельное. Например, КС «картофель» и «Картофель» будут разными.

 КС желательно записывать в определенной логической последовательности, ставя на первое место основной объект исследования. КС, как правило, прописываются под аннотацией, перед основным текстом как в электронной, так и в печатной версиях статьи.

 Вот еще несколько полезных советов, как правильно подобрать КС. Нужно постараться представить, по каким словам пользователи будут осуществлять поиск, чтобы найти именно эту информацию. Можно попробовать выделить основные термины, повторяющиеся в статье, и проверить с помощью онлайн сервисов, будет ли по ним осуществляться поиск. Попытаться проанализировать, что авторы могли писать, когда искали информацию по данной работе. Выделенные ключевые позиции в статье могут совпасть с поиском других исследователей, которые работают в этой же области науки. Грамотное составление набора КС привлечет намного больше ученых и повысит индексацию работы.

  КС необходимо перевести на академический английский язык. Это откроет доступ к работе ученым со всего мира, что может способствовать увеличению уровня цитирования и индексации и, соответственно, повысит рейтинг автора. Поскольку требуется перевод КС, то рекомендуется использовать общеупотребительные термины наряду со специальными. Следует помнить, что каждое КС – это самостоятельный элемент, оно должно иметь собственное значение.

  Приведем несколько примеров, иллюстрирующих особенности написания КС для научных статей по проблематике АПК.

   Остановимся на статье с правильным написанием КС (рисунок 1).

Рисунок 1 – Правильное написание КС

  В данном случае КС подобраны надлежащим образом, выражают суть статьи и эффективны для поиска. Указан объект исследование «картофель», указаны элементы агротехники (конкретно, отдельные приемы ресурсосберегающей технологии возделывания культуры») – «сроки посадки», «способы посадки», «регуляторы роста». Что еще бы хотелось добавить к КС – латинское наименование культуры «Solanum tuberosum», чтобы расширить возможности поиска, и место проведения исследований – «Смоленская область», так как природно-климатические условия имеют значение для возделывания сельскохозяйственных культур.

Остановимся на статьях с неправильным написанием КС (рисунок 2, 3).

Рисунок 2 – Неправильное написание КС

  В данном случае КС подобраны неправильно, слишком широко и неконкретно, они не имеют прямого отношения к статье, отражают более общие понятия и для поиска не имеют значения. В данном случае уместно было бы написать следующие ключевые слова: картофель, Solanum tuberosum, Leptinotarsa decemlineata колорадский жук, фенотипическая изменчивость, структура популяций, морфотипы, инсектициды, трансгенные растения, выживаемость.

Рисунок 3 – Неправильное написание КС

  В данном случае мы видим избыток КС. Приведено много узких понятий, перечисляются фактически все элементы агротехники, о которых в статье лишь упоминается, при этом статья имеет более общий характер, небольшого объема и не требует такого количества КС. Здесь уместно было бы отобрать следующие термины для раскрытия содержания документа: картофель, Solanum tuberosum, технологии возделывания, адаптивные технологии, история, Удмуртия.

  Следующий пример иллюстрирует результаты поиска по определенной теме в поисковой системе Google. Проводился поиск по следующим КС: картофель, колорадский жук, инсектициды, биологическая эффективность (рисунок 4).

Рисунок 4 – Запрос в поисковой системе Google

  В ответ на запрос поисковая система выдала большое количество документов, многие из которых релевантны поисковому предписанию (рисунок 5).

Рисунок 5 – Результаты запроса в поисковой системе Google

  Это говорит о том, что были выбраны правильные КС для поиска по данной теме.

Выводы. КС должны отражать основное содержание и раскрывать смысл научной статьи. Для правильного составления списка КС нужно придерживаться определенных правил, которые позволят представить их в виде поискового образа документа. Поэтому так важно, чтобы КС, несущие основную смысловую нагрузку статьи, были подобраны точно и полно. С помощью КС составляются информационные запросы и ведется тематический поиск в автоматизированных информационно-поисковых системах. Большинство информационно-поисковых систем научных учреждений и наиболее популярных поисковых систем в Интернет (Google, Яндекс, Rambler) осуществляет поиск именно по ключевым словам. Используя КС, можно значительно сузить область поиска и более качественно составить запрос к поисковому серверу. Чем лучше (качественнее) составлен запрос к поисковой машине, тем меньше общее количество найденных документов и больше из них релевантных. Если основные темы научной статьи достаточно точно и полно отражены в списке КС, то даже при беглом ознакомлении с документом пользователи поймут, о чем идет речь в статье, могут проявить интерес к данной работе и заинтересоваться другими работами автора.

Список источников

  1. 1. Абрамов Е. Г. Подбор ключевых слов для научной статьи // Научная периодика: проблемы и решения. – 2011. – № 2. – С. 35–40.
  2. 2. Даркулова К. Н., Ергешова Г. Необходимость выделения ключевых слов для свертывания текста // VI Международная студенческая электронная научная конференция «Студенческий научный форум 2014». – URL: https://files.scienceforum.ru/pdf/2014/177.pdf (дата обращения 17.02.2022).
  3. 3. Захаров В. П. Корпусная лингвистика: Учебно-методическое пособие. СПб. : СПбГУ, 2005. 50 с.
  4. Индексирование документов базы данных ЦНСХБ. Методические указания // состав. ПирумоваЛ. Н., Харченко Л. Т. – Москва, 1995. – 35 с.
  5. 4. Камшилова О. Н. Малые формы научного текста: ключевые слова и аннотация (информационный аспект) // Известия Российского государственного педагогического университета им. А. И. Герцена. – 2013. – № 156. – С. 106–117.
  6. 5. Леонтьева Н. Н. Автоматическое понимание текстов: системы, модели, ресурсы. – М. : Академия, 2006. – 304 с.
  7. 6. Москвитина Т. Н. Ключевые слова и их функции в научном тексте // Вестник Челябинского государственного педагогического университета. – 2009. – № 11. – С. 270–283.
  8. 7. Пирумова Л. Н. К вопросу об оформлении научной статьи // Восемнадцатые Денисьевские чтения : избранные материалы междунар. науч.-практ. конф. по библиотековедению, книговедению и проблемам библиотечно-информационной деятельности, г. Орел, 28-29 окт. 2021 г. – Орел, 2022. – С. 67-81.
  9. 8. ПирумоваЛ. Н., Харченко Л. Т. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в БД АГРОС. (Методические материалы) – Москва, 2001. – 70 с.

Сведения об авторе

Соколова Жанна Владимировна, старший научный сотрудник отдела аналитико-синтетической обработки документов и лингвистического обеспечения, Центральная научная сельскохозяйственная библиотека

К оглавлению выпуска

Аналитика

08.05.2022, 481 просмотр.