Работы молодых ученых и практиков. НОВИКОВ А.А. АНАЛИЗ РАЗВИТИЯ НОРМАТИВНОЙ БАЗЫ СТАНДАРТИЗАЦИИ ПО ЛИНГВИСТИЧЕСКОМУ ОБЕСПЕЧЕНИЮ БИБЛИОТЕЧНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

Стандартизация играет важнейшую роль в жизни современного общества, так как затрагивает практически все сферы жизнедеятельности человека, обеспечивает эффективность экономических и технологических процессов. В стандартах отражается опыт человечества, достигнутый в результате созидательной деятельности. Только опираясь на достигнутый опыт человек может двигаться дальше по пути развития. В полной мере это относится и к информационным видам деятельности, составляющим предметную область комплекса стандартов по информации, библиотечному и издательскому делу - СИБИД.

Реализация введения новых стандартов всегда сложна. Препятствуют этому и организационные процессы, так как любой виток развития начинается с того, что до перехода на новую ступень, сотрудникам необходимо поддерживать оба направления, как принятого в организации, так и принимаемых стандартов, что вызывает внутреннее несогласие из-за кажущегося возрастания рабочих требований.

Экономические и правовые препятствия, особенно в государственном секторе не позволяют в полной мере оценить повышение рентабельности в отложенном периоде. Но, для повышения институциональной ценности и прозрачности в определении экономической эффективности, невозможно без реализации введения новых ISO и ГОСТ Р. Именно это и лежит в основе актуальности данной работы, посвящённой анализу развития нормативной базы стандартизации по лингвистическому обеспечению библиотечных информационных систем.

Понимание того, что такое лингвистическое обеспечение библиотечных информационных систем, очень разнообразно. В литературе нет однозначной трактовки этого термина. Лингвистическое обеспечение информационных систем является набором представленных в нужном формате языков, необходимых для работы информационной системы. В информационных системах используются языки программирования и языки, предназначенные для организации общения компьютера и человека, то есть лингвистическое обеспечение.

Говоря об отечественных исследователях лингвистическому обеспечению библиотечных информационных систем, нельзя не упомянуть, А. Б. Антопольского [2], Е. М. Зайцеву [4], К. В. Вигурского [3], которые занимались проблемой стандартизации лингвистического обеспечения библиотечных информационных систем. В результате работы отечественных ученых, можно вынести следующее положение: в автоматизированных информационных системах выделение лингвистического обеспечения (ЛО) из состава информационного обеспечения и оформление его в качестве самостоятельной подсистемы службы или направления деятельности было фактически завершено к 1976 году и получило юридическое закрепление. Постановлением от 30.09.81 “Об утверждении единого порядка разработки и развития автоматизированных систем НТИ”.

Так же лингвистическими форматами можно назвать рубрикаторы, такие как ББК [5], УДК [6], ГРНТИ [1] и т.д. Но в своей статье, сделан упор на технические, лингвистические средства библиотечных систем.

Выбор технических форматов связан с тем, что именно на них базируется основное лингвистическое обеспечение библиотечных информационных систем, как отечественных, так и зарубежных. Анализ данных систем служит фундаментом для понимая изменений в ГОСТах и ISO.

Основным пунктом анализа было Дублинское ядро [8], так как оно связано с организацией и представлением информации, стандартизацией, сохранением и использованием метаданных. Дублинское ядро оказало значимое влияние на создание прикладных профилей и стандартов метаданных, разработку концептуальных моделей, исследования в области перекрестных и связанных данных, а также проведение дискутирования о структуре знаний в системе.

Проанализированная литература свидетельствует о важном вкладе Dublin Core [10] и DCMI [11] в развитие семантического поля, приведшего к созданию семантической паутины (semantic Web) и области информационно - библиотечных наук.

Изучив стандарты Dublin Core [7] и DCMI, MARC, описание ресурсов доступа к ресурсам Resource Description and Access (RDA) [9] и семантический веб, мы пришли к выводу, что усложнение информационных потоков отвечали на вызовы информационных функций, которые в конечном итоге отражались в системах стандартизации.

Исследование базировалось на анализе следующих стандартов: ISO/TC 46 /SC 4 N487. “Информация и документация - Международный стандартный идентификатор библиотек и связанных с ними организаций (ISIL)”, ISO/DIS 15836-2 Набор элементов метаданных Dublin Core, ГОСТ Р 7.0.98-202_ «Система стандартов по информации, библиотечному и издательскому делу. Международный стандартный идентификатор для библиотек и родственных организаций», ГОСТ Р ИСО 15836-2-2022 «СИБИД. Набор элементов метаданных «Дублинское ядро». Часть 2. Свойства и классы DCMI».

Основными изменениями в рассматриваемых стандартах по сравнению с предыдущими можно назвать то, что «URI используются для идентификации терминов». Разница между этими двумя определениями заключается в синтаксисе - если проблема в этом, то достаточно принять для согласованности одно и то же определение и добавить примечание, взятое прямо из RDF. Но если смотреть общественное обсуждение данного стандарта, то можно выявить следующие: URI: компактная последовательность символов, которая идентифицирует абстрактный или физический ресурс. В итоге Определение URI - 15836-.1 было принято из ИСО 12785-1:2009 Информационные технологии. Обучение, образование, подготовка - Упаковка содержимого - Часть 1: Информационная модель.

В результате мы считаем, что лучше взять URI спецификацию из стандарта URI стандарта, RFC 3986, и исправить определение в следующей версии стандарта 15836-1.

Рассматривая стандарты «ISO/TC 46 /SC 4 N487. “Информация и документация - Международный стандартный идентификатор библиотек и связанных с ними организаций (ISIL)”, ISO/DIS 15836-2 Информация и документация - Набор элементов метаданных Dublin Core. Часть 2: Свойства и классы DCMI». Мы выявили, что наличие кода страны в ISIL, должно обеспечит уникальность идентификаторов, которые уже являются уникальными в пределах домена страны, но неоднозначных во всем мире.

Чтобы сделать их уникальными необходимо добавить символы, которые идентифицируют домен наименования в пределах конкретной страны.

При анализе нововведений ГОСТ Р 15836 – 2 – 2022, выявили, что при обсуждении был поднят вопрос некорректного определение термина «класс». В англоязычном тексте стандарта ISO 15836-2:2019 (en)) читаем, что «class - set of resources». Однако, там же, дается ссылка на первоисточник этих определений RDF Schema. Но, мы считаем, что согласно ГОСТ Р 1.7-2014 в стандарте не допускается изменять структуру международного стандарта. Кроме того, рассмотрение документа RDF Schema не позволило выявить противоречий в определении термина «класс».

Все нововведение, которые были рассмотрены в исследование, были приняты при большом количестве правок и несогласием среди некоторых голосовавших экспертов. Вынесенные пункты были направлены на улучшение работ библиотек, архивов, музеев и других учреждений, связанных с этими стандартами и своевременно отреагировать на грядущие изменения.

 

Список источников

  1. 1. Антопольский А. Б., Белоозеров В. Н., Маркарова Т. С., Дмитриева Е. Ю. Установление соответствий рубрик ГРНТИ рубрикам других систем классификации научной и технической информации // Научно-техническая информация. Серия 1: Организация и методика информационной работы. – 2015. – № 3. – С. 3-18.
  2. 2. Антопольский А. Б. Лингвистическое обеспечение электронных библиотек //Электронные библиотеки. – 2002. – Т. 5. – №. 2. – С. 3.
  3. 3. Антопольский А. Б., Вигурский К. В. Концепция электронных библиотек //Электронные библиотеки. – 1999. – Т. 2. – №. 2. – С. 1.
  4. 4. Зайцева Е. М. Лингвистическое обеспечение автоматизированных библиотечно-информационных систем: современные требования и направления развития // Научные и технические библиотеки. – 2000. – №. 3. – С. 54-57.
  5. 5. Сукиасян Э. Р. Библиотечно-библиографическая классификация (ББК): современное состояние и перспективы // Научные и технические библиотеки. – 2020. – №. 1. – С. 60-75.
  6. 6.  Сукиасян Э. Р. Универсальная десятичная классификация: возникновение, распространение в современном мире // Научно-техническая информация. Серия 1: Организация и методика информационной работы. – 2006. – №. 10. – С. 1-5.
  7. 7. Apps A., MacIntyre R. Dublin core metadata for electronic journals // Research and Advanced Technology for Digital Libraries: 4th European Conference, ECDL 2000 Lisbon, Portugal, September 18–20, 2000 Proceedings 4. – Springer Berlin Heidelberg, 2000. – С. 93-102.
  8. 8. Mana S. C., Sasiprabha T. A study on various semantic metadata standards to improve data usability // 2019 International Conference on Computational Intelligence in Data Science (ICCIDS). – IEEE, 2019. – С. 1-4.
  9. 9. Monyela M. Challenges of resource description and access (RDA) implementation in Sub-Saharan Africa: a review of literature // Journal of Library Metadata. – 2020. – Т. 20. – №. 2-3. – С. 111-126.
  10. 10. Nilsson M. et al. Formalizing Dublin core application profiles–description set profiles and graph constraints // Metadata and Semantics. – Boston, MA : Springer US, 2009. – С. 101-111.
  11. 11. Zhang A., Zhang Y., Jia J. The reuse of DCMI metadata terms in linked open vocabulary // The Electronic Library. – 2023. – Т. 41. – №. 1. – С. 152-165.

 

Сведения об авторе

Новиков Алексей Андреевич  – магистрант Московского государственного института культуры

К оглавлению выпуска

Аналитика

30.08.2023, 236 просмотров.