БИБЛИОТЕЧНО-ИНФОРМАЦИОННЫЕ НАУКИ: ТЕОРИЯ И МЕТОДОЛОГИЯ. АНТОПОЛЬСКИЙ А.Б. СИСТЕМЫ ОРГАНИЗАЦИИ ЗНАНИЙ: СОБРАНИЯ, РЕЕСТРЫ, СЕРВИСЫ

Введение

  Системы организации знаний (Knowledge organization system, далее  KOS) - относительно новый термин в библиотечно-информационной науке (LIS), заменивший в последние годы известные термины языки индексирования,  информационные или информационно-поисковые языки.

 Соответственно понятие KOS включает все традиционные библиотечно-библиографические средства: авторитетные файлы, классификации, таксономии, рубрикаторы, предметные заголовки, тезаурусы. Также к KOS относятся современные средства представления знаний – фреймы, семантические сети, тематические карты, графы знаний и, конечно, онтологии.  Многие (но не все) авторы включают в состав KOS такие инструментально-семантические средства, как языки разметки, системы метаданных и схемы данных. Наконец, в соответствии с трактовкой Международного общества по организации знаний (ISKO) [1] к KOS относятся терминологические системы и сервисы – глоссарии, словари, справочники, базы данных. Хотя терминологические средства традиционно не относятся к LIS, содержательная связь терминологии и KOS несомненна. Заметим, что в обзорной литературе конкретные KOS часто называются словарями.

 Быстрый рост числа KOS и их широкое распространение привело к появлению большого числа систем и сервисов, которые осуществляют разные услуги в области KOS, прежде всего сбор, учет, хранение, навигацию, доступ и поиск. Сами эти системы могут иметь разные названия - репозитории, архивы, банки данных и т.д. В данной статье мы будем их называть собраниями или реестрами.

 В предлагаемой статье содержится аналитический обзор собраний и реестров KOS, а также сервисов в этой области.  Наш анализ основан на базе данных BARTOC [2], где каталогизировано 129 реестров KOS. BARTOC описан более подробно. Эта база не включает российские реестры KOS, поэтому им посвящен отдельный раздел.

Виды собраний и реестров KOS

 В Приложении приведен перечень 129 собраний (реестров) KOS. Приводится наименование каждого реестра, перевод названия, либо пояснение на русском языке и адрес домашней страницы. Перечень упорядочен по алфавиту наименований.

 Описание каждого реестра в БД BARTOC включает:

  1. Аннотация
  2. Наименование
  3. URI
  4. Сервисы (API)
  5. Домашняя страница
  6. Дата создания
  7. Словари, доступные в данном реестре
  8. Тип

терминологический сервис, 

хранилище терминологии

 Реестры предоставляют доступ к терминологии данного KOS, либо через API (сервис терминологии), либо другими способами (различаются реестр или собрание терминологии). BARTOC включает 91 собрание или репозиторий с полным доступом к словарному содержимому, т.е.  реестры, через которые доступны термины и понятия, входящие в данный KOS. Другие реестры предоставляют информацию о словарях (т.е. метаданные) вместо содержания словаря как такового. Метаданные для словарей обычно содержат как описательное содержание, так и информацию об управлении и происхождении. Реестр может содержать данные о повторном использовании логических классов и свойств в словарях.

 В работе М. Цзен и Ф. Майра  [13] предлагается список типов  поставщиков услуг на основе собраний или реестров KOS.

 Многофункциональный реестр KOS. Пример – Базовый реестр тезаурусов, онтологий и классификаций (BARTOC), подробно описанный ниже.

 Поставщик индивидуальных словарей.  Например, EuroVoc[1] - многоязычный тезаурус Европейского союза (ЕС). Термины на европейских языках и их сопоставления с восемью другими доступны на веб-сайте или с помощью скачивания.

 Отдельное учреждение как поставщик всех словарей, подготовленных в нем.  Так, Библиотека Конгресса предоставляет доступ ко всем словарным массивам за все годы, обнародованный в Библиотеке Конгресса. Например, реестр Схемы классификации включает 212 классификаций, а реестр Тематические схемы – 254 тезаурусов и других  KOS.

 Единый портал для национальных словарей KOS, созданных в стране. Например, финский сервис тезаурусов и онтологий FINTO позволяет как публиковать, так и просматривать десятки словарей, созданных в Финляндии. Кроме того, сервис предлагает интерфейсы для интеграции тезаурусов и онтологий в другие приложения и системы.

 Портал, ориентированный на предметную область, для сбора словарей, созданных различными структурами.  Например, Связанные данные культурного наследия.

 Программное обеспечение, предоставляющее конечным пользователям инструменты для использования/повторного использования опубликованных словарей. Например, SKOSprovider предоставляет интерфейс, который может быть включен в приложение, чтобы позволить ему взаимодействовать с различными словарями, представленными в SKOS.

 Онтология верхнего уровня, которая упрощает отображение понятий и сущностей в нескольких словарях.   Например, онтология KOKO.  поддерживает управление и публикацию набора взаимосвязанных приложений. Онтология Базовые словари финского языка позволяет пользователям использовать несколько онтологий как единое, совместимое, межотраслевое представление вместо отдельных онтологий. Другой пример - сервис UMBEL который  предназначен для отображения онтологий и внешних словарей (OpenCyc, DBpedia, PROTON, GeoNames и schema.org) и обеспечивает связи с более чем 2 миллионами объектов Википедии.

  Реестр любых словарей, опубликованных с использованием Семантической паутины. Например, на сайте LOV в настоящее время зарегистрировано более 600 словарей; все они прошли определенную проверку качества в формате связанных открытых данных. В дополнение к описательным метаданным о словаре, метаданным использования о повторном использовании свойств в словарях, административным метаданным, показывающим самые последние обновления, и техническим метаданным, касающимся выразительности с точки зрения RDF, OWL, и RDF. Подробная информация о словаре представлена с помощью статистики, такой как общее количество классов, свойств, типов данных и экземпляров.

 Реестр любых продуктов связанных открытых данных, включая KOS,  Например, datahub[2]. является крупнейшим реестром LOD  Авторы [13] провели анализ этого реестра в 2017 г. Было обнаружено  более 11 тыс. наборов связанных открытых данных,  в том числе более 1000  различных KOS.

 Перечень типов, выделенных М. Цзен и Ф. Майром, может быть продолжен.  

 Многие системы, специализирующиеся на KOS, разработали стратегии и технологии, обеспечивающие не только доступность, но и совместимость, стабильность и масштабируемость контента и приложений, которые они предоставляют.  Те сервисы, которые содержат полное содержимое KOS, а также своевременно обновляемые управленческие данные по каждому компоненту, также известны как репозитории KOS.  Они могут быть одноязычными или многоязычными; количество словарей KOS, содержащихся в хранилище, может варьироваться от одного до 3 тыс. и более.

 Некоторые реестры собирают KOS определенного типа.  Например, собрания KOS, созданные на платформе Семантической паутины. Есть реестры, включающие только KOS, представленные на языке веб-онтологий (OWL).

 В последние годы многие реестры хранят собранные KOS в определенном формате, например с использованием популярного инструмента Skosmos.

 Одни сервисы предоставляют только самую последнюю версию KOS, в то время как некоторые поддерживают все версии. Дополнительные функции могут быть доступны в дополнение к поиску, просмотру, отображению и навигации. Некоторые из них также позволяют сопоставлять словари или предоставляют прямые ссылки на значения данных.

 Более конкретно, реестры можно разделить по типу контента, какие именно концептуальные, лексические, и/или инструментальные средства они включают:

  • - Универсальные – доступ ко всем видам KOS
  • - Собрание тезаурусов
  • - Собрание онтологий
  • - Терминологические БД и сервисы
  • - Авторитетные (библиографические) KOS
  • - Собрание классификаций,
  • - Собрание систем метаданных
  • - Инструментальные средства для создания и поддержки KOS
  • - Платформы для интеграции KOS
  • - Сервисы для поиска и доступа

 Также реестры естественно разделить по тематическому признаку (выборочные примеры дисциплин приводятся в алфавитном порядке);

  • - Библиотековедение
  • - Биомедицина
  • - Информатика
  • - Лингвистика
  • - Культурное наследие
  • - Образование
  • - Океанология
  • - Окружающая среда
  • - Сельское хозяйство
  • - Социальные науки
  • - Универсальные

  Реестры можно разделить по статусу;

o        Международные

o        Общенациональные

o        Профессиональные сообщества

o        Для массовых пользователей

  Конечно, возможны и другие основания классификации реестров.

 Базовый регистр тезаурусов, онтологий и классификаций

 Наиболее представительное собрание KOS, созданное при поддержке ISKO, получило название Базовый регистр тезаурусов, онтологий и классификаций (BARTOC) [2][3]. Это собрание представляет собой базу данных KOS, а также    сервисов и реестров KOS.  Всего BARTOC содержит описания св. 3,5 тыс. KOS, а также 129 других сервисов и реестров KOS. 

 BARTOC был основан Андреасом Ледлом как Базельский регистр тезаурусов, онтологий и классификаций в библиотеке Базельского университета, Швейцария. В 2020 году база данных перенесена на новую техническую инфраструктуру в Центральный офис Объединенной библиотечной ассоциации (VZG) Германии и переименована. Реализация полностью доступна как Open Source.

 Основная цель BARTOC - собрать как можно больше KOS в одном месте, чтобы добиться большей наглядности, выделить их особенности, сделать их доступными для поиска и сопоставимыми, а также способствовать обмену знаниями. BARTOC включает KOS из любой предметной области, на любом языке, в любом формате публикации и с любой формой доступности. Интерфейс поиска BARTOC доступен на 20 европейских языках и предоставляет два варианта поиска: базовый поиск по ключевым словам и расширенный поиск.

 Последний имеет следующие фильтры: тип KOS, язык, тематика, лицензия доступа, а также ссылка на сервис или реестр, через который доступны термины и понятия, образующие данную KOS.

Описания KOS включают следующий   набор реквизитов:

  • - Аннотация
  • - Наименования
  • - Сокращение
  • - Тип KOS,
  • - Тема (предмет)
  • - Лицензия
  • - Языки
  • - Дата создания
  • - URI
  • - Домашняя страница

 Статистика KOS по типам в базе BARTOC основана на перечне типов KOS, который был разработан в качестве основного профиля приложения Дублинского ядра Группой сетевых KOS (NKOS) на основе обзора типов KOS, составленного Марсией Цзэн [12]. Этот перечень типов приведен на табл.1.

 

          Табл. 1.  Статистика типов KOS в базе BARTOC,

 Русское наименование типа KOS

Английское наименование

 Количество KOS

1.              

Авторитетный список имен

Name authority list

223

2.              

Географический справочник

Gazetteer

20

3.              

Глоссарий

Glossary

353

4.              

Кольцо синонимов

Synonym ring

1

5.              

Онтология

Ontology

723

6.              

Семантическая сеть

Semantic network

7

7.              

Словарь

Dictionary

92

8.              

Список

List

121

9.              

Схема категоризации

Categorization schema

21

10.           

Схема классификации

Classification   schema

956

11.           

Схема предметных заголовков

Subject heading schema

111

12.           

Таксономия

Taxonomy

105

13.           

Тезаурус

Thesaurus

803

14.           

Терминология

Terminology

219

 

 Реквизит Язык представляет собой обширный алфавитный список языков, на котором представлен KOS, На табл. 2 приводится число KOS на 10 самых распространенных языках. Нужно учитывать, что многие  KOS являются многоязычными. Например,  УДК представлена на 53 языках, а DDC  на 13. Нужно отметить, что на русском языке имеется 81 KOS, в основном многоязычных, и в топ-10 русский язык не попал.

 

Табл. 2. Топ 10 языков, на которых представлены  KOS

 

Язык

 Количество KOS

1.

Английский

1929

2.

Немецкий

763

3.

Французский

576

4.

Испанский

486

5.

Шведский

299

6.

Итальянский

228

7.

Финский

210

8.

Португальский

197

9.

Греческий

156

10.

Каталонский

141

 

          В реквизите Лицензия  указан  вид лицензии, на основе которой доступен данный KOS.  Всего список включает около 40 видов лицензий, в том числе 13 видов Creative Commons, самые распространенные представлены на табл. 3.

Табл. 3 Наиболее распространенные лицензии  доступа к KOS

Вид лицензии

Количество KOS

Creative Commons Attribution 3.0

208

Creative Commons Public Domain Dedication

187

Open Government License 1.0

178

Creative Commons Attribution-NoDerivs 3.0

84

Creative Commons Attribution-ShareAlike 3.0

55

In Copyright (InC)

53

Creative Commons Attribution-NoCommercial-ShareAlike 3.0

46

Creative Commons Attribution 4.0

32

Creative Commons Attribution-NoCommercial NoDerivs 3.0

17

W3C  Document License

16

 

          Тематика. В качестве тематической классификации BARTOC использует Десятичную классификацию Дьюи (DDC). В табл. 4 приводится распределение KOS по первому уровню DDC.

 

Табл. 4:  Распределение KOS по тематике

Код DDC

 Рубрика

Количество KOS

0

 Информатика, информационные технологии, общие работы

666

1

Философия и психология

61

2

Религия

56

3

Социальные науки

823

4

Языки

109

5

Наука

323

6

Технология

319

7

Искусство и досуг

240

8

Литература

24

9

История и география

161

 

  Нужно отметить, что при поиске по тематике в BARTOC предъявляется как поисковый только рубрики первого уровня DDC ,  хотя реальные  объекты  в системе проиндексированы глубже. При выдаче описания KOS выдается рубрика ДДК нужного уровня.  Например,  El Tesaurus d'Història de Catalunya. Тематика: Пиренейский полуостров и прилегающие острова (946.)  Таким образом, поиск по более глубоким рубрикам возможен, если рубрика пользователю известна.  KOS  также индексированы  дескрипторами  тезауруса EUROVOC, но они не предъявляются.

 Также предусмотрен поиск по предметным рубрикам Библиотеки Конгресса, но это пока не реализовано.

 В целом можно отметить, что тематический поиск в BARTOC организован неудовлетворительно. Значительная часть KOS (по оценке до половины) не имеет индексов для тематического поиска.

 Конечно. можно использовать простой лексический поиск по наименованию KOS, но качество этого поиска не требует комментариев.

Выводы

 В настоящее время (август 2024 г.) BARTOC содержит информацию о 3,5 тыс. классификаций, тезаурусов, онтологий и других контролируемых словарях. В дополнение к улучшенной видимости и удобству поиска с помощью словарного описания, BARTOC включает все больше и больше средств для доступа к словарному контенту.  BARTOC становится центром словарных сервисов для унифицированного просмотра, поиска и повторного использования понятий и их идентификаторов. Управление доступом осуществляется путем сопоставления существующих сервисов и форматов, таких как Skosmos, SKOS и пользовательских терминологических API, с общим форматом данных на основе JSON. Все методы доступны в библиотеке JavaScript, поэтому доступ к контролируемым словарям можно добавлять в другие веб-приложения без необходимости углубляться в многочисленные спецификации API.

 История российских собраний КОS

 Проблема создания совместимого комплекса информационных языков для Государственной системы научно-технической информации (ГСНТИ) была поставлена еще в 1960-х гг. и получила развитие во второй половине 1970-х гг. Поскольку было очевидным, что большая часть языковых средств ГСНТИ, представляют ИПЯ посткоординатного типа -  тезаурусы и дескрипторные словари, то задача их совместимости, т.е. приведения их в соответствие с требованиями информационного обмена,  была сформулирована как организация их  согласованного ведения. В этих условиях центр тяжести разработок был перенесен на организацию эффективной системы ведения ИПЯ. Была поставлена задача и начато проектирование автоматизированной системы ведения информационных языков (АСВИЯ) [5].

 К этому времени число АСНТИ, использующих ИПЯ посткоординатного индексирования с тезаурусами, возросло без малого до ста единиц. Нужно было разработать и апробировать на практике ряд методов возможно более полного автоматизированного анализа тезаурусов Государственной автоматизированной системы НТИ (ГАСНТИ) с целью создания и согласованного ведения пересечения рабочих тезаурусов. Разработанный в 1975 г. технический проект АСВИЯ включал уже помимо описания идеологии и основных проектных решений системы весьма значительный фактический и экспериментальный материал, полученный с помощью машинного анализа фрагментов реальных словарей [5].

 В 1980 г. АСВИЯ была принята в эксплуатацию и в течение 5 дет был создан фонд, включающий св. 240 отечественных КОS на традиционных и машинных носителях, в том числе; информационно-поисковые тезаурусы, дескрипторные словари, рубрикаторы и классификации. Был разработан нормативный документ, регламентирующий регистрацию тезаурусов, рубрикаторов и других KOS [10]. При регистрации проводится научно-техническая экспертиза для установления целесообразности применения языкового средства в органах ГСНТИ. Экспертиза состоит в проверке соответствия рубрикаторов, тезаурусов и систем индексирования на соответствие государственным стандартам и другим нормативно-техническим документам в части их содержания, а также формы представления как в книжном виде, так и на машиночитаемых носителях. Содержание и форма представления рубрикаторов должна соответствовать ГОСТ Р 7.0.49. Зарегистрированные локальные рубрикаторы и другие языковые средства составляют информационный фонд автоматизированной системы ведения информационных языков (АСВИЯ), поддерживаемый ВИНИТИ как головным органом ГСНТИ. В период массовой разработки отраслевых систем научно-технической информации было зарегистрировано более 200 версий локальных рубрикаторов, покрывающих практически все области экономики.

 Опыт функционирования АСВИЯ описан в сборнике материалов [3].

  В дальнейшем с учетом опыта АСВИЯ, а также опыта автоматизированного ведения рубрикаторов реферативного журнала ВИНИТИ была разработана Система классификационных схем (СКС).  Для сопоставления классификаций в единой базе данных разработаны и внедрены новые инструментальные средства установления взаимосвязей на основе аппарата отображения рубрик (MAP-технология). Эти средства основаны на реляционной модели данных и обеспечивают формальную целостность и непротиворечивость взаимных связей. Основу модели составляет теоретико-множественное представление отображения рубрики одной рубрикации на другую рубрикацию на базе общего списка квалификаторов, используемых в формулах отображения. Подробное описание СКС представлено в книге [7].

  В настоящее время создана база данных СКС, включающая полный текст следующих классификаций:[4]

  • - Библиотечно-библиографическая классификация (2015 г.) (ББК-2015/18)
  • - Государственный Рубрикатор НТИ России (ГРНТИ)
  • - Классификатор Scopus (Scopus)
  • - Классификатор Web of Science (WoS)
  • - Классификатор Организации экономического содействия и развития (ОЭСР)
  • - Классификатор Российского научного фонда (РНФ)
  • - Классификатор Российского фонда фундаментальных исследований (2019 г.) (РФФИ-2019)
  • - Международная патентная классификация (2015 г.) (МПК-2015)
  • - Номенклатура специальностей научных работников (2012-2017 гг.) (ВАК-2012/17)
  • - Универсальная десятичная классификация (УДК)

 В настоящий момент доступны приведенные выше классификаторы. Можно просматривать каждый из них в соответствии с иерархическими и прямыми связями рубрик. Функция просмотра отображений позволяет изучать смысловые связи выбранной рубрики со всеми классификаторами, представленными в СКС, а также осуществлять переходы по отображениям между классификаторами.

 Кроме KOS, создаваемых в рамках библиотечно-информационной деятельности, в СССР была создана Единая система классификации и кодирования технико-экономической и социальной информации, (ЕСКК ТЭСИ), включающая множество классификаторов, применение которых регламентировано для государственных информационных систем. Описание современного состояния ЕСКК ТЭСИ можно найти в [8].

 В настоящее время официальное опубликование, издание и распространение общероссийских классификаторов осуществляет Российский институт стандартизации (РСТ)[5]. Каталог РСТ включает 110 классификаторов[6]. Комплект З8 официально действующих общероссийских классификаторов содержится также на сайте «Общероссийские классификаторы»[7].

 Также в России создано ряд терминологических ресурсов и сервисов, не связанных впрямую с библиотечно-информационной деятельностью. Их подробное описание можно найти в монографии «Лингвистические информационные ресурсы» [6].

 Следует отметить некоторые российские проекты, направленные на представление KOS в наиболее перспективном формате - связанных открытых данных на платформе семантической паутины.

 Идею интеграции нескольких тезаурусов русского языка в Семантическую паутину в облаке лингвистических связанных открытых данных реализовал Д.А. Усталов  [11]. См. также [4].

 Еще один российский  проект преобразования традиционной KOS в семантическую паутину, конкретно, Библиотечно-библиографической классификации  (ББК) в связанные открытые данные, описан в работе О. А. Лавреновой [9].   Проект основан на разработанном в Российской государственной библиотеке навигаторе по разделителям генерального систематического каталога на базе ББК.

 Более подробное описание этих проектов имеется также в [6].

  Заключение

 Опыт развития современного научного информационного пространства знаний убедительно свидетельствует, что важное место в его формировании занимают разнообразные системы организации знаний. При этом они играют решающую роль для обеспечения функциональной совместимости информационных систем, в том числе при обмене данными или интеграции, данных. Также очень важно обеспечить повторное использование разработанных KOS, которых много создается как в России, так и за рубежом. Лучшим инструментом для этого может стать преобразование KOS в связанные открытые данные на платформе Семантической паутины.

  Для решения этой задачи естественным решением было бы создание реестра KOS, практически используемых в российской библиотечной и научно-информационной деятельности. Такой реестр должен стать важным компонентом инфраструктуры Единого научного информационного пространства знаний России.

 Список источников

  1. 1. Международное общество по организации знаний (ISKO) [Электронный ресурс]. –URL:  https://www.isko.org/ (дата обращения: 15 августа 2024 г.)
  2. 2. База данных BARTOC [Электронный ресурс]. –URL: https://bartoc.org/ (дата обращения: 16 августа 2024 г.)
  3. 3. Автоматизированная система ведения информационных языков АСВИЯ : информационные материалы / ВНИИКИ ; Гос. ком. СССР по стандартам. – Москва, 1986.
  4. 4. Интеграция тезаурусов RussNet и YARN / И. В. Азарова, П. И. Браславский, В. П. Захаров [и др.] // Компьютерная лингвистика и вычислительные онтологии : Сборник научных статей. Труды XIX Международной объединенной научной конференции, Санкт-Петербург, 22–24 июня 2016 года. – Санкт-Петербург: Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, 2016. – С. 7-13.
  5. 5. Антопольский А. Б., Вайсберг А. М., Зарувинская Л. А. Принципы создания и функционирования автоматизированной системы ведения информационных языков // Научно-техническая информация. Сер. 2. 1976. № 6. - С. 8-12.
  6. 6. Антопольский А.Б. Лингвистические информационные ресурсы /ИНИОН РАН, Фундам. б-ка ; науч. ред Д.В. Ефременко, Москва : ИНИОН РАН, 2022. - 466 с.
  7. 7. Гиляревский Р.С. Рубрикатор как инструмент информационной навигации: учебное пособие / Р. С. Гиляревский, А. В. Шапкин, В. Н. Белоозеров. – М.: МГУКИ, 2008. – 239 с.
  8. 8. Единая система классификации и кодирования технико-экономической и социальной информации/ Большая Российская энциклопедия 2023 [Электронный ресурс]. –URL: https://bigenc.ru/c/edinaia-sistema-klassifikatsii-i-kodirovaniia-tekhniko-ekonomicheskoi-i-sotsial-noi-informatsii-5191d3?ysclid=lzl6fz659x479535149 (дата обращения: 15 сентября 2024 г.)
  9. 9. Лавренова О. А., Павлов В. В. Библиотечно-библиографическая классификация как традиционная система организации знаний в среде открытых связанных данных / О. А. Лавренова, // Научные и технические библиотеки. – 2017. – № 4. – С. 44-60.
  10. 10. Порядок экспертизы и регистрации языковых средств Государственной автоматизированной системы научно-технической информации» М.: Государственный комитет СССР по науке и технике, 1982. – 10 с.
  11. 11. Усталов, Д. Семантические сети и обработка естественного языка / Д. Усталов // Открытые системы. СУБД. – 2017. – № 2. – С. 46-47. 
  12. 12. Zeng, Marcia L.  Knowledge Organization Systems (KOS) // Knowledge Organization. 2008. 35, nos. 2-3. Р. 160–182.
  13. 13. Zeng М. Knowledge Organization Systems (KOS) in the Semantic Web: A multi-dimensional review / Marcia Lei Zeng, Philipp Mayr.  // International Journal on Digital Libraries. 2019, September.  DOI:10.1007/s00799-018-0241-2
  14.  

Примечания

[1] Адреса  домашних страниц всех реестров даны в Приложении

[2] Datahub https://old.datahub.io/dataset .  

[3] Также существует бета версия в формате Skosmos https://skosmos.bartoc.org/

[4] Система классификационных схем http://rffi20.viniti.ru/Default.aspx

[5] Российский институт стандартизации (РСТ) [Электронный ресурс]. – URL: https://www.gostinfo.ru/pages/Maintask/public/

[6] Каталог Общероссийские классификаторы технико-экономической и социальной информации [Электронный ресурс]. – URL: https://www.gostinfo.ru/catalog/classiflist/?ysclid=lwag16h1h7741608050

[7] Общероссийские классификаторы [Электронный ресурс]. – URL:  https://classifikators.ru/ 

Приложение. Перечень собраний, реестров и сервисов KOS

AberOWL ontology repository and semantic search engine

Платформа для доступа к биологическим данным на основе онтологий

http://aber-owl.net/#/

ACDH Vocabs

Служба KOS Австрийского центра цифровых гуманитарных наук и культурного наследия

https://vocabs.acdh.oeaw.ac.at/

agINFRA Linked Data Vocabularies

KOS по сельскому хозяйству

http://vocabularies.aginfra.eu/

AgroPortal

Онтологии по сельскому хозяйству

http://agroportal.lirmm.fr/

American Society for Indexing

Тезаурусы, авторитетные файлы и других контролируемых словарей, отобранные пользователями

http://www.asindexing.org/about-indexing/thesauri/online-thesauri-and-authority-files/

Aristotle MetaData Registry

Платформа реестра метаданных с открытым исходным кодом

http://www.aristotlemetadata.com/

Australian Bureau of Statistics

Классификации австралийского бюро статистики и таблицы соответствия

http://www.abs.gov.au/websitedbs/D3310114.nsf/home/MCS.ViewAllClassifications

Australian Education Vocabularies

KOS в сфере образования Австралии

http://vocabulary.curriculum.edu.au/

BARTOC Registry

Базовый реестр тезаурусов, онтологий и классификаций

http://bartoc.org/

BARTOC Skosmos

Новая версия BARTOC (бета версия Skosmos)

https://skosmos.bartoc.org/

BioPortal

Самое полное в мире хранилище биомедицинских онтологий.

http://bioportal.bioontology.org/

BMICC MedPortal

Портал медицинской терминологии, хранилище и платформа онтологий

https://medportal.bmicc.cn/

CENDI Agency Terminology Resources

доступ к онлайн-тезаурусу и другим  KOS различных федеральных научных и технических агентств

http://www.cendi.gov/projects/proj_terminology.html

CESSDA Vocabulary Service

словарный сервис Консорциума европейских архивов данных по социальным наукам.

 

https://vocabularies.cessda.eu/

CLARIN Concept Registry

понятия, релевантные для языковых ресурсов. с постоянными идентификаторами

https://www.clarin.eu/ccr

Classification Schemes

Схемы классификации Службы связанных данных Библиотеки Конгресса

http://id.loc.gov/vocabulary/classSchemes

coli-conc KOS Registry

Инфраструктура управления и  совместимости библиотечных KOS

https://coli-conc.gbv.de/terminologies/

Conservation controlled vocabularies

Словари связанных природоохранных данных

https://www.ligatus.org.uk/lcd/controlled-vocabularies

Culture Grid Vocabulary Bank

Словарный банк контролируемых словарей, тезаурусов и терминологий

http://culturegrid.lexaurus.net/culturegrid/

DANS KOSo Observatory

KOSo (Системная обсерватория организации знаний)

https://knoworg.org/the-dans-koso-observatory/

DANTE

KOS по музейному делу

https://api.dante.gbv.de/

DARIAH Vocabs Servicey

Собрание KOS по искусству и гуманитарным наукам

https://vocabs.dariah.eu/

DataHub

Платформа управления данными от Фонда открытых знаний

http://datahub.io/

Datu

Служба тезаурусов и контролируемых словарей Высшей школы социальных наук

https://datu.ehess.fr/

DERI Vocabularies

 Словари, разработанные в Исследовательском институте цифрового предпринимательств

http://vocab.deri.ie/

DGIWG Terminology Registry

Терминологический реестр Рабочей группы по цифровой геопространственной информации

https://www.dgiwg.org/resources

Digital Archives Metadata Registry

Реестр метаданных цифровых архивов

https://github.com/srnsw/metadata

DIMDI

Официальные медицинские классификации, терминология и стандарты Министерства здравоохранения ФРГ

http://www.dimdi.de/dynamic/de/klassifikationen/index.html

DoD Data Services Environment

Метаданные среды передачи данных Министерства обороны США

https://metadata.ces.mil/dse/

DTU Wind Ontology viewer

Служба KOS  по ветроэнергетике

http://data.windenergy.dtu.dk/ontologies/view/

EcoPortal

Собрание семантических ресурсов по экологии и смежным областям

http://ecoportal.lifewatch.eu/

eHealth Ontario Terminology Registry

Реестр терминологии электронного здравоохранения Онтарио

http://www.ehealthblueprint.com/en/documentation/chapter/terminology-registry

EMBL-EBI Ontology Lookup Service (OLS)

Собрание биомедицинских онтологий

http://www.ebi.ac.uk/ols/

EU Vocabularies

Контролируемые словари, схемы, онтологии, модели данных ЕС

https://publications.europa.eu/en/web/eu-vocabularies

European Register of Marine Species (ERMS)

Таксономический список биологических видов, встречающихся в морской среде Европы,

http://www.marbef.org/data/erms.php

Europeana Metadata Registry

Реестр метаданных Европеаны

http://www.europeanaconnect.eu/results-and-resources.php?page=5#Registry

FAIRSharing

Стандарты данных и метаданных, связанный с базами данных и политикой в отношении данных.

https://fairsharing.org

Finnish Interoperability platform terminologies

Финская платформа совместимости  терминологии

https://sanastot.suomi.fi/

Finto

Финский сервис тезаурусов и онтологий

https://finto.fi/

GESIS Controlled Vocabulary Service

Служба KOS Немецкой инфраструктуры социальных наук.

https://lod.gesis.org/

Getty Vocabularies

Словари Getty  - структурированная терминология по искусству, архитектуре и др.

https://www.getty.edu/research/

tools/vocabularies/index.html

GFBio Terminology Server

Сервер терминологии  и онтологий по ботанике

http://terminologies.gfbio.org/

Glossarissimo!

Собрание одноязычных и многоязычных ресурсов и терминологии для письменных переводчиков

https://glossarissimo.wordpress.com/

Heritage Data

Тезаурусы и словари национального культурного наследия

http://www.heritagedata.org/blog/

HeTOP

Портал терминологии и  онтологий по здравоохранению

http://hetop.eu/hetop/

HIVE

Технология связанных открытых данных (LOD),  и Связанных открытых словарей (LOV)

http://cci.drexel.edu/mrc/projects/hive/

I-ADOPT Catalogue of Terminologies

Терминологии для составления описаний семантических переменных по естественным наукам

https://i-adopt.github.io/terminologies

ID.LOC.GOV

Доступ к онтологиям и контролируемым словарям для библиографического описания

https://id.loc.gov/

IF4IT Inventory of Taxonomies

Инвентарь таксономий Международного фонда информационных технологий

http://www.if4it.com/taxonomy.html

Inspire Registry

Доступ к реестрам пространственной информации

http://inspire.ec.europa.eu/registry

ISOcat

Реестр категорий данных ISO TC37 (DCR)

http://www.isocat.org/

JISC Directory of Metadata Vocabularies

Справочник по словарям метаданных и другим KOS Объединенного комитета по информационным системам

http://www.jiscdigitalmedia.ac.uk/guide/controlling-your-language-links-to-metadata-vocabularies/

KOKO- Linked Open Ontology cloud

KOKO - это коллекция финских базовых онтологий, которые были объединены воедино.

https://finto.fi/koko/en /

Knowledge for All

Открытый инструмент для поиска научной литературы, обмена  и доступа.

http://www.k4all.ca/

KulturNav

Открытое облачное программное обеспечение как услуга для словарей культурного наследия

http://kulturnav.org/

LC Linked Data Service

Служба связанных данных предоставляет доступ к стандартам и словарям, Библиотеки Конгресса.

http://id.loc.gov/

LD4P Authority Lookup Service

Служба поиска авторитетных данных для библиотек

https://lookup.ld4l.org /

legivoc

Терминологическая база данных по законодательству Евросоюза

http://legivoc.org/

LIDO Vocabularies

Терминология  LIDO – облегченной информации, описывающей объекты для метаданных в хранилищах культурного наследия

https://cidoc.mini.icom.museum/working-groups/lido/lido-overview/lido-terminology/ 

LINCS Vocabularies

 Словари сообщества образования взрослых

https://lincs.ed.gov/keywords/vocabulary

LinDA

Инструментарий преобразования данных в формат RDF

http://linda.epu.ntua.gr/vocabularies/all/

Linked ISPRA

Тезаурусы и онтологии ISPRA -объединенного исследовательского центра Евросоюза

http://dati.isprambiente.it/ontologie-e-thesauri/thesauri/

LisTRE (Linked Thesaurus fRamework for Environment)

Многоязычный тезаурусный фреймворк по окружающей среде

http://linkeddata.ge.imati.cnr.it/

Loterre

Терминологические междисциплинарные ресурсы

https://www.loterre.fr/

 LOV - Linked Open Vocabularies

Связанные открытые словари

http://lov.okfn.org/dataset/lov/

Luxembourg Service central de législation Controlled vocabularies

Словари, контролируемые центральной службой по легислатуре Люксембурга

http://data.legilux.public.lu/vocabulaires

Marine Metadata Interoperability (Ontology Registry and Repository

Совместимость метаданных в океанологии (реестр и хранилище онтологий)

https://mmisw.org/ont/#/

MatPortal

Онтология материаловедения

https://matportal.org/

md:term

Общедоступный интерфейс для доступа к контролируемым словарям в цифровом музее

https://term.museum-digital.de/

Metadata registry of the German Network for Educational Research Data

Реестр метаданных Немецкой сети данных в области образования

https://mdr.iqb.hu-berlin.de/

METeOR

Австралийское хранилище стандартов метаданных для секторов здравоохранения и социального обеспечения

http://meteor.aihw.gov.au/

museumsvokabular.de

Словари, доступные в цифровом виде по музейному делу.

http://museum.zib.de/museumsvokabular/

nbvok -Nasjonalbibliotekets vokabular-tjeneste

Словарный сервис Национальной библиотеки Норвегии - контролируемые словари, представленные в виде LOD в соответствии с SKOS-онтологией.

https://www.nb.no/nbvok/

NERC Vocabulary Server

Стандартизированные термины по  океанологии и смежным областям

https://vocab.nerc.ac.uk/

Network of Terms

Собрание KOS  и терминологический сервис по культурному наследию

https://termennetwerk.netwerkdigitaalerfgoed.nl/

NextGate Match-Metrix Terminology Registry

Реестр терминологии лабораторного оборудования

http://www.nextgate.com/

NFDI4Chem Terminology Service

Репозиторий терминологии  и онтологий по химии

https://terminology.nfdi4chem.de/ts/

NFDI4Ing Terminology Service

Собрание инженерных онтологий

https://terminology.nfdi4ing.de/ts

NFDI4Objects Terminologies

Материальное наследие человечества и окружающей среды

https://github.com/nfdi4objects/n4o-terminologies 

OCLC Termino-logy Services

 Собрание контролируемых словарей,  тезаурусов и систем предметных заголовков,

http://www.oclc.org/research/themes/data-science/termservices.html

ONIX subject scheme identifier

Контролируемые словари издательского и книготоргового  формата ONIX

https://ns.editeur.org/onix/en/27

ONKI

Финские и международные онтологии, словари и тезаурусы.  Сейчас заменен на Finto.

https://onki.fi/

onomy.org

Сайт для создания таксономий, фолксономий и других словарей для Семантической сети

http://onomy.org/

Ontobee

Сервер связанных данных для онтологий

http://www.ontobee.org/

Open Metadata Registry

Открытый реестр метаданных (ранее Реестр NSDL)

http://metadataregistry.org/

Opentheso

Бесплатное многоязычное программное обеспечение для управления тезаурусами

https://opentheso.huma-num.fr/opentheso/

Orphadatа

Наборы данных по редким заболеваниям

http://www.orphadata.org/cgi-bin/index.php/

OSSE (Open Source Registry System for Rare Diseases)

Система реестра редких заболеваний в ЕС с открытым исходным кодом

https://www.osse-register.de/en/

Phaidra Classifi-cation Server

Сервер для индексирования цифровых объектов для нескольких стран

http://vocab.phaidra.org/

PoolParty Vocabulary Hub

общедоступные таксономии SKOS и онтологии OWL, а также схемы RDF

https://www.poolparty.biz/vocabulary-hub/

PRIDE Archive - proteomics data repository

Хранилище данных протеомики, включая идентификацию белков и пептидов

http://www.ebi.ac.uk/pride/archive/

ProZ.com term search

Поиск терминов по переводным глоссариям и словарям.

http://www.proz.com/about/overview/terminology/

RDA Metadata Directory

Каталог метаданных для научных данных.

http://rd-alliance.github.io /metadata-directory/

RDA Registry

Связанные данные и представления семантической сети элементов RDA

http://www.rdaregistry.info/

Realiter

Сеть панлатинской терминологии

http://www.realiter.net/

Research Vocabu-laries Australia

Исследовательские словари Австралии

https://vocabs.ardc.edu.au/

SAS -Subject Analysis Systems  Collection

Североамериканский информационный центр KOS

http://plc.fis.utoronto.ca/resources/inforum/sas.htm

Semantic Lookup Platform

Собрание биомедицинских ресурсов,

https://semanticlookup.zbmed.de/

SIFR BioPortal

Открытая платформа  для французских биомедицинских онтологий и терминологий

http://bioportal.lirmm.fr/

SISS Vocabulary Services

интерфейс веб-пользователей  для словарей и других KOS

https://www.seegrid.csiro.au/wiki/Siss/RegisterOfVocabularies

Society of American Archivists Metadata Directory

Каталог метаданных Общества американских архивистов

https://www2.archivists.org/groups/metadata-and-digital-object-section/metadata-directory

SSHOC vocabulary service

Словари проекта «Открытое облако социальных и гуманитарных наук»

https://vocabs.sshopencloud.eu/browse/en/

Subject Schemes

Тематические схемы Службы связанных данных Библиотеки Конгресса

http://id.loc.gov/vocabulary/subjectSchemes

TaxoBank

Информация о контролируемых словарях всех типов и сложности

http://www.taxobank.org/

Taxonomy Warehouse

Портал таксономии: каталог, документация, услуги

http://www.taxonomywarehouse.com/

TemaTres

Словарный сервер с открытым исходным кодом, веб-приложение для управления  KOS

http://www.vocabularyserver.com/

TERMCAT

Центр развития и интеграции каталонской терминологии

http://www.termcat.cat/ca/El_TERMCAT/

TermCoord

Инструменты и ресурсы для работы переводчиков с терминологией и документацией

http://termcoord.eu/home/terminology-toolbox/

Termportalen

Норвежский терминологический портал

http://www.terminologi.no/

TermSciences

Терминологический портал  для объединения терминологических ресурсов

http://www.termsciences.fr/

The Alexandria Library

Ресурсы для письменных переводчиков и поставщиков языковых услуг

https://alexandria-translation-resources.com/

The Dublin Core Metadata Registry

Метаданные Инициативы Дублинского ядра и связанные с ними словари.

http://dcmi.kc.tsukuba.ac.jp/dcregistry/

The OBO Foundry

Открытые биологические и биомедицинские онтологии

http://www.obofoundry.org

Thesauri im WWW

Сервис поддержки тезаурусов  Академии прикладных наук Кёльна

http://www.fbi.fh-koeln.de/institut/labor/bir/thesauri_new/thesauri.htm

Thésauro-annuaire

Бесплатный франкоязычный тезаурус онлайн

http://www.tard-bourrichon.fr/

TIB Terminology Service

Точка доступа к терминологии  архитектуры, химии, физики, информатики, математики

https://terminology.tib.eu/ts/

TOTEM

Онлайн-реестр метаданных технической среды

http://www.keep-totem.co.uk/

UDDI

Реестр бизнес-интернет-сервисов на основе XML.

https://www.techtarget.com/whatis/definition/UDDI-Universal-Description-Discovery-and-Integration

UMBEL - Upper Mapping and Binding Exchange Layer  

Верхний уровень отображения и обмена привязками

https://en.wikipedia.org/wiki/UMBEL

UMLS -Unified Medical Language System

Единая система медицинского языка  - терминология, стандарты классификации и кодирования 

https://www.nlm.nih.gov/research/umls/

US Environmental Protection Agency Terminology Services

Терминологическая служба Агентства США по охране окружающей среды

https://iaspub.epa.gov/sor_internet/registry/termreg/searchandretrieve/glossariesandkeywordlists/search.do

USHIK Metadata Registry

Реестр метаданных Базы знаний в области медицинской информации США

https://ushik.ahrq.gov/registry.jsp

Value Encoding Schemes and Content Standards

Схемы кодирования значений и стандарты содержания (приложение к учебнику по метаданным)

http://www.metadataetc.org/book-website/readings/appendixbencodschemes.htm

VEST / AgroPortal MAP OF STANDARDS

Глобальная карта словарей для обмена данными в области продовольствия и сельского хозяйств

http://aims.fao.org/vest-registry

VEST Registry

Метаданные онтологий по сельскому хозяйству

http://aims.fao.org/vest-registry

WHO indicator registry

Реестр показателей здоровья и измерений ВОЗ

http://www.who.int/gho/indicator_registry/

xTree public

Собрание более 70 словарей по культуре и искусству

http://xtree-public.digicult-verbund.de/vocnet/

ZBW classifications

Служба тезаурусов и классификаций (ZBW – Информационный центр экономики имени Лейбница)

http://zbw.eu/beta/skosmos/

ZPID Vocabularies

Контролируемые словари Института психологии Лейбница (ZPID)  в формате SKOS

https://vocabs.leibniz-psychology.org/

 

Сведения об авторе

Антопольский Александр Борисович – доктор технических наук, профессор, главный научный сотрудник Института научной информации по общественным наукам Российском академии наук.

К оглавлению выпуска

content-analysis, конференции, проекты, Library education, information environment, библиотековедение, web-сервер

24.07.2024, 17 просмотров.