БИБЛИОТЕЧНО-ИНФОРМАЦИОННЫЕ НАУКИ: ТЕОРИЯ И МЕТОДОЛОГИЯ. АНТОПОЛЬСКИЙ А.Б. СИСТЕМЫ ОРГАНИЗАЦИИ ЗНАНИЙ: СОБРАНИЯ, РЕЕСТРЫ, СЕРВИСЫ
Введение
Системы организации знаний (Knowledge organization system, далее KOS) - относительно новый термин в библиотечно-информационной науке (LIS), заменивший в последние годы известные термины языки индексирования, информационные или информационно-поисковые языки.
Соответственно понятие KOS включает все традиционные библиотечно-библиографические средства: авторитетные файлы, классификации, таксономии, рубрикаторы, предметные заголовки, тезаурусы. Также к KOS относятся современные средства представления знаний – фреймы, семантические сети, тематические карты, графы знаний и, конечно, онтологии. Многие (но не все) авторы включают в состав KOS такие инструментально-семантические средства, как языки разметки, системы метаданных и схемы данных. Наконец, в соответствии с трактовкой Международного общества по организации знаний (ISKO) [1] к KOS относятся терминологические системы и сервисы – глоссарии, словари, справочники, базы данных. Хотя терминологические средства традиционно не относятся к LIS, содержательная связь терминологии и KOS несомненна. Заметим, что в обзорной литературе конкретные KOS часто называются словарями.
Быстрый рост числа KOS и их широкое распространение привело к появлению большого числа систем и сервисов, которые осуществляют разные услуги в области KOS, прежде всего сбор, учет, хранение, навигацию, доступ и поиск. Сами эти системы могут иметь разные названия - репозитории, архивы, банки данных и т.д. В данной статье мы будем их называть собраниями или реестрами.
В предлагаемой статье содержится аналитический обзор собраний и реестров KOS, а также сервисов в этой области. Наш анализ основан на базе данных BARTOC [2], где каталогизировано 129 реестров KOS. BARTOC описан более подробно. Эта база не включает российские реестры KOS, поэтому им посвящен отдельный раздел.
Виды собраний и реестров KOS
В Приложении приведен перечень 129 собраний (реестров) KOS. Приводится наименование каждого реестра, перевод названия, либо пояснение на русском языке и адрес домашней страницы. Перечень упорядочен по алфавиту наименований.
Описание каждого реестра в БД BARTOC включает:
- Аннотация
- Наименование
- URI
- Сервисы (API)
- Домашняя страница
- Дата создания
- Словари, доступные в данном реестре
- Тип
терминологический сервис,
хранилище терминологии
Реестры предоставляют доступ к терминологии данного KOS, либо через API (сервис терминологии), либо другими способами (различаются реестр или собрание терминологии). BARTOC включает 91 собрание или репозиторий с полным доступом к словарному содержимому, т.е. реестры, через которые доступны термины и понятия, входящие в данный KOS. Другие реестры предоставляют информацию о словарях (т.е. метаданные) вместо содержания словаря как такового. Метаданные для словарей обычно содержат как описательное содержание, так и информацию об управлении и происхождении. Реестр может содержать данные о повторном использовании логических классов и свойств в словарях.
В работе М. Цзен и Ф. Майра [13] предлагается список типов поставщиков услуг на основе собраний или реестров KOS.
Многофункциональный реестр KOS. Пример – Базовый реестр тезаурусов, онтологий и классификаций (BARTOC), подробно описанный ниже.
Поставщик индивидуальных словарей. Например, EuroVoc[1] - многоязычный тезаурус Европейского союза (ЕС). Термины на европейских языках и их сопоставления с восемью другими доступны на веб-сайте или с помощью скачивания.
Отдельное учреждение как поставщик всех словарей, подготовленных в нем. Так, Библиотека Конгресса предоставляет доступ ко всем словарным массивам за все годы, обнародованный в Библиотеке Конгресса. Например, реестр Схемы классификации включает 212 классификаций, а реестр Тематические схемы – 254 тезаурусов и других KOS.
Единый портал для национальных словарей KOS, созданных в стране. Например, финский сервис тезаурусов и онтологий FINTO позволяет как публиковать, так и просматривать десятки словарей, созданных в Финляндии. Кроме того, сервис предлагает интерфейсы для интеграции тезаурусов и онтологий в другие приложения и системы.
Портал, ориентированный на предметную область, для сбора словарей, созданных различными структурами. Например, Связанные данные культурного наследия.
Программное обеспечение, предоставляющее конечным пользователям инструменты для использования/повторного использования опубликованных словарей. Например, SKOSprovider предоставляет интерфейс, который может быть включен в приложение, чтобы позволить ему взаимодействовать с различными словарями, представленными в SKOS.
Онтология верхнего уровня, которая упрощает отображение понятий и сущностей в нескольких словарях. Например, онтология KOKO. поддерживает управление и публикацию набора взаимосвязанных приложений. Онтология Базовые словари финского языка позволяет пользователям использовать несколько онтологий как единое, совместимое, межотраслевое представление вместо отдельных онтологий. Другой пример - сервис UMBEL который предназначен для отображения онтологий и внешних словарей (OpenCyc, DBpedia, PROTON, GeoNames и schema.org) и обеспечивает связи с более чем 2 миллионами объектов Википедии.
Реестр любых словарей, опубликованных с использованием Семантической паутины. Например, на сайте LOV в настоящее время зарегистрировано более 600 словарей; все они прошли определенную проверку качества в формате связанных открытых данных. В дополнение к описательным метаданным о словаре, метаданным использования о повторном использовании свойств в словарях, административным метаданным, показывающим самые последние обновления, и техническим метаданным, касающимся выразительности с точки зрения RDF, OWL, и RDF. Подробная информация о словаре представлена с помощью статистики, такой как общее количество классов, свойств, типов данных и экземпляров.
Реестр любых продуктов связанных открытых данных, включая KOS, Например, datahub[2]. является крупнейшим реестром LOD Авторы [13] провели анализ этого реестра в 2017 г. Было обнаружено более 11 тыс. наборов связанных открытых данных, в том числе более 1000 различных KOS.
Перечень типов, выделенных М. Цзен и Ф. Майром, может быть продолжен.
Многие системы, специализирующиеся на KOS, разработали стратегии и технологии, обеспечивающие не только доступность, но и совместимость, стабильность и масштабируемость контента и приложений, которые они предоставляют. Те сервисы, которые содержат полное содержимое KOS, а также своевременно обновляемые управленческие данные по каждому компоненту, также известны как репозитории KOS. Они могут быть одноязычными или многоязычными; количество словарей KOS, содержащихся в хранилище, может варьироваться от одного до 3 тыс. и более.
Некоторые реестры собирают KOS определенного типа. Например, собрания KOS, созданные на платформе Семантической паутины. Есть реестры, включающие только KOS, представленные на языке веб-онтологий (OWL).
В последние годы многие реестры хранят собранные KOS в определенном формате, например с использованием популярного инструмента Skosmos.
Одни сервисы предоставляют только самую последнюю версию KOS, в то время как некоторые поддерживают все версии. Дополнительные функции могут быть доступны в дополнение к поиску, просмотру, отображению и навигации. Некоторые из них также позволяют сопоставлять словари или предоставляют прямые ссылки на значения данных.
Более конкретно, реестры можно разделить по типу контента, какие именно концептуальные, лексические, и/или инструментальные средства они включают:
- - Универсальные – доступ ко всем видам KOS
- - Собрание тезаурусов
- - Собрание онтологий
- - Терминологические БД и сервисы
- - Авторитетные (библиографические) KOS
- - Собрание классификаций,
- - Собрание систем метаданных
- - Инструментальные средства для создания и поддержки KOS
- - Платформы для интеграции KOS
- - Сервисы для поиска и доступа
Также реестры естественно разделить по тематическому признаку (выборочные примеры дисциплин приводятся в алфавитном порядке);
- - Библиотековедение
- - Биомедицина
- - Информатика
- - Лингвистика
- - Культурное наследие
- - Образование
- - Океанология
- - Окружающая среда
- - Сельское хозяйство
- - Социальные науки
- - Универсальные
Реестры можно разделить по статусу;
o Международные
o Общенациональные
o Профессиональные сообщества
o Для массовых пользователей
Конечно, возможны и другие основания классификации реестров.
Базовый регистр тезаурусов, онтологий и классификаций
Наиболее представительное собрание KOS, созданное при поддержке ISKO, получило название Базовый регистр тезаурусов, онтологий и классификаций (BARTOC) [2][3]. Это собрание представляет собой базу данных KOS, а также сервисов и реестров KOS. Всего BARTOC содержит описания св. 3,5 тыс. KOS, а также 129 других сервисов и реестров KOS.
BARTOC был основан Андреасом Ледлом как Базельский регистр тезаурусов, онтологий и классификаций в библиотеке Базельского университета, Швейцария. В 2020 году база данных перенесена на новую техническую инфраструктуру в Центральный офис Объединенной библиотечной ассоциации (VZG) Германии и переименована. Реализация полностью доступна как Open Source.
Основная цель BARTOC - собрать как можно больше KOS в одном месте, чтобы добиться большей наглядности, выделить их особенности, сделать их доступными для поиска и сопоставимыми, а также способствовать обмену знаниями. BARTOC включает KOS из любой предметной области, на любом языке, в любом формате публикации и с любой формой доступности. Интерфейс поиска BARTOC доступен на 20 европейских языках и предоставляет два варианта поиска: базовый поиск по ключевым словам и расширенный поиск.
Последний имеет следующие фильтры: тип KOS, язык, тематика, лицензия доступа, а также ссылка на сервис или реестр, через который доступны термины и понятия, образующие данную KOS.
Описания KOS включают следующий набор реквизитов:
- - Аннотация
- - Наименования
- - Сокращение
- - Тип KOS,
- - Тема (предмет)
- - Лицензия
- - Языки
- - Дата создания
- - URI
- - Домашняя страница
Статистика KOS по типам в базе BARTOC основана на перечне типов KOS, который был разработан в качестве основного профиля приложения Дублинского ядра Группой сетевых KOS (NKOS) на основе обзора типов KOS, составленного Марсией Цзэн [12]. Этот перечень типов приведен на табл.1.
Табл. 1. Статистика типов KOS в базе BARTOC,
№ |
Русское наименование типа KOS |
Английское наименование |
Количество KOS |
1. |
Авторитетный список имен |
Name authority list |
223 |
2. |
Географический справочник |
Gazetteer |
20 |
3. |
Глоссарий |
Glossary |
353 |
4. |
Кольцо синонимов |
Synonym ring |
1 |
5. |
Онтология |
Ontology |
723 |
6. |
Семантическая сеть |
Semantic network |
7 |
7. |
Словарь |
Dictionary |
92 |
8. |
Список |
List |
121 |
9. |
Схема категоризации |
Categorization schema |
21 |
10. |
Схема классификации |
Classification schema |
956 |
11. |
Схема предметных заголовков |
Subject heading schema |
111 |
12. |
Таксономия |
Taxonomy |
105 |
13. |
Тезаурус |
Thesaurus |
803 |
14. |
Терминология |
Terminology |
219 |
Реквизит Язык представляет собой обширный алфавитный список языков, на котором представлен KOS, На табл. 2 приводится число KOS на 10 самых распространенных языках. Нужно учитывать, что многие KOS являются многоязычными. Например, УДК представлена на 53 языках, а DDC на 13. Нужно отметить, что на русском языке имеется 81 KOS, в основном многоязычных, и в топ-10 русский язык не попал.
Табл. 2. Топ 10 языков, на которых представлены KOS
|
Язык |
Количество KOS |
1. |
Английский |
1929 |
2. |
Немецкий |
763 |
3. |
Французский |
576 |
4. |
Испанский |
486 |
5. |
Шведский |
299 |
6. |
Итальянский |
228 |
7. |
Финский |
210 |
8. |
Португальский |
197 |
9. |
Греческий |
156 |
10. |
Каталонский |
141 |
В реквизите Лицензия указан вид лицензии, на основе которой доступен данный KOS. Всего список включает около 40 видов лицензий, в том числе 13 видов Creative Commons, самые распространенные представлены на табл. 3.
Табл. 3 Наиболее распространенные лицензии доступа к KOS
Вид лицензии |
Количество KOS |
Creative Commons Attribution 3.0 |
208 |
Creative Commons Public Domain Dedication |
187 |
Open Government License 1.0 |
178 |
Creative Commons Attribution-NoDerivs 3.0 |
84 |
Creative Commons Attribution-ShareAlike 3.0 |
55 |
In Copyright (InC) |
53 |
Creative Commons Attribution-NoCommercial-ShareAlike 3.0 |
46 |
Creative Commons Attribution 4.0 |
32 |
Creative Commons Attribution-NoCommercial NoDerivs 3.0 |
17 |
W3C Document License |
16 |
Тематика. В качестве тематической классификации BARTOC использует Десятичную классификацию Дьюи (DDC). В табл. 4 приводится распределение KOS по первому уровню DDC.
Табл. 4: Распределение KOS по тематике
Код DDC |
Рубрика |
Количество KOS |
0 |
Информатика, информационные технологии, общие работы |
666 |
1 |
Философия и психология |
61 |
2 |
Религия |
56 |
3 |
Социальные науки |
823 |
4 |
Языки |
109 |
5 |
Наука |
323 |
6 |
Технология |
319 |
7 |
Искусство и досуг |
240 |
8 |
Литература |
24 |
9 |
История и география |
161 |
Нужно отметить, что при поиске по тематике в BARTOC предъявляется как поисковый только рубрики первого уровня DDC , хотя реальные объекты в системе проиндексированы глубже. При выдаче описания KOS выдается рубрика ДДК нужного уровня. Например, El Tesaurus d'Història de Catalunya. Тематика: Пиренейский полуостров и прилегающие острова (946.) Таким образом, поиск по более глубоким рубрикам возможен, если рубрика пользователю известна. KOS также индексированы дескрипторами тезауруса EUROVOC, но они не предъявляются.
Также предусмотрен поиск по предметным рубрикам Библиотеки Конгресса, но это пока не реализовано.
В целом можно отметить, что тематический поиск в BARTOC организован неудовлетворительно. Значительная часть KOS (по оценке до половины) не имеет индексов для тематического поиска.
Конечно. можно использовать простой лексический поиск по наименованию KOS, но качество этого поиска не требует комментариев.
Выводы
В настоящее время (август 2024 г.) BARTOC содержит информацию о 3,5 тыс. классификаций, тезаурусов, онтологий и других контролируемых словарях. В дополнение к улучшенной видимости и удобству поиска с помощью словарного описания, BARTOC включает все больше и больше средств для доступа к словарному контенту. BARTOC становится центром словарных сервисов для унифицированного просмотра, поиска и повторного использования понятий и их идентификаторов. Управление доступом осуществляется путем сопоставления существующих сервисов и форматов, таких как Skosmos, SKOS и пользовательских терминологических API, с общим форматом данных на основе JSON. Все методы доступны в библиотеке JavaScript, поэтому доступ к контролируемым словарям можно добавлять в другие веб-приложения без необходимости углубляться в многочисленные спецификации API.
История российских собраний КОS
Проблема создания совместимого комплекса информационных языков для Государственной системы научно-технической информации (ГСНТИ) была поставлена еще в 1960-х гг. и получила развитие во второй половине 1970-х гг. Поскольку было очевидным, что большая часть языковых средств ГСНТИ, представляют ИПЯ посткоординатного типа - тезаурусы и дескрипторные словари, то задача их совместимости, т.е. приведения их в соответствие с требованиями информационного обмена, была сформулирована как организация их согласованного ведения. В этих условиях центр тяжести разработок был перенесен на организацию эффективной системы ведения ИПЯ. Была поставлена задача и начато проектирование автоматизированной системы ведения информационных языков (АСВИЯ) [5].
К этому времени число АСНТИ, использующих ИПЯ посткоординатного индексирования с тезаурусами, возросло без малого до ста единиц. Нужно было разработать и апробировать на практике ряд методов возможно более полного автоматизированного анализа тезаурусов Государственной автоматизированной системы НТИ (ГАСНТИ) с целью создания и согласованного ведения пересечения рабочих тезаурусов. Разработанный в 1975 г. технический проект АСВИЯ включал уже помимо описания идеологии и основных проектных решений системы весьма значительный фактический и экспериментальный материал, полученный с помощью машинного анализа фрагментов реальных словарей [5].
В 1980 г. АСВИЯ была принята в эксплуатацию и в течение 5 дет был создан фонд, включающий св. 240 отечественных КОS на традиционных и машинных носителях, в том числе; информационно-поисковые тезаурусы, дескрипторные словари, рубрикаторы и классификации. Был разработан нормативный документ, регламентирующий регистрацию тезаурусов, рубрикаторов и других KOS [10]. При регистрации проводится научно-техническая экспертиза для установления целесообразности применения языкового средства в органах ГСНТИ. Экспертиза состоит в проверке соответствия рубрикаторов, тезаурусов и систем индексирования на соответствие государственным стандартам и другим нормативно-техническим документам в части их содержания, а также формы представления как в книжном виде, так и на машиночитаемых носителях. Содержание и форма представления рубрикаторов должна соответствовать ГОСТ Р 7.0.49. Зарегистрированные локальные рубрикаторы и другие языковые средства составляют информационный фонд автоматизированной системы ведения информационных языков (АСВИЯ), поддерживаемый ВИНИТИ как головным органом ГСНТИ. В период массовой разработки отраслевых систем научно-технической информации было зарегистрировано более 200 версий локальных рубрикаторов, покрывающих практически все области экономики.
Опыт функционирования АСВИЯ описан в сборнике материалов [3].
В дальнейшем с учетом опыта АСВИЯ, а также опыта автоматизированного ведения рубрикаторов реферативного журнала ВИНИТИ была разработана Система классификационных схем (СКС). Для сопоставления классификаций в единой базе данных разработаны и внедрены новые инструментальные средства установления взаимосвязей на основе аппарата отображения рубрик (MAP-технология). Эти средства основаны на реляционной модели данных и обеспечивают формальную целостность и непротиворечивость взаимных связей. Основу модели составляет теоретико-множественное представление отображения рубрики одной рубрикации на другую рубрикацию на базе общего списка квалификаторов, используемых в формулах отображения. Подробное описание СКС представлено в книге [7].
В настоящее время создана база данных СКС, включающая полный текст следующих классификаций:[4]
- - Библиотечно-библиографическая классификация (2015 г.) (ББК-2015/18)
- - Государственный Рубрикатор НТИ России (ГРНТИ)
- - Классификатор Scopus (Scopus)
- - Классификатор Web of Science (WoS)
- - Классификатор Организации экономического содействия и развития (ОЭСР)
- - Классификатор Российского научного фонда (РНФ)
- - Классификатор Российского фонда фундаментальных исследований (2019 г.) (РФФИ-2019)
- - Международная патентная классификация (2015 г.) (МПК-2015)
- - Номенклатура специальностей научных работников (2012-2017 гг.) (ВАК-2012/17)
- - Универсальная десятичная классификация (УДК)
В настоящий момент доступны приведенные выше классификаторы. Можно просматривать каждый из них в соответствии с иерархическими и прямыми связями рубрик. Функция просмотра отображений позволяет изучать смысловые связи выбранной рубрики со всеми классификаторами, представленными в СКС, а также осуществлять переходы по отображениям между классификаторами.
Кроме KOS, создаваемых в рамках библиотечно-информационной деятельности, в СССР была создана Единая система классификации и кодирования технико-экономической и социальной информации, (ЕСКК ТЭСИ), включающая множество классификаторов, применение которых регламентировано для государственных информационных систем. Описание современного состояния ЕСКК ТЭСИ можно найти в [8].
В настоящее время официальное опубликование, издание и распространение общероссийских классификаторов осуществляет Российский институт стандартизации (РСТ)[5]. Каталог РСТ включает 110 классификаторов[6]. Комплект З8 официально действующих общероссийских классификаторов содержится также на сайте «Общероссийские классификаторы»[7].
Также в России создано ряд терминологических ресурсов и сервисов, не связанных впрямую с библиотечно-информационной деятельностью. Их подробное описание можно найти в монографии «Лингвистические информационные ресурсы» [6].
Следует отметить некоторые российские проекты, направленные на представление KOS в наиболее перспективном формате - связанных открытых данных на платформе семантической паутины.
Идею интеграции нескольких тезаурусов русского языка в Семантическую паутину в облаке лингвистических связанных открытых данных реализовал Д.А. Усталов [11]. См. также [4].
Еще один российский проект преобразования традиционной KOS в семантическую паутину, конкретно, Библиотечно-библиографической классификации (ББК) в связанные открытые данные, описан в работе О. А. Лавреновой [9]. Проект основан на разработанном в Российской государственной библиотеке навигаторе по разделителям генерального систематического каталога на базе ББК.
Более подробное описание этих проектов имеется также в [6].
Заключение
Опыт развития современного научного информационного пространства знаний убедительно свидетельствует, что важное место в его формировании занимают разнообразные системы организации знаний. При этом они играют решающую роль для обеспечения функциональной совместимости информационных систем, в том числе при обмене данными или интеграции, данных. Также очень важно обеспечить повторное использование разработанных KOS, которых много создается как в России, так и за рубежом. Лучшим инструментом для этого может стать преобразование KOS в связанные открытые данные на платформе Семантической паутины.
Для решения этой задачи естественным решением было бы создание реестра KOS, практически используемых в российской библиотечной и научно-информационной деятельности. Такой реестр должен стать важным компонентом инфраструктуры Единого научного информационного пространства знаний России.
Список источников
- 1. Международное общество по организации знаний (ISKO) [Электронный ресурс]. –URL: https://www.isko.org/ (дата обращения: 15 августа 2024 г.)
- 2. База данных BARTOC [Электронный ресурс]. –URL: https://bartoc.org/ (дата обращения: 16 августа 2024 г.)
- 3. Автоматизированная система ведения информационных языков АСВИЯ : информационные материалы / ВНИИКИ ; Гос. ком. СССР по стандартам. – Москва, 1986.
- 4. Интеграция тезаурусов RussNet и YARN / И. В. Азарова, П. И. Браславский, В. П. Захаров [и др.] // Компьютерная лингвистика и вычислительные онтологии : Сборник научных статей. Труды XIX Международной объединенной научной конференции, Санкт-Петербург, 22–24 июня 2016 года. – Санкт-Петербург: Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, 2016. – С. 7-13.
- 5. Антопольский А. Б., Вайсберг А. М., Зарувинская Л. А. Принципы создания и функционирования автоматизированной системы ведения информационных языков // Научно-техническая информация. Сер. 2. 1976. № 6. - С. 8-12.
- 6. Антопольский А.Б. Лингвистические информационные ресурсы /ИНИОН РАН, Фундам. б-ка ; науч. ред Д.В. Ефременко, Москва : ИНИОН РАН, 2022. - 466 с.
- 7. Гиляревский Р.С. Рубрикатор как инструмент информационной навигации: учебное пособие / Р. С. Гиляревский, А. В. Шапкин, В. Н. Белоозеров. – М.: МГУКИ, 2008. – 239 с.
- 8. Единая система классификации и кодирования технико-экономической и социальной информации/ Большая Российская энциклопедия 2023 [Электронный ресурс]. –URL: https://bigenc.ru/c/edinaia-sistema-klassifikatsii-i-kodirovaniia-tekhniko-ekonomicheskoi-i-sotsial-noi-informatsii-5191d3?ysclid=lzl6fz659x479535149 (дата обращения: 15 сентября 2024 г.)
- 9. Лавренова О. А., Павлов В. В. Библиотечно-библиографическая классификация как традиционная система организации знаний в среде открытых связанных данных / О. А. Лавренова, // Научные и технические библиотеки. – 2017. – № 4. – С. 44-60.
- 10. Порядок экспертизы и регистрации языковых средств Государственной автоматизированной системы научно-технической информации» М.: Государственный комитет СССР по науке и технике, 1982. – 10 с.
- 11. Усталов, Д. Семантические сети и обработка естественного языка / Д. Усталов // Открытые системы. СУБД. – 2017. – № 2. – С. 46-47.
- 12. Zeng, Marcia L. Knowledge Organization Systems (KOS) // Knowledge Organization. 2008. 35, nos. 2-3. Р. 160–182.
- 13. Zeng М. Knowledge Organization Systems (KOS) in the Semantic Web: A multi-dimensional review / Marcia Lei Zeng, Philipp Mayr. // International Journal on Digital Libraries. 2019, September. DOI:10.1007/s00799-018-0241-2
Примечания
[1] Адреса домашних страниц всех реестров даны в Приложении
[2] Datahub https://old.datahub.io/dataset .
[3] Также существует бета версия в формате Skosmos https://skosmos.bartoc.org/
[4] Система классификационных схем http://rffi20.viniti.ru/Default.aspx
[5] Российский институт стандартизации (РСТ) [Электронный ресурс]. – URL: https://www.gostinfo.ru/pages/Maintask/public/
[6] Каталог Общероссийские классификаторы технико-экономической и социальной информации [Электронный ресурс]. – URL: https://www.gostinfo.ru/catalog/classiflist/?ysclid=lwag16h1h7741608050
[7] Общероссийские классификаторы [Электронный ресурс]. – URL: https://classifikators.ru/
Приложение. Перечень собраний, реестров и сервисов KOS
AberOWL ontology repository and semantic search engine |
Платформа для доступа к биологическим данным на основе онтологий |
http://aber-owl.net/#/ |
ACDH Vocabs |
Служба KOS Австрийского центра цифровых гуманитарных наук и культурного наследия |
|
agINFRA Linked Data Vocabularies |
KOS по сельскому хозяйству |
http://vocabularies.aginfra.eu/ |
AgroPortal |
Онтологии по сельскому хозяйству |
http://agroportal.lirmm.fr/ |
American Society for Indexing |
Тезаурусы, авторитетные файлы и других контролируемых словарей, отобранные пользователями |
http://www.asindexing.org/about-indexing/thesauri/online-thesauri-and-authority-files/ |
Aristotle MetaData Registry |
Платформа реестра метаданных с открытым исходным кодом |
http://www.aristotlemetadata.com/ |
Australian Bureau of Statistics |
Классификации австралийского бюро статистики и таблицы соответствия |
http://www.abs.gov.au/websitedbs/D3310114.nsf/home/MCS.ViewAllClassifications |
Australian Education Vocabularies |
KOS в сфере образования Австралии |
|
BARTOC Registry |
Базовый реестр тезаурусов, онтологий и классификаций |
http://bartoc.org/ |
BARTOC Skosmos |
Новая версия BARTOC (бета версия Skosmos) |
|
BioPortal |
Самое полное в мире хранилище биомедицинских онтологий. |
http://bioportal.bioontology.org/ |
BMICC MedPortal |
Портал медицинской терминологии, хранилище и платформа онтологий |
https://medportal.bmicc.cn/ |
CENDI Agency Terminology Resources |
доступ к онлайн-тезаурусу и другим KOS различных федеральных научных и технических агентств |
http://www.cendi.gov/projects/proj_terminology.html |
CESSDA Vocabulary Service |
словарный сервис Консорциума европейских архивов данных по социальным наукам.
|
https://vocabularies.cessda.eu/ |
CLARIN Concept Registry |
понятия, релевантные для языковых ресурсов. с постоянными идентификаторами |
https://www.clarin.eu/ccr |
Classification Schemes |
Схемы классификации Службы связанных данных Библиотеки Конгресса |
http://id.loc.gov/vocabulary/classSchemes |
coli-conc KOS Registry |
Инфраструктура управления и совместимости библиотечных KOS |
https://coli-conc.gbv.de/terminologies/ |
Conservation controlled vocabularies |
Словари связанных природоохранных данных |
https://www.ligatus.org.uk/lcd/controlled-vocabularies |
Culture Grid Vocabulary Bank |
Словарный банк контролируемых словарей, тезаурусов и терминологий |
http://culturegrid.lexaurus.net/culturegrid/ |
DANS KOSo Observatory |
KOSo (Системная обсерватория организации знаний) |
https://knoworg.org/the-dans-koso-observatory/ |
DANTE |
KOS по музейному делу |
https://api.dante.gbv.de/ |
DARIAH Vocabs Servicey |
Собрание KOS по искусству и гуманитарным наукам |
https://vocabs.dariah.eu/ |
DataHub |
Платформа управления данными от Фонда открытых знаний |
http://datahub.io/ |
Datu |
Служба тезаурусов и контролируемых словарей Высшей школы социальных наук |
|
DERI Vocabularies |
Словари, разработанные в Исследовательском институте цифрового предпринимательств |
http://vocab.deri.ie/ |
DGIWG Terminology Registry |
Терминологический реестр Рабочей группы по цифровой геопространственной информации |
https://www.dgiwg.org/resources |
Digital Archives Metadata Registry |
Реестр метаданных цифровых архивов |
https://github.com/srnsw/metadata |
DIMDI |
Официальные медицинские классификации, терминология и стандарты Министерства здравоохранения ФРГ |
http://www.dimdi.de/dynamic/de/klassifikationen/index.html |
DoD Data Services Environment |
Метаданные среды передачи данных Министерства обороны США |
https://metadata.ces.mil/dse/ |
DTU Wind Ontology viewer |
Служба KOS по ветроэнергетике |
|
EcoPortal |
Собрание семантических ресурсов по экологии и смежным областям |
http://ecoportal.lifewatch.eu/ |
eHealth Ontario Terminology Registry |
Реестр терминологии электронного здравоохранения Онтарио |
http://www.ehealthblueprint.com/en/documentation/chapter/terminology-registry |
EMBL-EBI Ontology Lookup Service (OLS) |
Собрание биомедицинских онтологий |
http://www.ebi.ac.uk/ols/ |
EU Vocabularies |
Контролируемые словари, схемы, онтологии, модели данных ЕС |
https://publications.europa.eu/en/web/eu-vocabularies |
European Register of Marine Species (ERMS) |
Таксономический список биологических видов, встречающихся в морской среде Европы, |
http://www.marbef.org/data/erms.php |
Europeana Metadata Registry |
Реестр метаданных Европеаны |
http://www.europeanaconnect.eu/results-and-resources.php?page=5#Registry |
FAIRSharing |
Стандарты данных и метаданных, связанный с базами данных и политикой в отношении данных. |
https://fairsharing.org |
Finnish Interoperability platform terminologies |
Финская платформа совместимости терминологии |
|
Finto |
Финский сервис тезаурусов и онтологий |
https://finto.fi/ |
GESIS Controlled Vocabulary Service |
Служба KOS Немецкой инфраструктуры социальных наук. |
|
Getty Vocabularies |
Словари Getty - структурированная терминология по искусству, архитектуре и др. |
https://www.getty.edu/research/ tools/vocabularies/index.html |
GFBio Terminology Server |
Сервер терминологии и онтологий по ботанике |
http://terminologies.gfbio.org/ |
Glossarissimo! |
Собрание одноязычных и многоязычных ресурсов и терминологии для письменных переводчиков |
https://glossarissimo.wordpress.com/ |
Heritage Data |
Тезаурусы и словари национального культурного наследия |
http://www.heritagedata.org/blog/ |
HeTOP |
Портал терминологии и онтологий по здравоохранению |
http://hetop.eu/hetop/ |
HIVE |
Технология связанных открытых данных (LOD), и Связанных открытых словарей (LOV) |
http://cci.drexel.edu/mrc/projects/hive/ |
I-ADOPT Catalogue of Terminologies |
Терминологии для составления описаний семантических переменных по естественным наукам |
|
ID.LOC.GOV |
Доступ к онтологиям и контролируемым словарям для библиографического описания |
https://id.loc.gov/ |
IF4IT Inventory of Taxonomies |
Инвентарь таксономий Международного фонда информационных технологий |
http://www.if4it.com/taxonomy.html |
Inspire Registry |
Доступ к реестрам пространственной информации |
http://inspire.ec.europa.eu/registry |
ISOcat |
Реестр категорий данных ISO TC37 (DCR) |
http://www.isocat.org/ |
JISC Directory of Metadata Vocabularies |
Справочник по словарям метаданных и другим KOS Объединенного комитета по информационным системам |
http://www.jiscdigitalmedia.ac.uk/guide/controlling-your-language-links-to-metadata-vocabularies/ |
KOKO- Linked Open Ontology cloud |
KOKO - это коллекция финских базовых онтологий, которые были объединены воедино. |
|
Knowledge for All |
Открытый инструмент для поиска научной литературы, обмена и доступа. |
http://www.k4all.ca/ |
KulturNav |
Открытое облачное программное обеспечение как услуга для словарей культурного наследия |
http://kulturnav.org/ |
LC Linked Data Service |
Служба связанных данных предоставляет доступ к стандартам и словарям, Библиотеки Конгресса. |
http://id.loc.gov/ |
LD4P Authority Lookup Service |
Служба поиска авторитетных данных для библиотек |
|
legivoc |
Терминологическая база данных по законодательству Евросоюза |
http://legivoc.org/ |
LIDO Vocabularies |
Терминология LIDO – облегченной информации, описывающей объекты для метаданных в хранилищах культурного наследия |
https://cidoc.mini.icom.museum/working-groups/lido/lido-overview/lido-terminology/ |
LINCS Vocabularies |
Словари сообщества образования взрослых |
|
LinDA |
Инструментарий преобразования данных в формат RDF |
http://linda.epu.ntua.gr/vocabularies/all/ |
Linked ISPRA |
Тезаурусы и онтологии ISPRA -объединенного исследовательского центра Евросоюза |
http://dati.isprambiente.it/ontologie-e-thesauri/thesauri/ |
LisTRE (Linked Thesaurus fRamework for Environment) |
Многоязычный тезаурусный фреймворк по окружающей среде |
http://linkeddata.ge.imati.cnr.it/ |
Loterre |
Терминологические междисциплинарные ресурсы |
https://www.loterre.fr/ |
LOV - Linked Open Vocabularies |
Связанные открытые словари |
http://lov.okfn.org/dataset/lov/ |
Luxembourg Service central de législation Controlled vocabularies |
Словари, контролируемые центральной службой по легислатуре Люксембурга |
http://data.legilux.public.lu/vocabulaires |
Marine Metadata Interoperability (Ontology Registry and Repository |
Совместимость метаданных в океанологии (реестр и хранилище онтологий) |
https://mmisw.org/ont/#/ |
MatPortal |
Онтология материаловедения |
https://matportal.org/ |
md:term |
Общедоступный интерфейс для доступа к контролируемым словарям в цифровом музее |
|
Metadata registry of the German Network for Educational Research Data |
Реестр метаданных Немецкой сети данных в области образования |
https://mdr.iqb.hu-berlin.de/ |
METeOR |
Австралийское хранилище стандартов метаданных для секторов здравоохранения и социального обеспечения |
http://meteor.aihw.gov.au/ |
museumsvokabular.de |
Словари, доступные в цифровом виде по музейному делу. |
http://museum.zib.de/museumsvokabular/ |
nbvok -Nasjonalbibliotekets vokabular-tjeneste |
Словарный сервис Национальной библиотеки Норвегии - контролируемые словари, представленные в виде LOD в соответствии с SKOS-онтологией. |
|
NERC Vocabulary Server |
Стандартизированные термины по океанологии и смежным областям |
https://vocab.nerc.ac.uk/ |
Network of Terms |
Собрание KOS и терминологический сервис по культурному наследию |
|
NextGate Match-Metrix Terminology Registry |
Реестр терминологии лабораторного оборудования |
http://www.nextgate.com/ |
NFDI4Chem Terminology Service |
Репозиторий терминологии и онтологий по химии |
https://terminology.nfdi4chem.de/ts/ |
NFDI4Ing Terminology Service |
Собрание инженерных онтологий |
https://terminology.nfdi4ing.de/ts |
NFDI4Objects Terminologies |
Материальное наследие человечества и окружающей среды |
https://github.com/nfdi4objects/n4o-terminologies |
OCLC Termino-logy Services |
Собрание контролируемых словарей, тезаурусов и систем предметных заголовков, |
http://www.oclc.org/research/themes/data-science/termservices.html |
ONIX subject scheme identifier |
Контролируемые словари издательского и книготоргового формата ONIX |
https://ns.editeur.org/onix/en/27 |
ONKI |
Финские и международные онтологии, словари и тезаурусы. Сейчас заменен на Finto. |
https://onki.fi/ |
onomy.org |
Сайт для создания таксономий, фолксономий и других словарей для Семантической сети |
http://onomy.org/ |
Ontobee |
Сервер связанных данных для онтологий |
http://www.ontobee.org/ |
Open Metadata Registry |
Открытый реестр метаданных (ранее Реестр NSDL) |
http://metadataregistry.org/ |
Opentheso |
Бесплатное многоязычное программное обеспечение для управления тезаурусами |
|
Orphadatа |
Наборы данных по редким заболеваниям |
http://www.orphadata.org/cgi-bin/index.php/ |
OSSE (Open Source Registry System for Rare Diseases) |
Система реестра редких заболеваний в ЕС с открытым исходным кодом |
https://www.osse-register.de/en/ |
Phaidra Classifi-cation Server |
Сервер для индексирования цифровых объектов для нескольких стран |
http://vocab.phaidra.org/ |
PoolParty Vocabulary Hub |
общедоступные таксономии SKOS и онтологии OWL, а также схемы RDF |
https://www.poolparty.biz/vocabulary-hub/ |
PRIDE Archive - proteomics data repository |
Хранилище данных протеомики, включая идентификацию белков и пептидов |
http://www.ebi.ac.uk/pride/archive/ |
ProZ.com term search |
Поиск терминов по переводным глоссариям и словарям. |
http://www.proz.com/about/overview/terminology/ |
RDA Metadata Directory |
Каталог метаданных для научных данных. |
http://rd-alliance.github.io /metadata-directory/ |
RDA Registry |
Связанные данные и представления семантической сети элементов RDA |
http://www.rdaregistry.info/ |
Realiter |
Сеть панлатинской терминологии |
http://www.realiter.net/ |
Research Vocabu-laries Australia |
Исследовательские словари Австралии |
https://vocabs.ardc.edu.au/ |
SAS -Subject Analysis Systems Collection |
Североамериканский информационный центр KOS |
http://plc.fis.utoronto.ca/resources/inforum/sas.htm |
Semantic Lookup Platform |
Собрание биомедицинских ресурсов, |
https://semanticlookup.zbmed.de/ |
SIFR BioPortal |
Открытая платформа для французских биомедицинских онтологий и терминологий |
http://bioportal.lirmm.fr/ |
SISS Vocabulary Services |
интерфейс веб-пользователей для словарей и других KOS |
https://www.seegrid.csiro.au/wiki/Siss/RegisterOfVocabularies |
Society of American Archivists Metadata Directory |
Каталог метаданных Общества американских архивистов |
https://www2.archivists.org/groups/metadata-and-digital-object-section/metadata-directory |
SSHOC vocabulary service |
Словари проекта «Открытое облако социальных и гуманитарных наук» |
|
Subject Schemes |
Тематические схемы Службы связанных данных Библиотеки Конгресса |
http://id.loc.gov/vocabulary/subjectSchemes |
TaxoBank |
Информация о контролируемых словарях всех типов и сложности |
http://www.taxobank.org/ |
Taxonomy Warehouse |
Портал таксономии: каталог, документация, услуги |
http://www.taxonomywarehouse.com/ |
TemaTres |
Словарный сервер с открытым исходным кодом, веб-приложение для управления KOS |
http://www.vocabularyserver.com/ |
TERMCAT |
Центр развития и интеграции каталонской терминологии |
http://www.termcat.cat/ca/El_TERMCAT/ |
TermCoord |
Инструменты и ресурсы для работы переводчиков с терминологией и документацией |
http://termcoord.eu/home/terminology-toolbox/ |
Termportalen |
Норвежский терминологический портал |
http://www.terminologi.no/ |
TermSciences |
Терминологический портал для объединения терминологических ресурсов |
http://www.termsciences.fr/ |
The Alexandria Library |
Ресурсы для письменных переводчиков и поставщиков языковых услуг |
https://alexandria-translation-resources.com/ |
The Dublin Core Metadata Registry |
Метаданные Инициативы Дублинского ядра и связанные с ними словари. |
http://dcmi.kc.tsukuba.ac.jp/dcregistry/ |
The OBO Foundry |
Открытые биологические и биомедицинские онтологии |
http://www.obofoundry.org |
Thesauri im WWW |
Сервис поддержки тезаурусов Академии прикладных наук Кёльна |
http://www.fbi.fh-koeln.de/institut/labor/bir/thesauri_new/thesauri.htm |
Thésauro-annuaire |
Бесплатный франкоязычный тезаурус онлайн |
http://www.tard-bourrichon.fr/ |
TIB Terminology Service |
Точка доступа к терминологии архитектуры, химии, физики, информатики, математики |
https://terminology.tib.eu/ts/ |
TOTEM |
Онлайн-реестр метаданных технической среды |
http://www.keep-totem.co.uk/ |
UDDI |
Реестр бизнес-интернет-сервисов на основе XML. |
https://www.techtarget.com/whatis/definition/UDDI-Universal-Description-Discovery-and-Integration |
UMBEL - Upper Mapping and Binding Exchange Layer |
Верхний уровень отображения и обмена привязками |
|
UMLS -Unified Medical Language System |
Единая система медицинского языка - терминология, стандарты классификации и кодирования |
https://www.nlm.nih.gov/research/umls/ |
US Environmental Protection Agency Terminology Services |
Терминологическая служба Агентства США по охране окружающей среды |
https://iaspub.epa.gov/sor_internet/registry/termreg/searchandretrieve/glossariesandkeywordlists/search.do |
USHIK Metadata Registry |
Реестр метаданных Базы знаний в области медицинской информации США |
https://ushik.ahrq.gov/registry.jsp |
Value Encoding Schemes and Content Standards |
Схемы кодирования значений и стандарты содержания (приложение к учебнику по метаданным) |
http://www.metadataetc.org/book-website/readings/appendixbencodschemes.htm |
VEST / AgroPortal MAP OF STANDARDS |
Глобальная карта словарей для обмена данными в области продовольствия и сельского хозяйств |
http://aims.fao.org/vest-registry |
VEST Registry |
Метаданные онтологий по сельскому хозяйству |
http://aims.fao.org/vest-registry |
WHO indicator registry |
Реестр показателей здоровья и измерений ВОЗ |
http://www.who.int/gho/indicator_registry/ |
xTree public |
Собрание более 70 словарей по культуре и искусству |
http://xtree-public.digicult-verbund.de/vocnet/ |
ZBW classifications |
Служба тезаурусов и классификаций (ZBW – Информационный центр экономики имени Лейбница) |
|
ZPID Vocabularies |
Контролируемые словари Института психологии Лейбница (ZPID) в формате SKOS |
Сведения об авторе
Антопольский Александр Борисович – доктор технических наук, профессор, главный научный сотрудник Института научной информации по общественным наукам Российском академии наук.
content-analysis, конференции, проекты, Library education, information environment, библиотековедение, web-сервер
24.07.2024, 17 просмотров.