ИНТЕРВЬЮ. АЛЕКСАНДР АНТОПОЛЬСКИЙ: «СФЕРА НАУЧНОЙ ИНФОРМАЦИИ ДОЛЖНА ПРЕВРАТИТЬСЯ В ИНФРАСТРУКТУРУ ЦИФРОВОЙ НАУКИ» [Интервью главного редактора журнала «Культура: теория и практика» Н.В. Лопатиной с А.Б. Антопольским]

В 2023 году отметил свой юбилей выдающий российский ученый, доктор технических наук, профессор, главный научный сотрудник Института научной информации по общественным наукам Российском академии наук Александр Борисович АНТОПОЛЬСКИЙ. К этому событию приурочено интервью юбиляра с главным редактором электронного научного журнала «Культура: теория и практика» Н.В. Лопатиной.

 Н. Лопатина. Уважаемый Александр Борисович, редакционная коллегия и читатели электронного научного журнала «Культура: теория и практика» хотели бы поздравить Вас со знаменательной датой и, пользуясь случаем, задать несколько вопросов о Ваших исследованиях, представляющих особый интерес для нашего научного сообщества.

   Вопрос первый и самый актуальный: цифровая гуманитаристика как научная дисциплина, которая уверенно занимает должное место в современной науке, но довольно медленно встраивается в её официальную структуру. Как Вы думаете, почему современные российские гуманитарные и социальные науки настороженно относятся к новому этапу конвергенции точного и гуманитарного знания?

А.Б. Антопольский.  Благодарю за поздравления!

    Начнем с того,  что современная организация науки и научной инфосферы вообще очень плохо реагирует на современные вызовы и тенденции. Возьмите, например, научную информационную инфраструктуру. Какой вид она приобретает, скажем, в Евросоюзе, и как она выглядит в России? Разрыв, к сожалению, впечатляющий. Это относится и к цифровой гуманитаристике.

   Сегодня в мире уже около тысячи научных и образовательных центров объявили о своей принадлежности к этой дисциплине. В России эти центры можно перечислить на пальцах одной или двух рук. Хотя в России проектов этого направления довольно много – и в институтах памяти, и в академических учреждениях, но большинство разработчиков не знает, что «говорит прозой». Многие просто привыкли жить в своей узкой профессиональной среде и не хотят знать, что делается у соседей в смежных областях. Особенно это касается разработчиков информационных систем библиотек,  архивов, музеев.

    По мере развития компьютерных приложений и информационных систем в филологии, истории, социологии, философии и других социогуманитарных науках, а также в институтах памяти, очевидным образом проявились общие методы, ресурсы, инструменты, а затем и специализированные организации, обслуживающие эти приложения, то есть информационная инфраструктура цифровой гуманитаристики. На этой основе возникли журналы, конференции, ассоциации. Таким образом, цифровая гуманитаристика организационно оформилась в мире как самостоятельная дисциплина.

   Конечно, это – прикладная дисциплина, собственной теоретической базы у нее нет. Но по мере развития появились и специфические задачи, например, в корпусной лингвистике, стилометрии. В свою очередь, цифровые гуманитаристы ставят новые задачи перед IT-индустрией. Возьмите, например, новый сервис Яндекса по распознаванию рукописных текстов.

Н. Лопатина. Какие научные задачи и исследовательские профили Вы считаете на сегодняшний день приоритетными для цифровой гуманитаристики?

А.Б. Антопольский. Думаю, что самыми актуальными являются именно практические задачи.

   Например, у нас нет фонда открытых программных продуктов по анализу текстов, массивов документов, социальных сетей и организации, которая бы поддерживала такой фонд. Актуальной задачей, конечно, является и создание русскоязычной онтологии, которую можно создавать только коллаборативно. Очень нужны репозитории, на основе которых нужно решать задачи валидации и оценки научных ресурсов. Примером может служить проект К. Маслинского по репозиторию филологических данных в Пушкинском Доме.

   Много интересных результатов обещает и применение методов искусственного интеллекта. Но, конечно, центральным направлением должна быть задача интеграции информационных ресурсов науки и образования в единое российское электронное пространство знаний (ЕРЭПЗ). Эта задача еще в 2014 г. в правительственных документах была поставлена как перспектива развития Национальной электронной библиотеки в коллаборации ее участников, однако, позже ее решение было фактически свернуто. Хотя, на мой взгляд, создание ЕРЭПЗ должно стать целью общегосударственной программы. Подробнее этот вопрос освещен в книге «Научная информация и электронное пространство знаний». [1]

Н. Лопатина. Можем ли мы сегодня говорить о значимых достижениях цифровой гуманитаристики, тех самых, которые позволяют решить важные задачи организации и выполнения научных исследований?

А.Б. Антопольский. Примеров можно привести много. Из мировых можно назвать стандарты и методики TEI (Text Encoding Initative) по цифровому представлению текста. На этой основе выполнено множество (свыше 200) проектов. А в России на базе TEI появились так называемые «семантические издания» – очень интересные проекты Высшей школы экономики и других организаций-разработчиков. Можно упомянуть и проекты по TEI В.П. Захарова в СПбГУ.

Н. Лопатина. С работами каких исследователей цифровой гуманитаристики Вы рекомендуете познакомиться нашим читателям в первую очередь?

А.Б. Антопольский. Классическими работами для дисциплины можно считать коллективные монографии A Companion to Digital Humanities (2004) [2] и A New Companion to Digital Humanities (2016) [3]. Их обзор на русском языке можно найти в моей с Д. Ефременко книге Инфосфера общественных наук (2017) [4].

По цифровой филологии можно рекомендовать сборник интервью И.А. Пильщикова [5]. По цифровой истории – это, конечно, журнал Историческая информатика, который издается под редакцией Л.И. Бородкина – единственное российское периодическое издание по цифровой гуманитаристике. Интересный обзор цифровых аудиовизуальных архивов подготовила Ю.Ю. Юмашева [6].

   Сейчас под редакцией А.Ю. Володина готовится коллективная монография по состоянию цифровой гуманитаристики в мире и России, ее выход планируется в конце года. А вообще мировой поток литературы очень большой!

Н. Лопатина. Возможно ли дать конкретные рекомендации историкам, искусствоведам, социологам относительно тех цифровых инструментов, которые должны быть включены в их творческие лаборатории?

А.Б. Антопольский. Конечно, конкретные рекомендации по цифровым инструментам – это не для рамок интервью. Достаточно назвать их количество – в популярном каталоге инструментов цифровой гуманитаристике TAPOR (https://tapor.ca/home) представлено свыше 1500 инструментов. Там же можно найти их классификацию по многим параметрам, в том числе по области применения, статусу, доступности и др.

Н. Лопатина. Лингвистические информационные ресурсы как предмет цифровой гуманитаристики рассмотрены в Вашей новой, очень интересной книге [7]. Какие научные и практические задачи в этом секторе исследования Вы ставите на приоритетные позиции?

А.Б. Антопольский. Если исходить из зарубежного опыта, то для лингвистических ресурсов наиболее актуальным являются коллаборация и интеграция ресурсов, актуализация и поддержка их в открытом доступе. Для этого наиболее подходящей технологией являются связанные открытые данные (LOD). Я недавно опубликовал обзор по применению этой технологии [8].

Н. Лопатина. Какие проблемы документирования исчезающих языков, архивирования языкового разнообразия представляются Вам на сегодняшний день наиболее сложными: теоретико-методологические, информационно-технологические или организационные?

А.Б. Антопольский. Что касается российской практики, то она гораздо скромнее, чем зарубежная. За рубежом эти исследования ведутся более широким фронтом, есть международные программы и ассоциации, множество проектов и ресурсов. Я могу назвать лишь один действующий такой проект, правда, очень качественный – это проект LINGVODOC по уральским и алтайским языкам. Этот проект далеко не покрывает всю проблематику по исчезающим языкам России.

Н. Лопатина. Терминологический менеджмент в гуманитарных науках – это перспективное или уязвимое направление исследований и разработок?

А.Б. Антопольский. Я достаточно скептически отношусь к терминологическому менеджменту. Многолетние усилия по разработке терминологических стандартов дали, по-моему, ничтожный результат; эти стандарты почти никто не применяет.

Н. Лопатина. Следующий блок вопросов касается цифровой инфраструктуры науки. Насколько мы готовы к комплексному рассмотрению ресурсов, лингвистических средств, цифровых инструментов работы с данными, искусственного интеллекта? Или целесообразно сегодня сохранение дискретного подхода, в котором научное творчество, интеллектуальная деятельность и ее результаты сами по себе, а информационные ресурсы, библиотечно-информационная деятельность и аналитические инструменты сами по себе?

А.Б. Антопольский. Нынешнее положение я считаю неудовлетворительным.

Задачами цифровой гуманитаристики в институтах памяти должны быть не столько развитие собственных технологий, сколько обслуживание науки и образования. Для этого нужно внимательно изучать потребности ученых в тех или иных инструментах, услугах и ресурсах и именно их и предоставлять. Я это формулирую так: сфера научной информации, включая институты памяти, должна превратиться в инфраструктуру цифровой науки. Это верно для всей науки и для социогуманитарной также.

Н. Лопатина. Если речь пошла об информационных ресурсах, то несколько вопросов на эту тему. Проблема классификации информационных ресурсов: сохраняется ли она как общетеоретическая проблема информатики или можно считать её решённой? Либо классификации потеряли смысл в качестве теоретического инструмента? Вопрос не праздный: если мы посмотрим паспорта научных специальностей, для которых информационные ресурсы составляют объектно-предметный комплекс, то отметим отсутствие этой научной проблемы в представленных экспликациях.

А.Б. Антопольский. Существующие паспорта специальностей с этой точки зрения уже устарели. Для многих наук информационные ресурсы являются не только источником, но и главным результатом исследований. Они должны поддерживаться, в том числе, с помощью грантов. Считаю большой ошибкой РНФ, что гранты на информационные ресурсы сейчас впрямую не выделяются.

Н. Лопатина. Информационные ресурсы социально-гуманитарных наук, инфосфера общественных наук: каковы на сегодняшний день границы этого мультиотраслевого информационного массива? Имеем ли мы дело только с публикациями либо происходит агрегация знаний и данных разных форм существования как новый уровень электронного пространства научных знаний?

А.Б. Антопольский. Конечно, доля традиционных публикаций в информационном пространстве науки заметно сокращается, но не в абсолютных величинах. Возрастает доля непубликуемых материалов, дата-сетов, промежуточных результатов исследований, программных продуктов и других информационных объектов. А с агрегацией разнородных данных - вопрос сложный. Цифровые гуманитаристы эти вопросы поднимают, а традиционные библиотекари, архивисты и музейщики – нет. Я уже говорил, что эта задача должна была стать мейнстримом в рамках единого российского  электронного пространства знаний.

Н. Лопатина. И следующий вопрос закономерен: интеграция информационных ресурсов науки, агрегируемых и генерируемых различными организациями – реальность или по-прежнему зона развития без ясной стратегии?

А.Б. Антопольский. Стратегии, очевидно, нет. У вновь созданного Российского центра научной информации (РЦНИ) в уставе прописано методическое руководство научными банками данных, но за год его существования ни одного действия в этом направлении мы не видели.

Н. Лопатина. В этом контексте не могу не затронуть вопрос интеграции ресурсов библиотек, архивов, музеев: насколько сегодня решены вопросы теории и практики, которые ставились 10 лет назад?

А.Б. Антопольский. Пока мы на том же этапе. Реально интеграцией занималась Президентская библиотека, но ее опыт следует признать неудачным. Решение вопросов интеграции на основе библиографических стандартов – это тупиковый путь. Я не знаю последних результатов, но еще недавно из 6 млн. отсканированных документов Российского государственного исторического архива каталогизировано в Президентской библиотеке было несколько десятков тысяч. Это несерьезно. Интеграция возможна на платформе связанных открытых данных, но стратегией в России это пока не стало. Хотя не могу не отдать должное энтузиазму Б.Р. Логинова, главного адепта технологии LOD в стране, по крайней мере, для библиотечной отрасли. Других интеграционных проектов институтов памяти в России я не знаю, а за рубежом их очень много.

Н. Лопатина. В сегодняшнем нашем интервью мы идем в обратной последовательности от постановки актуальных задач к оценке результатов прошлых лет в ракурсе сегодняшнего состояния информационной сферы. И следующий вопрос об Информрегистре. Можем ли мы сегодня определить его историческую роль в становлении информационной инфраструктуры или еще рано это делать?

А.Б. Антопольский. Информрегистр сыграл полезную роль в 90-х и нулевых годах, в попытке комплексного подхода к проблемам информационных ресурсов, по крайней мере, в части их учета, классификации и попыток оценки. Позже, будучи переведенным в состав Роскомнадзора, он эти функции потерял. В какой-то момент многие задачи по ресурсам пыталась решать Информкультура, возглавляемая И. Бегтиным. Правда, в центре его интересов были не научные, а государственные информационные ресурсы. Сейчас функции организации научных информационных ресурсов по идее должен выполнять РЦНИ, но пока не выполняет.

Н.Лопатина. Оглядываясь назад, в информационную историю общества, направленность, методологические приоритеты, дух, настроение, события какого периода развития информационных наук вспоминается с наибольшим удовольствием?

А.Б. Антопольский. Конечно, это были 1960-1970-е гг. Тогда было много энтузиазма, новых идей. Создавались многие организации информационного профиля, ГСНТИ в целом, вообще наша страна была на мировом уровне. Сейчас Россия, к сожалению, очень отстает в этой сфере.

Н.Лопатина. А если заглядывать вперёд, в будущее, какие научные планы Вы строите сегодня?

А.Б. Антопольский. За всю страну говорить не берусь, ситуация очень непростая. По-моему, прорывов в нашей области ждать не приходится. Что касается лично меня, сейчас я участвую в двух проектах. Во-первых, это справочно-информационная система по цифровой гуманитаристике, которую ИНИОН делает вместе с Сибирским федеральным университетом. Во-вторых, это «Партархив» - информационная система по политическим партиям и деятелям новой России, которая стоит в планах ИНИОН.

Н.Лопатина. От имени всех наших читателей благодарю Вас, Александр Борисович, за внимание к нашему журналу и интересный разговор!

СПИСОК ИСТОЧНИКОВ

  1. 1. Антопольский А. Б. Научная информация и электронное пространство знаний / ИНИОН РАН, Фундам. б-ка ; науч. ред. Д.В. Ефременко. – Москва : Институт научной информации по общественным наукам РАН, 2020. – 252 с.
  2. 2. A Companion to Digital Humanities /Edited by Susan Schreibman, Ray Siemens, John Unsworth. – Blackwell Publishing Ltd., 2004. – 640 p.
  3. 3. A New Companion to Digital Humanities /Edited by Susan Schreibman, Ray Siemens, John Unsworth. – John Wiley & Sons, 2016. – 592 p.
  4. 4. Антопольский, А. Б. Инфосфера общественных наук России / А. Б. Антопольский, Д. В. Ефременко. – Москва-Берлин : ООО "Директмедиа Паблишинг", 2017. – 678 с.
  5. 5. Пильщиков И.А. Семь бесед о филологии и Digital Humanities: Интервью и дискуссии (2015-2011)/ И.А. Пильщиков; общ ред и сост. В.С. Полиловой – М.; Изд-во Московского университета, 2022 – 190 [2] с.
  6. 6. Юмашева Ю.Ю. Цифровая трансформация аудиовизуальных архивов. Аудиовизуальные архивы онлайн. - Москва-Берлин, Директ-Медиа; 2020 – 599 с.
  7. 7. Антопольский А.Б. Лингвистические информационные ресурсы / Науч. редактор Д.В. Ефременко. – Москва : Институт научной информации по общественным наукам РАН, 2022. – 464 c.
  8. 8. Антопольский А.Б Связанные открытые данные в цифровой гуманитаристике // Научно-техническая информация. Сер. 2. Информационные процессы и системы. – 2022.  – № 5. – С. 23-30.

 СВЕДЕНИЯ ОБ АВТОРАХ

 Антопольский Александр Борисович – доктор технических наук, профессор, главный научный сотрудник Института научной информации по общественным наукам Российском академии наук.

 Лопатина Наталья Викторовна – доктор педагогических наук, профессор, главный редактор сетевого издания «Электронный научный журнал «Культура: теория и практика», заведующий кафедрой библиотечно-информационных наук Московского государственного института культуры.

 ИЛЛЮСТРАТИВНЫЙ МАТЕРИАЛ

 Фотографии размещены с разрешением правообладателей. 

К оглавлению выпуска

интервью

19.08.2023, 268 просмотров.