Российские ученые научили нейросеть читать древние свитки, не разворачивая их
Читать древние свитки и старинные книги, не раскрывая их, теперь умеет искусственный интеллект. Это совместный проект отечественных инженеров и экспертов Федерального исследовательского центра "Информатика и управление" Российской академии наук. Разработку уже оценили в Государственном историческом музее. О новом методе анализа текста – Антон Николаев.
Созданная российскими программистами нейросеть виртуально разворачивает и выдает на экране компьютера текст берестяных грамот – памятников древней письменной культуры Руси. По замыслу разработчиков, программа поможет сохранить подлинник от повреждений и разрушений. В качестве тестового задания используется свернутый в трубочку листок с текстом, который помещается в томограф – тоже российский. Нейросеть отделяет слои один от другого и распознает текст даже в сложных случаях. Правда, не во всех. "Это проблема слипания слоев – слоистых объектов: свитков, писем, книг. Эту задачу мы решили, и это признано мировым сообществом. Еще одна задача, которая по-прежнему требует решения, насколько мы знаем, ее полностью еще в мире никто не решил, это проблема разрыхления слоев", – сообщил зав. отделом "Зрительные системы" ФИЦ ИУ РАН, технический директор компании "Смарт Энджинс" Дмитрий Николаев.
Российская нейросеть полностью автоматическая. Еще один плюс, говорят в компании "Смарт Энджинс", программа распознает только то, что написано. Но не может реконструировать утраченные фрагменты или интерпретировать изображенное. "Вам дают результат интерпретации, а у вас нет возможности ни подтвердить, ни опровергнуть эту интерпретацию. Это чрезвычайно опасно. То есть вам дают случайный факт, а у вас даже нет инструмента выявить ошибки в программе, которые приводят к ложным интерпретациям", – пояснил Дмитрий Николаев.
В Историческом музее хранятся как раз те самые берестяные грамоты. Но их давно и успешно разворачивают вручную и читают реставраторы. Тем не менее необходимы новые инструменты исследований. Например, в такой области, как изучение древних рукописных книг. "Рукописей дошло очень мало. Они гибли от пожаров и от недомыслия, недосмотра – от всего. До нас дошли пара сотен рукописей от трех первых столетий. Даже те, которые сохранились, бывают в плохом состоянии. Мы пытаемся это преодолеть и прочесть по крайней мере то, что угасло, то, что смыто, то, что зачеркнуто", – рассказала старший научный сотрудник отдела рукописей и старопечатных книг Исторического музея Елена Уханова.
Иногда плохая сохранность – результат намеренных действий. Например, в этом сборнике с житиями святых, привезенном с Афона по приказу царя Алексея Михайловича для приведения русских богослужебных книг в соответствие с греческими, специально испорчены лица мучителей святых. "Одна из наших основных задач – это сохранность фондов. И, безусловно, исследования. И здесь нам на помощь приходит современная практика – конвергенция наук, когда мы можем сочетать в своей работе возможности как гуманитарных, так и естественных наук", – пояснила заместитель генерального директора по фондовой работе Исторического музея Марина Чистякова.
Исторический музей уже много лет использует передовые достижения российской науки. Сотрудничает с Курчатовским институтом и Институтом космических исследований. Метод виртуальной реставрации считается перспективным, поскольку сохраняет памятники культуры в неприкосновенности.