Математики Петербургского университета разработали программу для исследования текстов

09 августа 2016 11:13
Первым подвергли анализу сочинение египетского географа и историка XIV - XV веков Такиюддина аль-Макризи "Описание Египта". Этот двухтомник из собрания Мичиганского университета считался более поздней копией труда аль-Макризи. Исследование петербургских математиков принесло неожиданный результат.

Американские ученые из Йельского университета рассказали, как продлить жизнь с помощью книг. Для этого они наблюдали за образом жизни почти трёх с половиной тысяч людей старше пятидесяти лет. Так вот, те, кто читал больше трёх с половиной часов в неделю, жили на два года дольше, чем те, кто не читал вовсе.

Свой метод, как читать, предложили математики Санкт-Петербургского университета. Они разработали программу для исследования текстов - как современных, так и старинных. Первым подвергли анализу сочинение египетского географа и историка XIV - XV веков Такиюддина аль-Макризи "Описание Египта". Этот двухтомник из собрания Мичиганского университета считался более поздней копией труда аль-Макризи. Исследование петербургских математиков принесло неожиданный результат.

Идея исследовать рукопись Аль-Макризи принадлежит востоковеду с мировым именем Александру Кнышу. Профессор Мичиганского университета, он возглавил в своей альма-матер в Петербурге новую научную лабораторию по анализу и моделированию социальных процессов. Работы Аль-Макризи представляют для ее сотрудников особый интерес. Ведь этот египетский автор, живший в XV веке, уделял большое внимание именно социальной стороне истории. Для исследования аспиранты Александр Сенов и Андрей Бояров разработали "умный" алгоритм, действующий по принципу нейронной сети человеческого мозга. 

"Вот эти самые повороты, наклоны, штрихи, ширина и тому подобное - это как некий черный ящик, которому мы скармливаем примеры. Он на основании этих примеров обучается, сам строит какие-то логические правила и потом их применяет", - комментирует  аспирант Санкт-Петербургского государственного университета Александр Сенов.

Оранжевым цветом выделены куски текста, которые с очень большой долей вероятности вышли из-под пера самого Аль-Макризи. Кстати, исследователи говорят, что перенастроить свою программу могут для изучения любого рукописного текста.

"Такой подход вполне применим для других языков. Но для этого нужно подготовить определенную базу обучения", - говорит аспирант Санкт-Петербургского государственного университета  Андрей Бояров.

Сотрудники отдела рукописей библиотеки Академии наук считают, что метод петербургских математиков представляет несомненный интерес. Хотя уж они-то точно знают, как непросто установить истину, когда дело касается средневековых текстов.

"Средневековая литература является компилятивной по своему характеру. То есть то, что сейчас расценивается как плагиат, тогда считалось достойным дополнением для текста", - говорит заведующая отделом рукописей библиотеки Российской академии наук, доктор исторических наук Мария Корогодина. 

А такая, казалось бы, индивидуальная особенность, как почерк, вносит в труд исследователей еще больше путаницы.

В средневековых рукописях стремились стандартизировать свой почерк, сделать его приближенным к идеалу. Кроме того, возникала мода на различные украшения - завитушки, особые начерки, красивым способом написанные те или иные буквы. И профессиональный писец, увидев новую очень красивую букву, заимствовал ее и начинал использовать", - комментирует заведующая отделом рукописей библиотеки Российской академии наук, доктор исторических наук Мария Корогодина. 

Специалисты уверены, что с развитием новейших технологий нас ждет еще немало открытий. 

Новости культуры