Приложение для оцифровки и анализа тибетских текстов разработали в Новосибирске
Платформу для распознавания, оцифровки и анализа буддийских текстов на тибетском языке создала студентка Новосибирского университета. В основе приложения – технология искусственного интеллекта. Сервис будет способствовать сохранению тибетского письменного наследия. О новой разработке – Анастасия Путинцева.
Тибетский язык – ключ к главным книгам буддизма. Это не только религия. Плюс к пониманию истории, традиций. Важно, говорит священнослужитель, чтобы тексты были доступны всем.
"Люди будут понимать. Не молясь, лоб расшибать, а смыслово будут понимать, о чем священнослужитель молится, о чем думать", – пояснил лама Новосибирского дацана Очир Базаров.
А этот огромный фонд книг на тибетском языке собран в Улан-Удэ. Рукописи с уникальными сведениями о философии, религии, медицине, истории, искусстве. Многие до сих пор не переведены на бурятский и русский. Привозили их в российский центр буддизма еще сотни лет назад разные люди. В конце XIX – начале XX века разведчик-нелегал Гомбожаб Цыбиков под видом буддийского монаха проник в тибетский город Лхасу. Там он собирал различную информацию. В том числе привез оттуда книги на тибетском языке. Выглядели листочки примерно так. Сегодня они все хранятся в определенных условиях. Но важно всё это сохранить и передать потомкам.
Такие книги называют потхи. Эти стопки узких, продолговатых, тончайших страниц ничем не скреплены. Сакральные тексты на них начертаны прописными буквами. Лингвист Анна Мурашкина помогает сберечь уникальные тексты и расширить доступ к ним. За два года студентка освоила систему тибетского языка – особенности написания букв, предложений – и создала электронное приложение для оцифровки текстов.
"Тибетский язык очень сильно отличается от любых индоевропейских языков. У него нет привычного нам деления на слова с помощью пробела. Слова делятся только по значению. У них есть интересные знаки препинания, которые отделяют мысль", – рассказала студентка Новосибирского государственного университета Анна Мурашкина.
Для расшифровки подойдет любая фотография или скан страницы с текстом. За 15 секунд прописные литеры превращаются в печатные тибетские. А для тех, кто не знает язык, программа прописывает звучание слов на латинице. Теперь тексты легко копировать, читать и переводить. Лингвисты планируют научить приложение автоматически переводить документы на разные языки. Это поможет ученым избавиться от рутины и сохранить на века уникальные тексты.