Сергей Стиллавин и его друзья История Большого театра. Оцифровка исторических архивов Большого театра
Персоны
С.СТИЛЛАВИН: У нас в этом часе не традиционный «Большой тест-драйв», что мы привыкли делать с вами по понедельникам, а сегодня у нас совершенно специальные гости. И вы уже из этого ролика небольшого аудио, может быть, что-то успели уловить, а, если не успели, тогда Фекла, наша дорогая коллега Фекла Толстая, Фекла, доброе утро.
Ф.ТОЛСТАЯ: Доброе утро.
С.СТИЛЛАВИН: С Феклой мы виделись чуть ли ни год назад последний раз.
Ф.ТОЛСТАЯ: Когда читали «Войну и мир» все вместе, телеканал «Культура» и радиостанция «Маяк», это прекрасный был проект.
С.СТИЛЛАВИН: Да, он был, кстати, поощрен, насколько ты помнишь.
Ф.ТОЛСТАЯ: Да, да.
С.СТИЛЛАВИН: С чем тебя и поздравляем. И сегодня Фекла пришла не одна. Иван Бодягин у нас сегодня в студии. Иван, доброе утро.
И.БОДЯГИН: Здравствуйте.
С.СТИЛЛАВИН: Иван вице-президент компании ABBYY. Но, товарищи, пока что загадка для обывателя, во-первых, почему вы вместе, я прежде вас не видел. Петра Фадеева я еще могу представить, на месте которого ты сейчас сидишь.
Ф.ТОЛСТАЯ: Да, слушай, я сижу, и задница горит, честно говоря, потому что я сижу ровно на том месте, на котором всегда сидит Петя, мой добрый партнер, с которым мы в этой студии целый год вместе отработали, но, правда, давно уже это было. Мне очень приятно быть здесь с Иваном, потому что Иван представляет компанию, которую я давно очень искренне люблю, это замечательная российская компания, которая известна по всему свету, и многие считают, что это какая-то гигантская западная компания. На самом деле, все…
С.СТИЛЛАВИН: Иван достаточно компактный, slim, говоря по-английски.
Ф.ТОЛСТАЯ: Меня связывает очень хороший опыт работы с этой компанией. Я просто в двух словах скажу, что три года назад музей Толстого, в котором я служу, обратилась к компании ABBYY с предложением помочь нам оцифровать 90-томное собрание сочинений Толстого.
С.СТИЛЛАВИН: Слушай, я тоже теперь буду говорить: «Я служу на «Маяке». Мне нравится.
Ф.ТОЛСТАЯ: Нет, служат в театре, служат в музее, на «Маяке» не знаю. Ну, представь себе, что я пришла работать в музей и говорю: «А где вот скажите, пожалуйста, в интернете я не могу найти собрание сочинений Толстого?» Мне говорят: «Да как-то мы не знаем» Я говорю: «Ну, подождите, я новый человек, просто наверняка где-то должно быть, но где?» Оказалось, что нет. Ну, как можно работать с наследием великого писателя, когда нет в интернете, недоступно все, что, самое главное его собрание сочинений. Мы обратились в компанию ABBYY, и компания ABBYY к моему большому удивлению и радости сказала: «Мы вам поможем, мы вам все сделаем». И с помощью главных технологий ABBYY, есть такая программа FineReader, которая распознает тексты и из картинки делает, собственно, текст.
С.СТИЛЛАВИН: Файл.
Ф.ТОЛСТАЯ: Да. Мы открыли такой волонтерский проект, который называется…
С.СТИЛЛАВИН: Приятно с Феклой работать, все сама говорит.
Ф.ТОЛСТАЯ: Мы открыли такой волонтерский проект, который назывался «Весь Толстой в один клик» и призвали, ну, просто людей нам помочь.
С.СТИЛЛАВИН: Это после проекта нашего вот этого телевизионного?
Ф.ТОЛСТАЯ: Нет, это было еще несколько лет назад, это было, по-моему, 2,5 года назад. И, знаете, тут, когда мы открывали этот проект, были самые разные высказывания. Многие высказывали скепсис и говорили: «Ну, что, кому это нужно вычитывать тексты, это же не развлечение, это же вы за это не даете никакие ни деньги, ни бонусы, зачем людям этим заниматься?» А я как-то так самонадеянно говорила: «Ну, знаете, что, в нашей стране с нашей великой культурой, если не найдется несколько сот человек, тогда вообще, пиши, пропало».
С.СТИЛЛАВИН: А тебе не пытались говорить: «Вот ты Толстая, ты и сиди и вычитывай».
Ф.ТОЛСТАЯ: Особенно, учитывая, что Толстых очень много, и если вы все, Толстые, сядете.
С.СТИЛЛАВИН: Да, да, целый корректорский отдел наберется.
Ф.ТОЛСТАЯ: То тогда все сами и сделаете. Но, слушай, каково же было наше удивление, когда и у нас какой-то был такой немножко бизнес-план, вот это мы сейчас сделаем через несколько месяцев, мы покажем первый том, через год покажем еще что-то. Все рухнуло просто сразу, потому что несколько тысяч человек, прибежали с огромной, ну, условно говоря, прибежали, потому что речь идет об интернете, и все можно делать, не выходя из дома, и буквально за две недели прочли 90 томов.
С.СТИЛЛАВИН: За две недели?
И.БОДЯГИН: Первый этап был закончен за две недели.
Ф.ТОЛСТАЯ: Так что я храню самые-самые лучшие воспоминания о сотрудничестве. И в этом году мы с компанией ABBYY решили предпринять подобный проект, воодушевившись успехом толстовского, но, мне кажется, что это даже интересней. Речь идет о гигантском и невероятно интересном архиве Большого театра, который хранится в музее Большого театра, это собрание афиш, программок, фотографий, ну, там есть еще и много других интересных вещей, и костюмы, и эскизы декораций и так далее. Но речь идет о получении информации именно из программок и афиш, для того чтобы составить такую энциклопедию жизни Большого театра, и чтобы в результате этой работы можно было узнать, кто когда выходил в каких партиях, а вот в какой первой партии вышла на сцену Майя Михайловна Плисецкая, а когда Шаляпин.
С.СТИЛЛАВИН: Есть такая партия.
Ф.ТОЛСТАЯ: А когда Шаляпин, и в каких ролях.
С.СТИЛЛАВИН: Так, Фекла, мы сейчас об этом поговорим. Все-таки Иван, он такой интеллигентный, культурный мужчина, молчит, это приятно. Вань, еще раз, доброе утро.
И.БОДЯГИН: Доброе утро еще раз.
С.СТИЛЛАВИН: О компании чуть-чуть расскажи нам, поскольку ты у нас в гостях сегодня.
И.БОДЯГИН: Мы занимаемся много, чем, ну, в частности, основное направление нашей деятельности это распознавание текстов.
С.СТИЛЛАВИН: Ты начинал обучение на криптографическом факультете КГБ?
И.БОДЯГИН: Я? Нет, что вы.
С.СТИЛЛАВИН: Минская школа.
И.БОДЯГИН: Я скромный физик.
С.СТИЛЛАВИН: Ну, Касперский так начинал.
И.БОДЯГИН: Ну, Касперский, не всем же Касперским, скромнее надо быть. Мы извлекаем информацию из текстов, переводим его во всякий машиночитаемый вид и таким образом делаем ее доступной.
С.СТИЛЛАВИН: Вы были пионерами вот в этом деле?
И.БОДЯГИН: Ну, не совсем пионерами, но в каком-то смысле, да, мы занимаемся этим больше 30, меньше все-таки 30 лет, но, в общем, около того. И, да, мы были одной из первых компаний в мире, которая этим стала заниматься, и, в общем, мы до сих пор, без ложной скромности, да, мы лучшие.
С.СТИЛЛАВИН: И сегодня вы не только же в России работаете?
И.БОДЯГИН: Конечно, да, у нас 16 офисов по всему миру в разных странах, включая Австралию, Америку, Канаду, Японию.
С.СТИЛЛАВИН: Эти технологии, они, где наиболее задействованы? Требуются кому, ну, кроме Феклы и ее бизнес-плана?
И.БОДЯГИН: Ну, на самом деле, спектр применения очень и очень широкий. Ну, основное это, конечно, всякий бизнес, когда нужно различного рода договора, документы и прочее вот это вот.
С.СТИЛЛАВИН: И эта система, она расшифровывает и человеческий почерк?
И.БОДЯГИН: Ну, с человеческим почерком сложнее. Мы умеем работать с человеческим, с рукописным текстом, но в довольно ограниченных сценариях, например, когда, если это какая-нибудь форма, то есть заполненная форма, а не просто произвольный текст, тогда да, тогда мы это поддерживаем.
С.СТИЛЛАВИН: Ну, в основном, это соответственно какие-то тексты, книги можно оцифровывать.
И.БОДЯГИН: Книги, журналы, газеты, визитки, чеки, вот это все.
Т.КЕРБИ: Были ли какие-нибудь моменты со сложностью со старыми буквами потерянными?
И.БОДЯГИН: Да, конечно, потому что каждый, там сложность в том, что каждый шрифт нужно подбирать и настраивать отдельно и, естественно, старые шрифты это отдельные работы, которые нужно поддержать. И, в частности, мы поддерживаем старославянский, мы поддерживаем готику, то, чего мало, кто делает вообще.
С.СТИЛЛАВИН: Готично. Ну, вот Фекла нам обрисовала ситуацию вашего сотрудничества. Как с твоей стороны это выглядело все?
И.БОДЯГИН: Ну, как, во-первых, это красиво.
С.СТИЛЛАВИН: Как это произошло?
И.БОДЯГИН: То есть мы, это, на самом деле, фантастическое чувство, это можно сравнить с просмотром, не знаю, можно футбольный матч по телевизору смотреть, а можно на стадионе. И вот эти эмоции, когда вживую, когда действительно всем миром делать какое-то большое дело, это очень интересно, очень увлекательно, и, в общем, красиво.
С.СТИЛЛАВИН: Иван, вы романтик? Я немножко о конкретике спрашивал, как пришла Фекла в офис.
И.БОДЯГИН: Ну, как пришла, пришла в офис сказала, а почему бы не сделать.
С.СТИЛЛАВИН: Я правильно понял, Фекла, что не существовало цифрового как бы формата всего того, что Толстой написал, вообще не было?
Ф.ТОЛСТАЯ: Не существовало. Потому что есть самое полное собрание сочинений 90-томное и благодаря компании ABBYY и, главное, благодаря нескольким тысячам…
С.СТИЛЛАВИН: За две недели.
Ф.ТОЛСТАЯ: Надо сказать, что чуть больше, конечно, это заняло времени, потому что и это тоже мне очень симпатично в позиции компании ABBYY, потому что ABBYY говорит: «Смотрите, у нас есть программа, которая распознает, но мы должны ее проверить. Раз проверить, два проверить, три проверить. Потому что как бы мы почти волшебники, но все-таки нет».
И.БОДЯГИН: Да, все еще очень великий шанс, что есть ошибка, что может быть ошибка, что, ну, действительно сложная задача.
С.СТИЛЛАВИН: То есть надо все вычитать.
Ф.ТОЛСТАЯ: Надо все вычитать, да. И вот сейчас мы открыли буквально на прошлой неделе в Большом театре, вместе с директором Большого театра Владимиром Георгиевичем Уриным, мы открыли вот этот проект «Открой историю Большого», и он будет еще интереснее, еще сложнее. Почему? Потому что сначала нужно будет просто на первом этапе, волонтерам просто проверить соответствие афиш и программок. Вот у вас на одной части экрана находится картинка, не знаю, JPEG или что-то такое.
С.СТИЛЛАВИН: Фотка.
Ф.ТОЛСТАЯ: Фотка, да, то есть то, что отсканировано тоже силами компании ABBYY, вот в последние месяцы очень много отсканировано, и Большой театр сканировал, но и сейчас ABBYY очень много отсканировала. А на правой части экрана у вас как бы распознанное, то, что машина понимает в том, что написано.
С.СТИЛЛАВИН: А что она может понимать в афише?
Ф.ТОЛСТАЯ: Она понимает практически все. Ну, то есть, я не знаю, может быть, тут вот оторвали кусочек и непонятно, одна буква исчезла, или там что-то замялось, и он одну букву туда-сюда не понял.
Т.КЕРБИ: Ну, вроде все равно редактор нужен на всякий случай.
Ф.ТОЛСТАЯ: Вот мы просим людей, которым это интересно, присоединиться к этому. И первое, что нужно сделать, это нужно просто проверить на полное соответствие. Ну, представьте себе, меня, например, эти вещи завораживают абсолютно. Когда мы пришли в один из первых разов в музей Большого театра и просто стали смотреть с коллегами из ABBYY…
С.СТИЛЛАВИН: Какую площадь он занимает? Вот так, если навскидку.
Ф.ТОЛСТАЯ: Несколько комнат.
С.СТИЛЛАВИН: Ну, уставленных.
Ф.ТОЛСТАЯ: Да, стеллажи уставлены сброшюрованными, сшитыми за один год программками. И мы стали смотреть просто с технической точки зрения, как сканировать. Вот представьте себе, мы открываем такую довольно старенькую, переплетенную такую папочку.
С.СТИЛЛАВИН: Книжку.
Ф.ТОЛСТАЯ: Да, книжку. Просто навскидку. И вдруг видим: «Концерт Федора Шаляпина», еще старыми буквами написано, фитой. И ты понимаешь, что вот ты к этому прикасаешься, понятно, что ты, наверное, не единственный, не первый, но это настоящая история, и мы можем эту историю сделать доступной для всех, для всех, для всех. И посмотреть, это же документы, совершенно замечательные документы об истории главного театра страны. А на втором этапе уже, который, я надеюсь, начнется в начале следующего года, это еще интереснее. С помощью, опять же, систем ABBYY, и Иван, наверное, сейчас расскажет, потому что это совершенно уникальные системы, которые понимают текст, мы попробуем разделить этот текст…
С.СТИЛЛАВИН: Понимают и начинают вступать с ним в диалог.
Ф.ТОЛСТАЯ: Да, мы попробуем разделить. Вот это название партии, а вот это исполнитель, а это название балета, а это дирижер, который дирижировал. Ведь на программке, в общем, можно довольно легко понять, кто…
С.СТИЛЛАВИН: Много фамилий.
Ф.ТОЛСТАЯ: Да, но все-таки, может быть, Иван скажет об этой технологии, потому что она совершенно уникальна.
С.СТИЛЛАВИН: Пожалуйста, Иван Бодягин, вице-президент ABBYY, компании, которая рождена у нас, но работает по всему миру, распознавание текста. Вань, как эта штука понимает? Потому что, знаешь, когда мы, всякий раз в студии заходит разговор, ну, не в студии, а просто включаешь, например, «Россию 1», новости, а там что-нибудь про цифровые технологии, сразу соображения об апокалипсисе, потому что конец света, восстание машин, все дела. Как эта штука работает? И насколько она интеллектуальна?
И.БОДЯГИН: Ну, до восстания машин еще далеко. Но она, ну, как, с одной стороны, она, конечно, не очень интеллектуальна, но, с другой стороны, она делает фантастические вещи. И вообще в различении текста и в различении смысла текста есть несколько этапов, несколько стадий осознания этого текста. То есть, этап номер раз, нужно просто этот текст перевести в цифровой вид, понятный компьютеру. Потом можно, ориентируясь на расположение текста и на некое понимание того, что…
Ф.ТОЛСТАЯ: Слева партии, справа исполнители, например.
С.СТИЛЛАВИН: То есть она графику понимает.
И.БОДЯГИН: Ну, некое взаимное расположение полей, как, например, мы чеки распознаем, как визитки распознаем.
С.СТИЛЛАВИН: Тут товар, а тут цена.
И.БОДЯГИН: Совершенно верно, там есть некий шаблон, откуда можно извлечь информацию. А третий, следующий этап…
С.СТИЛЛАВИН: Это все нужно, для того чтобы поисковик потом запустить, да?
Ф.ТОЛСТАЯ: Конечно.
С.СТИЛЛАВИН: Чтобы можно было забить вот этого дирижера и посмотреть, где он и когда работал, и найти ему… А есть ли у него алиби на 31 октября 1906 года? Нет.
И.БОДЯГИН: Например. А третий этап, это когда мы разбираем текст на некие смысловые блоки, выстраиваем связь между ними и потом действительно можно понять некий смысл текста. То есть, например, такая технология позволяет, ну, не знаю, для примера, вот если вы смотрели когда-нибудь договор купли-продажи автомобиля.
С.СТИЛЛАВИН: Да.
И.БОДЯГИН: Там же нет стандартных полей, где, что находится, там совершенно произвольный текст. Но как бы выстроив связи между текстом, мы понимаем, кто продал, кому продал, какую машину, под каким номером.
С.СТИЛЛАВИН: То есть он все это сам интеллект дробит.
И.БОДЯГИН: Эта технология уже довольно уникальная. То есть таких в мире, пожалуй, близких аналогов…
С.СТИЛЛАВИН: Это ваша?
И.БОДЯГИН: Да, это наша. Мы этой технологией последние 15 лет, пытаемся ее как-то…
С.СТИЛЛАВИН: А как вы учите машину понимать из текста, кто, ну, условно говоря, покупатель, кто продавец? Как это происходит? Я понимаю, что это сложно понять людям, которые научили машину.
И.БОДЯГИН: Ой, это такой не банальный процесс.
ВЛАДИК: Во-первых, это секретно, Сергей.
И.БОДЯГИН: Ну, нет, на самом деле, не секретно. Но, опять, тут сплав машины и человека. Во-первых, у нас работает больше 300 лингвистов, профессиональных лингвистов, которые выстраивают смысловые блоки для конкретного языка.
С.СТИЛЛАВИН: Логические как бы схемы, да?
И.БОДЯГИН: Да. Для русского, для английского, для других языков выстраивают конкретное семантическое дерево так называемое.
С.СТИЛЛАВИН: А те, которые на английском, это носители языка или наши разбираются в английском?
И.БОДЯГИН: Есть и наши, есть и носители, в общем, мы привлекаем. У нас это 300 только работают, ну, порядка 300, я могу ошибаться.
С.СТИЛЛАВИН: Это лингвисты.
И.БОДЯГИН: Это лингвисты, которые у нас в штате. А еще есть аутсорсеры, которые работают соответственно на контракте. И второе, это с помощью нейронных сетей, сейчас очень популярная тема, соответственно вот эти всякие машины…
С.СТИЛЛАВИН: Это что такое, объясни нам.
Ф.ТОЛСТАЯ: О, это очень интересно, расскажите, Ваня, это очень интересно.
С.СТИЛЛАВИН: Мы склонны к самообразованию. Что такое нейронные сети, брат?
И.БОДЯГИН: Нейронные сети, это такая штука…
С.СТИЛЛАВИН: Владик, тревожную музыку, нам нужно сосредоточиться.
И.БОДЯГИН: Это такая штука, ты ей на вход подаешь совершенно беспорядочный набор данных, а она из него автоматом извлекает какой-то смысл. Как происходит там внутри, никто не знает.
С.СТИЛЛАВИН: Это как бы аналитические системы?
И.БОДЯГИН: Ну, да, некоторым образом.
С.СТИЛЛАВИН: Ну, из серии, что вы можете, например, как вот у нас несколько человек типа село за шпионаж, они читали открытые источники, потом делали какие-то глубоко идущие, не нужные выводы о какой-то теневой стороне вопроса, и после этого были посадки. Потому что люди поняли что-то не то, что надо понять. Это шутка. Ну, понятно, эта штука упорядочивает.
И.БОДЯГИН: Она самообучаемая. То есть можно ей сначала, она тренируется на каком-то наборе данных, а потом ей скармливаешь любой другой произвольный набор, и она на основе обучения делает свой вывод.
С.СТИЛЛАВИН: Погодите, Ваня, ну, вот скажите честно, я на вас смотрю и на Владика за вами, вы розовый, Владик уже серый в ходе беседы. Вам страшно самому-то, что она еще и самообучаемая?
И.БОДЯГИН: Страшно интересно.
С.СТИЛЛАВИН: Ну, вы чувствуете ответственность за будущее землян?
И.БОДЯГИН: Конечно, все в наших руках.
С.СТИЛЛАВИН: Хорошо, запомним его, достаточно запоминающееся лицо. Фекла, а как вам удалось заинтересовать таких занятых людей, чтобы они, в принципе, я так понимаю, из любви к искусству тратили свое время, ресурсы?
И.БОДЯГИН: Не только из любви. Мы, на самом деле…
С.СТИЛЛАВИН: Или вы тренируетесь на Большом театре?
И.БОДЯГИН: Как я уже говорил, во-первых, это красиво. Во-вторых, очень важно, когда делаешь продукт, важно понимать, как люди им пользуются, иначе ты продукт не сделаешь удобный, хороший.
С.СТИЛЛАВИН: Это должна быть живая система.
И.БОДЯГИН: Да.
С.СТИЛЛАВИН: Не просто архив мертвый.
И.БОДЯГИН: И в этом смысле это уникальная штука, потому что она дает нам доступ, опять же, к тем самым тысячам волонтерам, которые реально используют продукт в реальной жизни на реальных сценариях, и нам очень полезно это, даже банально с точки зрения того, как продукт хороший сделать, как качество распознавания повысить, как сделать удобный интерфейс.
С.СТИЛЛАВИН: Фекла, несколько раз сегодня за время нашей беседы живой в прямом эфире это слово «волонтеры» прозвучало. Я правильно понимаю, что мы можем и пригласить…
Ф.ТОЛСТАЯ: Мы именно очень хотели бы пригласить, да.
С.СТИЛЛАВИН: Наших слушателей. Давайте критерии, что за люди вам нужны.
Ф.ТОЛСТАЯ: Вы знаете, мне кажется, что нам нужны и Большому театру нужны люди просто, которым это интересно. Это самое главное. И на первом этапе, мне кажется, что это не самая трудная работа, просто внимательная работа сличения картинки и расшифровки.
С.СТИЛЛАВИН: Эта работа, она, ну, смотрите, есть сайт http://www.openbolshoi.ru/. Есть сайт, эта работа для волонтера удаленная?
Ф.ТОЛСТАЯ: Конечно.
С.СТИЛЛАВИН: То есть он может у себя дома перед своим собственным монитором, компьютером вам помогать, имея интернет, правильно? Не надо ломиться в комнату Большого театра.
Ф.ТОЛСТАЯ: Дело в том, что компания ABBYY предоставляет совершенно бесплатно, вот на время проекта всем волонтерам программу FineReader, которую можно скачать на свой компьютер, и с помощью этой программы соответственно скачивать какие-то пакеты документов, я сейчас не знаю, какой пакет, 20 афиш или что-то в этом роде, 15-20 программок.
И.БОДЯГИН: Ну, да, такой порядок, несколько страниц.
Ф.ТОЛСТАЯ: Вы сделали это, проверили, отдали, скачали следующий пакет. Такая система пакетов сделана, чтобы люди не набирали бесконечное количество, а потом сидели и не доделывали.
С.СТИЛЛАВИН: Сделал, получи новый.
Ф.ТОЛСТАЯ: Сделал, получи новый. Но интересно, что, в общем, нет возможности выбора, мы идем подряд, и тоже любопытно, что тебе достанется, кого ты увидишь на афише и на программке.
С.СТИЛЛАВИН: А какова тогда система перепроверки того, что проверил волонтер? Или вот эти пакеты могут быть отправлены разным волонтерам тоже, такое не исключено?
Ф.ТОЛСТАЯ: Нет, просто будет сделан один этап проверки, потом второй этап проверки. Но вот, имея опыт оцифровки Толстого, я хочу сказать, что у нас изначально была придумана, ух, мы так подстраховывались, какая-то система оценок, вот этот волонтер…
С.СТИЛЛАВИН: Бонусы.
Ф.ТОЛСТАЯ: Нет, бонусы это отдельно. Система оценок в смысле этот волонтер хорошо вычитывает, мы в следующий раз меньше его проверяем, а этот плохо вычитывает, мы ему потом вообще ничего не даем. И тоже эта система оценок абсолютно не понадобилась, потому что, в принципе, качество работы людей очень высокое.
С.СТИЛЛАВИН: Фекла, ну, ты главное скажи, контрамарки будут?
Ф.ТОЛСТАЯ: Для тех, кто, лидеров проекта, для тех, кто будет лучшим, я думаю, что будут.
С.СТИЛЛАВИН: Будут. Ну, я вытащил из Феклы Толстой это обещание. Фекла, на самом деле, на ветер слова не бросает. Что я к настоящему моменту понял - есть наша компания российская ABBYY, они занимаются расшифровкой текстов, переводом аналога в цифру. И совместно, под эгидой соответственно Феклы Толстой…
Ф.ТОЛСТАЯ: Нет, под эгидой Большого театра.
С.СТИЛЛАВИН: Под эгидой Большого театра, но под руководством Феклы, вот этот большой проект под названием «Открой историю Большого», он уже стартовал?
Ф.ТОЛСТАЯ: Да.
С.СТИЛЛАВИН: Но можно по-прежнему стать волонтером, для этого надо зарегистрироваться на сайте http://www.openbolshoi.ru/, установить себе программу ABBYY FineReader и дальше, следуя инструкции, можно поучаствовать.
Ф.ТОЛСТАЯ: Наслаждаться историей Большого театра.
С.СТИЛЛАВИН: Мы тут, пока шла реклама короткая, поговорили о возможностях интеллекта сегодня машинного, ну, это называется хитрым словом нейросети. Ну, чтобы мы с вами ни черта не понимали, обычные люди, чтобы нам было не страшно, но, на самом деле, возможности, конечно, потрясающие, когда компьютер, ну, что такое компьютер, это не ящик, это просто программа, которая где-то там находится, сама сканирует текст, написанный, напечатанный, сама проводит связи между фигурантами этого текста, героями.
ВЛАДИК: Анализирует, по сути.
С.СТИЛЛАВИН: И размышляет на эту тему. И вот с Ваней говорили о том, что программе дали задание басню древнюю греческую исследовать.
И.БОДЯГИН: Эзопов миф.
С.СТИЛЛАВИН: И она провела исследование и выяснила, кто, с кем, как, сколько, и все стало известно. И вообще, конечно, масштабы работы сегодня интеллектуальных системы, это ведь у нас Ваня, его компания ABBYY занимается текстом написанным, есть еще программы, которые занимаются распознаванием речи, не знаю, может быть, уже мысли анализируются. И вот в этих глобальных масштабах выстраиваются вот эти связи, о которых, может быть, некоторые люди даже не догадываются. Но хорошо, что вот эти технологии, я бы их назвал двойными, хорошо, что они служат культуре. И, Фекла, ведь ты об этом ратуешь только, да?
Ф.ТОЛСТАЯ: Ну, мне кажется, что сейчас очень интересные происходят вещи, и вот ABBYY в этом смысле, на мой взгляд, на самом переднем краю какой-то науки и технологии. То есть речь идет о том, что мы не просто будем искать в интернете по ключевому слову, как мы сейчас ищем, а что уже информация в интернете будет как бы, ну, мы будем искать по значению.
С.СТИЛЛАВИН: По смыслу.
Ф.ТОЛСТАЯ: По смыслу, да, да, по смыслу, совершенно верно. И таким образом выстраиваются какие-то очень интересные горизонтальные связи, которые дают возможность представлять себе все, что хотите.
С.СТИЛЛАВИН: Обозреть необозримое.
Ф.ТОЛСТАЯ: Да, какие-то вещи очень интересные видеть. Я хочу сказать, что при том, что мы говорим, конечно, технологии страшно важны, но все-таки надо, будет справедливо и очень важно сказать о том, что все равно всего мы машиной не распознаем. И здесь очень важен труд сотрудников музея, которые будут эту всю информацию перепроверять уже с точки зрения такой настоящей содержательной. То есть, например, в программке бывает, что в программке написано одно, а была замена и другой там исполнитель.
С.СТИЛЛАВИН: Тот заболел.
Ф.ТОЛСТАЯ: Да. Или, например, важно очень соотнести, бывают разные названия произведений, спектаклей. Вот мы знаем, что «Жизнь за царя», потом в советское время назывался «Иван Грозный». Вот это тоже нужно все понимать.
С.СТИЛЛАВИН: А сейчас опять «За царя».
Ф.ТОЛСТАЯ: Да, совершенно верно. Но и надо сказать, что история по созданию такой «Энциклопедии Большого театра» сотрудники Большого театра и, в частности, инициатором был такой Евгений Самсонович Цодоков, блестящий знаток оперы, Большой театр начал без какого бы то ни было нашего участия, вот в этом году они эту работу уже начали. Вопрос только в том, что, конечно, технологии, которые приносят ABBYY и волонтеры, как мы надеемся, а сейчас уже больше 1,5 тысяч волонтеров зарегистрировалось на нашем сайте, и все, кому интересны история культуры, история музыки, история балета, всех призываю присоединиться на сайте http://www.openbolshoi.ru/.
С.СТИЛЛАВИН: В конце концов, контрамарки.
Ф.ТОЛСТАЯ: Нет, ну, понятно, что мы не можем, и Большой театр не может тысячам и тысячам волонтеров это предложить, но лучшим из лучших, наверное, такого рода подарки будут предоставлены. Так вот я хочу сказать, что Большой театр такую работу начал. Волонтеры сейчас будут просто…
С.СТИЛЛАВИН: Рыть.
Ф.ТОЛСТАЯ: Да, будут поставлять огромные новые массивы информации, которая будет оцифрована, и дальше еще нужно будет все это проверить и в такую энциклопедию составить, которая, на самом деле, есть похуже аналоги в мире, там Metropolitan Opera, еще какие-то, La Scala, какие-то оперы начали делать такие энциклопедии.
С.СТИЛЛАВИН: На вас глядя.
Ф.ТОЛСТАЯ: Нет, мне кажется, что, если все получится, а я уверена, что все получится хорошо, то такая энциклопедия Большого театра будет самая масштабная и самая объемная. А, самое главное, что она будет опираться на очень конкретные бумаги, документы, в том отношении, что вы смотрите, Вишневская в каких-то партиях выходила, и вы можете дойти до первоисточника, вы можете увидеть отсканированную программку, где будет сказано, что Галина Павловна Вишневская вот в такой-то…
С.СТИЛЛАВИН: В первый раз.
Ф.ТОЛСТАЯ: Да. Здесь еще хочется отметить очень важную роль компании «КАМИС», это такая компания, которая занимается системами, базами данных для музеев, и ведущая компания. Все абсолютное большинство ведущих музеев России пользуются системой «КАМИС». И вот компания «КАМИС», собственно, и будет делать, уже начала разработку этого сайта, на котором все это будет представлено. Надо сказать, что вообще это получается такая уникальная история, когда впервые музейные фонды будут оцифровываться с помощью волонтеров. Потому что это же не только театр, это мы говорим еще о музее театра, 240 лет его истории, 241-й сейчас сезон идет. И, знаете, этим занимались ведущие английские музеи, например, Британский музей или музей Виктории и Альберта, они на глазах у пользователей, вместе с пользователями создают свои оцифрованные архивы. Ну, например, что они предлагают, скажем, мне это очень симпатично, что такое привлечение волонтеров, они говорят, вы знаете, вот у нас фотографии, помогите нам, пожалуйста, обрезать эту фотографию, рамки обрезать, чтобы она лучше смотрелась на сайте. Вот отсканировали, как отсканировали…
С.СТИЛЛАВИН: А вы режьте.
Ф.ТОЛСТАЯ: Слушайте, это интересно. Ты, когда режешь, ты рассматриваешь эти замечательные произведения искусства.
С.СТИЛЛАВИН: В любом случае можно что-нибудь отрезать не нужное, правильно?
Ф.ТОЛСТАЯ: Да. Я просто хочу сказать, что в данном случае Большой театр предлагает волонтерам гораздо более интересную, гораздо более содержательную интеллектуальную работу. Вот такого рода работы, передаваемые волонтерами, я еще не знаю, чтобы в мире было.
С.СТИЛЛАВИН: Друзья мои, сегодня мы говорим о проекте, в котором каждый из вас имеет возможность поучаствовать. Я вот действительно мучал Ивана Бодягина, вице-президента компании ABBYY нашей российской, что за люди участвуют, вот уже почти 1,5 тысячи человек прошли регистрацию на сайте, еще раз напомню, http://www.openbolshoi.ru/.
ВЛАДИК: Безработные, наверное. Шутка.
С.СТИЛЛАВИН: Послушайте, ну, что вы. Тут не платят, тут искусство, это окрыляет. Вы понимаете, о чем я говорю, искусство окрыляет.
ВЛАДИК: Я понимаю. Просто пришло в голову, значит, время есть свободное.
С.СТИЛЛАВИН: Понятно, у вас нет. Так вот люди заходят на сайт http://www.openbolshoi.ru/, регистрируются, ставят себе программу для распознавания текстов ABBYY FineReader на время работы над архивом Большого театра. Программа бесплатно работает, да, у этих активистов, у вас. Люди могут что-нибудь и себе отксерить?
И.БОДЯГИН: Ну, могут, конечно.
С.СТИЛЛАВИН: И соответственно по инструкциям можно действительно помочь, это большое дело. В принципе, наверное, если говорить серьезно, то вот такие большие кампании в хорошем смысле слова, не кампанейщина, а вот кампании большие, когда добровольцы действительно, это такая очень европейская, мне кажется, история такая, западная, когда люди бескорыстно собираются и что-то делают вместе. И с этой точки зрения…
Ф.ТОЛСТАЯ: Сереж, почему вы отказываете русским людям в том, что чтобы делать что-то вместе по-волонтерски. Мне кажется, что сейчас волонтерское движение в самых разных сферах в России невероятно развито.
С.СТИЛЛАВИН: Но вот так, чтобы помочь Большому, такое в первый раз, чтобы Большому помочь.
Ф.ТОЛСТАЯ: Ну, это еще, надо сказать, большая благодарность руководству Большого театра, извините, что тавтология такая. Потому что за то, что Большой театр, оказывается, настолько открыт своим поклонникам. Потому что, согласитесь, что не всякое учреждение вот так позволит участвовать.
С.СТИЛЛАВИН: Ну, может быть, по примеру и другие наши консервативные, грубо говоря, мэтры музейного дела или культурной среды тоже пойдут по этому примеру.
Ф.ТОЛСТАЯ: Я надеюсь. Но мне просто кажется, что все архивы и музеи, они должны быть максимально открыты для пользователей, в этом и есть смысл, что мы хранили это столько десятилетий.
ВЛАДИК: Например, архив ОГПУ.
С.СТИЛЛАВИН: Нет, это вы туда не лезьте.
ВЛАДИК: Меня и не пустят туда.
С.СТИЛЛАВИН: Я помню, знаете, как, если посмотреть какие-то про 1990-е годы полудокументальные, можно сказать, фильмы-расследования, что мы слышали про музеи, что стоял на посту милиционер и медленно отпиливал от какой-нибудь золотой рамы себе кусочек. Надо действительно музеям возвращать доброе имя и собирательное доброе имя, что мы все участвуем, это все для нас, опять же, не только для горстки, грубо говоря, посвященных людей, а действительно проникнуть в архивы, в музей такому широкому кругу личностей с альтруистической направленностью, правильно. Не всякого рода жуликам вроде вас, Владик.
Ф.ТОЛСТАЯ: Ну, выкрутился.
С.СТИЛЛАВИН: Вань, скажи, пожалуйста, какое количество вы еще ждете? Потому что после нашего эфира, мне кажется, сайт может зависнуть http://www.openbolshoi.ru/.
И.БОДЯГИН: Сложно сказать. На Толстом, если я не ошибаюсь, было 3,5 тысячи человек или около того, волонтеров.
Ф.ТОЛСТАЯ: Ну, просто и это число кончилось, потому что уже все сделали на первом этапе. Здесь работы гораздо больше, поэтому мы ждем всех, кому это интересно. И сейчас движемся от сегодняшнего дня вглубь истории, поэтому, пожалуйста…
С.СТИЛЛАВИН: Сверху вниз.
Ф.ТОЛСТАЯ: Сверху вниз, да. Поэтому, пожалуйста, присоединяйтесь и не думайте, что вы опоздаете, может быть, еще и самые интересные вещи вам будут доступны.
С.СТИЛЛАВИН: Скажи, пожалуйста, Фекла, и тебе вопрос, и Ване, когда этот процесс будет завершен, когда все будет оцифровано и проверено, во что это выльется, что из себя будет представлять этот виртуальный, грубо говоря, музей?
Ф.ТОЛСТАЯ: Ну, я в двух словах это упоминала, что это будет такой сайт, электронный архив Большого театра, который сейчас издает компания «КАМИС», которая занимается музейными базами данных. Но, конечно, здесь еще будет очень большая работа сотрудников Большого театра, для того чтобы это все систематизировать, потому что волонтеры, они просто расшифровывают программки, извлекают данные.
И.БОДЯГИН: Тексты, данные какие-то.
Ф.ТОЛСТАЯ: Данные, совершенно верно. Но все это надо еще потом осмыслить, убрать какие-то дубли. Вот у нас несколько Ивановых, надо понять, что это один человек или несколько. То есть это просто специалисты должны перепроверить и потом эту информацию уже ответственно выдать на суд всех любителей оперы и балета по всему миру.
С.СТИЛЛАВИН: Ну, вот по твоему представлению, вы уже занимались оцифровкой Толстого, сколько времени будет идти, ну, так, оптимистично, вот эта работа над Большим? Не поздно ли сегодня уже людям зарегистрироваться на сайте http://www.openbolshoi.ru/?
И.БОДЯГИН: Совсем не поздно.
Ф.ТОЛСТАЯ: Нет, совсем не поздно. Мне кажется, что мы будем заниматься распознаванием этих текстов, ну, до конца года минимум, и в начале следующего, и потом в следующем году какой-то фрагмент этой работы представим. Потому что здесь нет идеи, давай, быстро, не важно, как, вперед. Все-таки хочется это сделать спокойно, вдумчиво, в свое удовольствие, если речь идет о волонтерах. И, если смотреть со стороны Большого театра, то, понимаете, Большой театр это марка, Большой театр это качество.
С.СТИЛЛАВИН: И вот приобщиться к этому.
Ф.ТОЛСТАЯ: Да, приобщиться к этому очень, мне кажется, здорово. Но и потом представить эту историю Большого театра, конечно, нужно, чтобы она выглядела достойно.
С.СТИЛЛАВИН: Друзья мои, ну, это Фекла Толстая, вы, естественно, ее узнаете, и Иван Бодягин у нас сегодня в студии был гостем, вице-президент компании ABBYY. Вань, приятно, что наши люди с нашими мозгами, с нашими технологиями и с нашим Большим театром сегодня работают вместе. И особенно приятно, что каждый наш слушатель, если есть время, зайдите, пожалуйста, если намерены поучаствовать в истории фактически, ведь оцифровка это история, http://www.openbolshoi.ru/. Устанавливайте себе на компьютер программу для распознавания текстов ABBYY FineReader, ну, а дальше по инструкциям, и вам будут высылать тогда пакеты афиш и программок, вы будете проверять правильность расшифровки машиной этих сведений.
Ф.ТОЛСТАЯ: Да, да, а потом еще фотографий, масса всего интересного.
С.СТИЛЛАВИН: Да, масса всего интересного. И огромное спасибо, Фекла и Иван. Спасибо большое за ваш интересный рассказ.
Ф.ТОЛСТАЯ: Спасибо большое, спасибо и вам.
И.БОДЯГИН: Спасибо.
С.СТИЛЛАВИН: Ну, и Владик тоже пойдет сегодня прикасаться к истории, к искусству. Ребята, вам хорошего дня. Пока.