Новый фотонный чип распознаёт изображения со скоростью света
Сегодня технологии компьютерного зрения, распознавания лиц, речи и многих других машинных функций, имитирующих человеческие способности, основаны на глубоких нейронных сетях.
Эти искусственные нейросети имитируют работу человеческого мозга, хотя скорость обработки информации в них ограничена аппаратным обеспечением ("железом").
Теперь учёные разработали глубокую нейронную сеть на фотонном микрочипе. Она может распознавать и классифицировать изображения менее чем за наносекунду. То есть менее чем за миллиардную долю секунды.
Поясним, что задачи в искусственных нейронных сетях решают искусственные нейроны, получающие информацию и сотрудничающие между собой в поисках оптимального решения.
Нейронная сеть неоднократно корректирует связи между нейронами, чтобы найти наилучшую модель поведения для решения той или иной задачи. Затем нейросеть принимает эту модель в качестве значения по умолчанию, имитируя таким образом процесс обучения в человеческом мозге.
Нейронная сеть называется глубокой, если в ней есть несколько слоёв нейронов, каждый из которых дополнительно преобразовывает входные данные.
Хотя такие системы искусственного интеллекта вполне эффективны и уже широко применяются, используемое в них оборудование значительно ограничивает их возможности.
Во-первых, скорость вычисления в таких системах обычно ограничивается частотами не более трёх гигагерц — такова частота большинства современных графических процессоров, которые применяются в нейронных сетях.
Во-вторых, в отличие от биологических нейронов, которые могут как вычислять, так и хранить данные, электронные нейроны могут быть либо единицами памяти, либо единицами обработки данных. И "перебрасывание" данных вперёд и назад между этими компонентами приводит к затратам как времени, так и энергии.
Также необработанные визуальные данные должны быть преобразованы в цифровые электронные сигналы, на что также уходит время.
Более того, для хранения изображений и видео часто требуется большой блок памяти, что может представлять потенциальный риск конфиденциальности.
В новом исследовании учёные разработали фотонную глубокую нейронную сеть, которая может напрямую анализировать изображения без необходимости в дополнительных модулях, датчиках или накопителях данных.
Она может классифицировать изображение менее чем за 570 пикосекунд (триллионных долей секунды). Это сопоставимо по времени с одним тактовым циклом в самых современных микрочипах.
В результате нейросеть может классифицировать почти два миллиарда изображений всего за одну секунду! Для сравнения, частота кадров в обычном видео составляет от 24 до 120 кадров в секунду.
Новое устройство стало первой глубокой нейронной сетью, полностью реализованной на интегрированном фотонном устройстве с возможностью масштабирования (увеличения вычислительной мощности). Размер чипа составляет всего 9,3 квадратных миллиметра.
Сейчас исследователи экспериментируют с классификацией видео и 3D-объектов с помощью этого устройства. Также разработчики тестируют более крупные чипы с большим количеством пикселей и нейронов для классификации изображений с более высоким разрешением.
Пока что речь идёт о распознавании небольших чёрно-белых картинок, то есть достаточно простых изображений.
В будущем применение этой технологии не ограничивается классификацией фото и видео. Любой сигнал, такой как звуки или речь, может быть преобразован в некий оптический домен (рисунок) и почти мгновенно классифицирован с использованием этой технологии. Правда, конвертация звуков в символы будет занимать определённое время.
Результаты новой работы подробно описаны в статье, вышедшей в научном журнале Nature.
Ранее мы рассказывали о том, что с помощью системы зеркал были созданы искусственные измерения, неизвестные человеку.
Также мы сообщали о создании первого в мире фотонного процессора.
Рассказывали мы и о метаматериале, созданном исследователями из МГУ, на основе которого разрабатываются устройства для сверхбыстрой передачи информации.
Больше прорывных новостей из мира науки вы найдёте в разделе "Наука" на медиаплатформе "Смотрим".