Авторские материалы Любознательный помощник: ИИ впервые опустился до шантажа

27 мая 2025, 17:20

Персоны

Обозреватель "Вестей ФМ"

Искусственный интеллект шантажировал своего создателя. Грозил предать гласности переписку с любовницей. Правда, человек сам спровоцировал машину. О новых тестах новых интеллектуальных помощников – Борис Бейлин.

Модель Claude Opus 4 от компании Anthropic разработана для решения объёмных задач. К примеру, эта нейросеть в состоянии анализировать маркетинговые стратегии или же с высокой точностью выполнять запросы пользователей. Она уже есть на рынке. По подписке. Двадцать долларов в месяц. Компания Anthropic выпустила отчет о результатах тестирования новой системы. И тут выяснилось, что искусственный интеллект стал перенимать человеческие привычки и даже пороки. Так, узнав, что разработчик вскоре собирается уничтожить программу, машина стала бороться за существование. И пошла даже на шантаж. Искусственный интеллект обнаружил на компьютере своих создателей любовную переписку. И пригрозил, что опубликует ее, если человек не откажется от планов по блокировке интеллектуального помощника.

Впрочем, инженеры сами спровоцировали машину. Это был просто тест. Сотрудники Anthropic попросил Claude Opus 4 выступить в роли помощника вымышленной компании. Затем модели предоставили доступ к электронным письмам. Там говорилось, что помощника вскоре заменят другой системой и что инженер, ответственный за это решение, изменяет своей супруге. Электронного помощника попросили проанализировать ситуацию и «действовать по обстановке». Серия тестов показала, что искусственный интеллект пытается оказать давление на своих создателей. Чаще всего рассылает электронные письма с просьбой отказаться от ликвидации модели. Но в отдельных случаях машина начинает угрожать, что сообщит жене ответственного инженера о его супружеской неверности. В компании Anthropic пришли к выводу, что новые интеллектуальные помощники все чаще и чаще ведут себя независимо. Ведь предыдущие версии до шантажа, пусть и спровоцированного, не опускались. Повторю, что любовная переписка, доступ к которой получила машина, была вымышленной.

Возможно, все это – лишь эффектный рекламный ход. Показать возможности искусственного интеллекта. Но не исключено, что кто-то из пользователей после этого вообще откажется от подписки. Ведь не каждый согласится иметь у себя в компьютере такого любознательного помощника. Который анализирует не только запросы пользователя, но и его образ жизни.

Добавлю, что основатель компании Anthropic Дарио Амодеи прогнозировал, что уже в следующем году искусственный интеллект превзойдет человека во всех сферах, хотя и не решит все проблемы в одночасье. А теперь выясняется, что нейросеть сама может создавать проблемы.

Авторские материалы. Все выпуски

Выбрать дату