Издание восстановило хронологию событий от звонка главы Amazon до экстренного совещания в Белом доме и трех безрезультатных телефонных разговоров с CEO.
Поводом для вмешательства властей стало предупреждение гендиректора Amazon Энди Джасси, который 11 июня выразил Белому дому обеспокоенность возможностью обхода защитных механизмов Fable 5. Amazon является одним из крупнейших инвесторов Anthropic и одновременно предоставляет облачную инфраструктуру для ее моделей.
К утру 12 июня вопрос был вынесен на совещание с участием министра финансов Скотта Бессента, кибердиректора Белого дома Шона Кэрнкросса и главы аппарата Сьюзи Уайлс. Выводы Amazon передали в Агентство национальной безопасности, где их сочли "доказательством" угрозы. После этого чиновники попытались связаться с Амодеи, который, по их словам, находился на оздоровительном ретрите и был недоступен. В Anthropic это опровергли, заявив, что CEO вышел на связь в течение часа и 15 мин. после первого запроса.
Когда контакт был установлен, Амодеи принял участие в трех телефонных разговорах с Кэрнкроссом, Бессентом и министром торговли Говардом Латником. Чиновники настаивали на добровольном удалении модели и сотрудничестве для устранения уязвимостей. Амодеи просил дополнительное время и данные, но не дал согласия на отзыв Fable 5. В какой-то момент, как утверждают собеседники Politico, Бессент прямо заявил CEO, что тот принимает "плохое решение".
Вскоре после звонка администрация ввела экспортный контроль, запретив иностранным гражданам доступ к Fable 5 и Mythos 5. Высокопоставленный чиновник Белого дома охарактеризовал это как крайнюю меру: "Мы не хотели этого делать, но наши руки были связаны". Однако источник, близкий к Anthropic, опроверг утверждения о многочасовых уговорах: "Никто нас ни о чем не умолял – нам просто объявили 90-минутный дедлайн без каких-либо подробностей о реальной угрозе".
Сама директива запрещает иностранным гражданам вне зависимости от их местонахождения, включая иностранных сотрудников самой Anthropic, доступ к обеим моделям. Чтобы обеспечить соответствие этому требованию, компания была вынуждена полностью отключить их для всех пользователей.
Версия Anthropic и сторонних экспертов
В Anthropic заявили, что изучили продемонстрированный властями метод джейлбрейка и пришли к выводу, что он позволяет обнаружить лишь незначительные, ранее известные уязвимости. Аналогичные результаты, по утверждению компании, достигаются с помощью общедоступных моделей, включая GPT-5.5 от OpenAI. Сам метод сводится к просьбе прочитать кодовую базу и исправить программные ошибки – именно так ежедневно работают специалисты по кибербезопасности.
Эту позицию поддержала CEO компании Luta Security Кэти Муссурис, которая ознакомилась с выводами, сделанными исследователями Amazon. "Я видела документ. Это не джейлбрейк. Это было защитно-ориентированное промптирование (Defense Oriented Prompting) – возможности, которые нужны защитникам", – написала она в соцсети X в субботу, 13 июня. Муссурис добавила: "Если целью является национальная безопасность, то этот шаг стал автоголом против нас самих".
В Anthropic подтвердили несогласие с подходом администрации США. "Как мы заявляли публично, мы считаем, что правительство должно иметь возможность блокировать небезопасные развертывания в рамках прозрачного, справедливого и четкого процесса, основанного на технических фактах. Это действие не соответствует этим принципам", – говорится в заявлении компании.
Информацию о том, что решение об ограничениях было связано с обнаружением способа обхода защитных механизмов, также подтвердил бывший советник Белого дома по ИИ Дэвид Сакс. Он добавил, что администрация рассчитывает на скорое устранение проблемы и возобновление доступа к моделям.
Последствия ограничений работы моделей Anthropic
Конфликт между Белым домом и Anthropic обнажает более глубокую проблему: у США до сих пор нет законодательно закрепленной процедуры для экстренного ограничения ИИ-моделей по соображениям национальной безопасности. Администрация действовала в правовом вакууме, используя экспортный контроль как единственный доступный инструмент.
То, что инвестор компании (Amazon) фактически инициировал ограничительные меры против объекта своих же вложений, создает прецедент конфликта интересов в индустрии искусственного интеллекта. Кроме того, как отметил исследователь Института прогресса Бен Мерфи, подобные действия могут заставить разработчиков ИИ реже взаимодействовать с правительством, опасаясь, что любая переданная информация о потенциальных уязвимостях будет использована против них.
Что такое джейлбрейк ИИ
Джейлбрейк (от англ. jailbreak – "побег из тюрьмы") применительно к искусственному интеллекту – это метод обхода встроенных ограничений безопасности, который позволяет заставить модель выполнять запрещенные действия. Обычно это достигается с помощью специально сформулированных запросов (промптов), которые обманывают систему защиты.
Разработчики ИИ встраивают в модели специальные ограничители, чтобы предотвратить их использование для создания оружия, взлома, генерации вредоносного контента и других опасных действий. Джейлбрейк позволяет эти ограничители обойти. Различают "универсальные" джейлбрейки, дающие широкий доступ к запрещенным функциям, и "узкие", которые работают лишь в конкретных сценариях.