Cайт веб-разработчика, программиста Ruby on Rails ESV Corp. Екатеринбург, Москва, Санкт-Петербург, Новосибирск, Первоуральск

Белый дом требует чуда. Власти приказали сделать Claude Fable 5 абсолютно неуязвимой

Белый дом США выдвинул Anthropic ультиматум: модель Claude Fable 5 вернётся в открытый доступ только после того, как компания докажет, что защита от джейлбрейков непробиваема. Специалисты по безопасности единогласны — добиться этого невозможно в принципе.

Администрация Трампа ранее отозвала Fable 5 с рынка, сославшись на выводы Агентства национальной безопасности: в модели обнаружены способы обойти встроенные ограничения в сферах кибербезопасности, химии и биологии.

Джейлбрейк — это манипуляция с запросами, которая вынуждает модель игнорировать собственные правила безопасности. Именно страх перед тем, что такой инструмент окажется в руках недружественных государств, стал официальным обоснованием для отключения.

Anthropic возражала: угроза преувеличена, последствия подобных атак — минимальны. Технические переговоры с Министерством торговли и Офисом национального кибердиректора ни к чему не привели. Администрация закрыла дискуссию: спорить о масштабах риска она больше не намерена.

Теперь Белый дом перекладывает ответственность на компанию целиком. Чиновники прямо говорят: у государственных структур нет ресурсов, чтобы самостоятельно искать уязвимости в каждой новой модели. Anthropic обязана регулярно тестировать свои разработки и первой сообщать властям о находках.

Проблема в том, что независимые специалисты считают эти требования технически невыполнимыми. По их оценке, защитные механизмы языковых моделей — временная мера: рано или поздно достаточно опытные пользователи или более совершенные ИИ-системы найдут обходной путь. Принципиального решения не существует — а значит, Fable 5 рискует остаться недоступной бессрочно.

Пока Anthropic и Белый дом ведут этот спор, Министерство обороны уже активно применяет искусственный интеллект в боевых операциях, от которых ранее Anthropic принципиально отказалась. Так, директор по цифровым технологиям ведомства Камерон Стэнли официально заявил, что в ходе операции «Epic Fury» чат-бот Grok компании xAI Илона Маска обеспечил нанесение ударов по более чем 2000 целям за 96 часов. Ряд сенаторов уже потребовали законодательно запретить применение языковых моделей без контроля человека в решениях о применении силы.

SecurityLab