Боитесь открыть ящик Пандоры? Самая мощная модель Anthropic в истории полностью не решается выйти в публичный доступ

BlockBeatNews

В кодовой базе OpenBSD обнаружен изъян, который был спрятан 27 лет. В FFmpeg есть изъян, спрятанный 16 лет; тот фрагмент кода до того, как его нашли, вызывался более 5 000 000 раз. Вытащили их не какие-то топовые исследователи ни с одной из платформ для выплат за уязвимости и не Project Zero от Google. Это модель Anthropic, ещё не выпущенная для широкой публики, под кодовым названием Claude Mythos Preview.

7 апреля Anthropic объявила Project Glasswing. Сам по себе ход очень простой: Mythos Preview отправили в список белого доступа. В списке есть AWS, Apple, Google, Microsoft, Nvidia, Broadcom, Cisco, CrowdStrike, JPMorgan Chase, Linux Foundation, Palo Alto Networks, а также около 40 организаций, отвечающих за критически важную инфраструктуру. Людям вне списка доступ не предоставляется. Anthropic прямо сказала, что в краткосрочной перспективе не планирует публично выпускать эту модель.

Это первый раз, когда передовая лаборатория по собственной инициативе решила запереть самое сильное, что у неё есть.

За последние два года темп релизов почти как условный рефлекс. Каждое поколение GPT, Gemini и Claude — это «выпуск, наблюдение, закрытие пробелов». Собственная «политика ответственного расширения» (RSP) Anthropic по сути тоже является рамочной конструкцией: достигай порога возможностей — применяй соответствующие меры по смягчению рисков — и продолжай выпускать. Glasswing не является следующим шагом в рамках этого протокола — это его первое исключение. Модель, которую Anthropic уже сама оценила как «не подходящую для публикации по исходному процессу», вынули отдельно и отдали только стороне защиты.

Что сделало Mythos Preview. Официальная формулировка — «тысячи zero-day уязвимостей, охватывающих каждую основную операционную систему и каждый основной браузер». Но важнее цифр говорит размах по возможностям. У Claude 4.6 Opus в задачах вроде автономной разработки уязвимостей вероятность успеха близка к нулю — то есть шесть месяцев назад, по собственным оценкам Anthropic, самая сильная из публичных моделей ещё не могла сделать это. Mythos умеет связывать несколько несвязанных между собой уязвимостей в одну полноценную цепочку атаки; использование браузера в четыре шага — уже доказанный пример. От «почти нуля» к «цепочке из четырёх уязвимостей» — это не разовое улучшение между поколениями, а скачок.

Случившееся уже почувствовала сторона сопровождения. Linux-ядро — Greg Kroah-Hartman, а автор curl — Daniel Stenberg — недавно оба публично говорили об одном и том же: за последний год AI-генерированные отчёты по безопасности перешли от «уровня спама» к «реальным, высококачественным, на которые нельзя не смотреть». Количество отчётов, получаемых открытыми проектами, растёт, и качество растёт, а число людей у мейнтейнеров не растёт. Это «боль», которую оборонительная сторона уже давно переживает. Действия Anthropic просто вывели это из области смутной тревоги в открытую плоскость.

Стоит взглянуть и на сам список белого доступа. Три облака (AWS, Google, Microsoft), три компании по железу (Apple, Nvidia, Broadcom), два производителя сетевых устройств (Cisco, Palo Alto Networks), одна компания по безопасности конечных точек (CrowdStrike), один открытый инфраструктурный фонд (Linux Foundation) и один банк. В списке только один банк — JPMorgan Chase.

Это не случайное распределение квот. Anthropic нарисовала карту «если оборону не удержать — рухнет всё». Большая часть кода в мире исполняется на стеке этих компаний, большая часть денег в мире крутится на счетах одной из них. Логика белого списка — не «кому нужнее», а «кто первым, если сломается, потянет за собой всех». Помимо белого списка, Anthropic также выделила открытым безопасностным организациям 4 миллиона долларов. Деньги — для наращивания человеческих ресурсов, модель — для наращивания возможностей; вместе это сводится к одной фразе: несколько месяцев для мейнтейнеров.

Слова Anthropic собственными формулировками звучат ещё прямее. В заявлении компания пишет: «Учитывая скорость развития AI, подобные возможности не будут надолго оставаться в руках участников, которые сосредоточены на безопасном развертытывании». Следом — фраза: «Чтобы защищать глобальную сетевую инфраструктуру, может потребоваться несколько лет».

Если поставить эти две фразы рядом. Anthropic считает, что окно, в течение которого модель может утечь или быть воспроизведена, короткое, а окно, в течение которого сторона защиты успеет аккуратно закрыть уязвимости, — длинное. Вся ценность Glasswing как раз в разнице между этими двумя временными отрезками. Контролируемый «первый ход» в обмен на окно для патчей от нескольких месяцев до года.

У этой истории есть ещё и измерение по Вашингтону. Anthropic ведёт постоянные переговоры с правительством США о возможностях Mythos Preview; параллельно у неё с Министерством обороны США идёт незавершённый спор о сфере применения военного AI. Одна компания с одной стороны отказывается использовать модель для некоторых военных целей, а с другой — сама отправляет эту модель в команды по безопасности Linux Foundation и Apple. Эти две вещи не противоречат друг другу — это две стороны одной и той же оценки. Anthropic определяет, «для чего эту модель можно использовать», а не оставляет право определения пользователям.

Самое нетипичное в Glasswing — не то, что она сделала, а то, когда она это сделала. Раньше компании AI доказывали свою состоятельность через релизы. Теперь Anthropic выбрала способ «доказывать через непубличность». Передовая лаборатория запирает самое сильное, что у неё есть, и при этом говорит, что причина не в коммерции, не в том, что «alignment ещё не завершён», и не в требованиях регулирования — причина в том, что она сама посчитала: сроки открытого релиза уже не успевают за сроками исправления.

В ближайшие несколько месяцев смотреть нужно будет не на сам Mythos Preview, а на то, сколько уязвимостей, которые проявятся на нём у примерно 50 организаций из белого списка, будет закрыто. Следующий шаг — смотреть, последуют ли другие передовые лаборатории. Если последуют, в индустрии, которая держится на ритме «открыто, итеративно, открыто», впервые появится действие по принципу «запираем, а там видно». Если не последуют, Anthropic станет тем, кто стоит у двери. С ключами в руке, глядя на часы.

Нажмите, чтобы узнать о вакансиях BlockBeats

Добро пожаловать в официальное сообщество BlockBeats:

Telegram — подписочная группа: https://t.me/theblockbeats

Telegram — чат: https://t.me/BlockBeats_App

Twitter — официальный аккаунт: https://twitter.com/BlockBeatsAsia

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев