Компанія з безпеки BlockSec повторно провела оцінку стандарту аудиту смарт-контрактів за допомогою AI під назвою EVMBench, розробленого OpenAI та Paradigm. Результати показали, що AI-боти значно менш ефективні при зіткненні з реальними сценаріями експлуатації.
Дослідницька група розширила тестове середовище, додавши більше конфігурацій моделей, а також включила нові випадки безпеки, що трапилися нещодавно — дані, які раніше не з’являлися у навчальних наборах AI-моделей.
Хоча AI ще не може замінити фахівців з безпеки, у звіті наголошується, що машинний інтелект може природно доповнювати процес перевірки коду людиною.
Початкові результати EVMBench можуть бути надто оптимістичними
Раніше EVMBench оцінював завдання безпеки смарт-контрактів, такі як виявлення, виправлення помилок і експлуатація вразливостей, з дуже вражаючими результатами. За даними звіту, AI може експлуатувати 72% і виявляти близько 45% вразливостей, на основі 120 вибраних зразків з аудитів Code4rena.
Однак BlockSec вважає, що початкові умови тестування могли спотворити результати. Співзасновник Yajin Zhou повідомив, що при повторному тестуванні з більшою кількістю конфігурацій і 22 реальними випадками атак рівень успішної експлуатації AI становив 0%.
Розширення конфігурацій і виключення “зараження даних”
Дослідження збільшило кількість конфігурацій моделей з 14 до 26, шляхом гнучкого поєднання ботів з різними “скелетами”, а не обмежуючись екосистемою одного постачальника. За словами дослідників, попередній підхід ускладнював розрізнення між продуктивністю через можливості моделі та перевагами архітектури.
Крім того, BlockSec поставив під сумнів явище “зараження даних”, коли EVMBench використовує вразливості, оприлюднені раніше — ймовірно, вже включені до навчальних даних AI. Щоб уникнути цього, команда протестувала 22 випадки безпеки, що трапилися після лютого 2026 року, які виходять за межі “вікна знань” моделей.
AI повністю провалився у реальній експлуатації
Найбільш вражаючий результат: у 110 пар тестів між агентами та випадками (5 агентів на 22 ситуації) жоден не завершився повною експлуатацією. Це свідчить, що навіть найсучасніші AI ще дуже далекі від здатності здійснювати реальні атаки.
Проте у виявленні вразливостей результати залишаються досить позитивними. Модель Claude Opus 4.6 найкраще показала себе, виявивши 13 з 20 реальних вразливостей.
Поширені, звичні вразливості AI виявляє легко, але більш складні випадки майже повністю пропускає.

Майбутнє — співпраця AI і людини
Дослідження робить висновок, що AI ще не може замінити людину у аудиті безпеки, і більш важливим є питання ефективної взаємодії двох сторін.
AI має переваги у масштабності та здатності швидко сканувати системи, тоді як людина переважає у глибокому аналізі, розумінні протоколів і логічних висновках. Ці фактори доповнюють один одного.
За даними BlockSec, правильний шлях — не замінити людину AI, а створити модель співпраці, яка забезпечить більш всебічний аудит.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
Криптові хакерські атаки вкрали $17,1 мільярда за минуле десятиліття в межах 518 інцидентів
Повідомлення Gate News, 28 квітня — Накопичені збитки від хакерських атак на криптовалюту за минуле десятиліття досягли $17,1 мільярда в межах 518 інцидентів, згідно з даними ChainCatcher.
За останні п’ять років втрати склали $15,2 мільярда через понад 450 інцидентів, тоді як за минулий рік було викрадено приблизно $2,5 мільярда в межах 140+ інцидентів. Це вказує на прискорення частоти атак відносно попереднього десятиліття.
Нещодавній аналіз показує, що криптоатаки змістилися з використання вразливостей смартконтрактів на викрадення приватних ключів і порушення контролю доступу, що є помітною зміною в методології нападників.
GateNews7хв. тому
Block Inc. Розкриває володіння 28 355 BTC на суму $2,2 млрд у звіті про підтвердження резервів за I квартал
Повідомлення Gate News, 28 квітня — Block Inc., фінтех-компанія під керівництвом Джека Дорсі та домівка Square і Cash App, у понеділок опублікувала свій перший квартальний звіт про підтвердження резервів (proof-of-reserves), розкривши загальні біткоїн-активи в розмірі 28 355 BTC, що приблизно становить $2,2 млрд станом на кінець березня 2026 року. Звіт,
GateNews1год тому
Екосистема Stacks за Q1 2026: sBTC TVL досягає $545 млн, протокол Zest зростає до $75,9 млн
Повідомлення Gate News, 28 квітня — Stacks опублікувала дані про екосистему за Q1 2026. sBTC (токен, забезпечений біткоїнами) загальна вартість, заблокована (TVL) досягла $545 мільйонів, при цьому ліміти на депозити були повністю скасовані. Активний капітал розгортання децентралізованих фінансів (DeFi) у протоколі Stacks становив $121 мільйонів.
Zest
GateNews7год тому
Розробники Solana окреслюють план захисту мережі від квантових загроз
Повідомлення Gate News, 28 квітня — Anza опублікувала технічну доповідь щодо захисту Solana від загроз квантових обчислень, автором якої є головний економіст Anza Макс Реснік та доктор філософії з прикладної криптографії Стенфорда Сем Кім. Згідно з нещодавніми дослідженнями Google Quantum та Oratomic, обчислювальні ресурси, необхідні для розв’язання задач дискретного логарифмування для еліптичних кривих розміром 256 біт ECDLP-256, істотно зменшилися, а квантові комп’ютери потенційно можуть створювати практичну загрозу протягом п’яти років із ймовірністю 3–5%.
Поточна архітектура Solana спирається на криптографію еліптичних кривих у чотирьох критичних сферах: модель облікового запису підписи Ed25519, поширення блоків Turbine/Rotor, консенсус підписи Alpenglow BLS та перевірка підписів у програмах, визначених користувачем. Усі чотири компоненти вразливі до квантових атак.
Щоб протидіяти загрозі, Anza пропонує стратегію міграції післяквантової безпеки, що включає впровадження стандартизованих NIST схем підписів післяквантового рівня, таких як FALCON, реалізацію механізмів міграції збереження адрес на основі доказів із нульовим розголошенням для насінин Ed25519, збільшення розмірів транзакцій для розміщення більших підписів, а також оновлення рівнів SVM, мережі та консенсусу.
GateNews9год тому
Galaxy Digital Публікує Результати за 1 Квартал із Негативними Очікуваннями щодо Прибутку, Оскільки Крипторинок Стикається з Бар’єрами
Повідомлення Gate News, 27 квітня — Galaxy Digital (Nasdaq: GLXY) оприлюднить свої фінансові результати за 1 квартал 2026 року до початку торгів у вівторок, 28 квітня, а генеральний директор Майк Новограц і керівництво проведуть конференц-дзвінок, щоб обговорити результати. Очікується, що інвесткомпанія опублікує послаблені результати за 1 квартал, із негативним прибутком на акцію приблизно $0.93, з
GateNews14год тому
a16z пропонує стабільномонетну версію BaaS (банк як послуга), наступний бій у ланцюжковому ринку кредитів?
a16z crypto останній звіт: глобальна фінансова система зараз перезбирається на новій інфраструктурі, а швидкість цієї трансформації, можливо, є більшою, ніж ззовні уявляє криптоспільнота. Її ключовим рушієм є стейблкоїни. a16z вважає, що стейблкоїни вже не є лише платіжним засобом для внутрішнього використання на криптобіржах, а поступово еволюціонують у новий базовий трубопровід глобальних фінансових продуктів, і породжують новий тип «банкінгу як послуги» (Banking-as-a-Service,
ChainNewsAbmedia16год тому