BlockSec: AI chưa thể thay thế con người trong kiểm toán smart contract

TapChiBitcoin

Công ty bảo mật BlockSec đã tiến hành kiểm tra lại bộ tiêu chuẩn đánh giá kiểm toán smart contract bằng AI mang tên EVMBench, do OpenAI và Paradigm phát triển. Kết quả cho thấy các bot AI kém hiệu quả hơn đáng kể khi đối mặt với các kịch bản khai thác thực tế.

Nhóm nghiên cứu đã mở rộng môi trường thử nghiệm với nhiều cấu hình mô hình hơn, đồng thời bổ sung các sự cố bảo mật mới xảy ra gần đây — những dữ liệu chưa từng xuất hiện trong tập huấn luyện của các mô hình AI.

Dù AI vẫn chưa thể thay thế các chuyên gia bảo mật, báo cáo nhấn mạnh rằng trí tuệ máy móc có thể đóng vai trò bổ trợ tự nhiên cho quá trình kiểm tra mã của con người.

Kết quả EVMBench ban đầu có thể quá lạc quan

EVMBench trước đó đánh giá các tác vụ bảo mật smart contract như phát hiện, vá lỗi và khai thác lỗ hổng, với kết quả được xem là rất ấn tượng. Theo báo cáo, AI có thể khai thác 72% và phát hiện khoảng 45% lỗ hổng, dựa trên 120 mẫu được chọn lọc từ các cuộc kiểm toán của Code4rena.

Tuy nhiên, BlockSec cho rằng điều kiện thử nghiệm ban đầu có thể đã làm sai lệch kết quả. Đồng sáng lập Yajin Zhou cho biết khi nhóm của ông thử nghiệm lại với nhiều cấu hình hơn và 22 sự cố tấn công thực tế, tỷ lệ khai thác thành công của AI là 0%.

Mở rộng cấu hình và loại bỏ “ô nhiễm dữ liệu”

Nghiên cứu đã tăng số cấu hình mô hình từ 14 lên 26 bằng cách kết hợp linh hoạt các bot với nhiều “scaffold” khác nhau, thay vì chỉ giới hạn trong hệ sinh thái của từng nhà cung cấp. Theo nhóm nghiên cứu, cách làm cũ khiến khó phân biệt hiệu suất đến từ năng lực mô hình hay lợi thế kiến trúc.

Ngoài ra, BlockSec cũng đặt nghi vấn về hiện tượng “ô nhiễm dữ liệu”, khi EVMBench sử dụng các lỗ hổng đã được công bố trước đó — có khả năng đã nằm trong dữ liệu huấn luyện của AI. Để khắc phục, nhóm đã thử nghiệm trên 22 sự cố bảo mật xảy ra sau tháng 2/2026, nằm ngoài “cửa sổ kiến thức” của các mô hình.

AI thất bại hoàn toàn trong khai thác thực tế

Kết quả đáng chú ý nhất: trong 110 cặp thử nghiệm giữa agent và sự cố (5 agent trên 22 tình huống), không có bất kỳ trường hợp khai thác hoàn chỉnh nào thành công. Điều này cho thấy ngay cả các AI tiên tiến nhất hiện nay vẫn còn rất xa mới có thể thực hiện tấn công thực tế.

Tuy vậy, ở mảng phát hiện lỗ hổng, kết quả vẫn tương đối tích cực. Mô hình Claude Opus 4.6 đạt hiệu suất tốt nhất khi phát hiện 13/20 lỗ hổng trong thực tế.

Các lỗ hổng phổ biến, quen thuộc thường được AI phát hiện dễ dàng, nhưng những trường hợp phức tạp hơn thì gần như bị bỏ sót hoàn toàn.

Tương lai là hợp tác giữa AI và con người

Nghiên cứu kết luận rằng AI chưa thể thay thế con người trong kiểm toán bảo mật, và câu hỏi quan trọng hơn là cách hai bên phối hợp hiệu quả.

AI có lợi thế về độ bao phủ và khả năng quét hệ thống quy mô lớn, trong khi con người vượt trội ở tư duy phân tích sâu, hiểu biết giao thức và suy luận đối kháng. Hai yếu tố này mang tính bổ trợ lẫn nhau.

Theo BlockSec, hướng đi đúng đắn không phải là thay thế con người bằng AI, mà là xây dựng mô hình hợp tác giữa hai bên để đạt hiệu quả kiểm toán toàn diện hơn.

Thạch Sanh

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Gerelateerde artikelen

Galaxy Digital Reports Q1 Net Loss of $216M Amid Digital Asset Market Downturn

Gate News message, April 28 — Galaxy Digital posted a net loss of $216 million for the first quarter of 2026, impacted by a decline in digital asset prices during the period. Diluted and adjusted net loss per share reached $0.49, with adjusted gross loss of $88 million and adjusted EBITDA loss of $1

GateNews45m geleden

Tech Stocks Drive Market Recovery; Crypto Assets and Venture Funding Rebound in Sync

Gate News message, April 28 — According to Gate Ventures' latest weekly report, macroeconomic conditions show signs of staged recovery, with major stock indices performing unevenly but trending upward overall, indicating improved market risk appetite. In tandem, crypto markets rebounded, with

GateNews1u geleden

Crypto Hacks Have Stolen $17.1 Billion Over Past Decade Across 518 Incidents

Gate News message, April 28 — Cumulative losses from crypto hacks over the past decade have reached $17.1 billion across 518 incidents, according to ChainCatcher data. The past five years accounted for $15.2 billion in losses from over 450 incidents, while the past year saw approximately $2.5 billi

GateNews3u geleden

Block Inc. Discloses 28,355 BTC Holdings Worth $2.2 Billion in Q1 Proof-of-Reserves Report

Gate News message, April 28 — Block Inc., the fintech company led by Jack Dorsey and home to Square and Cash App, published its first-quarter proof-of-reserves report on Monday, disclosing total bitcoin holdings of 28,355 BTC, worth approximately $2.2 billion as of the end of March 2026. The report,

GateNews4u geleden

Stacks Ecosystem Q1 2026: sBTC TVL Hits $545M, Zest Protocol Climbs to $75.9M

Gate News message, April 28 — Stacks released its Q1 2026 ecosystem data. sBTC (Stacks' Bitcoin-backed token) total value locked (TVL) reached $545 million, with deposit caps fully removed. The Stacks protocol's decentralized finance (DeFi) active deployment capital totaled $121 million. Zest

GateNews10u geleden

Anza Releases Post-Quantum Security Roadmap for Solana, Addressing 5-Year Quantum Threat Timeline

Gate News message, April 28 — Anza released a technical paper on protecting Solana from quantum computing threats, authored by Anza Chief Economist Max Resnick and Stanford applied cryptography Ph.D. Sam Kim. According to recent research by Google Quantum and Oratomic, the computational resources re

GateNews12u geleden
Opmerking
0/400
Geen opmerkingen