Claude Codeを逆向解析して、2つのキャッシュバグを発見し、APIコストを静かに10〜20倍に引き上げる可能性がある

BlockBeatNews

1M AI News によるモニタリングによれば、ある開発者が Ghidra、MITM 代理、radare2 を用いて Claude Code のスタンドアロン版の 228MB バイナリをリバースエンジニアリングし、ユーザーが気づかないまま API コストを 10〜20 倍に引き上げ得る 2 つの独立したキャッシュの Bug を発見しました。関連する分析は GitHub(issue #40524)に提出され、Anthropic により回帰 Bug としてマークされ、対応が割り当てられています。

最初の Bug は、スタンドアロン版で使用されているカスタム Bun ランタイムに存在します。API リクエストごとに、ランタイムはリクエストボディ内で課金識別子を検索し置き換えますが、置換ロジックがヒットするのはリクエストボディ内の最初の一致項目です。会話履歴にたまたまその文字列が含まれている場合(たとえば Claude Code 内部の課金メカニズムについて議論している場合)、置換はシステムプロンプトではなくメッセージ内容に対して行われ、結果として各リクエストでキャッシュの完全な再構築が毎回トリガーされます。暫定的な回避策は、npx @anthropic-ai/claude-code を使って実行することです。npm パッケージのバージョンには、この置換ロジックは含まれていません。

2 つ目の Bug は、–resume または --continue によってセッションを復元するすべてのユーザーに影響し、v2.1.69 から導入されました。セッション復元時に、システム付加情報の注入位置が新規セッションと異なるため、キャッシュの接頭辞が完全に一致せず、その結果、会話履歴全体がキャッシュから読み込まれるのではなく、全量が書き換えられます。以降のラウンドでは復元は正常に動作しますが、復元操作そのものがすでに大量の追加コストを発生させており、現時点では外部の回避策はありません。

当該開発者の見積もりによると、約 50 万 token の長い会話では、Bug 1 が毎回のリクエストにつき追加で約 0.04 ドルを消費し、Bug 2 が毎回の復元につき追加で約 0.15 ドルを消費します。両者を合わせると、単一のリクエストあたりのコストは 0.20 ドル超となり得ます。これまでに Anthropic のエンジニア Lydia Hallie が、ユーザーが使用量制限に到達する速度は「想定よりはるかに速い」ことを確認しており、Reddit のコメント欄では複数のユーザーが、この 2 つのキャッシュの Bug が異常な使用量の消費の根本原因の一つである可能性があると考えています。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし