Análise reversa do código Claude revela dois bugs de cache, que podem aumentar silenciosamente o custo da API em 10-20 vezes

BlockBeatNews

De acordo com o monitorizador 1M AI News, um programador descompôs por engenharia inversa o ficheiro binário de 228MB da versão instalada de forma independente do Claude Code, através de Ghidra, um proxy MITM e o radare2, e descobriu dois bugs de cache independentes que podem aumentar o custo da API em 10-20 vezes sem que os utilizadores tenham conhecimento. A análise correspondente foi submetida ao GitHub (issue #40524) e a Anthropic marcou-a como um bug de regressão, atribuindo-a para resolução.

O primeiro bug está no runtime Bun personalizado utilizado pela versão instalada de forma independente. Sempre que é feita uma chamada à API, o runtime procura um identificador de faturação no corpo do pedido e substitui-o, mas a lógica de substituição corresponde ao primeiro item que o corpo do pedido contém. Se o histórico da conversa incluir exactamente essa cadeia (por exemplo, ao discutir o mecanismo interno de faturação do Claude Code), a substituição vai acertar no conteúdo da mensagem em vez do prompt de sistema, fazendo com que cada pedido dispare uma reconstrução total em cache. A solução temporária de contorno é executar em vez disso o npx @anthropic-ai/claude-code; a versão do pacote npm não inclui esta lógica de substituição.

O segundo bug afecta todos os utilizadores que retomam sessões usando --resume ou --continue, introduzido desde a v2.1.69. Ao retomar uma sessão, a posição em que a informação adicional do sistema é injectada é diferente da de uma sessão recém-criada, o que faz com que o prefixo da cache não corresponda completamente: a conversa inteira passa de ser lida a partir da cache para ser reescrita na totalidade. As rondas seguintes voltam ao normal, mas a operação de retoma em si já gerou custos adicionais consideráveis e, neste momento, não existe uma solução de contorno externa.

O programador estima que, para uma conversa longa de cerca de 500 mil tokens, o Bug 1 consome cerca de 0.04 dólares adicionais por pedido, enquanto o Bug 2 consome cerca de 0.15 dólares adicionais por retoma; somados, o custo por pedido pode ultrapassar 0.20 dólares. Anteriormente, a engenheira da Anthropic Lydia Hallie já tinha confirmado que a velocidade com que os utilizadores atingem o limite de utilização é «muito mais rápida do que o esperado»; na secção de comentários do Reddit, vários utilizadores consideram que estes dois bugs de cache podem ser uma das principais razões para o consumo anómalo de uso.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário