Benchmark chatbot LLM terbaru dari Desember 2025 menunjukkan gambaran yang menarik—tingkat halusinasi masih sangat beragam, berkisar dari 15% hingga 52% di seluruh pasar. Gila, bukan? Target aspirasional industri hanya berada di 1–2%, jadi kita berbicara tentang celah besar antara performa aktual model-model ini dan di mana mereka perlu berada. Itulah realitas yang tidak selalu disorot oleh siklus hype.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Benchmark chatbot LLM terbaru dari Desember 2025 menunjukkan gambaran yang menarik—tingkat halusinasi masih sangat beragam, berkisar dari 15% hingga 52% di seluruh pasar. Gila, bukan? Target aspirasional industri hanya berada di 1–2%, jadi kita berbicara tentang celah besar antara performa aktual model-model ini dan di mana mereka perlu berada. Itulah realitas yang tidak selalu disorot oleh siklus hype.