DeepSeek terbaru merilis makalah yang mengungkapkan arah teknologi yang menarik. Inti ide adalah memisahkan bagian memori jangka panjang dari model bahasa besar dari bobot model, dan sebaliknya menyimpannya ke perangkat keras memori, sehingga dapat secara signifikan mengurangi tekanan pada VRAM. Solusi teknologi n-gram yang disebutkan dalam makalah ini didasarkan pada ide tersebut—melalui penyimpanan dependensi jangka panjang di memori eksternal, bukan bergantung pada parameter internal model.



Dari sudut pandang perangkat keras, perubahan arsitektur ini berarti apa? Kebutuhan memori akan meningkat secara signifikan. Seiring model besar berkembang ke arah ini, permintaan pasar untuk DDR5 kemungkinan memasuki siklus pertumbuhan baru. Micron sebagai pemasok memori utama, dalam jangka panjang akan menjadi penerima manfaat.

Dari sudut pandang investasi, tekanan harga DDR5 mungkin akan terus meningkat. Jika solusi teknologi semacam ini benar-benar diimplementasikan dan dipromosikan, tidak berlebihan untuk mengharapkan penggandaan tahun ini—tergantung pada kemajuan nyata dalam pelatihan dan penerapan model.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)