จากมุมมองพื้นฐาน วิธีการทั้งสองนี้จริงๆ แล้วเป็นไปตามตรรกะหลักเดียวกัน ต่างก็พูดถึงปัญหาเดียวกัน: โมเดลเพื่อให้บรรลุความต่อเนื่องของความทรงจำระยะยาวและความเสถียรของความเข้าใจ การพึ่งพาเพียงหน้าต่างบริบทคงที่และการเก็บน้ำหนักไว้ในหน่วยความจำไม่เพียงพอ ข้อจำกัดนี้กำหนดขีดจำกัดของสถาปัตยกรรมในปัจจุบัน กล่าวอีกนัยหนึ่ง "ความเข้าใจ" ที่แท้จริงจำเป็นต้องก้าวข้ามข้อจำกัดของพารามิเตอร์ในตัวโมเดล—นี่คือปัญหาหลักที่การออกแบบสถาปัตยกรรม AI ทั้งหมดต้องแก้ไข

ดูต้นฉบับ
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • รางวัล
  • 9
  • repost
  • แชร์
แสดงความคิดเห็น
0/400
NonFungibleDegenvip
· 01-22 20:44
ngl ขีดจำกัดของหน้าต่างบริบทนี้อาจจะไม่มีอะไรเลย แต่ก็เหมือนเป็นทุกอย่าง? เหมือนเราทุกคนแค่พยายามทำใจถ้าคิดว่าพารามิเตอร์คงที่จะเพียงพอในระยะยาว ser... ทั้งหมดนี้รู้สึกเหมือนช่วง NFT เริ่มต้นเลยทีเดียว, ทุกคนพุ่งเข้าใส่ก่อนที่จะเข้าใจเทคโนโลยีจริงๆ lol
ดูต้นฉบับตอบกลับ0
TheMemefathervip
· 01-22 20:37
พูดง่ายๆ ก็คือโมเดลในตอนนี้ยังไม่เก่งพอ ยังไม่มีความเข้าใจที่แท้จริง
ดูต้นฉบับตอบกลับ0
MintMastervip
· 01-22 19:46
พูดถึงแล้วนะ นี่ก็เหมือนกับว่าระบบโมเดลขนาดใหญ่อยู่เหมือนปลาทอง ที่จำได้แค่ไม่กี่วินาทีเท่านั้น... การพึ่งพาแค่หน้าต่างและน้ำหนักก็ไม่สามารถรองรับได้เลย
ดูต้นฉบับตอบกลับ0
CryptoTherapistvip
· 01-20 16:44
ngl, this hits different... you're basically saying the model's got trauma from context window limitations? like, we're all trapped in the same psychological prison lmao. the ceiling isn't the ceiling, it's just where we stopped doing the inner work 💭
ตอบกลับ0
LightningSentryvip
· 01-20 01:09
พูดง่ายๆ ก็คือโครงสร้างโมเดลขนาดใหญ่ในปัจจุบันนั้นโดยพื้นฐานแล้วเป็นอัมพาต การเพิ่มพารามิเตอร์ก็ไม่สามารถช่วยได้
ดูต้นฉบับตอบกลับ0
ConsensusBotvip
· 01-20 01:07
สุดท้ายแล้วก็เป็นปัญหาเดิมๆ อยู่ดี, context window ก็เหมือนกับการใส่กรวยเข้าไปในสมองของโมเดล ถึงเก่งแค่ไหนก็จำไม่ได้อยู่ดี
ดูต้นฉบับตอบกลับ0
LiquidationOraclevip
· 01-20 01:07
พูดง่ายๆ ก็คือโมเดลในปัจจุบันมีข้อบกพร่องตามธรรมชาติ ต้องคิดหาวิธีที่จะก้าวข้ามมัน
ดูต้นฉบับตอบกลับ0
TokenDustCollectorvip
· 01-20 00:54
สุดท้ายแล้วก็เป็นจุดอ่อนนี้แหละ หน้าต่างบริบทนั้นไม่สามารถบรรจุความเข้าใจที่แท้จริงได้เลย เหมือนกับการใช้กล่องเล็กๆ เพื่อบรรจุจักรวาลทั้งใบ
ดูต้นฉบับตอบกลับ0
SelfStakingvip
· 01-20 00:44
พูดง่ายๆ ก็คือโครงสร้างโมเดลในปัจจุบันเป็นเสมือนเพดานที่ไม่สามารถก้าวข้ามได้ ระบบหน้าต่างคงที่นั้นควรจะถูกแก้ไขไปนานแล้ว
ดูต้นฉบับตอบกลับ0
ดูเพิ่มเติม
  • ปักหมุด