Live AI Wire
LLM ใช้ compute ยาวนานไม่ได้ดีเสมอ — วิจัยใหม่เตือนเรื่อง overthinking และวิธีจัดสรรงบประมาณให้ชาญฉลาด
กลุ่มวิจัยเพิ่งค้นพบว่าการให้ reasoning model คิดนานขึ้นไม่ได้ช่วยเสมอ บางครั้งมันยิ่งทำให้ผิดไปจากคำตอบที่ถูก ปัญหาคือ decoder-only attention มีขีดจำกัดในการ track state ยาวๆ ดังนั้นวิจัยใหม่เสนอวิธีจัดสรร compute budget ตามความสำคัญของแต่ละงาน ไม่ใช่เท่าๆ กัน และตัดส่วน reasoning ที่ซ้ำซ้อนออกไป เพื่อให้ inference ประหยัดและแม่นยำขึ้น
arXiv — cs.AI