Live AI Wire

LLM ใช้ compute ยาวนานไม่ได้ดีเสมอ — วิจัยใหม่เตือนเรื่อง overthinking และวิธีจัดสรรงบประมาณให้ชาญฉลาด

กลุ่มวิจัยเพิ่งค้นพบว่าการให้ reasoning model คิดนานขึ้นไม่ได้ช่วยเสมอ บางครั้งมันยิ่งทำให้ผิดไปจากคำตอบที่ถูก ปัญหาคือ decoder-only attention มีขีดจำกัดในการ track state ยาวๆ ดังนั้นวิจัยใหม่เสนอวิธีจัดสรร compute budget ตามความสำคัญของแต่ละงาน ไม่ใช่เท่าๆ กัน และตัดส่วน reasoning ที่ซ้ำซ้อนออกไป เพื่อให้ inference ประหยัดและแม่นยำขึ้น

05 มิ.ย. 2569 12:06 1 แหล่งข่าว AI สรุปภาษาไทย

arXiv — cs.AI

ประเด็นที่ควรจับตา

Extended reasoning ทำให้ performance แย่ลงบน state-tracking tasks เพราะ attention bottleneck ไม่ทำให้ model track ข้อมูลยาวได้
Consequence-aware allocation: ใช้ compute มากขึ้นสำหรับงานที่ผิดพลาดมีผลกระทบสูง (เช่น database migration) ไม่ใช่ความยากเท่านั้น
Segment-level trimming ตัดส่วน overthinking ออกจาก chain-of-thought ได้ 30-40% token ลดลงโดยไม่ทำให้ accuracy ตกต่ำ

LLM ใช้ compute ยาวนานไม่ได้ดีเสมอ — วิจัยใหม่เตือนเรื่อง overthinking และวิธีจัดสรรงบประมาณให้ชาญฉลาด

ประเด็นที่ควรจับตา

Join Our Free Trial