รับ Brief ฟรี
← กลับไป Wire

Live AI Wire

LLM ใช้ compute ยาวนานไม่ได้ดีเสมอ — วิจัยใหม่เตือนเรื่อง overthinking และวิธีจัดสรรงบประมาณให้ชาญฉลาด

กลุ่มวิจัยเพิ่งค้นพบว่าการให้ reasoning model คิดนานขึ้นไม่ได้ช่วยเสมอ บางครั้งมันยิ่งทำให้ผิดไปจากคำตอบที่ถูก ปัญหาคือ decoder-only attention มีขีดจำกัดในการ track state ยาวๆ ดังนั้นวิจัยใหม่เสนอวิธีจัดสรร compute budget ตามความสำคัญของแต่ละงาน ไม่ใช่เท่าๆ กัน และตัดส่วน reasoning ที่ซ้ำซ้อนออกไป เพื่อให้ inference ประหยัดและแม่นยำขึ้น

05 มิ.ย. 2569 12:06 1 แหล่งข่าว AI สรุปภาษาไทย
arXiv — cs.AI

ประเด็นที่ควรจับตา

  • Extended reasoning ทำให้ performance แย่ลงบน state-tracking tasks เพราะ attention bottleneck ไม่ทำให้ model track ข้อมูลยาวได้
  • Consequence-aware allocation: ใช้ compute มากขึ้นสำหรับงานที่ผิดพลาดมีผลกระทบสูง (เช่น database migration) ไม่ใช่ความยากเท่านั้น
  • Segment-level trimming ตัดส่วน overthinking ออกจาก chain-of-thought ได้ 30-40% token ลดลงโดยไม่ทำให้ accuracy ตกต่ำ