Live AI Wire
นักวิจัยทดสอบ LLM ในงานแพทย์จริง — ตั้งแต่สรุปเอกสารถึงตัดสินใจคลินิก
กลุ่มวิจัยหลายแห่งเปิดตัวเครื่องมือและ benchmark เพื่อวัดความน่าเชื่อถือของ LLM ในงานแพทย์จริง ตั้งแต่สรุปวรรณกรรมทางการแพทย์ การตัดสินใจคลินิก การประเมินความปลอดภัยผู้ป่วย ไปจนถึงการใช้ LLM เป็น \"ผู้พิพากษา\" เพื่อประเมินผลลัพธ์ทางการแพทย์ ผลการศึกษาแสดงว่า LLM มีศักยภาพ แต่ยังมีช่องว่างเรื่องความลำเอียง ความปลอดภัย และการให้เหตุผลตามหลักการแพทย์จริง
arXiv — cs.AI