SCBX Unlocking AI SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications
Jul 26, 2024

Session 1: ACL & LLM Roadmap in Thailand กลับมาอีกครั้งกับงาน SCBX Unlocking AI คราวนี้กลับมาใน EP 9 ภายใต้หัวข้อ Advancing ThaiLLM Development and Applications เพื่อนําเสนอเรื่องราวเกี่ยวกับ AI และ LLM ที่กําลังอยู่ในความสนใจของผู้คนทั่วโลกนับตั้งแต่ ChatGPT ถือกําเนิดขึ้น งานนี้มีหัวข้อเสวนาน่าสนใจหลายหัวข้อ โดยเริ่มแรกได้ ดร.เทพชัย ทรัพย์นิธิ Vice President, AiAT & Director of Artificial Intelligence Research จากศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (National Electronics and Computer Technology Center : NECTEC หรือเนคเทค) มาบรรยายเรื่อง ACL & LLM Roadmap in Thailand แต่ก่อนจะอธิบายเรื่อง LLM ดร.เทพชัย เกริ่นถึงสิ่งที่เรียกว่า ACL ก่อนว่าคืออะไร และสําคัญอย่างไรกับโลก AI และ LLM โดย ACL นั้นมี 2 ความหมายดังนี้ Annual Meeting on Computational Lingustics หรือการจัดประชุมวิชาการของเหล่านักภาษาศาสตร์คอมพิวเตอร์ ซึ่งเป็นงานที่เก่าแก่ จัดมาตั้งแต่ปี 1962 แต่เดิมเคยใช้ชื่อ Association on Machine Translation and Computation Linguistics Association of Computational Linguistics หรือผู้ที่ดูแลและจัดงานประชุมนี้ขึ้นมานั่นเอง หากขาดงานนี้และคณะผู้จัดไป อาจส่งผลให้ความตื่นตัวในแวดวง AI เปลี่ยนจากหน้ามือเป็นหลังมือ ดร.เทพชัย ให้ข้อมูลเพิ่มเติมว่าการประชุม ACL จัดขึ้นที่สหรัฐอเมริกามาตลอด จนกระทั่งปี 1996 ที่เริ่มไปจัดประเทศอื่นบ้าง เช่นที่แคนาดา สเปน ก่อนจะมาจัดที่เอเชียครั้งแรกที่ฮ่องกงเมื่อปี 2000 และเดือนสิงหาคม 2024 นี้ประเทศไทยก็จะเป็นเจ้าภาพจัดประชุมด้วย ซึ่งเขาเองก็จะไปร่วมงานเช่นกัน หลังเข้าร่วมงาน ACL มาตั้งแต่ปี 2009 แล้ว ดร.เทพชัย มองว่าวันนี้เราเห็นประโยชน์ของ AI และ LLM ที่เป็นรูปธรรมมากขึ้น เหตุผลก็เพราะการถือกําเนิดของ ChatGPT ในเวลาไม่กี่ปียังเกิด LLM ที่เป็น Multilingual ทั้งของ Google, Microsoft, Meta, Apple และ OpenAI ซึ่งเน้นภาษาอังกฤษ มี LLM ที่ประเทศจีนพัฒนาขึ้นโดย Baidu, Huawei และ Qwen ส่วนประเทศไทยก็มี LLM ภาษาไทยเช่นกัน เช่น OpenThaiGPT และ Typhoon เป็นต้น ดร.เทพชัย ยังบอกว่าไทยวาง Roadmap มียุทธศาสตร์เป้าหมาย และผลลัพธ์ตามแผนปฏิบัติการด้าน AI จํานวน 5 ข้อ โดยยุทธศาสตร์ด้าน LLM อยู่ในด้านที่ 2 ด้วย ซึ่งแสดงให้เห็นว่าประเทศไทยให้ความสําคัญกับเรื่องนี้มาก และน่าจะเป็นประโยชน์ต่อการเอาไปใช้ในเชิงธุรกิจ หรือการศึกษาวิจัยในอนาคต โดยตอนนี้ เขาและทีม NECTEC ได้รับคําเรียกร้องจากทั้งหน่วยงานรัฐและเอกชนเยอะมาก เพื่อให้ช่วยสร้าง LLM ที่มีความเฉพาะด้าน เอามาช่วยงานที่มีความเฉพาะเจาะจงกับแต่ละองค์กร ซึ่งต้องมาติดตามกันต่อไปว่า จะพัฒนาและนํามาใช้งานอย่างไร อีกงานสําคัญคือการจับมือกับสํานักงานการวิจัยแห่งชาติ (วช.) กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม และกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม เพื่อสร้าง LLM 3 โมเดลคือ Pretrained LLM เป็น Base Model ที่เก่งกาจในการใช้ภาษาไทย ซึ่งทุกคนสามารถใช้งานร่วมกันได้ Fine Tuning Model เพื่อรองรับงานด้านการท่องเที่ยว การแพทย์ และสิ่งแวดล้อม Opensourced Model ที่องค์กรเอกชนจะสามารถนําไปพัฒนาและต่อยอดให้กับอุตสาหกรรมอื่นๆ ที่ตนเองทํางานอยู่ได้ อีกสิ่งที่กําลังทําอยู่คือ Chatbot Arena หรือการเอา Chatbot แต่ละตัวมาคุยกันเอง เพื่อให้ทราบว่า ข้อมูลจาก Bot ตัวไหนถูกต้อง ใช้งานง่าย ใช้งานได้จริงกว่ากัน อีกสิ่งที่ดร.เทพชัยเน้นย้ําคือ การเอา AI มาใช้จะต้องมีความปลอดภัยและไว้ใจได้ จึงเกิดโครงการพัฒนา Trustworthy AI Framework ขึ้นมา เป็นการเอา LLM แต่ละตัวมาศึกษาว่ามันเข้าข่ายความปลอดภัยจากเรื่องบ้าง เช่น ความรุนแรง การละเมิดกฎหมาย ความลามกอนาจาร รวมถึงเป็นมิตรต่อสุขภาพจิต และดีต่อสังคมและวัฒนธรรมไทยหรือไม่ เป็นต้น สุดท้าย ดร.เทพชัย ยังกาง Roadmap ที่ทาง NECTEC ได้วางแผนไว้คร่าวๆ ไว้ว่าภายใน 5 ปีจากนี้จะพัฒนา OpenThaiGPT ที่พัฒนามากขึ้น โดยปี 2028 จะพัฒนา OpenThaiLLM และ Multimodel OpenThaiLLM เวอร์ชั่น 3.0.0 สําหรับใช้งานงาน 3D World Instruction ให้ได้ หากทุกอย่างเป็นไปตามแผนที่วางไว้ เราน่าจะได้เห็นความท้าทาย ความแปลกใหม่ และสิ่งที่น่าตื่นตาตื่นใจเกิดขึ้นแก่ประเทศไทยอีกมากมายตามมาแน่นอน Session 2: Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration จากที่โลกนี้มีกําแพงด้านภาษาขวางกั้น การจะสื่อสารกับชาวต่างชาติต้องใช้ความรู้และสั่งสมประสบการณ์นานพอตัว แต่การมาถึงของ Generative AI และการพัฒนาอย่างก้าวกระโดดของ LLM ทําลายกําแพงทางภาษาอย่างราบคาบ จนตอนนี้ไม่แค่ในสหรัฐอเมริกา หรือในยุโรปเท่านั้นที่กําลังพัฒนา LLM ที่ฉลาดและล้ําสมัย แต่ในเอเชีย โดยเฉพาะในภูมิภาคเอเชียตะวันออกเฉียงใต้นั้นก็กําลังพัฒนาเช่นกัน แถมหลายประเทศยังร่วมมือกันอย่างน่าจับตามองด้วย ศ.ดร.สรณะ นุชอนงค์ Director of VISTEC-depa หนึ่งในผู้บุกเบิกด้าน LLM ในไทย มาบรรยายเรื่อง Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration ในงาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications เพื่ออธิบายว่าการศึกษา วิจัย และพัฒนาด้าน LLM ในแถบเอเชียตะวันออกเฉียงใต้ตอนนี้รุดหน้าไปไกลเพียงใด หนึ่งในโครงการที่เด่นมากอยู่ที่ประเทศสิงคโปร์ ชื่อว่า SEALD (Southeast Asian Languages in One Network Data) หรือเรียกง่ายๆ ว่า AI Singapore เป็นโครงการที่เชิญชวนนักวิจัยในประเทศเพื่อนบ้านมาร่วมมือกันสร้าง LLM ที่โดดเด่นด้านภาษาท้องถิ่นของเอเชีย เนื่องจากประเทศในแถบเอเชียตะวันออกเฉียงใต้ล้วนมีภาษาหลักของแต่ละประเทศอยู่แล้ว ไม่เพียงแค่นั้นยังมีภาษาถิ่น หรือภาษารอง อีกนับพันภาษา การที่โครงการมุ่งพัฒนา LLM ที่มีข้อมูลของภาษาต่างๆ ในภูมิภาคนี้ ถือเป็นการใช้ความหลากหลาย หรือ Diversity ให้เกิดประโยชน์นั่นเอง ทั้งนี้ หากนักวิจัยจะทํา R&D พัฒนา LLM อย่างมีประสิทธิภาพ จะต้องมีการวัดผลที่ดีด้วย แต่ปัญหาของการพัฒนา LLM ทุกวันนี้คือยังวัดผลได้ยาก ไม่แค่เฉพาะในแถบเอเชีย แต่แม้กระทั่ง LLM ภาษาอังกฤษเองก็ยังมีปัญหานี้อยู่ โดย ศ.ดร.สรณะ แจกแจงว่ามี 4 อุปสรรคสําคัญในการวัดผลดังนี้
Sparse Evaluation Data - มีเพียงไม่ถึง 10 ภาษาเท่านั้น ที่ถูกนํามาใช้พัฒนาและให้ AI เรียนรู้ Resource Gap - ในจํานวน 1,308 ภาษาในแถบเอเชียตะวันออกเฉียงใต้ มี 700 ภาษาที่มีข้อมูลหรือ Datasets ที่ถูกต้องสําหรับใช้วัดผลน้อย แค่ 1-2 Datasets เท่านั้น Quality of Resources คุณภาพของข้อมูลที่อยู่ในอินเทอร์เน็ต ยังไม่ได้รับการยืนยันว่าถูกต้องเพียงพอจะนําไปใช้งานต่อได้ Cultural Relevance ข้อมูล หรือศัพท์เฉพาะเกี่ยวกับภาษารองหลายภาษา แปลมาจากภาษาอังกฤษอีกที อาจไม่สอดคล้องกับวัฒนธรรมหรือบริบทจริงๆ ของพื้นที่นั้น ทั้งนี้รัฐบาลสิงคโปร์เข้าใจปัญหานี้ดี จึงพัฒนาโครงการ SEACrowd ขึ้นมาเพื่อรวบรวม Datasets ของประเทศในแถบเอเชียตะวันออกเฉียงใต้อย่างเป็นทางการ และมีนักวิจัยของ Vistec เข้าไปมีร่วมในโครงการด้วย ศ.ดร.สรณะ คาดหวังว่า SEACrowd จะเป็น Benchmark ที่ดีที่ช่วยให้มั่นใจว่า Data ที่ได้มาจะนําเสนอถึงความเป็นภูมิภาคเอเชียตะวันออกเฉียงใต้ได้จริงๆ ไม่ใช่การคิดไปเอง หรือแปลมาจากแหล่งข้อมูลของประเทศตะวันตกอีกที เพราะอย่าลืมว่าการพัฒนา LLM แล้ววัดผลด้วย Benchmark ที่ถูกต้อง ใช้งานได้จริง มีผลอย่างยิ่งต่อการตีพิมพ์หรือไม่ได้ตีพิมพ์งานวิจัย ไปจนถึงการพัฒนาต่อเป็นผลงานที่ใช้ได้จริงด้วย จะช่วยนําทางนักวิจัยไปสู่เป้าหมาย และทําให้นักวิจัยรู้ว่าปัญหาไหนที่ต้องแก้ไข ปัญหาไหนไม่ต้องแก้ไขอะไรแล้ว สิ่งไหนที่จะช่วยพัฒนา LLM ให้ดียิ่งขึ้นต่อไป เป็นต้น แต่ก็มีข้อควรระวังในการวัดผลด้วยเช่นกัน ศ.ดร.สรณะ ยกตัวอย่างเปเปอร์ชื่อ Don’t Make Your LLM an Evaluation Benchmark Cheater ที่ได้ข้อสรุปว่า ให้ระวังการตั้งใจวัดผลให้ออกมามีตัวเลขที่ดูดี ดูสวยที่สุด แต่กลับไม่สามารถเอาไปใช้งานจริงได้เมื่อต้องทํางานจริง เพราะมันไม่ต่างอะไรกับนักเรียนที่ตั้งใจอ่านหนังสือเพื่อสอบให้ได้คะแนนดี แต่เอาความรู้ที่ได้มานั้นไปใช้ประโยชน์อะไรไม่ได้ ส่วนในอนาคต ศ.ดร.สรณะ ยืนยันว่าไทยจะร่วมมือกับโครงการ SEACrowd ต่อไป เพื่อนําภาษาไทยที่มีความเป็นภาษาถิ่น เข้าไปอยู่ในฐานข้อมูลกลาง ให้คนทั่วโลกได้รู้จักมากขึ้นต่อไป Session 3: Understanding Textual Embeddings: Applications in Retrieval and Recommendation เคยสงสัยไหมว่า เว็บไซต์ประกาศรับสมัครงานอย่าง JobTopGun หาวิธีช่วยให้ผู้สมัครงานได้งานที่ใช่ได้อย่างไร คําตอบอยู่ในงาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications ที่ผ่านมานั่นเอง! อ.ดร.เอกพล ช่วงสุวนิช จากภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย มาบรรยายเรื่อง Understanding Textual Embeddings: Applications in Retrieval and Recommendation และเล่าประสบการณ์ที่เคยฝึกฝนและพัฒนา LLM อย่างไรบ้าง โดยมีกรณีศึกษาคือ JobTopGun นั่นเอง ดร.เอกพล บอกว่ามนุษย์เรามีความสามารถในการตีความ เรารู้ว่า ประโยคไหนมีความหมายเหมือนหรือใกล้เคียงกับประโยคไหนบ้าง เช่น A Little Girl Seems to be Very Sad มีความหมายใกล้เคียงกับ The Little Child is Far From Being Happy แต่เมื่อจะพัฒนา LLM ก็ถือเป็นความท้าทายเหมือนกันว่า เราจะต้องป้อนข้อมูลอย่างไรให้คอมพิวเตอร์เข้าใจความหมายของประโยคที่เขียนไม่เหมือนกัน แต่ความหมายเหมือนหรือใกล้เคียงกันได้ด้วย ดร.เอกพล ยกตัวอย่างว่า เขาเคยฝึกระบบของ JobTopGun เว็บไซต์ประกาศหางานที่เปิดโอกาสให้ผู้คนเอาเรซูเม่สมัครงานมาอัปโหลดในเว็บไซต์ หน้าที่ของเขาคือทําอย่างไรก็ได้เพื่อหาทางจับคู่เรซูเม่ต่างๆ ให้เจอตําแหน่งงานที่เหมาะสมให้ได้ เขาจึงฝึกให้ปัญญาประดิษฐ์อ่านเรซูเม่ของผู้สมัครงาน และ Job Description ของแต่ละงานจากแต่ละองค์กร จนมันรู้จักลักษณะงานที่เหมาะสมของแต่ละคน จนเข้าใจว่าถ้าเจอว่าประวัติของคนๆ นี้ต้องไปทํางานแบบไหน กับบริษัทใด สําหรับเทคนิคในการเรียนรู้ที่ใบ้สอนปัญญาประดิษฐ์คร่าวๆ จะมี 2 แนวคือ Sparse Embeddings และ Dense Embedbings Sparse Embeddings หมายถึงการให้ Machine Learning อ่านหนังสือแล้วนับว่าหนังสือเหล่านี้มี Keyword อะไร เยอะแค่ไหนบ้าง เช่น หนังสือของวิลเลียม เชกสเปียร์ มีคําว่า Battle กี่คํา หรือมีคําว่า Soilder กี่คํา เป็นต้น แล้วเอาผลที่ได้ไปวิเคราะห์ต่อข้อดีของ Sparse Embeddings คือใช้งานง่าย เข้าใจง่าย แต่ก็มีข้อควรระวัง เช่น บางกรณีอาจไม่เจอคําที่ต้องการให้นับ และบ่อยครั้งคอมพิวเตอร์อาจมองข้ามคําที่มีความหมายเดียวกัน แต่ไม่ใช่คําเดียวกัน ดังนั้นอาจต้องเปลี่ยนจากการนับจํานวนครั้ง เป็นการนับเปอร์เซ็นต์ หรือความถี่แทนว่าเจอคํานี้บ่อยแค่ไหน Dense Embedbings ป้อนข้อมูล หรือ Input สําหรับ Deep Learning แล้วแปลงค่าสิ่งต่างๆ ออกมาเป็นตัวเลข หากเลขไหนเหมือนกัน หรือใกล้เคียงกัน หมายความว่าสามารถจับคู่สิ่งๆ นั้นกันได้ง่ายดร.เอกพล เล่าว่านี่คือวิธีการที่เขาสอนให้ Machine Learning ของ JobTopGun ได้เรียนรู้วิธีอ่านเรซูเม่ของผู้สมัครงาน โดย AI จะแปลงค่าเรซูเม่, Job Description หรือประกาศรับสมัครงานออกมาเป็นตัวเลข แล้วหากเลขนั้นเทียบกันแล้วได้ค่าใกล้เคียงกันหรือเท่ากัน ก็บ่งชี้ว่าเรซูเม่ของผู้สมัครงานเหมาะกับงานนั้นที่เปิดรับสมัครไว้นั่นเอง ทั้ง Sparse และ Dense Embedbings ต่างมีข้อดีและข้อเสียแตกต่างกันไป ก่อนใช้ต้องดูว่ากรณีไหนที่ควรใช้ Sparse กรณีไหนควรใช้ Dense หรือจะนํามาใช้ร่วมกัน เพื่อดึงข้อดีของทั้ง 2 วิธีออกมาให้เต็มที่ ขอเพียงเข้าใจคอนเซ็ปต์ และวิธีการทํางาน ดร.เอกพลมั่นใจว่า เราจะสามารถพัฒนาสิ่งที่น่าสนใจได้อีกมากมาย เพื่อยกระดับการทํางานของตัวเองและองค์กรต่อไป Session 4: Investment Insights Unleashed: AI-Powered Digital RM and Customer Service คนที่จะเป็นนักลงทุนประสบความสําเร็จ สิ่งที่ขาดไม่ได้คือต้องติดตามข้อมูลข่าวสารตลอดเวลา แต่เพราะข้อมูลข่าวสารยุคนี้มาเร็วมาไวจนยากจะตามทันได้ การพลาดข้อมูลสําคัญไปเพียงนิดเดียว อาจส่งผลให้แทนที่จะได้ผลกําไร กลับขาดทุนมหาศาลในพริบตา แต่จะเป็นอย่างไรหากนักลงทุนสามารถเข้าถึงข้อมูลที่จําเป็นต่อการลงทุนได้ง่ายขึ้น? คุณวีรินท์ ฉันทโรจน์ AI Transformation Lead จาก InnovestX ฉายภาพนั้นในการบรรยายเรื่อง Investment Insights Unleashed: AI-Powered Digital RM and Customer Service ในงาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications อธิบายว่าแพลตฟอร์ม InnovestX เอา LLM มาใช้เพื่อให้ข้อมูลข่าวสารที่จําเป็นแก่นักลงทุนได้อย่างไร คุณวีรินท์ เล่าว่า InnovestX มีฐานลูกค้าในปัจจุบันประมาณ 1 ล้านคน แต่คนส่วนใหญ่ประมาณ 98% เป็นลูกค้าทั่วไปที่มีเวลาลงทุนค่อนข้างน้อย เพราะต้องทํางานประจํา และไม่มีคนมาแนะนําการลงทุนส่วนบุคคลว่า ควรซื้อหุ้นตัวไหน ควรขายหุ้นตัวไหน ต้องเจียดเวลาทํางานไปติดตามข่าวสารจากแหล่งต่างๆ เอาเอง และเนื่องจากการลงทุนในปัจจุบันไม่ได้มีแค่หุ้นไทย แต่ยังมีหุ้นต่างประเทศ มีกองทุนรวม พันธบัตร หุ้นกู้ให้เลือกซื้อได้ รวมถึงสินทรัพย์เสี่ยงอย่างคริปโตเคอร์เรนซี่ เราแทบไม่มีทางติดตามข่าวสารทันเลย หรือถ้าทัน เราจะไม่รู้เลยว่าข้อมูลที่ได้มา มีผลต่อพอร์ตในการลงทุนของเราเองแค่ไหน อีกความท้าทายคือ ลูกค้ามักจะติดต่อเข้ามาสอบถามข้อมูลด้านการลงทุนจาก InnovestX ผ่านหลายช่องทาง ทําให้ Customer Service ต้องทํางานหนักเป็นพิเศษเพื่อรับเรื่องจากลูกค้า ขณะเดียวกันก็เป็นไปได้ยากที่จะพัฒนาผู้เชี่ยวชาญด้านการลงทุนที่เป็นมนุษย์ ให้ทํางานเพื่อรองรับจํานวนลูกค้าที่เพิ่มขึ้นได้ทันด้วย จากกรณีต่างๆ ที่สั่งสมมา จึงเกิดเป็นการพัฒนา AI-Powered Digital RM ผ่าน LLM ที่ชื่อ Typhoon เพื่อช่วยพนักงานของ InnovestX ในการทํางาน และช่วยให้ลูกค้าของแพลตฟอร์มให้สามารถเข้าถึงข้อมูลการลงทุนที่ตรงกับความต้องการที่สุด ในการบริการลูกค้า InnovestX เอา AI เข้ามาช่วยทํางาน Customer Service เป็น Chatbot ให้บริการเปิดบัญชี หรือตอบคําถามการลงทุนขั้นพื้นฐาน ซึ่งช่วยลดปัญหา Information Overload ช่วยลดระยะเวลาในการทํางาน แล้วให้ผู้เชี่ยวชาญที่เป็นมนุษย์คอยรับเรื่องเฉพาะกรณีใหญ่ๆ เท่านั้น ผลพลอยได้ที่ตามมายังช่วยลด Human Error และช่วยให้อารมณ์ของพนักงานไม่ตึงเครียดหรือเหนื่อยล้าเกินไป สําหรับข้อมูลที่ LLM ของ InnovestX นํามาใช้ จะเอามาจากบทวิเคราะห์ที่ทีมวิเคราะห์ของ InnovestX จัดทําขึ้น ทุกเปเปอร์จะมีการอ้างอิงว่า ข้อมูลที่นํามาใช้มีที่มาจากแหล่งใด เพื่อให้นักลงทุนเข้าไปอ่านเพิ่มเติมหากมีเวลา ช่วยเพิ่มความน่าเชื่อถือ และทําให้ลูกค้านักลงทุนมั่นใจว่า นักวิเคราะห์ไม่ได้คิดเลขขึ้นเองโดยไร้หลักการหรือหลักฐานยืนยัน ไม่เพียงแค่นั้น การใช้โมเดลของ Typhoon ยังช่วยให้ InnovestX ประหยัดงบประมาณได้มากกว่า 10% เมื่อเทียบกับการใช้โมเดลอื่นๆ เช่น GPT4o และพนักงานสามารถตอบลูกค้าได้เร็วขึ้น ประหยัดเวลามากขึ้น มั่นใจมากขึ้นว่าจะสามารถส่งมอบคําแนะนําในการลงทุนที่มีคุณภาพไปถึงลูกค้าได้อย่างรวดเร็ว ภายในงาน SCBX Unlocking AI ยังสาธิตการใช้งาน AI-Powered Digital RM แบบ Realtime ด้วย ทําให้เห็นว่า AI ของ InnovestX ทํางานอย่างไร ตอบสนองต่อข้อมูลที่ลูกค้าป้อนเข้ามาจริงอย่างไร เพื่อสร้างความรู้สึกดีๆ ให้ลูกค้าที่ใช้บริการ ทําให้พวกเขาลงทุนอย่างมีความสุขและประสบความสําเร็จต่อไป หากใครสนใจ อยากรู้ว่าข้อมูลการลงทุนจาก InnovestX น่าเชื่อถือและไว้ใจได้จริงหรือไม่ สามารถลองทักแชทไปหา InnovestX ได้เลย Session 5: Advancing Thai LLMs and Their Applications งาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications นอกจากอัดแน่นไปด้วยการบรรยายถึง LLM ในแง่มุมที่น่าสนใจ ยังมีการเสวนาปิดท้ายด้วย ชื่อเดียวกับธีมงานเลยนั่นคือ Advancing Thai LLMs and Their Applications งานนี้ได้รับเกียรติจากผู้เชี่ยวชาญที่มีประสบการณ์การศึกษาและพัฒนา LLM ในระดับชาติและในระดับโลก ประกอบด้วย ดร.เทพชัย ทรัพย์นิธิ Vice President, AiAT & Director of Artificial Intelligence Research จาก NECTEC, ศ.ดร.สรณะ นุชอนงค์ Director of VISTEC-depa, อ.ดร.เอกพล ช่วงสุวนิช จากภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย และคุณวีรินท์ ฉันทโรจน์ AI Transformation Lead จาก InnovestX โดยมี ดร.ฐิติพัทธ อัชชะกุลวิสุทธิ์ อาจารย์ประจําภาควิชาวิศวกรรมชีวการแพทย์ คณะวิศวกรรมศาสตร์ มหาวิทยาลัยมหิดล ทําหน้าที่เป็นพิธีกร สาระสําคัญของการเสวนาครั้งนี้มีเรื่องอะไรน่าสนใจบ้าง Insiderly ai สรุปมาแล้วดังนี้ คุณวีรินท์ บอกว่า LLM สามารถเอามาใช้ในแวดวงการเงินได้หลายอย่าง นอกจากเอามาประมวลข้อมูลช่วยในการลงทุน ยังสามารถเอามาช่วยแก้หนี้เสียของผู้บริโภค, ลดค่าใช้จ่าย, ลดความเสี่ยง และช่วยปรับ Customer Experience ให้ดีขึ้นได้ เป็นต้น ส่วน ดร.เอกพล เล่าว่า LLM สามารถเอาไปใช้ในแวดวงวิชาการได้หลายอย่าง เพื่อดูแลนิสิตนักศึกษาให้ดีขึ้น พร้อมยกตัวอย่างว่าปัจจุบันมีจํานวนนิสิตในคณะเพิ่มขึ้นหลายเท่า แต่จํานวนอาจารย์ผู้สอนกลับไม่ได้เพิ่มขึ้นในอัตราส่วนเท่ากัน เขาจึงทดลองเอา LLM มาช่วยงาน เช่น เอามาช่วยตรวจข้อสอบด้วย แต่พอลองเอามาตรวจข้อสอบก็พบว่า LLM ไม่ได้ให้คําตอบที่เที่ยงตรงมากเมื่อเทียบกับการตรวจเองด้วยมนุษย์ หากเอามาใช้อาจทําให้เกรดของนักศึกษาคลาดเคลื่อนได้ จึงเป็นสิ่งที่ต้องติดตามกันต่อไปว่า ในอนาคตจะสามารถพัฒนาระบบที่มีความเที่ยงตรงขึ้นมาช่วยงาน และแบ่งเบาภาระของคณาจารย์ได้อย่างไร ดร.เทพชัย เสริมว่าใน NECTEC เองก็เอา LLM มาใช้เช่นกัน แต่ใช้กับงานง่ายๆ เช่น เอามาใช้เป็น Chatbot คอยตอบคําถามเกี่ยวกับกฎระเบียบขององค์กร อาทิ วันหยุด วันลา สวัสดิการพนักงาน ซึ่งบางทีเขาก็ลองปรับเปลี่ยนวิธีคําถามให้ยากขึ้น อาจใส่สถานการณ์ที่ซับซ้อนเข้าไปเป็นตัวแปรเพื่อทดสอบว่า มันสามารถตอบคําถามที่พลิกแพลงไปจากที่เรียนรู้ได้แค่ไหน ส่วน ศ.ดร.สรณะ ให้ข้อมูลเพิ่มเติมว่า ตอนนี้กําลังช่วยคณะนิติศาสตร์ มหาวิทยาลัยธรรมศาสตร์ ฝึกฝน LLM เพื่อให้ทําหน้าที่ผู้ช่วยนักกฎหมาย ทั้งนี้สาเหตุที่ไม่ฝึกให้มันเป็นทนาย เพราะยังไม่สามารถมั่นใจและพึ่งพาคําตอบของมันได้เต็มที่ว่ามีความเที่ยงตรงมากกว่าหรือเท่ากับการวินิจฉัยคดีของมนุษย์ ทําให้บทบาทของ LLM ในการเป็นผู้ช่วยนักกฎหมายตอนนี้จะยังจํากัดอยู่แค่การช่วยหาข้อมูล ช่วยสรุปข้อกฎหมาย และคาดว่าภายในเดือนกันยายนนี้จะนําเดโม่สาธิตการใช้งานออกมาให้ทุกคนได้รับชมกัน อีกสิ่งที่ ศ.ดร.สรณะ เน้นย้ําก็คือ คนทั่วไปยังเข้าใจผิดกันอยู่ว่า เราสามารถเอา LLM มาใช้งานเป็น Database สําหรับสืบค้นข้อมูลกันจริงๆ ได้เลย ซึ่งไม่ใช่ เพราะอย่าลืมว่าข้อมูลที่ได้ยังมีความคลาดเคลื่อน ผิดไปจากข้อเท็จจริงอยู่ หากใครจะใช้งานมันเป็นฐาน Database ต้องมีความเชี่ยวชาญจริงๆ ต้องรู้ว่าข้อมูลที่มันให้นั้นถูกหรือผิด และต้องตรวจสอบข้อมูลของมันอยู่เสมอด้วย ดร.เทพชัย บอกว่าการจะมี LLM ที่ดีที่ให้ข้อมูลถูกต้อง จําเป็นต้องมาจากการให้เรียนรู้ข้อมูลพื้นฐานที่ดีด้วย แต่เขายอมรับว่าปัจจุบันยังมีไม่กี่คนเท่านั้นที่สามารถฝึกฝน LLM แล้ว Fine Tuning คําตอบออกมาได้อย่างที่ตั้งใจไว้ ดังนั้นหากต้องการเห็นแวดวง AI พัฒนามากขึ้น ก็จําเป็นต้องเร่งเสริมสร้างบุคลากรขึ้นมาเพื่อช่วยยกระดับวงการให้มากขึ้นด้วย คุณวีรินท์ ยืนยันว่าการหาคนมาเสริมทีม AI Engineer นั้นยากจริงๆ ในกรณีของ InnovestX เจอปัญหาจากทั้งปัจจัยภายในและภายนอก โดยปัจจัยที่มีผลมากๆ ก็คือสภาพของตลาดหุ้นประเทศไทยเองที่ตอนนี้อยู่ในช่วงขาลง เมื่อเทียบกับประเทศอื่นๆ ที่เป็นช่วงขาขึ้น ทําให้ผู้คนสนใจข้อมูลจากหุ้นไทยน้อยลง แล้วพอคนสนใจน้อย เม็ดเงินที่จะเข้ามาสนับสนุนให้วงการเติบโตก็น้อยลงไปด้วย ไม่สามารถพัฒนาอย่างมีประสิทธิภาพได้ ปัญหาเรื่องคนยังส่งผลให้ชุมชนของผู้คนในวงการพัฒนา AI ยังไม่แข็งแรงเท่าที่ควรคือเรื่องใหญ่ที่ทุกคนล้วนเจอ ดร.เอกพล เล่าว่าเคยเจอคนจากหลายองค์กรที่พยายามศึกษาและพัฒนา LLM ด้วยตัวเอง แต่พอต้องเรียนรู้เองก็มีค่าใช้จ่ายที่สูง และต้องเสียค่าลองผิดลองถูกที่แพงมาก นั่นทําให้เขายิ่งเห็นความสําคัญของงานเสวนาอย่าง SCBX Unlocking AI ว่าสามารถนําผู้คนที่มีความสนใจในสิ่งเดียวกันมาเจอกัน แล้วนําไปสู่การพัฒนาสิ่งที่ดีขึ้นพร้อมกันได้ และเราควรต้องมีพื้นที่แบบนี้เพิ่มขึ้น หากต้องการให้แวดวง AI พัฒนาขึ้นจริงๆ
อ่านฟรีให้ตามทัน สมัครสมาชิกเมื่ออยากตัดสินใจให้คมขึ้น
บทความเปิดให้อ่านได้ตามปกติ ส่วนสมาชิกจะได้ brief เชิงลึก คลังย้อนหลัง และมุมวิเคราะห์สำหรับใช้คุยงานกับทีม