เข้าใจ Large Language Model หรือ LLM ฉบับคนไม่มีพื้นฐาน

August 8, 2024
Palida Koyama Yukie
LLM

องค์กรน่าจะคุ้นเคยกับการนำ AI หรือ Artificial Intelligence มากขึ้นในช่วงปีที่ผ่านมา เนื่องจากได้มีการนำเทคโนโลยี โดยเฉพาะ Generative AI มาใช้อย่างแพร่หลายมากขึ้นในแต่ละอุตสาหกรรม วันนี้ Disrupt จะพามารู้จักกับเบื้องหลังพื้นฐานโมเดลของ Generative AI ซึ่งก็คือ Large Language Models หรือที่เรารู้จักกันในนาม LLM นั่นเอง

LLM คือโมเดลพื้นฐานที่ใช้ในการประมวลผลข้อมูลทางภาษา ซึ่งเปรียบเสมือนพื้นฐานของ Generative AI โดยการทำงานของ LLM คือการทำนายคำศัพท์ จากฐานข้อมูลจำนวนมาก (Big Data) และข้อมูลจาก Clound บนอินเตอร์เน็ตทั้งหมด เพื่อทำให้ผลของการทำนายนั้นแม่นยำที่สุด ซึ่งทำให้ผลลัพธ์ของการสร้างคำนั้นตรงกับความต้องการของลูกค้า และสามารถโต้ตอบกลับมาได้ราวกับมนุษย์นั่นเอง

Highlight

  • AI เปรียบเสมือนศาสตร์ที่ทำให้คอมฉลาดเหมือนมนุษย์
  • Machine Learning คือวิธีหนึ่งที่ทำให้คอมพิวเตอร์ ฉลาด ผ่านการเรียนรู้ของข้อมูล
  • Deep Learning คือการจำลองการทำงานของสมองมนุษย์ โดยใช้โครงข่ายประสาทเทียม สามารถเรียนรู้ความสัมพันธ์ของ Data ที่ซับซ้อนได้ 
  • Large Language Models หรือ LLM  คือโมเดลพื้นฐานที่ใช้ในการเทรน Generative AI ในการประมวลผลให้ข้อมูลออกมาเป็นผลลัพธ์เชิงภาษาศาสตร์

LLM คืออะไร

Large Language Models หรือ LLM คืออะไร? LLM คือ โมเดลภาษาขนาดใหญ่ ซึ่งเป็นโมเดลพื้นฐานที่ใช้ประมวลผลข้อมูลต่าง ๆ และสร้างข้อมูลใหม่ๆ ออกมา ซึ่งส่วนใหญ่จะเป็นโมเดลพื้นฐานของ Generative AI  โดย LLM นั้นจะถูกสร้างขึ้นผ่านการจำลองสมองการเรียนรู้ของมนุษย์ (Deep Learning) ทำให้มีความสามารถในการเรียนรู้เข้าใจภาษาของมนุษย์ และสามารถ ‘คาดเดา’ หรือ สร้างคำ ภาษาได้เหมือนมนุษย์จริงๆ Generative AI นั้นมีความสามารถในการเข้าใจข้อมูลได้เอง โดยที่เราไม่ต้องเรียบเรียงให้ เบื้องหลังของโมเดล LLM จะเกิดเรียนรู้จากข้อมูลที่ได้รับการเทรนเข้ามาในระบบ (Training Models) โดยเกิดจากการเทรนข้อมูลจำนวนมหาศาล (Distribution Data) 

Large Language Models จะประมวลผลและส่งข้อมูลผ่านสมองของ AI (Deep Learning) และทำการเรียนรู้แบบตั้งค่าใหม่ (Fine-tuning) ซึ่งทำให้ LLM มีความสามารถในการตอบคำถาม แปลภาษา และคาดเดาคำศัพท์ หรือบริบทอื่นๆทางด้านภาษาศาสตร์ได้ดียิ่งขึ้น 

ในปัจจุบันมี LLM ที่มีชื่อเสียงมากมาย และเป็นที่นิยม เช่น ChatGPT, Bard, Gemini ฯลฯ โดยที่ได้มีการนำมาใช้ในบริบททางธุรกิจมากขึ้นในปัจจุบัน ไม่ว่าจะเป็น การพัฒนา Customer Experience ด้วย Chatbot โดยใช้พื้นฐานของ LLM ซึ่งทำให้การโต้ตอบกับลูกค้าเป็นไปอย่างธรรมชาติ และช่วยแก้ปัญหาเบื้องต้นให้กับลูกค้า และผู้ใช้บริการได้เป็นอย่างดี

LLM มีกี่ชนิด อะไรบ้าง

LLM หรือ Large Language Models แบ่งออกเป็นสองประเภท ได้แก่ 

1. Base LLM คือ โมเดลภาษาขนาดใหญ่ ที่ถูกเทรนให้ทำนายคำถัดไป เช่น กระเพราไก่ “ไข่ดาว”

2. Instruction Tuned LLM โมเดลภาษาขนาดใหญ่ที่นำ Base LLM  มาประยุกต์ตามคำสั่ง หรือนำมา เรียนรู้แบบตั้งค่าใหม่ (Fine-tuning)  ทำให้โมเดลมีความสามารถในการตอบคำถามได้ และ LLM ประเภทนี้สามารถรับคำสั่งผ่านข้อความของมนุษย์ได้อย่างเป็นธรรมชาติ ทำให้หลายๆครั้งคำตอบที่ได้รับจะขึ้นอยู่กับ คำถาม หรือ “Prompt” ที่มนุษย์ ใส่เข้าไปเพื่อถาม LLM 

โมเดล LLM ที่มีความสามารถตอบได้หลากหลายรูปแบบ ขึ้นอยู่กับ Insights ที่เรากำหนดลงไปใน Prompt เช่น การให้ข้อมูลเชิงลึกเพื่อเทรนบริบทให้กับโมเดล LLM หรือการสั่งให้ LLM ตอบกลับมาด้วยบริบทแบบทางการ สนุก สุภาพ ก็สามารถทำได้ผ่านการใส่ Prompt เข้าไป

Large Language Models (LLM) มีการทำงานอย่างไร

วิธีการหนึ่งที่ทำให้คอมพิวเตอร์ฉลาดผ่านการเรียนรู้ข้อมูลจะถูกเรียกว่า Machine Learning ซึ่ง LLM เป็นโมเดลที่ใช้กระบวนการประมวลผลข้อมูลที่ซับซ้อนออกมาให้รูปแบบของการสร้างสรรค์สิ่งใหม่เชิงภาษาศาสตร์ 

โดยหลักการทำงานคือ

  • การที่ LLM จะถูกเทรนด้วยข้อมูลจำนวนมหาศาลบนโลกดิจิทัลหรืออนไลน์ 
  • การประมวลผลผ่าน LLM ให้ออกมาเป็นข้อมูล ในลักษณะของการคาดเดา ภาษา สร้างสรรค์สิ่งใหม่จากภาษา
  • แต่ละคำที่ LLM จะทำนายต่อ จะถูกเรียกเป็นหน่วยว่า “Token” ซึ่งหมายถึงหน่วยย่อยภาษาของ LLM โดยในหนึ่งคำอาจจะมีหลาย Token พอเป็นตัวอักษรพิเศษ จะแบ่งออกเป็นหลาย Token มาก ประมวลผลได้ยากกว่า และเชื่อมโยงได้ยากกว่า เป็นเหตุผลที่ทำให้ ภาษาอื่นๆนอกจากภาษาอังกฤษ ยังไม่มีความแม่นยำให้การคาดเดา หรือสร้างคำมากนัก อย่างตัวอย่างที่ได้เห็นจาก ภาษาไทย ที่ยังมีการตีความหมายของคำ หรือสร้างสรรค์ผลงานทางภาษาที่ไม่ได้ถูกต้อง 100%

LLM จะได้รับการเทรนอย่างต่อเนื่อง ด้วยข้อมูล และ Prompt ของมนุษย์ที่สั่งให้ LLM คิด สร้างสรรค์สิ่งต่าง ๆ ขึ้น มา ซึ่งในที่สุดก็จะช่วยปลดล็อคศักยภาพของมนุษย์ในการทำสิ่งต่าง ๆได้อย่างมีประสิทธิภาพมากขึ้น

ข้อดีของ LLM คืออะไร ช่วยอะไรธุรกิจได้บ้าง

GenAI

ประโยชน์ของ LLM นั้นมีมากมาย โดยหลักๆแล้วจะเป็น use case และประโยชน์จากการใช้ โมเดลภาษา ทั้ง

  • การแปลงข้อความ วิเคราะห์ข้อความ
  • การสกัดข้อมูลจากข้อความ 
  • การจำแนกข้อความ เช่น Sentiment / Categories 
  • การสรุปข้อความ
  • การแปลภาษา 
  • การเขียนข้อความ การตอบ Email  ดราฟข้อความ 

นอกจากนั้นในแง่ของธุรกิจ LLM ยังช่วยสนับสนุน และให้ประโยชน์กับ Business Touchpoint ต่างๆ ไม่ว่าจะเป็น 

  • การพัฒนาประสบการณ์ของลูกค้า หรือ Customer Experience มีการร่นระยะเวลาของลูกค้าในการบริการผ่านระบบแชตอัตโนมัติ หรือ ChatBot เพื่อการโต้ตอบแบบ Real Time ซึ่งทางองค์กรได้มีการเทรน LLM เพื่อให้เข้าใจภาษาของการตอบกลับลูกค้าได้มีประสิทธิภาพยิ่งขึ้น
  • การพัฒนาผลิตภาพของหน่วย Developer หรือ IT อีกหนึ่งความสามารถของ LLM คือการที่สามารถเรียนรู้เกี่ยวกับภาษาได้เป็นอย่างดี ซึ่งภาษาคอมพิวเตอร์ ก็นับเป็นหนึ่งในประเภทของภาษา เช่นเดียวกัน ดังนั้น LLM จึงเข้ามาช่วยกลุ่มคนเหล่านี้ ในการเขียนโค้ด เติมโค้ด หรือแม้กระทั้ง วิเคราะห์ข้อผิดพลาด (Debugging) ได้เป็นอย่างดี
  • การวิเคราะห์ข้อมูล (Data Analytics) ในส่วนของ Data ทางด้านภาษา ปฏิเสธไม่ได้เลยว่า LLM มีความสามารถในการวิเคราะห์ข้อมูล และจำแนกข้อความได้ ซึ่งทำให้นำไปต่อยอดสู่การพัฒนาคอนเทนต์ที่น่าสนใจและตอบโจทย์ รวมไปถึงสรุปข้อมูลที่เราต้องการจาก input ข้อมูลที่เป็นภาพ ตาราง ได้ดีอีกด้วย

ข้อจำกัดของ LLM

ข้อจำกัดของ LLM นั้นยังมีอยู่และก็มีข้อควรระวังสำหรับผู้ที่ต้องการนำไปใช้ ไม่ว่าจะเป็น

  • AI Literacy: การตัดสินใจและความรู้ด้านการใช้ AI โดยเฉพาะการนำข้อมูลจาก LLM ไปใช้ ผู้ใช้จำเป็นต้องมีข้อมูลเพียงพอสำหรับการตัดสินใจ และการมุ่งเน้นไปที่การดึงศักยภาพของมนุษย์ออกมาให้มากที่สุด เช่น การให้มนุษย์ได้ทำงานที่มีคุณค่า และมีความหมายมากขึ้น 
  • Hallucination: บางครั้ง LLM ก็อาจจะมีสภาวะที่เราเรียกว่าการสร้างภาพลวง คือ LLM จะต้องพยายามหาคำตอบมาให้เราให้ได้ แม้ในเรื่องที่มันก็ไม่แน่ใจ เพราะทั้งหมดทั้งมวลอาจจะเกิดจากการเดาเป็นหลัก ดังนั้นด้วยข้อมูลที่มีอยู่ ต้องตรวจสอบให้ดีว่าสิ่งที่ LLM สร้างหรือตอบมานั้นเป็นเรื่องจริง เพื่อลดความผิดพลาดในการนำข้อมูลไปใช้

สรุป LLM คืออะไร

LLM หรือ Large Language Models คือโมเดลพื้นฐานการประมวลผลของ Generative AI ซึ่ง LLM จะเรียนรู้ผ่านกระบวนการเรียนรู้แบบเชิงลึก (Deep Learning) โดยผ่านการถูกเทรนด้วยข้อมูลจำนวนมหาศาลซึ่งทำให้เกิดเป็นโมเดลที่สามารถประมวลผลภาษาและมีความสามารถในการโต้ตอบ และสร้างสรรค์ข้อความได้เสมือนมนุษย์

LLM จึงมีศักยภาพอย่างมากในการช่วยให้ธุรกิจก้าวไปสู่ยุคของ Digital Transformation ได้อย่างเต็มรูปแบบ เพราะนอกจากจะช่วยเรื่องประสิทธิภาพการทำงานแล้ว LLM ยังช่วยมนุษย์ทำงานเชิงสร้างสรรค์ แก้ไขความผิดพลาด และแนะนำข้อมูลที่เป็นประโยชน์ให้ได้ภายในระยะเวลาเพียงหนึ่งอึดใจ องค์กรจึงต้องเริ่มปรับตัวเพื่อใช้ LLM กับหน้างานมากขึ้น และเพิ่มประสิทธิภาพของกระบวนการทำงานแบบเดิมๆในที่สุด

หากสนใจเรื่องการ Transform องค์กร และการปลูกฝังพนักงานให้ใช้ LLM สามารถติดต่อ Disrupt Corporate Program ได้ที่ Disrupt Corporate Program

Update ความรู้จาก Disrupt ได้ที่ช่องทาง