บทความและข่าวสาร | Seven Peaks Insights

แบบแผนสำหรับวางรากฐานข้อมูลเพื่อเตรียมความพร้อมในการขับเคลื่อน AI

sp_202510_evt_intelligent_apps_damien_herobanner_1x

องค์กรจำนวนมากเร่งนำ AI มาใช้งาน แต่มักมองข้ามความจริงที่สำคัญ นั่นคือ ความสำเร็จของ AI ไม่ได้ขึ้นอยู่กับโมเดลที่ซับซ้อน แต่ขึ้นอยู่กับการวางรากฐานข้อมูลที่แข็งแกร่งขององค์กร การลงทุนมหาศาลในอัลกอริทึมล้ำสมัยอาจไร้ผล หากโครงสร้างพื้นฐานด้านข้อมูลไม่สามารถรองรับการทำงานเหล่านั้นได้

ความจริงที่เรียบง่ายแต่สำคัญคือ การสร้างแอปพลิเคชันอัจฉริยะ จำเป็นต้องเริ่มต้นด้วยโครงสร้างพื้นฐานข้อมูลที่แข็งแกร่ง ถึงจะเปลี่ยนข้อมูลดิบให้เป็นสินทรัพย์เชิงกลยุทธ์ขององค์กรได้

เปลี่ยน data swamp ให้เป็นประโยชน์

ปัญหาที่พบได้ทั่วไปคือสถานการณ์ที่เรียกว่า "data swamp" ซึ่งข้อมูลกระจัดกระจายอยู่ตามแหล่งต่าง ๆ ขาดการจัดหมวดหมู่ที่สม่ำเสมอ และไม่มีการกำกับดูแล หรือความเป็นเจ้าของที่ชัดเจน ในสภาพแวดล้อมเช่นนี้ แม้แต่โมเดล AI ที่ก้าวหน้าที่สุดก็ล้มเหลว เพราะไม่สามารถเข้าถึง input ที่เชื่อถือได้

SP_202510_Evt - Intelligent-Apps-Damien-01

ทางออกของปัญหานี้คือการสร้างแพลตฟอร์มรากฐานข้อมูลที่มีการกำกับดูแล ซึ่งจะรวบรวมข้อมูลที่กระจัดกระจายให้กลายเป็นระบบศูนย์กลางที่ถูกบริหารจัดการอย่างดี พร้อมด้วยแหล่งข้อมูลเดียวที่เชื่อถือได้ ซึ่งเป็นหัวใจของการมี โครงสร้างข้อมูลสำหรับ AI ที่พร้อมใช้งาน

ออกแบบเพื่อการกำกับดูแลและการปฏิบัติตามกฎหมายตั้งแต่แรก

เพื่อให้ข้อมูล AI มีความน่าเชื่อถือ การพิจารณาเรื่องการกำกับดูแลและการปฏิบัติตามข้อกำหนด จึงต้องเริ่มตั้งแต่ต้น การสร้าง AI ที่เชื่อถือได้จำเป็นต้องมีการควบคุมที่เข้มงวดเพื่อสร้างความโปร่งใส ลดอคติ และสร้างความรับผิดชอบ 

 

SP_202510_Evt - Intelligent-Apps-Damien-02

ในระดับรากฐานข้อมูล การดำเนินการดังกล่าวหมายถึง การวางระบบควบคุมการเข้าถึงตามบทบาท การติดตามแหล่งที่มาข้อมูลอย่างละเอียด และการปกปิดข้อมูลส่วนบุคคลที่ระบุตัวตนได้โดยอัตโนมัติ มาตรการป้องกันเหล่านี้จะช่วยปกป้องข้อมูลลูกค้าและสอดคล้องกับกฎระเบียบสำคัญ เช่น PDPA หรือ GDPR โดยการติดตั้งระบบควบคุมเหล่านี้เข้ากับท่อส่งข้อมูลตั้งแต่วันแรก จึงง่ายกว่าการแก้ไขและติดตั้งภายหลังมาก

ปรับ workflow ข้อมูลให้เข้ากับความต้องการ

ก่อนตัดสินใจเลือกแนวทางการใช้ AI องค์กรควรพิจารณาเป้าหมายและวัตถุประสงค์ทางธุรกิจเป็นสำคัญ ควรเริ่มต้นจากโซลูชันที่ง่ายที่สุดที่ตอบสนองความต้องการในปัจจุบัน แต่ต้องออกแบบรากฐานข้อมูลให้สามารถปรับขนาดได้ เพื่อรองรับกรณีการใช้งานที่ซับซ้อนขึ้นในอนาคต การออกแบบที่เกินความจำเป็นตั้งแต่ต้นจะทำให้สิ้นเปลืองทรัพยากร ในทางกลับกันการสร้างโครงสร้างพื้นฐานข้อมูลที่ด้อยประสิทธิภาพ (under-building) จะนำไปสู่ภาระทางเทคนิค (technical debt) ที่มีค่าใช้จ่ายสูงในภายหลัง

ระดับความซับซ้อนของ AI มีตั้งแต่แบบพื้นฐานไปจนถึงระดับสูง:

  • LLM สามารถจัดการกับงานพื้นฐาน เช่น การสรุปข้อความ หรือการร่างอีเมล โดยอาศัย prompts ที่ตรงไปตรงมา องค์กรควรเริ่มต้นจากโซลูชันนี้สำหรับความต้องการในการสร้างข้อความพื้นฐาน
  • RAG เป็นการเชื่อมโยงโมเดลภาษาขนาดใหญ่เข้ากับฐานความรู้ที่เป็นกรรมสิทธิ์ขององค์กร เพื่อให้สามารถตอบคำถามได้อย่างแม่นยำ เลือกใช้แนวทางนี้เมื่อคุณต้องการให้ AI อ้างอิงข้อมูลเฉพาะของบริษัท อย่างไรก็ตาม ประสิทธิภาพของ RAG ขึ้นอยู่กับคุณภาพของข้อมูลเป็นหลัก
  • AI Agents สามารถดำเนินการตามเวิร์กโฟลวและตามเป้าหมายได้โดยอัตโนมัติ เช่น การทำ personalization หรือการวางแผน ด้วยการทำงานร่วมกับเครื่องมือที่กำหนดไว้อย่างชัดเจน พิจารณาใช้ Agents เมื่อคุณต้องการระบบอัตโนมัติที่มีวัตถุประสงค์การทำงานที่ชัดเจน
  • Agentic AI ทำหน้าที่ประสานงานระหว่าง Agent หลายตัว เพื่อจัดการงานร่วมกันขนาดใหญ่ได้อย่างอิสระ ควรสงวนความซับซ้อนระดับนี้ไว้สำหรับเวิร์กโฟลว์ที่ต้องการการประสานงานครอบคลุมข้ามระบบ

องค์กรควรปรับการนำไปใช้งานในระยะเริ่มต้นให้เข้ากับความท้าทายทางธุรกิจที่เผชิญอยู่ในปัจจุบัน แต่ต้องมั่นใจว่ารากฐานข้อมูลของคุณ สามารถรองรับความซับซ้อนในระดับถัดไปได้ เมื่อมีความจำเป็นในการขยายขีดความสามารถ

resized-textsp_202510_evt_intelligent_apps_damien_03_1x

การเตรียมข้อมูลด้วย RAG การเตรียมข้อมูลด้วย RAG 

RAG (Retrieval-Augmented Generation) ทำหน้าที่เป็นสะพานเชื่อมระหว่างโมเดลภาษาทั่วไป (General-purpose language models) กับฐานความรู้เฉพาะขององค์กร (Proprietary Knowledge) แทนที่จะอาศัยเพียงแค่สิ่งที่ LLM เรียนรู้ระหว่างการฝึกฝน RAG จะอ้างอิงคำตอบจากแหล่งข้อมูลเฉพาะของคุณโดยตรง ทำให้สามารถให้คำตอบที่แม่นยำเกี่ยวกับสินค้า นโยบาย หรือฐานความรู้ภายในองค์กรของคุณ ซึ่งถือเป็นหัวใจสำคัญสำหรับแอปพลิเคชันอย่าง ระบบสนับสนุนลูกค้าด้วย AI ระบบการจัดการความรู้ หรือเครื่องมือวิเคราะห์ธุรกิจอัจฉริยะ 

กระบวนการ RAG จะเปลี่ยนเอกสารให้เป็นข้อมูลที่สามารถค้นหาเชิงความหมายได้ (semantically searchable) ผ่านขั้นตอนหลัก 3 ขั้นตอน โดยเอกสารจะถูกแบ่งเป็นส่วนย่อยที่มีความหมาย จากนั้นแปลงเป็นเวกเตอร์เชิงตัวเลขที่จับความหมายเชิงความรู้สึก (semantic meaning) และจัดเก็บในฐานข้อมูลเวกเตอร์ (vector database) ที่เหมาะสำหรับการค้นหาความคล้ายคลึงกันโดยเฉพาะ เมื่อผู้ใช้ตั้งคำถาม ระบบจะดึงส่วนข้อมูลที่เกี่ยวข้องที่สุด เพื่อนำไปประกอบการสร้างคำตอบของ LLM

กระบวนการ RAG 3 ขั้นตอนสำคัญ:

1. การแบ่งส่วนข้อมูล 
เอกสารและแหล่งข้อมูลจะถูกแบ่งออกเป็นส่วนย่อยที่จัดการได้ ซึ่งทำให้ AI สามารถประมวลผลได้อย่างมีประสิทธิภาพ

2. การแปลงข้อมูลเป็นเวกเตอร์ 
ส่วนข้อมูลเหล่านี้จะถูกแปลงเป็นข้อมูลตัวเลขที่แสดงถึงความหมายเชิงความรู้สึก (Semantic Meaning) ซึ่งเป็นรูปแบบที่ AI สามารถทำความเข้าใจและวิเคราะห์ได้

3. การจัดเก็บเวกเตอร์
ข้อมูลเวกเตอร์ที่ได้จะถูกจัดเก็บใน vector database ที่ออกแบบมาสำหรับการค้นหาความคล้ายคลึงกันโดยเฉพาะ เพื่อสร้างฐานความรู้ที่ทรงพลังให้ AI สามารถดึงมาใช้ได้ทันที

SP_202510_Evt - Intelligent-Apps-Damien-04

การนำเข้าข้อมูล AI ในทางปฏิบัติ ด้วยการเปรียบเทียบและจัดการข้อมูลในเอกสาร

การเปรียบเทียบและจัดการข้อมูลในเอกสาร แสดงให้เห็นว่าการนำเข้าข้อมูลด้วย AI สามารถพลิกโฉมกระบวนการทางธุรกิจได้อย่างไร เวิร์กโฟลว์เริ่มต้นด้วย AI ที่ดึงข้อมูลจากเอกสารผ่านกระบวนการแบ่งส่วน และการแปลงข้อมูลเป็นเวกเตอร์ จากนั้นจึงจัดโครงสร้างข้อมูลที่ไม่มีรูปแบบให้อยู่ในตาราง ข้อมูลที่ดึงมานี้จะถูกส่งเข้าสู่กลไกการเปรียบเทียบข้อมูล (reconciliation engine) ซึ่งจะใช้กฎทางธุรกิจที่กำหนดไว้ล่วงหน้าในการเปรียบเทียบข้อมูลจากหลายแหล่งที่มา

ระบบใช้ สถาปัตยกรรมแบบ medallion ซึ่งเป็นแนวทางแบบแบ่งชั้นเพื่อปรับปรุงคุณภาพข้อมูลอย่างต่อเนื่อง ตั้งแต่ข้อมูลดิบไปจนถึงผลลัพธ์ที่ผ่านการตรวจสอบ โดยการรวบรวมข้อมูลจากแหล่งต่าง ๆ และกำหนดเวิร์กโฟลว์การรักษาความสมบูรณ์ของข้อมูล (data integrity workflows) ข้ามระบบอย่างชัดเจน นอกจากนี้ AI agent ยังทำหน้าที่ควบคุมดูแลกระบวนการทั้งหมด จัดการการแจ้งเตือน การแก้ไข และการสร้างรายงาน business intelligence อัจฉริยะ สิ่งต่างๆ ที่เคยใช้เวลาหลายวันในการทำงานด้วยมือ ปัจจุบันสามารถเสร็จสมบูรณ์ได้ภายในไม่กี่นาที ซึ่งช่วยให้สามารถวิเคราะห์ความเสี่ยงได้แบบเรียลไทม์ และเพิ่มประสิทธิภาพได้อย่างก้าวกระโดด

 

SP_202510_Evt - Intelligent-Apps-Damien-05

แบบแผนสู่ความสำเร็จของ AI เริ่มต้นที่ข้อมูล

ความสำเร็จของ AI เกิดจากการวางสถาปัตยกรรมระบบนิเวศทั้งหมด โดยมีจุดเริ่มต้นคือ รากฐานข้อมูลที่มีการกำกับดูแลที่แข็งแกร่ง หากปราศจากรากฐานดังกล่าว องค์กรจะไม่สามารถสร้างแอปพลิเคชันอัจฉริยะที่เชื่อถือได้ ปฏิบัติตามข้อกำหนด และส่งมอบมูลค่าทางธุรกิจที่แท้จริงได้

คุณพร้อมที่จะพลิกโฉมรากฐานข้อมูลของคุณให้พร้อมสำหรับ AI แล้วหรือยัง? บริการด้าน AI และความเชี่ยวชาญด้านการวิเคราะห์ข้อมูลของเรา พร้อมช่วยคุณสร้างโครงสร้างพื้นฐานข้อมูลที่ได้รับการกำกับดูแล เพื่อขับเคลื่อนแอปพลิเคชันอัจฉริยะที่น่าเชื่อถือและสร้างมูลค่าทางธุรกิจสูง


Damien Velly
VP of Data and AI at Seven Peaks

ในฐานะผู้นำทีม Data และ AI ประจำ Seven Peaks, Damien ส่งมอบโซลูชัน BI, AI และข้อมูลแบบครบวงจร โดยมุ่งเน้นที่ประสบการณ์ผู้ใช้และประสบการณ์ลูกค้า (UX/CX) ผ่านการประยุกต์ใช้ประสบการณ์ที่สั่งสมมาจากการทำงานกับบริษัทสตาร์ทอัพและองค์กรชั้นนำ

2023_Head of Data_Damien Velly_02 (1)

เยี่ยมชมอีเวนต์ที่ผ่านมาของเรา
ชมไฮไลต์และประเด็นสำคัญจากอีเวนต์ทั้งหมดได้ที่หน้าเพจของเรา
ดูอีเวนต์ทั้งหมด

ติดตามเราบน Facebook และ LinkedIn เพื่ออัปเดตและไม่พลาดงานกำลังจะมาถึงของเรา