บทความและข่าวสาร | Seven Peaks Insights

Data Visualization และ Data Storytelling สำหรับ AI และวิศวกรรมข้อมูล

BKK WEB and TechX in Bangkok with Seven Peaks Software

เมื่อเร็วๆ นี้เราได้จัดงาน BKK WEB meetup สุดพิเศษร่วมกับ SCB TechX เพื่อนำผู้เชี่ยวชาญในหลายอุตสาหกรรมมาคุยกันในงานสัมมนาแบบพาเนล การพูดคุยครั้งนี้ดำเนินรายการโดยคุณ Damien Velly, VP of Data & Analytics ของ Seven Peaks ร่วมด้วยคุณดนัย ลักษมีธนสาร Data Science Director ของ SCB TechX, คุณชยุตม์ จังพานิช Senior Data Science Consultant ของ SCB TechX และคุณ Yemunn Soe, Analytics Business Partner ของ Proximity Designs

เทคนิคการทำ data visualization ที่เหมาะสมสามารถเปลี่ยนข้อมูลจำนวนมหาศาลให้กลายเป็น insight ที่นำไปใช้งานเพื่อขับเคลื่อนธุรกิจให้เติบโตได้ เซสชันการสัมมนาของ BKK WEB ในครั้งนี้จึงเป็นข้อมูลแนะนำที่ครบครันในการทำให้ผู้ชมได้ทำความเข้าใจเกี่ยวกับ data visualization และนำไปปรับใช้กับธุรกิจได้

และนี่คือสรุปประเด็นสำคัญบางส่วนจากการพูดคุยกันในครั้งนี้เกี่ยวกับ “Data Visualization และ Data Storytelling สำหรับ AI และวิศวกรรมข้อมูล”

การทำ data visualization และ data storytelling ที่มีประสิทธิภาพ

เป้าหมายสูงสุดในการทำ data visualization (การแปลงข้อมูลให้เป็นภาพ) และ data storytelling (การสื่อสารข้อมูล) คือการทำให้แน่ใจว่าผู้ใช้ปลายทางนั้นเข้าใจและสามารถปฏิสัมพันธ์กับผลงานของคุณได้ ดังนั้น แก่นของ data visualization และ data storytelling ก็คือการทำความเข้าใจผู้ชม โดยเฉพาะอย่างยิ่งผู้ที่ไม่มีความรู้ทางเทคนิค นั่นเอง

เริ่มด้วยการสรุปว่าสิ่งสำคัญสำหรับผู้มีส่วนได้ส่วนเสียหลักของคุณคืออะไร จากนั้นจึงนำข้อมูลนั้นมาปรับให้เป็นภาพที่เข้าใจง่าย เมื่อคุณมี data visualization แล้วก็นำมันไปใช้กับเรื่องที่ต้องการจะเล่า

เมื่อคุณสร้างแดชบอร์ดขึ้นมา data visualization ก็ควรจะมีรูปแบบของโฟลว์ที่อ้างอิงจาก user journey ของแดชบอร์ดนั้น โดยเริ่มจากการอธิบายด้วยกราฟ, ชาร์ต, และ visualization ในรูปแบบอื่นๆ จากนั้นสรุปว่ามีเทรนด์สำคัญหรือสาระสำคัญอะไรบ้าง

Data Visualization and Storytelling for AI and Data Engineering by Seven Peaks Software

 

เครื่องมือและเทคนิคในการทำ data visualization

เครื่องมือที่เหมาะสมนั้นช่วยให้เราสามารถปรับปรุงการทำ data visualization ได้ อย่างไรก็ตาม บางทีก็เป็นเรื่องยากที่จะตัดสินใจเลือก ธุรกิจที่เล็กกว่าอาจจะจัดการชุดข้อมูลเล็กๆ ใน Excel ได้ แต่ Excel นั้นขาดความสามารถในการหาความหมายและความสอดคล้องของข้อมูลที่คุณจำเป็นต้องใช้ในที่สุด ซึ่งอาจทำให้เกิดปัญหาคอขวดได้

เครื่องมือที่เป็นโอเพนซอร์สอย่าง R, Python, และ JavaScript นั้นได้รับความนิยมอย่างแพร่หลาย อย่างไรก็ตาม มันเป็นเครื่องมือที่ออกแบบมาสำหรับ  developer ในขณะที่ตัวเลือกอื่นๆ อย่าง Power BI, Tableau, Sisense, และ GoodData นั้นมีความ interactive มากกว่าและเข้าถึงง่ายกว่า จึงเหมาะกับกลุ่มคนที่ไม่ใช่ developer และกระตุ้นให้คนทำงานข้ามแผนกได้ดีขึ้น

เครื่องมือของ BI บางอย่างนั้นอนุญาตให้ผู้ใช้ที่มีความเชี่ยวชาญด้านเทคนิคน้อยกว่าสามารถเปลี่ยนแปลงและโต้ตอบกับข้อมูลได้สะดวก ทำให้ธุรกิจสามารถทำ business intelligence ได้ด้วยตนเอง โดยผู้มีส่วนได้ส่วนเสียก็สามารถหา insight ที่ต้องการเจอเมื่อจำเป็นต้องใช้ได้

ท้ายที่สุดแล้ว เครื่องมือที่คุณเลือกใช้ก็ขึ้นอยู่กับงบประมาณขององค์กร, ความสามารถทางเทคนิคของคุณ, และคุณต้องการให้ทีมปฏิบัติงานนั้นสามารถหาข้อมูลที่เพียงพอต่อการทำงานได้เองมากน้อยแค่ไหน

นอกจากนั้น เทคนิคการทำ visualization ที่คุณเลือกก็ขึ้นอยู่กับข้อมูลที่คุณต้องการนำเสนอด้วย scatter plot นั้นเหมาะสำหรับการหาแพตเทิร์นและเทรนด์จากตัวแปรสองตัว ในขณะที่ heatmap นั้นเหมาะสำหรับข้อมูลจำนวนมาก ส่วน box plot และ histogram อาจจะเหมาะสำหรับการหาสิ่งผิดปกติในชุดข้อมูลขนาดใหญ่

สำหรับการวิเคราะห์ที่ซับซ้อนและหลายมิติใน AI และวิศวกรรมข้อมูลนั้น การวิเคราะห์พหุตัวแปร คือตัวเลือกที่เหมาะสมกว่า

ไม่ว่าจะอย่างไร คุณควรจำไว้ให้ดีว่า visualization ที่เหมาะสมนั้นจะช่วยให้ผู้ชมเข้าใจผลลัพธ์และเทรนด์ที่เกิดขึ้นได้อย่างรวดเร็ว

การวิเคราะห์ข้อมูลแบบเรียลไทม์นั้นจำเป็นหรือไม่

โดยปกติแล้ว องค์ประกอบสำคัญในการทำ data visualization นั้นอยู่ที่วิธีที่คุณบริหารจัดการและวิเคราะห์ข้อมูล การวิเคราะห์ข้อมูลแบบเรียลไทม์ช่วยให้คุณลงมือทำ ณ ตอนนั้นได้เลย ในขณะที่การประมวลผลข้อมูลแบบชุดนั้นมักทำในรูปแบบรายวัน รายสัปดาห์ หรือรายเดือน

พลังของข้อมูลแบบเรียลไทม์อยู่ที่ความเป็นปัจจุบันของมัน แต่ไม่ได้หมายความว่ามันจะเหมาะกับการใช้งานทุกรูปแบบ ใช่ว่าผู้มีส่วนได้ส่วนเสียทุกคนจะต้องการข้อมูลแบบเรียลไทม์เพื่อนำมาตัดสินใจ บางครั้งการวิเคราะห์ข้อมูลที่ช้าลงหน่อยอาจเปิดเผยให้เห็นข้อมูลในแง่ของเทรนด์และแพตเทิร์นได้มากกว่า การตัดสินใจด้วยข้อมูลแบบเรียลไทม์ควรทำเมื่อจำเป็นต่อการนำไปใช้งาน, เมื่อต้องผสานกับการทำ data activation เพื่อผสานกับระบบของ third party, และทำเพื่อคุณค่าทางธุรกิจ เท่านั้น

หากจำเป็นต้องใช้ข้อมูลแบบเรียลไทม์ ก็มีเครื่องมือมากมายที่ช่วยให้เราทำการวิเคราะห์แบบเรียลไทม์ได้ แต่มีค่าใช้จ่ายที่สูงกว่า คุณควรทำความเข้าใจเกี่ยวกับค่าใช้จ่ายเกี่ยวกับเครื่องมือที่ใช้อย่าง Vertica, Snowflake หรือ Databricks และประเมินว่าการใช้งานข้อมูลแบบเรียลไทม์นั้นจะสร้างรายได้คุ้มกับต้นทุนที่ต้องจ่ายไปหรือไม่

AI และการวิเคราะห์ข้อมูล 

AI เป็นเครื่องมือที่มีประโยชน์สำหรับการวิเคราะห์ข้อมูลและวิศวกรรมข้อมูล โดยเฉพาะอย่างยิ่งเมื่อเป็นงานที่ต้องทำซ้ำๆ และน่าเบื่อ ความสามารถของ AI นั้นได้รับการพัฒนาอย่างต่อเนื่อง โดยเฉพาะเมื่อมีแหล่งข้อมูลมากมายจากผู้คนที่ร่วมกันสร้างและแบ่งปันโมเดล เช่น Hugging Face

อย่างไรก็ตาม ความเป็นมนุษย์ก็ยังเป็นสิ่งจำเป็นในการนำเสนอบริบทและความรู้เฉพาะอุตสาหกรรม เพื่อให้มั่นใจว่าการวิเคราะห์ข้อมูลของคุณนั้นสอดคล้องกับเป้าหมายทางธุรกิจ

ตรวจสอบให้แน่ใจว่าข้อมูลสอดคล้องกันและปราศจากอคติ

Data visualization เป็นแนวทางที่ทำให้ข้อมูลอยู่ในรูปแบบที่เข้าใจง่ายโดยที่ไม่ควรดัดแปลงข้อมูลหรือทำให้เกิดอคติขึ้น ดังนั้นความแม่นยำของข้อมูลและการตรวจสอบข้อมูลคือสิ่งที่จำเป็นอย่างยิ่ง 

การควบคุมคุณภาพข้อมูลสามารถทำได้ผ่านการศึกษาและทดสอบข้อมูล ตั้งแต่ก่อนนำเข้าข้อมูลไปจนตลอดทั้งไปป์ไลน์

การยอมรับ data visualization ของธุรกิจต่างๆ

data storytelling ช่วยโน้มน้าวให้ธุรกิจต่างๆ เข้าใจว่าทำไมพวกเขาถึงต้องทำ data visualization ผู้มีส่วนได้ส่วนเสียในแต่ละธุรกิจรู้ว่า KPI หลักและ KPI รองที่พวกเขาต้องใช้กับธุรกิจมีอะไรบ้าง จึงควรให้พวกเขามีส่วนร่วมกับ data analysts และ data storytellers เพื่อให้แน่ใจว่า data visualization ที่ทำขึ้นมานั้นสมเหตุสมผล สิ่งนี้ช่วยให้เรื่องราวของข้อมูลนั้นชัดเจนได้มากที่สุดและธุรกิจสามารถนำไปใช้ได้ง่ายขึ้น

เมื่อธุรกิจทั้งหลายยินยอมนำข้อมูลไปใช้แล้ว ผู้ใช้ก็จำเป็นที่จะต้องมีทักษะในการอ่านข้อมูลด้วย ยกตัวอย่างเช่น จัดฝึกอบรมการอ่านข้อมูล เป็นต้น การทำความเข้าใจเรื่องเหล่านี้ช่วยให้สามารถใช้งานแดชบอร์ดและเครื่องมืออื่นๆ ในการทำ data visualization ได้ดีขึ้น และช่วยให้ธุรกิจสามารถทำการวิเคราะห์ได้ด้วยตนเอง 

กล่าวโดยสรุปก็คือ หัวใจสำคัญในการทำ data visualization อย่างมีประสิทธิภาพก็คือ การทำความเข้าใจวัตถุประสงค์ของข้อมูล รวมถึงเข้าใจคนที่จะนำข้อมูลไปใช้ด้วยเช่นกัน

หากคุณต้องการดูสัมมนาในครั้งนี้แบบเต็มๆ สามารถดูวิดีโอบันทึกการสัมมนาได้ที่นี่

 data analysis

Damien Velly, VP of Data and Analytics ที่ Seven Peaks

คุณ Damien เป็นนักคิดค้นที่วางกลยุทธ์ได้เป็นอย่างดี และเป็นผู้นำทีมพัฒนาดิจิทัลโปรดักต์ เขามีประสบการณ์ในการทำงานที่เกี่ยวเนื่องทั้งเรื่องธุรกิจ, เทคโนโลยี, และดีไซน์ มานานกว่า 8 ปี ด้วยความเชี่ยวชาญด้านการวิเคราะห์ข้อมูลทำให้ Damien ได้พัฒนาโปรดักต์และบริการมาแล้วกว่า 20 รายการ พร้อมด้วยผลกำไรรวมกันมากกว่า 15 ล้านเหรียญสหรัฐ

 

 

ยังไม่แน่ใจว่าควรจะเริ่มอย่างไรใช่ไหม
ทีมพัฒนาซอฟต์แวร์ที่มีประสบการณ์ของเราพร้อมช่วยคุณ
ติดต่อเรา