
AWS Summit Bangkok 2025: รากฐานข้อมูลสำหรับการวิเคราะห์และ AI: จากข้อมูลสู่ผลลัพธ์ในระดับขนาดใหญ่
สวัสดีค่ะผู้อ่าน DevelopersIO ทุกคน เฟินจาก Classmethod Thailand ค่ะ
วันนี้จะมาแชร์ข้อมูลจากเซสชั่นที่ได้เข้าร่วมฟังมาเมื่อวันที่ 29 เมษายนที่งาน AWS Summit Bangkok 2025 ที่ผ่านมาค่า
“_Data foundation for analytics and AI: From data to outcomes at scale” หรือภาษาไทยก็คือ “รากฐานข้อมูลสำหรับการวิเคราะห์และ AI: จากข้อมูลสู่ผลลัพธ์ในระดับขนาดใหญ่”
ในเซสชั่นนี้หลักๆจะพูดถึง basic ของการจัดการดาต้า เราจะบูรณาการเครื่องมือต่างๆอย่างไรให้ดาต้าและ AI ทำงานรวมกันได้อย่างมีประสิทธิภาพและลดความซับซ้อนทุกอย่างที่เคยมีค่ะ
Generative AI ที่กำลังเป็นเทรนด์ในตอนนี้ ในการที่องค์กรต่างๆจะนำมาใช้ สิ่งที่ต้องเปลี่ยนแปลงอย่างแรกคือเรื่องของ Data Foundation ที่สามารถรองรับการใช้งาน Generative AI
ปี 2025 นักวิเคราะห์กล่าวว่าจะเป็นปีของ Data Renaissance ปีแห่งการ Back To Basic ไปจัดการที่ Data Foundation เพื่อที่จะนำ Generative AI มาใช้ได้อย่างเต็มประสิทธิภาพ
ปัจจัยที่ทำให้องค์กรต่างๆยังไม่พร้อมสำหรับ Generative AI
- ดาต้ากับ AI ที่แยกกันโดยสิ้นเชิง ไม่ทำงานร่วมกัน ทำให้มีความซับซ้อนวลาที่ต้องทำงานรวมกัน
- Data silos ที่องค์กรเก็บดาต้าแยกกันหลายฟอร์แมตไว้หลายๆที่ เวลาที่จะดึงดาต้ามาทำงานร่วมกันทำได้ยาก
- Infrastructure ที่ไม่ยืดหยุ่น
- ไม่มี Tools ที่จะทำ Data Governance
สำหรับ AWS มีความทุ่มเทในการสร้างบริการที่ครบวงจนเพื่อซัพพอร์ทลูกค้าในการแก้ปัญหาและตอบสนองความต้องการต่างๆของลูกค้า อย่าง Storage Database Analytics AI
โดย AWS ได้พัฒนาบริการเพื่อให้ดาต้าและ AI ทำงานร่วมกันได้อย่างมีประสิทธิภาพ อุดช่องโหว่ที่ผู้ใช้งานเคยเจอนั่นก็คือ Amazon Sagemaker เวอร์ชั่นใหม่ เพื่อรวมบริการให้เรื่องของ AI และดาต้าอยู่ใน environment เดียวกัน
Amazon Sagemaker
โดยองค์ประกอบหลักของ Sagemaker มี 3 ส่วน
- Unified Studio : พัฒนาเรื่องของดาต้าและ AI โดยรวมบริการ AWS ที่เราคุ้นเคยเป็นอย่างดีมาใช้ร่วมกัน
- Data Governance : รวม Governance ที่เกี่ยวข้องไปถึง responsible AI
- Lakehouse : ตรงนี้ AWS ใช้เป็น Open Lakehouse ในการรวมดาต้าจากทุกที่เข้ามารวมกันที่เดียว โดยมี Open API เรียกใช้งาน (Apache Iceberge API)
ประโยชน์หลัก 4 อย่างของ Sagemaker เจนใหม่
1. ความเร็วจากดาต้าไปสู่ผลลัพธ์ของ AI
การบูรณาการเครื่องมือต่างๆที่มีอยู่ทำให้ได้ผลลัพธ์ที่เร็วขึ้น
2. Open ซึ่งจะเน้นในเรื่องของดาต้า ซึ่ง Sagemager จะรวมเรื่อง Data foundation รวมอยู่ด้วย ซึ่ง Datalake เด่นของ AWS ได่แก่ Amazon S3
ฟีเจอร์ใหม่ของ S3 ได้แก่ S3 Tables ที่เราจะสามารถรัน query ได้เร็วกว่า S3
หรือบางอค์กรที่ใช้ data warehouse ซึ่งทาง AWS ก็มีบริการที่รองรับคือ Amazon Redshift
เมื่อการใช้งานมีมากขึ้น บางองค์กรต้องการใช้ทั้ง Data Lake และ Data Warehouse ทำให้ต้องใช้ tools ต่างมากๆขึ้นหรือจัดการ ETL Pipeline
ในกรณีนี้ Sagemaker ประกอบด้วย Data Lake กับ Warehouse ที่ทำงานร่วมกันเป็นอย่างดี และยังมีในส่วนที่เรียกว่า Zero ETL ทำให้สามารถเรียกดาต้าจากที่อื่นเข้ามาใน data lake ได้โดยตรง ซึ่งทาง AWS มีการพัฒนาร่วมกัน SaaS อย่าง SAP Saleforce Servicenow etc. ซึ่งในอนาคตก็จะมีความร่วมมือกับ SaaS อื่นเรื่อยๆ ณ ปัจจุบันสามารถเชื่อมออกไป Source อื่นได้ผ่าน AWS Glue Connector โดยที่ไม่ต้องสร้าง Pipeline ใหม่
3. Trust
เมื่อมีการดึงด้าต้าจากที่ต่างๆมาใช้ที่เดียวกับ โปรเจคต์ต่างๆอยากจะมาใช้ดาต้าที่อยู่ตรงนี้ ทำให้ต้องมี governance ในการให้สิทธิ์ที่เหมาะสมกับแอปหรือยูสเซอร์ได้เหมาะสม Sagemaker เจนใหม่จึงมีฟีเจอร์ที่เรียกว่า Sagemake Catalog
โดยมีเบสจากบริการเดิมคือ Data Zone ที่ Build-in เข้าไปใน Unified Studio
ส่วนในการรองรับ Responsible AI มีการใช้ Amazone Bedrock Guardrails เพื่อจัดการข้อมูลที่ไม่เหมาะสม
4. Scale with confidence
AWS ให้บริการมา 19 ปี มีลูกค้ามากกว่า 2 ล้านราย AWS มีความพยายามที่จะโตพร้อมกับลูกค้าเสมอ และมีความมั่นใจว่า AWS จะสามารถรองรับข้อมูลของลูกค้าที่เพื่มขึ้นได้เสมอ
สุดท้าย
ข้อมูลที่ได้ฟังในเซสชั่นนี้ไม่ใช่ Road Map แต่เป็น service ที่ให้บริการอยู่ ณ ปัจจุบันแล้ว ท่านไหนสนใจข้อมูลเพิ่มเติม เช็คได้ที่หน้าเว้บด้านล่างเลยค่า