สรุปเนื้อหา Session Smarter, faster analytics with Generative AI & ML ใน AWS Summit Bangkok 2024
เกริ่นนำ
สวัสดีครับ ผม ต้า ครับ
ผมไปงาน AWS Summit Bangkok 2024 มา และ นี่เป็นบทความของ Session: Smarter, faster analytics with Generative AI & ML ที่ผมไปเข้าร่วมมา
โดยนี่เป็นการสรุปเนื้อหาคร่าวๆ เท่าที่ผมจดมาได้ โดย Slide ที่นำมาแปะในบทความนี้สามารถดูได้ในลิ้งก์ต่อไปนี้ครับ
โดยสรุปแล้ว เนื้อหาข้างใน Session จะเป็นการแนะนำว่าในการ Data analytics เราจะใช้ Generative AI และ ML เข้ามาช่วยเราได้ยังไงได้บ้างครับ
โดยเนื้อหาจะมีต่อไปนี้ครับ
เนื้อหา
อย่างแรกคือสำหรับเหตุผลที่จำเป็นต้องใช้ Data strategy บน AWS เพราะ AWS มี Service ตั้งต่ต้นน้ำถึงปลายน้ำมาให้แล้ว เราสามารถที่จะทำตั้งแต่ต้นน้ำถึงปลายน้ำได้ใน AWS ได้เลย
และหัวข้อต่อไปนี้เราจะมาดูว่า Generative AI จะสามารถเข้ามาช่วยเรากับแต่ละ Service ได้อย่างไร
AWS Glue
มาดู Tools ที่ใช้ในการ integration ของ AWS อย่าง Glue กัน
สิ่งที่น่าสนใจเมื่อ AWS นำ Generative AI เข้ามาช่วยในส่วนนี้คือ
จะมีการนำ Amazon Q เข้าไปรวมกับ AWS Glue Studio Notebook ซึ่งอันนี้ไม่ใช่อะไรใหม่ แต่เป็นการควบรวม หรือ เปลี่ยนชื่อให้เข้าใจง่ายขึ้นเฉยๆ
โดยที่แต่ก่อนจะมี Service ชื่อ
Amazon CodeWhisperer ซึ่งจะเป็น Service ที่จะ generate code ให้เรา โดยให้เราทำการเขียนคอมเมนต์ แล้วทาง Service จะทำการ Generative code ขึ้นมาให้เราเลย
ซึ่ง ทาง AWS ได้มีการนำ Service เข้าไปรวมกัน แล้วเปลี่ยชื่อกลายเป็น Amazon Q + AWS Glue Studio Notebook
ยกตัวอย่างเช่นเราเขียนคอมเมนต์ว่า # Create a sample dataframe with purchase orders ก็จะได้การ generate ตามภาพด้านล่าง
ซึ่งทางผู้พูดเขาก็บอกว่ามันก็เจ๋งดี แต่ก็ไม่ได้เจ๋งเท่าไร เพราะว่ามีอะไรที่เจ๋งกว่าจะมาถึง
AWS มีการ announcements ออกมาแล้วเกี่ยวกับฟังก์ชั่นใหม่ ที่จะเป็นการ generate จาก text แต่แทนที่จะ generate แค่ code จะเป็นการ generate ทั้ง Flow เลย เช่นเราว่าบอกให้ไปเอา data ส่วนนี้ของ Redshift มาใส่ที่ Glue หน่อย Generative AI ก็จะจัดการให้เราหมดเลย
Amazon Redshift
สำหรับ Service ที่เป็น warehouse ของ AWS นี้ ก็มี Generative AI เข้ามาช่วยโดยจะเป็นการ Generative Query (Generative SQL) โดยให้เราทำการพิมพ์ภาษามนุษย์เข้าแล้วไปแล้ว Redshift จะทำการ Generative Query ขึ้นมาให้เราครับ โดยหากไม่ถูกใจเราสามารถให้มันสร้างใหม่ได้ โดยตัว Generative SQL นี้มันจะทำการ Learning data เข้าใจ data ของเราเองไม่ต้องมากดปุ่มคอยให้มัน training ครับ
ส่วนสำหรับตัว Redshift Serverless จะมีการใช้ AI เข้ามาช่วยในการปรับสเปคให้พอดีกับการใช้งานในตอนนั้น ทำให้ไม่แพงเกินไป และได้ performance ตามที่ต้องการ
Amazon DataZone
Amazon DataZone เป็น คอนเซปต์หนึ่งของการ share data ที่ data producer เป็นคนกำหนดเอง โดยแบ่งแชร์ data ลงไปในพท้นที่ที่เรียกว่า zone แล้วคนใน zone เดี่ยวกันสามารถกดเข้าไปดู เอาไปทำอย่างอื่นได้
โดยการที่เราส่ง data ลง zone จำเป็นต้องเขียน Description ของ column แต่ละ column ต้องเขียนอธิบาย
โดยสิ่งที่ Generative AI จะเข้ามาช่วยคือ เวลาเราส่ง data ลง zone, AI จะเข้ามาอ่าน data ของเรา แล้วตั้งชื่อให้เองได้เลยครับ โดยเราสามารถเข้าไปเช็คได้ว่าถูกหรือไม่
Amazon QuickSight
สำหรับในหัวข้อนี้ สิ่งที่ Generative AI จะเข้ามาช่วยคือ การเปลี่ยนภาษามนุษย์ที่เราพิมพ์ลงไปให้เป็น Dashboard ซึ่งทางผู้บรรยาย เขาบอกว่ามันก็ไม่ได้ดูเจ๋งเท่าไร เพราะ คล้ายๆ กับ Generative SQL
แต่ที่เจ๋งคือการสรุปผลลัพท์ของ Dashboard ออกมาเป็น Report ซึ่งผู้อ่านสามารถเข้าไป edit รูปแบบของ Dashboard หรือ interact กับมันได้
ทิ้งท้าย
สำหรับเนื้อหาใน Session นี้ก็มีประมาณนี้ครับ
ในบรรดา Session ที่ผมเข้าร่วม อันนี้ถือเป็นอันนึงที่เนื้อหาน่าสนใจ เพราะนอกจากจะได้เห็นฟังก์ชั่นใหม่ๆ แล้ว ยังได้ฟังประสบการณ์การใช้ AWS จริงๆ จากทางกรุงศรี อีกด้วย
หากใครสนใจสามารถเข้าไปฟังย้อนหลังแบบเต็มๆ ได้ที่ลิ้งค์ด้านล่างนี้นะครับ