Amazon Redshift Serverless คืออะไร? รูปแบบใหม่ของ Amazon Redshift

2022.08.24

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

สวัสดีครับผม ต้า จากทีม Technical Support ครับ
วันนี้ผมจะมาแนะนำเกี่ยวกับ Service ใหม่ของ AWS ที่พึ่งเปิดตัวมาที่มีชื่อว่า Amazon Redshift Serverless ให้ได้รู้จักกันครับ

Amazon Redshift Serverless คืออะไร?

Amazon Redshift Serverless หมายถึง Service ที่มีความฟังก์ชันและความสามารถต่างๆเหมือนกับ Redshift(Provisioned Cluster) แต่มีจุดเด่นที่เป็น Redshift Serverless หรือก็คือ ไม่มี Instance ให้เราควบคุม เพราะ AWS จะจัดการทุกอย่างให้อยู่รูปแบบที่เหมาะสมที่สุดนั่นเอง

สำหรับท่านที่ต้องการทำความเข้าใจเพิ่มเติมเกี่ยว Amazon Redshift ตัวต้นฉบับสามารถดูรายละเอียดเพิ่มเติมได้ที่ลิ้งค์ด้านล่าง

Amazon Redshift Serverless มีดีอะไร?

ด้วยความที่มันเป็น Serverless ทำให้เราสามารถเข้าถึงไปยังข้อมูลแล้วทำการวิเคราะห์ข้อมูลได้ทันที โดยที่ไม่ต้องมาทำการ Setup, ตั้งค่า หรือ จัดการ Amazon Redshift Cluster

ค่าใช้จ่ายที่เกิดขึ้นตามจำนวนที่ใช้เท่านั้น

ความแตกต่างระหว่าง Amazon Redshift Serverless กับ Amazon Redshift คือ Amazon Redshift Serverless จะทำการปิดตัวเองลงเองเมื่อไม่ได้ถูกใช้งาน และเปิดขึ้นเองเมื่อถูกใช้งาน นั่นทำให้ช่วยลดค่าใช้จ่ายได้ ซึ่งแตกต่างกับ Amazon Redshift ที่เราจะต้องเปิดใช้งานตลอด 24 ชั่วโมง

ในการทำงานของ Amazon Redshift Serverless จะใช้ SQL feature, Performance รุ่นระดับท็อป, lake house architecture ที่มาจาก Cluster ของ Amazon Redshift ที่ดีที่สุด เพื่อดำเนินการ quary ในรูปแบบ Serverless ระหว่า core data sources, Data Lake, data warehouse
นั่นหมายความว่าหาก AWS จะจัดการเตรียม Resource ที่ดีที่สุดกับงานของเราให้เลย ทำให้เราไม่ต้องมาวิเคราะห์ Spec ที่จะใช้ในแต่ละงานเหมือนกับ Amazon Redshift อีกแล้ว

การรองรับฟังก์ชันและวิธีการเชื่อมต่อเกือบทุกอย่างที่ Amazon Redshift มี

Amazon Redshift Serverless มีการรองรับฟังก์ชันและวิธีการเชื่อมต่อเกือบทุกอย่างที่ Amazon Redshift มี

โดยสามารถดูรายละเอียดเพิ่มเติมได้ที่คลิปด้านล่าง

จุดเด่นของ Redshift Serverless


(ที่มาของภาพมาจากลิ้งค์ Youtube ด้านบน ↑ )

จุดเด่นของ Redshift Serverless มีดังนี้

Simplified user experience

ผู้ใช้งานสามารถเต็มที่กับการทำงาน Data Analysis โดยไม่จำเป็นต้องกังวลเกี่ยวกับ Note type Number of nodes หรือ Provisioning cluster เพราะ Redshift Serverless จะทำการจัดการเรื่องเหล่านี้อยู่ในเบื้องหลังเอง ไม่ว่าจะเป็นการใช้ WLM (Workload management) ปรับแต่ง carrier throughput ให้เหมาะสมที่สุด, การเปิดปิด Instance โดยอัตโนมัติ, การ patching หรือ Performance optimization task เราสามารถทำงาน Data Analysis ได้เลยโดยไม่ต้องไปยุ่งกับ cluster

Intelligent and dynamic compute

เมื่อเกิดปริมาณ Workload ขึ้นในช่วงเวลาหนึ่ง Redshift Serverless จะทำการ Provisioning และ scaling Data warehouse capacity โดยอัตโนมัติ เพื่อให้ได้ Performance ที่สม่ำเสมอและรวดเร็ว

All Redshift functionality and performance

Redshift Serverless สามารถใช้ฟังก์ชัน SQL ของ Redshift และคุณสมบัติของ Performance ได้ หรือก็คือ Query ที่มาจาก S3 Data Lake(Redshift Spectrum), Other operational databases(Fedrated Query) หรือ Data Sharing ที่ใช้กับองค์กรอื่นๆ

Pay for use

Redshift Serverless มีค่าใช้จ่ายเฉพาะ compute capacity สำหรับระยะเวลา Workload ไม่มีค่าใช้จ่ายในส่วนของ idleness

Amazon Redshift Serverless use cases

อยากเริ่มใช้งานแบบง่ายๆ (Easy Analytics)


จุดเด่น Redshift Serverless นั้นคือ การออกแบบทุกอย่างให้ออกมา Simple ที่สุด เพื่อที่เราจะได้โฟกัสเกี่ยวกับ Data Analysis โดยไม่จำเป็นต้องคิดเกี่ยวกับ Infrastructure ไม่ว่าจะเป็น การสร้าง Cluster, ควบคุม Cluster, Instance Type, จำนวน Node ยกตัวอย่างเช่น ในส่วนของ Data ก็มีการปรับให้เข้าใจง่ายขึ้นด้วย DataSharing ในส่วนของ Computing ก็มีการปรับให้เข้าใจง่ายขึ้นด้วย Redshift Serverlesss เมื่อเอาสิ่งนี้มาประกอบเข้าด้วยกัน ก็จะทำให้เกิดความคล่องตัวในการจัดการ Workload ต่างๆขึ้น

Workload ที่มีการผันแปรสูง (Variable workloads)


มันเป็นเรื่องยาก หากเราต้องการที่จะปรับ Scale up, Scale down ด้วยตัวเองตามการเปลี่ยนแปลงต่างๆของ Capacity ที่เกิดขึ้นใน 1 วัน ซึ่งปัญหานี้สามารถแก้ไขได้ด้วย Redshift Serverless นั่นเอง

Workload ที่มีความสม่ำเสมอ (Periodic workloads)

หาก Data ของเรามีการส่งถึงและจำเป็นต้องประมวลผลทุกๆ 1 ชั่วโมง และในการประมวลนั้นจะใช้เวลาครั้งละ 10 นาที นั่นหมายความว่าเป็นการประมวลผลที่มีความสม่ำเสมอครับ โดย Redshift Serverless ก็มีความสามารถในการจัดการเรื่องนี้ ที่สามารถ provisioning เริ่มงาน และ จบงาน ที่สม่ำเสมอได้ครับ

สภาวะที่มี spikes อยู่เป็นประจำ (Steady state with spikes)


ในระยะการทำงานจะมีช่วงที่เกิด Dynamic อยู่ตลอด(แบบภาพด้านบน) แม้ว่าในช่วงเวลาปกติก็จะเกิด Spike ที่ไม่คาดคิดอยู่ตลอด ในกรณีนี้ Redshift Serverless จะทำการ provisioning Resource เพื่อสร้าง Performace ที่คงที่อยู่ได้ และสามารถ Scale up, Scale down ตาม Capacity ได้

สรุป

สำหรับใครที่สนใจ Redshift Serverless สามารถดูรายละเอียดเพิ่มเติมได้ที่คลิปด้านล่างนี้

หรือในส่วนของ Amazon Official Website ก็มีหน้าต่าง Amazon Redshift Serverless ฉบับภาษาไทยมาให้ดูกันแล้ว

สำหรับผมก็ต้องขอตัวไปก่อน แล้วพบกันใหม่ในบทความต่อไป สวัสดีครับ / ต้า

บทความที่เกี่ยวข้อง