[レポート] Aurora PostgreSQL Limitless Database のアーキテクチャについて学べる LT「Serverless scaling with Amazon Aurora PostgreSQL Limitless Database」 #DAT338 #AWSreInvent
コーヒーが好きな emi です。
AWS re:Invent 2024 で Lightning talk「Serverless scaling with Amazon Aurora PostgreSQL Limitless Database(Amazon Aurora PostgreSQL Limitless Database によるサーバーレスのスケーリング)」に参加しました。
この LT では、2024/10/31 に GA された Amazon Aurora PostgreSQL Limitless Database の概要とアーキテクチャについて学べました。
概要
タイトル:DAT338 | Serverless scaling with Amazon Aurora PostgreSQL Limitless Database
アプリケーションの成長に合わせてデータベースを拡張することに苦労していませんか?Amazon Aurora PostgreSQL Limitless Databaseが毎秒数百万件の書き込みトランザクションをサポートするためにどのように拡張するのかを学び、単一データベースの操作の簡便性を維持しながらペタバイト単位のデータを管理する方法を習得しましょう。Aurora PostgreSQL Limitless Databaseのアーキテクチャ、分散型トランザクション管理、サーバーレスの拡張機能について詳しく見ていきましょう。Aurora PostgreSQL Limitless Databaseで優れたパフォーマンスを発揮するアプリケーションのパターンについて理解を深め、最適なパフォーマンスを実現するために避けるべきパターンについても学んでください。データベースインフラストラクチャの潜在能力を最大限に引き出し、真のスケーラビリティを体験する方法を発見してください。
スピーカー
David Wein(Sr Principal Technologist, AWS)
Anum Jang Sher(Product Manager, Amazon)
Thursday, December 5
11:00 AM - 11:20 AM PST
Venetian | Hall B | Expo | Theater 4
Session types: Lightning talk
Topic: Databases
Area of interest: Innovation & Transformation
Level: 300 – Advanced
Role: Developer / Engineer, IT Professional / Technical Manager, Solution / Systems Architect
Services: Amazon Aurora
レポート
LT は Expo の一角、シアター 4 という場所で行われました。オープンな場所です。
Amazon Aurora PostgreSQL Limitless Database の概要
従来のデータベーススケーリングの問題
- 単一のデータベースインスタンスがビジネス成長に伴いスケールの限界に達する
- シャーディング(データベースの分割)によりスケールは可能だが、多くの課題が発生する
- アプリケーション層でのクエリ処理が複雑化
- 一貫性の維持が困難
- 容量管理が煩雑で過剰プロビジョニングによるコスト増
Amazon Aurora PostgreSQL Limitless Database
- Amazon Aurora Limitless Database は、シャーディングによる水平スケーリングをマネージドで提供するサービス
- ユーザーがシャーディングに伴う複雑な管理(データの分散、トランザクションの一貫性の維持など)を意識する必要なく、単一のクラスターとしてデータベースを運用可能
- 特徴
- 水平スケーリング(マネージドシャーディング)
- 自動でデータを複数のシャードに分散し、パフォーマンスやスケーラビリティ向上
- ペタバイト規模のデータ管理や秒間数百万のトランザクション処理を実現
- ユーザーは単一のエンドポイントを利用し、シャードの存在を意識せずにデータベースを利用
- 必要に応じてコンピュートリソースを自動でスケールアップ・ダウン
利用開始方法
- AWS コンソールまたは API を使用してデプロイ可能。
- 最小/最大容量を設定するだけで簡単に構築可能。
アーキテクチャ
- Distributed transaction routers(ルーターのレイヤー)
- クエリ解析、計画、実行
- トランザクションの一貫性を維持
- Data access shards(コンピュートのレイヤー)
- データを保持し、スケーラビリティと可用性を向上
- ホットパーティション(特定のシャードに負荷が集中する問題)に自動対応
- コンピュート冗長性により、可用性 99.99% 保証
- テーブルタイプ
- シャードテーブル(Sharded tables)
- 主キーをもとに分割
- 関連するレコードは同じシャードに分配するようにできる = コロケーション(Collocation)できる
- 参照テーブル (Reference tables)
- 頻繁に読み取られるデータを効率的に利用するためのもの
- 参照テーブルのデータは全シャードに複製され、一貫性を保証
- シャードテーブル(Sharded tables)
終わりに
LT は Expo の中の一角で行われていて、予約無しで誰でも視聴できました。
Aurora PostgreSQL Limitless Database については以下の AWS Summit Japan 2024 のセッションレポートでも記載しているので、あわせてご覧ください。
Aurora DSQL も発表されて、どんどんデータ分野が熱くなっていますね!AI の活用においても元になるデータの活用は重要です。最新技術もどんどん進化していくので、引き続きキャッチアップしながら活用していきましょう!
参考
追記:動画がアップロードされていました。