[レポート] Amazon Redshift 新機能紹介 featuring Workday #ANT320 #reinvent

2019.12.04

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは!DA事業本部の大高です!ラスベガスからお届けします。

本記事はAWS re:Invent 2019のセッションレポートとなります。

概要

Learn about the most important and hottest new features of Amazon Redshift. In this session, we discuss the architectural evolution of Amazon Redshift and how it uses machine learning to create a self-optimizing data warehouse. We also review recent performance, concurrency, elasticity, and manageability enhancements behind its record price-to-performance ratio. Finally, we share a glimpse of our vision for the data warehouse of the future and hear from Workday about how Amazon Redshift’s latest features have helped Workday achieve its optimization and scale.

Amazon Redshiftの最も重要で最もホットな新機能について学びます。 このセッションでは、Amazon Redshiftのアーキテクチャの進化と、どのように機械学習を使用して自己最適化データウェアハウスを作成しているかを説明します。 また、記録的な価格対パフォーマンス比の背後にある、最近のパフォーマンス、同時実行性、伸縮性、および管理の向上についても確認します。 最後に、将来のデータウェアハウスに関するビジョンを垣間見るとともに、WorkdayからAmazon Redshiftの最新機能がWorkdayの最適化と拡張を達成するのにどのように役立ったかについてお話します。

本セッションはリピートセッションの「ANT320-R」となります。

スピーカー

スピーカーは以下の方々になります。

  • Michalis Petropoulos - Director Software Engineering, Amazon Web Services
  • Erol Guney - Data-as-a-Service Architect, Workday Inc

動画

新機能紹介

まずはMichalisさんによる新機能紹介です。

7年前と現在

7年前に登場したRedshiftの当時のスライドを振り返り、その7年後の現在では1万もの顧客数となっています。

データレイクアーキテクチャへ

顧客は図にあるようなデータレイクアーキテクチャへ向かっています。

Redshiftが選ばれる理由

Redshiftが選ばれる理由としては以下が挙げられます。

データレイクとAWS統合

  • AWS Lake Formationによるカタログとセキュリティ
  • エクサバイススケールのクエリ対応(Spectrum & フェデレーテッドクエリ)
  • AWS統合(AWS DMS, Amazon CloudWatch)

パフォーマンス

  • 他のクラウドデータウェアハウスと比較して3倍以上の速さ

低コスト

  • 他のクラウドデータウェアハウスより最大75%低い
  • 予測可能なコスト

スケーラブル

  • 仮想的に制限のないリニアスケーリング

よりセキュア&セキュリティー認証

  • AWS標準セキュリティー(AWS KMSによるVPC暗号化や、AWS CloudTrail)
  • SOC, PCI, DSS, ISO, FedRAMP, HIPAA認証

フルマネージド

  • プロビジョニングと管理が容易
  • 自動バックアップ
  • 99.9%のSLA

2019年の主なイノベーション

2019年の主なイノベーションの一覧です。とても頻繁に機能追加されているのが良くわかりますね。

ここから各新機能の紹介となります。

Amazon Redshift 第3世代コンピュートインスタンス: RA3

本日発表されたRA3インスタンスについてです。コンピュートとストレージの分離が求められている中、それを実現したインスタンスとなっています。

また、コスト比も非常に良いインスタンスとなっていることが分かります。

AQUA(Advanced Query Accelerator) for Amazon Redshift

こちらも本日発表されたAQUAについてです。追加コスト無しで10倍の速度を出せるというのは、本当にわくわくしますね。

AZ64圧縮エンコーディング

AZ64圧縮エンコーディングについてです。ストレージ最適化されており、高い圧縮性能を誇ることが分かります。

マテリアライズドビュー

最近発表されたマテリアライズドビューについてです。トリガについてはユーザトリガとなりますが、これにより自由度を持たせたとのこと。

新しいデータタイプGeometry: 空間データの収集、格納、分析

個人的には非常に熱いアップデートです。各種形状を持たせることができるGeometry型がサポートされ、40以上のSQL空間関数が利用できるようになりました。

コンカレンシースケーリング

コンカレンシースケーリングによって、コンピュートの伸縮性と拡張性がアップしました。SLAを維持した、仮想的に無制限の同時ユーザとクエリのサポートがされます。

Amazon Redshift フェデレーテッドクエリ (preview)

こちらも本日発表されたフェデレーテッドクエリについてです。RDSやAurora PostgreSQLにクエリが掛けられるという非常に夢がある機能ですね。GAが待ち遠しいです。

Parquet形式でのデータ出力

ついにUNLOADがParquet形式に対応しました。これで、例えば「CSVからのParquet変換をRedshiftを経由して行う」なんてことも出来ますね。

自動最適化

こちらは、最近までのアップデートによる自動最適化についてですね。直近の「Automatic Table Sort」によって一通り揃ったかと思います。

新しい管理コンソール

最近新しくなった管理コンソールです。見た目だけではなく、機能も改善されており、個人的にはスナップショットからの復元時に、アタッチするIAMロールが同時に指定できるようになったのが重宝しています。(これまでは、復元後にアタッチする流れでした)

自動ワークロード管理

これも非常に助かる機能です。WLMを自動モードにすることで、うまくワークロードを管理してくれます。

ストアドプロシージャのサポート

ストアドプロシージャがサポートされ、RedshiftでもPL/pgSQLが書けるようになりました。

ここまで、Redshiftの新機能紹介となりました。いくつは紹介がスキップされたことからも、非常に多くのアップデートが日々なされていることが分かりますね。利用者としては、ありがたい限りです。

Workday Data-as-a-Service

ここからはErolさんによるWorkday社のセッションです。

セッション内容

詳細は省きますが、WorkdayのDaaSのビジョンの理解と、どのようにしてRedshiftがWorkdayのDaaSプロダクトチームにアーキテクチャゴールとビジネスロジックにフォーカスできるようにしたかの紹介が行われました。

まとめ

以上、「Amazon Redshift 新機能紹介 featuring Workday」のレポートでした。続々とRedshiftに新機能が追加されていて、GA待ちの新機能も待ち遠しいですね!

それでは、また!