[速報] Amazon Redshiftが Amazon KDS と Amazon MSK のリアルタイムストリーミングインジェストの一般提供を発表! #reinvent

2022.11.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

データアナリティクス事業本部のコンサルティングチームの石川です。Amazon Redshiftが Amazon KDS と Amazon MSK のリアルタイムストリーミングインジェストの一般提供を発表されました!

Amazon KDS と Amazon MSK のリアルタイムストリーミングとは

Redshiftは、Amazon Kinesis Data Streams (KDS) および Amazon Managed Streaming for Apache Kafka (MSK) のリアルタイムストリーミングインジェストをサポートするようになりました。Amazon RedshiftからAmazon KDSのストリームデータをマテリアライズド・ビュー経由でニアリアルタイムにインジェストする機能が2022年2月からパブリック・プレビュー提供されていましたが、これが一般提供(GA)が開始されました。

リアルタイムストリーミングインジェストの機能

従来、ストリーミングデータをRedshiftに取り込むのに必要だった、S3で配置した後データのロード(COPY)が不要になります。今回の新機能によって毎秒数百メガバイトのストリーミングデータをRedshiftに取り込みながら、秒単位という低レイテンシーを実現できます。

Redshiftの新しいストリーミング取り込み機能により、Redshift内でSQLを使用して、複数のAmazon KDSストリームまたは複数のAmazon MSKトピックに同時に接続してデータを直接取り込むことができます。

Redshift ストリーミングインジェストでは、ストリーム上にマテリアライズドビューを用いて実装するため、データパイプラインが簡素化されます。マテリアライズドビューには、ELT (Extract Load Transform) パイプラインの一部としてSQL変換を含めることもできます。

マテリアライズドビューの自動更新機能が有効になっている場合、ストリーミングデータは、KDSストリームまたはMSKトピックからRedshiftストリーミングマテリアライズドビューに自動的かつ継続的に取り込まれます。インジェスト スケジュールを直接制御する必要がある場合は、ストリーミングマテリアライズドビューを手動で更新することもできます。

追加料金はなし

RedshiftのマテリアライズドビューとSQLを使用して、ストリーミングデータのダウンストリーム処理と変換をするため、追加料金は不要です。

対応リージョン

現在、すべての商用AWSリージョンで一般提供されています。

最後に

Redshiftで低レイテンシのストリーミングデータ取り込みが、素早く簡単に実現できるようになりました。マテリアライズドビューを用いたストリーミングデータの取り込みは素晴らしいアイディアだと考えています。

参考文献