[速報] OpenSearch ServiceのETLが簡単に。「Amazon OpenSearch Service zero-ETL integration with Amazon S3」リリース(preview) #AWSreinvent

2023.11.30

せーのでございます。 ただいま、AWS re:Invent 2023 keynoteをラスベガス現地にて聞いております。

Amazon OpenSearch Service向けのZero-ETLサービス「Amazon OpenSearch Service zero-ETL integration with Amazon S3」が発表されたのでお伝えします。

昨日のキーノートでもZero-ETL関連のサービスが発表されていましたが、今回、OpenSearch ServiceとS3のzero-ETLが可能になった、という発表です。これは便利そうですね。

S3でのデータ分析が格段に便利に

S3というサービスはそもそもデータストアとしての意義が強く、低コストで大量のデータを保管できるため、とりあえずデータはS3に放り込んで、分析が必要なデータはOpenSearch Serviceにコピーし、データを理解し、異常を特定し、潜在的な脅威を検出する必要がありました。

今回のこの「Amazon OpenSearch Service zero-ETL integration with Amazon S3」によって、S3に保存された様々なデータを移動することなく、複雑なクエリや可視化を簡単に実行することができます。

S3内の運用ログを可視化

OpenSearch ServiceとS3をZero-ETL連携することで、特に様々なログタイプのテンプレートを活用し、そのログタイプに合わせたデータ高速化を設定することができます。

テンプレートには、VPC フローログElastic Load Balancingログ、NGINX ログが含まれ、選択するとすぐにこれらのログの分析、可視化が可能となります。

AWS Glue Data Catalogを使用

AWS Management Consoleまたは API を使って、OpenSearch Service 用の新しい Amazon S3 ダイレクトクエリデータソースを作成することで、簡単に始めることができます。新しいデータソースは、AWS Glue Data Catalogを使用して、S3 バケットを表すテーブルを管理します。データソースを作成したら、OpenSearch ダッシュボードでAmazon S3テーブルとデータのインデックスとクエリデータを設定できます。
データソースとしてGlueを通したS3データをセットしたら、あとはSQLクエリを書けばOpenSearch Dashboard上にログデータの分析用グラフが表示されます。

課金は「インデックス維持」+「使用OCU」

気になる料金ですが、S3の料金、AWS Glue Data Catalogの料金の他に、OpenSearch Compute Units (OCUs)単位でクエリ量に応じて課金されます。またOpenSearch Service のインデックスとしてのインスタンス料金も維持として課金されますので、業務目的の際にはランニングコストを必ず試算した上で使用するようにしましょう。

プレビュー中

Amazon OpenSearch Service と Amazon S3 のZero-ETL統合は、AWSの米国東部(オハイオ州)、米国東部(北バージニア州)、米国西部(オレゴン州)、アジア太平洋(東京)、欧州(フランクフルト)、欧州(アイルランド)リージョンでプレビュー中です。

参考URL