ちょっと話題の記事

[新サービス]S3上のデータをSQLクエリで取得する、Amazon Athenaを試す #reinvent

2016.12.01

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

コンニチハ、千葉です。Amazon Athenaが発表されましたので、さっそく試してみました。これは、ほんとすごいです。

20161130-athena-0

Amazon Athenaとは?

詳細はAWSの公式ブログAmazon Athena – Amazon S3上のデータに対話的にSQLクエリをに記載されていますのでこちらを参照ください。

Amazon Athenaについて、上公式ブログから引用です。

Athenaは新しいサーバレスクエリサービスで、Amazon S3に保存された膨大な量のデータを標準SQLを使って簡単に分析できます。シンプルにAmazon Simple Storage Service (S3)に保存したデータを指定し、フィールドを定義して、クエリを投げると、数秒で結果を得られます。皆さんは、クラスタや他のインフラを構築したり管理したりチューニングする必要はなく、実行したクエリに対してのみお金を払うだけでよいです。裏では、Athenaがクエリを並列化して何百、何千コアに分散してくれ、数秒で結果を届けてくれます。

引用元:Amazon Athena – Amazon S3上のデータに対話的にSQLクエリを

やってみた

クエリを投げてみた

Athenaにログインすると、サンプルデータとしてelb_logsというテーブルがあります。このデータはS3にあるようです。 試しに、このテーブルに対してクエリを投げてみました。

20161130-athena-1

数秒で結果が返ってきます。これは、ほんとすごい。

よく使うクエリを登録してみた

よく使うクエリを登録して、何度も実行することができます。

Save Asを選択します。 20161130-athena-2

保存名と説明を記載します。 20161130-athena-3

あとは、Saved Queriesから確認できます。 20161130-athena-4 リンクをクリックするとすぐ実行できます。

クエリのヒストリを確認する

過去実行したクエリを確認できます。ステータスや、クエリにかかった時間も確認できますね。

20161130-athena-5

新しいデータベースやテーブルを作成する

新規にデータベースを作成してみます。

Saved Queriesをクリック。 20161130-athena-6

データベース情報とS3のURLを入力。 20161130-athena-7

フォーマットを入力。 20161130-athena-8

カラムの設定。 20161130-athena-9

オプションはそのままで。 20161130-athena-10

作成できました! 20161130-athena-11

他ツールとの連携

Quick SightやJDBCを利用できるということで、ドキュメントが公開されたようなので、やってみた系の他のブログで書きたいと思います!

最後に

Key Note 1日目、沢山の発表がありました。明日もあるので楽しみです!

参考