話題の記事

【速報】【新サービス】時系列データベースであるAmazon Timestreamが発表されました #reinvent

2018.11.29

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

サーバーレス開発部の阿部です。

re:Invent 2018のキーノートにて、時系列データベースであるAmazon Timestreamが発表されました。現在はプレビュー受付中です。

時系列データベースとは、その名の通り、タイムスタンプを持つデータを保持、扱うことに特化したものです。他の製品だとInfluxDBやBeringei (Gorilla)などがあります。

概要(サマリ)

Amazon Timestreamは、関係データベースの1/10のコストでIoTや運用系のアプリケーションのような大量のイベントを扱うケースを想定した時系列データベースサービスです。リレーショナルデータベースでも保持はできますが、時間感覚でのクエリや保存の最適化については不十分です。

Timestreamはこれら時系列データの保存やクエリを処理することを目的に構築されたデータベースとなります。

サーバーレスなマネージドサービスなので、もちろん管理するサーバーはありません。データのロールアップ、保持、階層化、圧縮も自動化されます。

メリット

1. 1000倍のオーダーで早いクエリと1/10のコスト

時系列データの取り扱いに関してはRDBと比較してパフォーマンスとコストで大きなメリットがあります。 Timestreamは時間感覚でデータを組織化するため、クエリの結果を作る際に大きなデータ読み込みを必要としません。 また、挿入と検索は別のレイヤで処理されるので、それぞれがパフォーマンスに影響しません。

2.組み込みの分析関数

平滑化や近似、保管などの組み込み関数があり、素早く分析を行うことができます。 加えて、クエリプロセッシングエンジンは様々な時間感覚に最適化されています。

3.サーバーレスであること

サーバーレスであるため、サービスのことに集中できます。アプリケーションの変更に対応するためのスケールも自動で対応します。 また、データ保持ポリシーを使用してデータ管理コストを最適化できます。

想定されるユースケース

Timestreamを使うことにより、時系列データがより重要になる以下のユースケースでメリットが期待できます。

  • DevOps(アプリケーションのパフォーマンス管理、ネットワークやサーバのモニタリングデータなど)
  • IoTアプリケーション(デバイスのセンサーデータ収集や活用など)
  • 産業設備のデータ収集(メンテナンスやモニタリング、フリートの管理、ルートの最適化や管理など)

まとめ

ユースケースであげられている通り、IoTなどは大量の時系列データが発生しますし、時間とともに増えていくデータに対してパフォーマンスの維持やクエリの最適化を含めた活用が求められます。Timestreamはこれらの課題に対してのアプローチとなります。今回のre:Inventではエッジサイドでのコンピューティングのセッションが活発だったので、今はこちらに力を入れているかと思ったらクラウドサイドにも期待したいサービスが出てきて嬉しいです。

気になるのはどのようなクエリを投げることができるか、ですが、これはプレビューを実際に触れるようになったら確認してみたいと思います。

非常に楽しみなプロダクトです!