re:Invent2022 Expoで出典していた「Datadog」について深掘りレポートしてみた #reinvent

2022.12.11

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、こんばんわ。 「re:Invent2022現地参加してやっちまった。」 どうも、CX 事業本部 Delivery 部 @札幌の hiro です。

そうです。丸山、re:Invent2022の現地(ラスベガス)イベントに参加させていただいております。

はじめに

re:Invent2022のExpo迫力に圧倒されながら、のらりくらり歩いたら、Datadogブースがやたらと幅を利かせていた(笑)ので、そのときの得た情報などをお話ししようと思います。

re:Invent 2022 Expoとは

他の方々もブログで紹介されていますが、re:Invent2022イベントにスポンサーブースが大量にある場所です。とにかくパックドな感じで自社サービスをガンガンアピールしている企業が多く、日本のブース展開とはまた違った雰囲気を感じることができました。

re:Invent2022Expo出典パートナーで個人的にアツいサービスを8つ紹介 #reinvent

Datadogブース

ごめんなさい!幅を利かせているブース写真を撮り忘れていました・・・

代わりに、Datadog公式Twitter情報とDatadogTシャツ、滑り台の良い弊社記事を添えさせてください。

  • Datadog公式Twitter情報

  • DatadogTシャツ

  • 滑り台の良い弊社記事

Datadog滑り台 滑ってみた #reInvent

とにかく、小さめのブースだけにとどまらず、とんでもなく大きいブースを構え、大人数でお話しを聞いてくれる人を呼び込んでいるブースでした。

以下のようにre:Invent用にページを設けたり、Datadog滑り台を特設で作ったり、ラスベガス空港ででかい看板作るくらい、力が入っており現地でもそれを感じることができました。

  • re:Invent用ページ

https://www.datadoghq.com/event/micro-aws-reinvent-2022/

  • Datadog滑り台

  • ラスベガスの空港でも看板

Datadogとは

マルチクラウドやサーバレス向けのメトリクスやイベントの監視やログ収集、アラート、データをダッシュボードで可視化できるツール、サービス。

https://www.datadoghq.com/ja/

社内でもDatadogについてもいくつかDatadogについても取り上げられています。

Monitoring Modern Infractructure(eBook provided by Datadog)を読んでみた #datadog

現地でどんな話を聞いてきた

Datadogのドキュメントページに行ってもわかるように、様々なプラットフォームをDatadogは提供しています。

https://docs.datadoghq.com/ja/?_gl=1*zph6ui*_ga*MjEwMzE5NTM4MC4xNjcwMjI2NTk5*_ga_KN80RDFSQK*MTY3MDczMTU2My4xMS4xLjE2NzA3MzQ4NzQuNjAuMC4w&_ga=2.4747891.1311707647.1670731564-2103195380.1670226599

その中で現地では、以下の内容を数分ほど聞いてきました。

  • インテグレーション
  • ダッシュボード
  • ログ
  • APM

他にも様々なプラットフォームがあるので、ぜひドキュメントページから一読してみるのをオススメします。

では聞いてた内容も含めつつ、そのプラットフォームについてお話しします。

※実際に聞いてきたときの写真を撮ることをしていないので、「何を聞いてきた」部分にある画像は、例としての画像になります。

■インテグレーション

すべてのシステム、アプリケーション、サービスの横断的な監視を実現します。Datadog が提供する 500 以上の組み込みインテグレーションをご活用ください。

画像からもわかるように、様々なサービスやOS、デバイスとのインテグレーションを行うことがわかると思います。

  • Datadog では、主に次の 3 種類のインテグレーションが提供されています。
  • エージェントベースのインテグレーションは、Datadog Agent と共にインストールされ、check という Python クラスメソッドを使用して、収集するメトリクスを定義します。
  • 認証 (クローラー) ベースのインテグレーションは、Datadog で設定されます。その際、API を使用してメトリクスを取得するための資格情報を指定します。これには、SlackAWSAzurePagerDuty などのよく使用されるインテグレーションがあります。
  • ライブラリインテグレーションでは、Datadog API を使用して、記述言語 (Node.jsPython など) に基づいてアプリケーションを監視できます。

◇何を聞いてきた

多くのサービスやOSなどとインテグレーションできるのですが、話を聞いてきた内容は全てAWSになります。

AWSのどういうものと連携ができるのか、インテグレーションすることでダッシュボードでどういうものが閲覧できるのかなど。

■ダッシュボード

re:Invent2022のkeynoteでも「Amazon QuickSight Paginated Reports」の発表があったように、視覚的に数値をグラフなどにして閲覧できることが需要としても増えてきています。

[新機能]Amazon QuickSight Paginated Reportsでページ分割したレポートを作成・共有できるようになりました #reinvent

Datadogも同様に、以下の画像のように視覚的に、かつ使用しやすいように使用者がカスタマイズすることなどもできます。

◇何を聞いてきた

「インテグレーション」の項目でもお話しした通り、AWSサービスについて主にお話しを聞いてきたので、AWSが動いているダッシュボードで、どんな感じで閲覧できるのかなど見てきました。

CloudWatchでも様々なものを閲覧できますが、個人的にはDatadog見やすいなーというイメージでした。

■ログ

ログに関しては、Datadogに関わらず様々なサービスで監視・閲覧ができるものだと思います。

Datadogのログ監視では、コスト効率を意識して「Datadog Logging without Limits」というサービスでログ収集・処理・アーカイブ・探索・監視ができるようになっているようです。

Datadog のログ管理 (ログとも呼ばれます) を使用して、サーバー、コンテナ、クラウド環境、アプリケーション、既存のログプロセッサやフォワーダーなど、複数のロギングソースにまたがるログを収集します。従来のロギングでは、コスト効率を維持するために分析・保持するログを選択する必要がありました。Datadog Logging without Limits* では、ログの収集、処理、アーカイブ、探索、監視をログの制限なく行うことができます。

パターンからログ収集に無駄があることが判定できすることが可能なので、便利のようです。

◇何を聞いてきた

AWSのCloudWatchなどでログ情報を閲覧できますが、こちらもログのテキストだけがズラーっとあるのではなく、どういう状態のログでどのくらいログが上がってきているのかを、視覚的に閲覧できるのはいいなと感じました。

■APM

APM(Datadog Application Performance Monitoring)は、WEBアプリケーションなどのリクエストやエラー、レイテンシーを監視し、可視化することができます。

また、Synthetic モニタリングを利用することで、LCP(Largest Contentful Paint)などもメトリクスとして可視化することができるようです。

◇何を聞いてきた

アプリケーションのレイテンシーなどを測ることができるのかなどをお話を聞いたところ可能ということで、その画面などを見せてもらいました。

以下の画像のように、Javascriptなどのサイズやレイテンシーが閲覧することが可能となっています。

まとめ

re:Invent2022 Expoの現地参加をしてきて、その中で「Datadog」に特化してお話しをしました。現地も盛り上がりも含め、ものすごく多くのものを学び、多くのチャンスも獲得できたのかもしれないと、興奮しております。

多くの情報があるが、それを人間が容易に理解できるような形で示しているサービスが数少ない中、Datadogのようなサービスでより便利になることは体験として良いことだなと感じました。

今回AWSに特化したような内容で記述していますが、他のサービスも一緒にインテグレーションすることで同時にサービス状況を閲覧することができるので、ものすごく便利なツールです。

所感

ラスベガスから帰省後に、Datadogについて色々調べると、他に便利な機能が結構あることに気がつきました。

例えば、Infrastructure(Host Map)では視覚的に(色で)CPU使用率がリージョンごとにわかる、ブラウザテストができて、E2Eテストができるなどです。

ユーザからサービス障害ありましたよと連絡が来る前にキャッチアップできるようにするためにも、一役買うのではないかなと感じました。

今後、所属しているプロジェクトやそれ以外にも役立てればと思い、現地レポートを兼ねて記述しました。もっと触っていこうと思います。

ちなみに、現地でE2Eはできるのか?って聞いたら、全然伝わらずEnd-to-Endか?って聞かれて、海外ではE2Eというのではなく、End-to-Endって言おう!っと思ったのでした。

ありがとうございました。