モダンデータスタック カテゴリ紹介 #6 『Event Tracking(イベントトラッキング)』 – Modern Data Stack Categories Overview Advent Calendar 2023
当エントリは『Modern Data Stack Categories Overview Advent Calendar 2023』 6日目のエントリです。
- Modern Data Stack Categories Overviewのカレンダー | Advent Calendar 2023 - Qiita
- Modern Data Stack Categories Overview Advent Calendar 2023 の記事一覧 | DevelopersIO
データ分析、データを扱う世界では昨今『モダンデータスタック(Modern Data Stack/MDS)』という考え方、サービス構成が大きな注目を浴びています。データの収集、処理、保存、分析に使用されるツールとクラウドデータサービスを集めたソリューションを指す言葉です。クラスメソッドとしてもこのモダンデータスタック(Modern Data Stack/MDS)を推しており、下記の内容でお客様にサービスとして提供しています。
このモダンデータスタックという考え方、現在では構成するサービス群のジャンルが非常に多岐に渡ってきています。このカテゴリ分けも正直企業や個人によって定義が分かれていたりするのですが、『Modern Data Stack - Everything that you need to know !』というサイトではこのカテゴリ分類がシンプルかつ分かりやすく展開されています。このアドベントカレンダー企画では、このサイトで展開されているカテゴリ毎について内容を理解することで見識を広め、今後のサービス展開・サービス選択を検討する足掛かりとして行きたいと思います。
当エントリでは、Modern Data Stack(MDS)におけるカテゴリ『Event Tracking(イベントトラッキング)』の内容について紹介します。
目次
モダンデータスタック(Modern Data Stack/MDS)における『イベントトラッキング』とは
アドベントカレンダー企画の趣旨については1日目のエントリ内『当アドベントカレンダー企画について』をご参照ください。
イベントトラッキングとは、ユーザーとデジタルインタフェース間のインタラクションを記録することです。ツールやシステムの助けを借りてイベントを追跡し、データを保存します。このような時に用いるツールを「イベントトラッカー」と呼びます。イベントトラッカーの種類は用途や目的によって異なります。
イベントで得られるデータはしばしば「行動データ」とも呼ばれます。行動データそのものの詳細については(後述する)Snowplow社のブログで詳細な解説が為されているものがありますので併せてご参照ください。
イベントトラッキングの内容や特徴については以下の通り。
- イベントトラッキングデータはAmazonやNetflix、Facebookのような組織によってユーザーをより深く理解し、製品やサービスを形成しマーケティングに情報を提供するために行動データを利用してきた歴史がある
- 適切なイベントトラッキングツールによってリッチで高品質な行動データを活用することが出来ると、行動データの活用方法は無限に広がる。例えば以下のようなさまざまなアプリケーションを実現できる。
- パーソナライズされた商品レコメンド
- ダイナミックな価格設定モデル設定
- リアルタイムの不正検知
- 解約削減
- クレジットスコアリング
- バスケット分析
- ヘルプデスクの有効化
- サプライチェーンの最適化
- イベントトラッキングにおける「イベント」
- 特定の時点で観察できる相互作用のこと。
- 一般的にこの相互作用は人間とデジタルインターフェース(ウェブサイト、アプリ、ウェアラブルデバイス)の間で起こるが、機械対機械の相互作用も含まれる。
- 例) ブログ記事のクリック、買い物かごに商品を入れる、実店舗を訪れ、割引カードを利用する等
- イベントトラッキングにおける「エンティティ」
- イベントが発生した環境を記述する情報。
- これらはイベントに豊富で詳細なコンテキスト情報を追加し、実用的な洞察を促進するのに役立つ
- 例) ユーザーID、クリックが発生したウェブページ、リンクを含むブログの閲覧時間
- ちなみにこの概念についてはSnowplow社独自のものらしい
- イベント・データの構造:だいたい属性と値のペアや配列を使ったJSON形式が多い
- イベントトラッキングツールに求められるポイント
- セキュリティ対応
- イベントトラッキングに使用するツールやプラットフォームが何であれ、変化する法規制に対応できる必要がある
- 柔軟性と拡張性
- 追跡する行動とその使用方法は、ビジネスの変化に合わせて柔軟に対応できる必要があり、イベント追跡ツールはこれを可能にする必要がある
- データ品質/データの観察
- より広い組織全体で自分たちの仕事に対する信頼を築くかという課題
- データセット間に不一致や矛盾があり、単一の真実の情報源」がない場合、データへの信頼は損なわれる
- イベントトラッキングツールは、データの品質と観察にも配慮すべき
- セキュリティ対応
MDSにおける主なイベントトラッキング系サービス
ここではモダンデータスタックにおける『イベントトラッキング』のカテゴリで主だったサービスについて幾つか言及していきたいと思います。(ここでの評価はユーザーによるサイト内でのLIKEの数が多いものを中心に見ていきます)
Rudderstack
1日目の「ETLツール」編に引き続きの登場、Rudderstack。
内容紹介詳細は1日目のエントリをご参照ください。
Segment
Segmentは、企業がファーストパーティーの顧客データを活用できるように支援する顧客データプラットフォーム(CDP)です。開発者が顧客データを統合・収集し、分析、マーケティング、データウェアハウスのための複数のツールに送信するためのAPIを提供します。また、Google Analytics、HEAP、adobe analytics、flurry、mixpanelなどの情報を統合して収集するための複数のデータソースも提供する。また、データガバナンスのためのソリューションも提供しています。
その他Segmentに関する基本的(初歩的)な情報は以下の通り。
- Getting Started Guide | Segment Documentation
- Twilio Segment Pricing Options | Twilio Segment
- Segment(@segment)さん / X
- Segment - YouTube
Snowplow
Snowplowは行動データプラットフォームです。データチームが大規模に行動データを取得し、運用できるように構築されています。大きく以下の特徴を備えています。
- ユーザーを特定し、ウェブサイトやアプリケーション、IoTとの関わり方を追跡
- ユーザーの行動データをスケーラブルなイベントデータウェアハウスに保存し、ビッグデータツールセット、従来のBIツール、統計ツール、グラフィカルツールなど、あらゆる分析ツールに接続してデータを解析することができる
- ウェブ解析やその他のスノープラウ・イベント・データを、マーケティング・データ・セットや顧客データ・セットなどのサードパーティ・データ・ソースと結合す
Snowplowに関してはDevelopersIOでも1件、下記のエントリが過去に公開されています。
その他Snowplowに関する基本的(初歩的)な情報は以下の通り。
- Get started with Snowplow | Snowplow
- Snowplow pricing | Snowplow
- Snowplow(@snowplow)さん / X
- Snowplow - YouTube
まとめ
という訳で『Modern Data Stack Categories Overview Advent Calendar 2023』6日目の記事、イベントトラッキングに関する紹介エントリでした。
明日7日目は『Metrics Store(メトリックストア)』に関する内容となります。お楽しみに!