(レポート) Developers Summit 2015 Autumn S-4:なぜテスラを買う人は43日前に一人旅をするのか? #devsumi

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

本記事はDevelopers Summit 2015 AutumnのS-4セッション、「なぜテスラを買う人は43日前に一人旅をするのか? -多次元データベースによる未来予測の実現-」のレポートです。

レポート

なぜテスラを買う人は43日前に一人旅をするのか? -多次元データベースによる未来予測の実現- by 株式会社マイクロアド 青井 順一氏

・なぜテスラを買う人は43日前に一人旅をするのか? ・テスラを買ってる人はまだ少ない、テスラを買う人は特徴的な人であることが多い ・テスラを買う人はどのような人なのか?それを知る方法を構築している ・多層多面的なデータを統合することによって、新しい知見を発見し、未来予測が実現できる ・独自の多次元データベースの構築

・データ活用の可能性 ・課題、限られたデータでは、分析対象の特徴を十分に知ることができない。 ・限られたデータでもわかること。年齢、性別、Web閲覧行動。 ・わからないこと。なぜ買ったのか、何が心を動かしたのか、といった本質的な情報 ・多様なデータを結びつけることで、分析対象の特徴を深く理解することができる ・多面的 ・行動分析、属性分析、時系列分析、ユーザー分析 ・多層的 ・メディア、カテゴリ、キーワード ・長期、短期 ・多次元データベースを活用することで、これまでのプロダクトで見つけることができなかった知見、特徴から予測できる未来、様々な分析が出来るようになる ・広告やマーケティング以外の活用も視野に入れている

・多次元データベースによるデータ活用 ・多次元データベースの全体像。多様なデータを様々な切り口から分析する。 ・多様なデータを独自開発のDWHに投入、ユーザーI/Fによって様々な分析が出来る。 ・分析の機能。高速検索、時系列分析、価値観/ライフスタイル分析。 ・どのようなデータを使っているか。オンラインデータ群とオフラインデータ群。 ・オンラインデータ→ネット広告でずっと使ってきた。 ・オフラインデータ群→近年進めているところ、外部の協力会社や調査機関の協力を得てデータを収集。 ・具体的なオンラインデータの例。Webアクセスログ、購買データ、位置情報、ネット接触時間、接触コンテンツ、でもブラフィックデータ。

・分析 ・高速検索。大規模行動ログから分析対象の特徴を見つける。 ・時系列分析、時系列の中で特徴的な行動とタイミングを見つけ出す。 ・価値観/ライフスタイル分析。性別や年齢と共にユーザーのライフスタイルを推定する。

・高速検索 ・ユーザーを多次元データベースを用いて検索、結果として未知の行動や特徴的な嗜好性を発見。 ・ターゲティング設計、商品開発やクリエイティブ設計に活用。 ・あるいは位置情報から居住者情報、地域特性を発見。 ・企業の出店計画、不動産計画に活用。 ・システム構成。Stormでストリーム処理、行動ログの統合、IDの共通化、サマリ処理を実施。 ・StormからHadoopやKVSに渡す。HadoopはPivotal HD。 ・ Hiveを使うより数十倍パフォーマンスが高い。 ・ KVSはAerospike。スケール、データ参照が効率的。 ・蓄積したデータを機械学習に渡す。デモグラフィック推定、クラスタリング、トピック分析を実行。 ・行動ログに特化した検索エンジンを独自に開発 ・インメモリデータベース ・行動ログに特化したインデクシング ・時系列データを高速に参照可能 ・複数条件を組み合わせた場合でも高速に検索が可能

・時系列分析 ・特徴的な行動をするタイミングを見つけ出す ・時系列な行動分析は非常に重要 ・特定な行動をとった後に購入する機会が高いとか ・購入にどれだけ時間をかけているかとか ・ユーザー行動の時系列分析をUIからリアルタイムで実行可能。 ・行動毎の特徴度を時系列で可視化

・価値観/ライフスタイル分析 ・行動の裏側に隠されたユーザーの価値観/ライフスタイルを見つけ出す ・ヤンケロビッチの価値観ヒエラルキー。人間を構成する要素をヒエラルキーとして可視化したもの。 ・性格→価値観→ライフスタイル→趣味嗜好→行動。 ・ネット広告で取り扱ってきたのは行動や趣味嗜好を分析したターゲティング配信。 ・今後取り組みたい領域がライフスタイル、価値観、性格といったヒエラルキーの上位層。 ・なぜそのような行動をしたのか?を理解するのは非常に難しい。ここを知ることが重要。 ・行動をベースにした独自のライフスタイルクラスタを作成。 ・インテリ層、キラキラ層、オタ層、落ち着き層、キッズ層 ・具体的な手法。様々な行動ログからクラスタリングを実行。 ・各クラスタに属するユーザーの行動を読み取る。 ・行動特性から価値観/ライフスタイルを判別 ・UIのデモ。ライフスタイルクラスタ毎に分析。年齢、性別、Web行動の時系列パターンなど。様々な切り口で見ることが出来る。 ・ユーザーを理解し、具体的な行動を把握し、広告配信に活用することが可能。

・今後の展望 ・多次元データベースの開発を年内に完了 ・オンライン・オフライン両方のデータを活用、新たなデータの収集 ・分析データを基にした予測モデルの研究開発 ・多次元データベースは広告やマーケティングにとどまらず、あらゆる企業活動・社会活動に貢献できると信じてる