[レポート]NTTドコモにおけるStreamlitを用いたデータ民主化 #SWTTokyo
2024.09.13
2024年9月11日~2024年9月12日に、「SNOWFLAKE WORLD TOUR TOKYO」が開催されました。
本記事はセッション「NTTドコモにおけるStreamlitを用いたデータ民主化」のレポートブログとなります。
登壇者
- 株式会社NTTドコモ データプラットフォーム部 担当課長 吉田祥平 氏
- 株式会社NTTドコモ データプラットフォーム部 データサイエンス エキスパート 藤平 亮 氏
セッション内容
ドコモにおける会員データの活用
- ドコモのデータ資産
- 1億人以上の会員IDに紐づく多種多様なデータ
- データを業務に活用しお客様への価値提供が重要と考えている
- NTTドコモのデータプラットフォーム
- 基盤のあるべき姿として以下の3つに注力
- オープンであること
- 様々なドメインのデータがあるが、それぞれにすべての担当者がアクセスできることを目指している
- ガバナンスが行き届いていること
- オープンさを求めるためにはガバナンスも求められる
- 貴重かつ個人情報を特定し得るデータなので個人が特定されないようにマスキングなどでガバナンスを効かせる
- 生産性が高いこと
- データは活用できるように整備できている状態であることが重要
- データカタログにも力を入れている
- オープンであること
- 基盤のあるべき姿として以下の3つに注力
- あるべき姿を達成するためのデータスタックの構成要素
- Snowflake を中心に dbt でデータ整備・加工
- カタログにはAlation を採用
- アプリケーションレイヤーには Tableau なども採用
- ここでは Streamlit によるデータアプリケーションによるデータ民主化について紹介
- データ活用のあるべき姿として以下の3つを掲げている
- スピード
- 市場の流れにあわせてデータ提供する必要がある
- インサイト
- 迅速かつ深いインサイトが必要
- 顧客体験のサービス化ができる分析が必要
- スケール
- 限られた社員しか使えない状態はドコモのあるべき姿ではない
- 様々な役割の方が分析できる状態を目指す
- スピード
- 上記のあるべき姿のために実施した取り組みが以降の内容
- ドコモとして「圧倒的に使いやすいデータ活用環境」の整備を目標とした
- これまでは専門家に依頼することで時間がかかっていた
- ユーザー自分で自分のやりたいことをできるようにするには、使いやすい環境が必要
- そこで作り出したのが「データアプリケーションプラットフォーム」
- データ活用のセルフ化のための環境
- それぞれの事業やユースケースに特化したアプリケーションとして用意
- 誰もがシンプルなUIで利用できる体験を作り出す
- データアプリケーションのデモ
- ユーザー自身が分析するので、ユーザーがフィルタするための項目を用意
- 抽出だけでなく比較も必要なのでそのための軸も指定できる
- 分析を開始すると可視化された状態で結果を表示できるような仕組みとしている
- ユーザーが自分の手でリアルタイムで使用できることが重要
データ活用定着に向けた課題と取り組み
- スモールスタート期
- 従来
- ビジネス・データ部門がわかれていることによるリードタイムの長期化
- データ部門も要望のヒアリング・データ加工・BIダッシュボード作成で人員がわかれていた
- 従来
- Streamlit はデータ加工できる人が UI も作成できるので同じ人が一連の開発を行える
- まずはコスト面も考慮した構成として Streamlit アプリを展開
- 当時は Streamlit in Snowflake(SiS)がないので Streamlit によるデータ活用環境を Google Cloud 上に用意
- いつでもどこでも誰でもアクセスできるようにした
- 広げるための施策
- これまで環境を整備してきたが、活用してもらうには、ビジネスユーザーにもアプリケーションを開発してもらう必要があると考えた
- そのためのトレーニングを作成、提供
- 開発者にはプラットフォームエンジニアとして開発者体験の向上を提供
- これまで環境を整備してきたが、活用してもらうには、ビジネスユーザーにもアプリケーションを開発してもらう必要があると考えた
- 研修プログラムの構成
- 受講者が受講後、8日間でアプリをリリースした実績も
- プログラムは改善しながら継続的に実施
- 効果
- 元は14名だった開発者が265名に
- アクティブでも100名を超える
- 利用拡大のための施策
- Snowflake 協力のもと SNOW CAMP というイベントを実施
- イベントの内容
- 社内コンペのような形式
- 最優秀賞アプリケーション
- d払いの利用状況を可視化するアプリケーション
- 加盟店の改革につなげる
- アプリケーションによる具体的な社内の効果測定
- 以下を実現できることが Streamlit の価値と考えている
- ビジネスユーザーが自分で実行できるUI
- エンジニア一人でUIまで開発できる
- アプリケーションやアプリケーションロジックも全社公開することでノウハウを共有できる
今後の展開
- 社内だけでなくグループや加盟店への展開を目標としている
- 社外提供の方法として SiS への移行も検討
- SiS に移行しマーケットプレイスで配布
- データクリーンルームによるデータのコラボレーションも視野に
- ロードマップ
- スモールスタートからクラウドに配置し全社化できた
- 今後はマーケットプレイスでグループ・パートナーにも活用してもらえれば
- Streamlit と 生成 AI の活用事例についても紹介
- 今後の展開
- ドコモ社内だけでなく、グループ・パートナーも含めデータ活用を実施することで顧客提供価値を高めていく
- この基盤として、会員基盤・データアプリケーションのマーケットプレイスを活用できる
さいごに
Streamlit によるデータ民主化までの具体的な施策をフェーズごとに解説いただいたセッションでした。
個人的には「データプラットフォームのあるべき姿」と「データ活用のあるべき姿」を明確にわけてそれぞれで重要なことを定義している点が勉強になりました。基盤が整うことももちろん重要ですが、活用時にはユーザー目線も加味した観点が必要で各フェーズにあった施策が実行されるべきというのは、当然のように見えますが、私自身も両方の観点を混同して考えていた部分があったように感じました。こういった点は自身も改めて意識していければと思います。