[レポート]『事例に学ぶ、データ統合を効率化してデータドリブンな組織を作るためのAWS活用術』を開催しました

2022.04.15

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

データアナリティクス事業本部 サービスソリューション部 サービス開発部のしんやです。

去る2022年03月11日(金)、『事例に学ぶ、データ統合を効率化してデータドリブンな組織を作るためのAWS活用術』と第して、プレミアアンチエイジング様に御登壇頂く形でクラウドを活用したデータドリブンな組織づくりについて事例発表頂くセミナーを開催致しました。

このセミナーでは、プレミアアンチエイジング様によるDWH導入事例、及び導入に際して選定頂く形となった、クラスメソッドが提供するAWSなどのクラウドDWHを活用したデータ統合基盤サービス「カスタマーストーリーアナリティクス(CSアナリティクス)」についての紹介がなされました。当エントリではその内容についてレポートします。

目次

データ分析でよくある課題と解決

  • 登壇者:甲木 洋介(クラスメソッド株式会社 データアナリティクス事業本部 プリセールスアーキテクト)

まずはじめに、日比様の事例発表に先立ってクラスメソッド株式会社 データアナリティクス事業本部 プリセールスアーキテクトの甲木より、昨今求められている「データ分析」の説明・解説がありました。要旨は以下内容となります。

データ分析基盤に求められる要素とポイント

  • データ分析基盤には一連の処理を実現するための「構成要素」が存在する
    • 収集:
      • ソースシステムからのデータの出力 or 基盤からのデータ取得
    • 保存
      • 生データ:データレイク - 取り出しはゆっくりでも良い
      • 集計データ:データウェアハウス(DWH)/データマート - 取り出しは素早く行いたい
    • 変換
      • ELT処理
    • 分析・活用
      • BIツール、テキスト出力→スプレッドシートや機械学習に連携
  • データ収集
    • データ収集の「向き」
      • データソースから「送り出す」 - ソースシステム管理者側の負担が増える
      • データソースに「取りに行く」- データを取得するための各種許可、経路確保に於いて課題が多い
    • データ収集の形式
      • テキスト形式(CSV, TSV)が王道
      • バイナリはテキストでメタ情報添付が必要
    • JSON等の「半構造化データ」はDWH側で対処可能なものがある
  • データ保存
    • 長期保存
      • 長期且つ安く、ならばオブジェクトストレージ
      • オブジェクトストレージを直接検索するサービスも登場している
      • 何でも自由に格納出来るのでカオスになりがち
    • 高速処理、検索
      • 高速検索/高速集計ならばデータウェアハウス(DWH)サービス
      • オブジェクトストレージよりも高単価
      • お金が許せばDWHに全てのデータを格納する考え方もあり
  • ETLよりELT
    • 変換処理を「誰が」「どんな方法(処理系)」で実施するか?(現在は様々な方法が検討可能)
    • DWHの容量、性能的余裕をデータ変換処理(ETLにおけるT(=Transform))に活用
    • T(=Transform)よりも先にL(=Load:DWHへのロード処理)を実行することで、DWH内部でデータ変換が行える(変換処理にDWHの性能を活用出来る)
  • データ分析・活用
    • BIツールでの分析
    • CSVダウンロードからのスプレッドシート利用...というケースも多い
    • SQLだけではない、APIでのアクセスも求められている(例:機械学習での利用など)

CS アナリティクスの紹介

「CS アナリティクス」は、データ分析基盤に必要な要素をまとめて提供する基盤テンプレートです。

AWSサービスをベースに上記で上がっているような課題や問題を解決、サポートするような独自開発のプログラムを備えており、短期・安価で導入可能なサービスとなっています。

CSアナリティクスは、お客様のデータの状況に合わせてまずは小さく始める、いわゆる「スモールスタート」に適しています。

特徴

CS アナリティクスは以下の特徴を備えています。

展開イメージ

そしてCS アナリティクスは以下のようなサービス構成で、お客様のデータ分析基盤における各種作業をサポートします。

  • 収集:Data Uploader
    • オンプレ環境を含めた、任意の環境にインストールする事ができるクライアントツール
    • ソースデータベースににアクセスしてデータを取得し、クラウドストレージへのファイルアップロードをサポート
  • 保存1(生データ):クラウドストレージ(Amazon S3 Google Cloud Storage
    • オブジェクトストレージで収集データを安価に長期保存可能
  • 保存2(DWH):3種類のDWH(Amazon Redshift / Snowflake / Google BigQuery)に対応
    • デーブル形式で大量データを高速に自由検索可能
  • 変換:JMC(Job Management Console)
    • ELT処理に必要な機能をAWS環境上にデプロイしたサーバ形式で提供
    • 画面からクラウドストレージへのデータ投入、SQLやPythonなどを処理として定義、スケジュール実行が可能
    • 処理結果の通知などにも対応
  • 注)分析・活用はお手持ちの分析ツールをご利用、連携頂く形となります

弊社ブログ「DevelopersIO」では、CS アナリティクスに関する記事も定期的に公開しています。

データの民主化と専任性を兼ねたハイブリッド組織 - 通販事業の継続成長を支えるCSアナリティクス導入事例 -

  • 登壇者:日比 大輔様 (プレミアアンチエイジング株式会社 事業戦略部 事業戦略チーム シニアマネージャー)

次いで本セミナーのメインとなる事例紹介をプレミアアンチエイジング株式会社 日比様より発表頂きました。

こちらの内容については日比様の語り口をそのまま再現する形で進めていきたいと思います。

自己紹介

今日は「データの民主化と専任性を兼ねたハイブリッド組織」というタイトルでお話をさせて頂きます。

非常に多くの方が集まって頂けたので、今日のこのお話を聞いて何らか得られるものがあったな、と思って頂けますと、私としてもすごく嬉しく思います。何卒宜しくお願い致します。

まずは簡単にプロフィール紹介を致します。約3年前、2019年にプレミアアンチエイジングに参画し、事業戦略本部 事業戦略部に所属。データマネジメントと事業管理を担当する中で、分析環境の設計や導入から活用推進、体系化までを広く行っています。それ以外にも事業の損益やKPI管理、事業の活性化に向けた推進の活動も行っています。

「異色の経歴」と周囲には良く言われるのですが、以前までは200億・200店舗規模の販売促進企画やVMD(=ビジュアルマーチャンダイザー:ブランドや企業の世界観やショップのイメージを表現し、あらゆる商品を視覚的に効果的に見せる、売場作りのスペシャリスト)などを行って参りました。百貨店をメイクアップアーティストとして回って予約制でメイクを受けていた経験もあります。

ちなみに私自身は「非エンジニア」です。今回の発表内容については、その辺りについても片隅に留めて頂きながらお聞き頂けますと幸いです。

企業紹介

プレミアアンチエイジングという会社、この社名を聞いて「あぁ、この会社か」と想起される方々がどれくらいいらっしゃるかな?とあるかと思います。本日はCM動画をお見せしたいと思いますので御覧ください。

Kinki Kidsさんに登場頂いたこちらのCM、最近多く流れていると思うんですけれども、我々はDUOブランドを運営している企業です。設立は2009年12月なので今は12年ほど経ちます。私が参画した当時は30人ほどの規模でしたが、今では約170名の規模に成長しています。

ブランドの紹介ですが、現在4つの化粧品ブランド、DUO、CANADEL、sitrana、immunoの4本柱でオムニチャネルで展開中です。CANADELに関しては、米倉涼子さんのCMで結構話題になったと思っております。

定期販売モデルによる安定した売上に加えて、卸売販売が拡大したことによって売上高は大幅に続伸しています。私が参画した時点で売上高は上昇傾向にありましたが、(参画以降も)継続して売上高を伸ばし、ここ3年に至っては入社年の約3倍の売上を記録するような実績となっています。

抱えていた「課題」

2019年の参画当時は、売上高の急成長の裏側で非常に大きな課題を抱えていました。表現として用いるならば「成長痛の発生」のようなものでした。

当時抱えていた成長痛を端的に言うと、事業の急成長と組織の拡大に伴い多様化、増大する「”知りたい”ニーズ」によるものでした。

具体例でいうと「現状把握」があります。これは更に幾つかに分解が可能です。

  • 基礎データ:売上高や顧客数の推移
  • 応用データ:バスケット分析、RFM分析、コホート分析
  • 特有のKPI:媒体別獲得数、広告投資効率

もちろん現状の把握だけでなく、「分析の調査」もニーズとしてありました。

  • 現場側の深堀調査:”なぜ?”に対する独自の調査を担当者レベルで行う
  • 専任による深堀調査:”なぜ?”に対する応用調査(統計など)

そして「改善提案」があります。これは分析チームによる深堀調査と提案といった領域です。

これら”知りたい”ニーズを満たす事が持続的な成長に繋がると確信し、早急に環境や体制を整える必要がありました。

課題解決へのアプローチ

そこで、私はまずこれらのニーズを分解するところからはじめました。具体的には以下の問い掛けを行っています。

  • ニーズに対するアウトプットレポートは
    • Q1:フォームで定型化出来るか?
    • Q2:ユーザー側の技術力で対応出来るか?

分解結果は以下の4象限にまとめる事ができました。

当てはめた結果が以下となります。

この4象限に対しての対応方針を決めて、その方針に沿ってアクションを起こしていけば解決出来るだろう...という考えが私の中にありました。ここでのポイントは2つです。

1つめは「BIによる担当者セルフ方式」。上記4象限の緑/赤/黄色部分においてはこの方式で対応可能と判断しました。テンプレート化出来る情報は全てBIで可視化し、テンプレート化が難しい案件に関しては、担当者に生データをしっかりお渡しし、個々で対応する。その際に担当者がSQLを知らなくてもBIでデータを抽出出来る仕組みを作ることによりBIで一通り完結することが出来ました。

こういった、誰でも簡単に見たいデータに触れられる環境の実装、これを私は「民主化」と呼んでいます。

2つめは「専門組織による対応」。テンプレート化が難しい応用情報(水色部分)については、アドホックな分析が必ず発生しますので、ここは都度専門組織が依頼を受けて対応する形としました。これを私は「専任性」と呼んでいます。

結論、対応方針は「データの民主化と専任性を兼ねた環境と組織体制の構築」としました。これを行えれば我々が抱えている課題はクリア出来るのではないか、ここに沿ってアクションを起こしていこうと思い、この実現に向けてDWHの導入に踏み切りました。

なぜDWHを導入するのか

なぜDWHを導入するのか?という「キッカケ」については、企業様によって様々あると思いますが、私達のケースでいくと「多くの機能がSaaSで集中管理していたことにより、色々な開発案件がバッティングしているという状況があったことがキッカケでした。前述した分析案件をやりたいね、と思っても他の案件とバッティングしてしまい、どうしても後手後手に回る、クイックな対応が出来ない(=足回りが重たい)状態にありました。

であれば、データ分析関連は独立してDWHでデータを管理することで、迅速性と柔軟性をしっかり持たせる必要があると思ったのがDWH導入の「キッカケ」です。既存SaaS環境からデータを抜き出し、DWHにデータを移動させ独自管理することで、やりたいこと(民主化、専任性、利活用)が出来る環境を作ろうと考えました。

選ばれたのは「Redshift」と「クラスメソッド」でした

独自管理するためのDWH選定を行うにあたり、DWHとパートナー業者に求めたことや条件は以下のものとなりました。

  • 非エンジニアでも実現できること。これは私がエンジニアではない、という事も関係しています。
  • テクニカルに関するナレッジが多くあるサービスやパートナーであること
  • できる限り迅速かつ安価で導入したい
  • “ファブレス経営”で必要最小限の人員で稼働させる必要があるため、運用保守を外部に任せたい
  • DWH以外にも、BI領域もまとめて対応出来る、オールインワンであること

これらの内容を踏まえて検討を行った結果、「Amazon Redshift」と「クラスメソッド」様に決定いたしました。

AWSを選定した理由としては大きく以下の3点がありました。

  • そもそものクラウドサービスが良かった(一言で言えば「管理が楽」)
  • クラウド市場におけるシェアがNo.1であった
  • Web上にナレッジが多く蓄積されていた

クラスメソッドを選んだ理由は「安心感」と「聞く力」

クラスメソッド様を選定した理由、これは一言で言えば「安心感」です。

DWH導入検討時、私は

「方針自体は描くことが出来たけれど、非エンジニアの自分がその方針を実現することが出来るのだろうか?」

という不安を抱えていました。ですが思考としては

「描いた目標の実現に向けて、足りない技術力やナレッジはパートナー業者にご協力をいただいて補填すればいいかな」

とも考えており、色々相見積もりや相談を行った結果、

「会話のなかで我々(プレミアアンチエイジング)がゴールを描き、クラスメソッド様が実現する」

というビジョンが見えたことで安心感を得ることができ、選定に繋がりました。

そして結論・事実として、私のような非エンジニアでも導入することができ、サービスとして稼働できています。


本日のセッションで一番強くお伝えしておきたい点は「クラスメソッドは”聞く力”に優れている」という点です。これは僕らのようなクライアントの「やりたい事を上手く咀嚼して実現してくれる能力」と解釈しています。

私自身、ここまで様々なプロジェクトに携わってきた中で、大切だなと思っていることの1つが「会話」であると感じています。特にシステム関連の話だと専門用語や知識が多く、会話からの認識齟齬が結果に大きく影響してくることが多々ありました。やはりシステムの方々が専門用語で会話をされていても、私も生煮えで理解しながら会話をしていくと結果的に出来上がった成果物が「これじゃないよね」というようなことがありました。その点において、その「聞く力」というのが、クラスメソッド様は長けているなぁという印象があります。

案件を進めていく過程で色々と会話をさせて頂きましたが、時折「こういうことをやりたい」という要望を挙げる際に、自分としてはかなりフワッとした形で出してしまうことがありました。伝えてはみたものの、自分でもちゃんと整理出来ていないな...というような。本日一緒に登壇頂いている大滝さん(データアナリティクス事業本部 サービスソリューション部 部長)とはその辺のやり取りをさせて頂いているのですが、そんな投げ方をしても「それってこういうことですよね?」と理解して頂き、受け止めてくれている。そういうのが良い意味で心に「刺さった」んですよね。

また、運用保守対応に関しても本当にスピーディに回答を得ることができ、トラブルがあった際も迅速に対応して頂いているなぁと感じています。

総括

クラスメソッド様と協業して数ヶ月後、DWHの導入は無事完了しました。DWH導入により実現できた民主化と専任性は以下のような形です。

社内組織としては会社は事業本部に、事業本部は責任部署にそれぞれ分解され、分解された各階層毎に求めるデータは全然違うものになると思っています。

DWHが揃い、データがしっかりと連携され、BIや分析ツールでアクセス出来るようになったことで、組織横断型のレポートや部内横断型レポート、個別に分析出来るような環境など、それぞれの領域に対してニーズが満たせるような状況になりました。また専門分析担当によるアドホックな対応においても民主化と専任性の領域でカバー出来たと思っています。

DWHの導入により”知りたい”ニーズに合わせたアウトプットが迅速で円滑にできるように、またセルフ化により専任者の負荷も分散されたので、より柔軟できめ細やかな対応が可能となりました。

民主化と専任性を両立させ、データドリブン体制に近づけた結果、事業・部門・担当者の3階層において可視化と分析が促進され、それぞれの領域で意思決定や最適化に繋がり、結果として売上高や利益に間接的に寄与出来たと思っています。

発表内容は以上となります。ご静聴ありがとうございました。

まとめ

というわけで、データ分析関連セミナー『事例に学ぶ、データ統合を効率化してデータドリブンな組織を作るためのAWS活用術』の発表内容レポートでした。

プレミアアンチエイジング様が直面している「課題」とそこから導き出された「解決のためのアクション」、それらを踏まえてなぜ「クラスメソッド」及び「CS アナリティクス」をお選び頂けたのかを知る事が出来て、サービスを開発・展開している我々としては非常にありがたく、また身の引き締まる思いでした。また、セッションの最終盤に行われたディスカッションでは「CSアナリティクス」に対する貴重な御意見・御要望も頂きました。この点についても社内で共有し、より良い形に昇華・改善していきたいと思います。

日比様。改めまして今回はセミナーに御登壇頂き、ありがとうございました!

また、当日ご参加頂いた皆様、ありがとうございました!