【レポート】Bridging the analytics gap with the Snowflake Data Cloud – Alteryx Inspire 2021
こんにちは、スズです。
日本時間の2021年5月19日~21日に、Alteryx Inspire 2021が開催されました。
本記事では、Alteryx Inspire 2021のセッションの中から、『Bridging the analytics gap with the Snowflake Data Cloud』のレポートをお届けします。
セッション
動画
概要
Analytic silos between Data Scientists and Business Analytics teams delay the value realization of ML/AI initiatives. Learn how Snowflake + Alteryx enable collaboration across analytic teams with a solution built around data access and governance.
データサイエンティストとビジネス分析チーム間のサイロは、ML/AIの価値の実現を遅らせます。SnowflakeとAlteryxを使ってチーム間の協力体制を可能にする方法を学びます。
登壇者
- Julian Forero
- Sr. Product Marketing Manager, Snowflake
Bridging the analytics gap with the Snowflake Data Cloud
THE ANALYTICS SPECTRUM
- 今日、世界には2種類の分析がある
- ビジネスインテリジェンス
- 記述的分析 (Descriptive Analytics)
- 診断的分析 (Diagnostic Analytics)
- データサイエンスまたは機械学習とよばれるもの
- 予測的分析 (Predictive Analytics)
- 処方的分析 (Prescriptive Analytics)
- ビジネスインテリジェンス
- ビジネスインテリジェンスからデータサイエンスに移動するには2つの軸がある
- より多くの価値を提供すること
- 組織はより多くのデータを活用できるようになる
- 機械学習のアルゴリズムは大量のデータを消費する
- 多くのデータを取得することでパフォーマンスが向上する
- ビジネス上の問題を解決するために重要な関連データがある
- 様々なツールが必要になる複雑さ
- 様々な才能の必要性が高まる
- より多くの価値を提供すること
- 予測的分析と処方的分析を取り入れるには?
THE ANALYTICS REALITY
- 多くの組織ではビジネスインテリジェンスを行う人たちが機械学習を活用することは容易ではなく、ビジネスアナリストが市民データサイエンティストとなってセグメンテーションに関わる予測分析などに活用できるような、ある種の連続した流れになっていない
- より顧客を理解し、製品を提供するにはどうするのか?
- サプライチェーンや金融サービスなどの観点で追跡している情報からどのように予測を作成できるのか?
- 予測する権利を利用して予測するにはどうすればいいのか?
- これらはビジネスユーザーとデータアナリストが機械学習アルゴリズムを使用するときのアクティビティ
- 同時に、データサイエンティストがサイロで作業していないことをどのように確認できるのか?
- アルゴリズムを考案するデータサイエンティストの洞察をビジネスに戻すにはどうすればいいのか?
- データを別のサービスに取り込むだけでなく、全ての情報、全ての洞察、モデルに適合するために使用しているデータの変換でさえも保持する
- 分析の価値を高めるため、コラボレーションと再利用性の量を減らす
WHY THE DIVIDE
- 課題を理解するために分割が発生する理由を理解することが重要
- データタイプ
- データアナリスト、ビジネスユーザー
- 主に構造化データを処理する
- データサイエンティスト
- 構造化データだけでなく、形式に関係なく、関連性の高いデータを使用する
- JSON形式のようなIoTデバイスからのデータ
- 様々なシステムログ、Webやモバイルレコード
- 画像や音声ファイル
- 構造化データと半構造化、非構造化データは異なる場所に存在する
- データアナリスト、ビジネスユーザー
- ツール
- データアナリスト、ビジネスユーザー
- BIツール、スプレッドシート
- ダッシュボードなどの分析レポート
- データサイエンティスト
- ノートブック、MLプラットフォーム
- データアナリスト、ビジネスユーザー
- 言語
- データアナリスト、ビジネスユーザー
- SQL、ノーコード、ローコード
- データサイエンティスト
- Python、R、Java
- ライブラリとフレームワークを提供する
- データを機能とデータモデルに変換するために必要なものを提供する
- データアナリスト、ビジネスユーザー
DEMOCRATIZE ACCESS TO ALL DATA
- データへのアクセスの民主化
- あらゆるタイプのデータをサポートする単一プラットフォームの提供
- 全ての人にデータを提供するスケーラブルな形式、そのために必要なセキュリティとガバナンスの継続的な提供
- Snowflakeでは
- 全てのデータが同じ場所に存在可能
- 構造化、半構造化データをサポート
- 非構造化データはプライベートプレビューでサポートを発表
- Snowflakeで半構造化データをSQLで操作可能
- ストレージの面で高い費用対効果
- スケーラブルなソリューション
- AWS、GCP、Azureのクラウドを選択可能
- 豊富なデータレイヤーを提供するSnowflake Data Cloudにアクセス可能
- 全てのデータが同じ場所に存在可能
- 次に重要なのはデータの可用性を高めること
- 多くの組織は大丈夫だと考えている
- 多くの組織は、財務データがどこにありそれを使って何ができるのか、マーケティングデータがどこにありそれを使って何ができるのかについて、問題ないと考えている
- 実際、組織内に収まらない多くのユースケースの多くのデータがある
- エコシステム、パートナー、サプライヤー、顧客
- Snowflakeでは周囲の他の組織ともデータを共有するための非常に簡単なレートとガバナンスの安全な方法を提供している
- リアルタイムの在庫を知るために予測分析が必要な場合
- リアルタイムの在庫を分析するためにサプライヤーからいくつかの情報を取得できるようにする必要がある
- 在庫の種類や特定の商品をいくつ注文する必要があるか予測する場合、データの種類にも影響する
- 多くの返品情報はサプライヤーが何を提供しているかに関するものになる
- Snowflakeが提供するデータクラウド(大半はSnowflake Data Marketplace)で全ての情報のリスク値を増やすことが重要
- Snowflake Data Marketplaceには125を超える様々な業界のデータセット、データサービス、アプリケーションがあり、利用者のデータを充実させることに役立つ
- 最近の例として、COVIDデータが利用可能であり、多くの小売業者や医療機関の役に立った
- COVIDだけでなく、Experian、Nielsen、他のすべての豊富なデータセットが、分析やデータサイエンスに従事する人々に価値を提供するデータセットになる
- リアルタイムの在庫を分析するためにサプライヤーからいくつかの情報を取得できるようにする必要がある
INCREASE COLLABORATION ACROSS TEAMS
- Snowflakeが複数のワークロードをサポートする単一のプラットフォームを提供することで、チーム間のコラボレーションを強化することに役立つ
- 適切な場所に適切な形式で確実に届くようにするためのパイプとなる
- 拡張性を提供し、全ての専門のデータサイエンティストが選択したフレームワークとツールでアクセス可能
- Alteryxと簡単に統合できるため、Alteryxのフロントエンドの体験で全てのデータにアクセス可能
- ローコードまたはノードなしで繰り返し可能なワークフローを簡単に実行可能
- Snowflakeエンジンはこのコラボレーションを実現する
- 他のプラットフォームがコンピュータネットワークをコンピューティング、ストレージに結び付けている
- 分離しながらも強力な統合により、プラットフォーム上の全てのユーザーが同じデータに対してそれぞれのワークフローを実行できる
- データアナリストとデータサイエンティストが同じデータに取り組んでいる場合
- それぞれ専用のコンピューティングを備えている
- 要求に応じて柔軟にスケーリングし、同時実行での問題はない
- より多くの人がデータにアクセスし、データから様々な洞察を構築できる
UNIFIED ANALYTICS TEAMS
- 分析チームを統合することで達成できるものが多くある
- 市民データサイエンティストとデータサイエンティストはビジネス上の意思決定を推進するモデルを実行することになる
- Alteryxではワークフローの繰り返し実行、他の人がワークフローを利用することが可能
- 同時に、データサイエンティストがモデルを構築し、その結果をSnowflakeに簡単に送り返すことができる
- 誰もがアクセスできるようにして、洞察を明らかにしようとしているアナリストにはML主導の洞察を提供し、ビジネスチーム内で共有して行動することができる
- 例えば、データサイエンティストがサードパーティのデータと内部のデータを使用してより優れたセグメンテーションモデルを考案している場合
- 特定の顧客に最適な製品などに関する推奨事項を考え出す
- 営業チームはより効率的に、顧客に最高の価値を提供できるようになりたいと考えている
- ML主導の洞察を活用して顧客について理解を深め、サービスを購入する可能性を高める
- データからモデルへの流れ、実用化される洞察が実際に発生するのは、全てのデータがそろっている場合に限られる
- また、全てのチーム、全てのアナリストチームは同じデータで共同作業を行う
- 分析チームだけでなく、組織内の他のチームを巻き込んで、データ周辺のエコシステムの一部になることもできる
- 例えば製品チームはML主導の洞察に基づいて新製品を構築することを検討し、ビジネスユニットチームと協力して様々なメトリックの進捗を確認する
- 新製品を中心に構築されたKPIは進化している
- 今日、世界で最も価値があるものはデータですが、それを使うことも同じぐらい価値がある
- 収益機会を増やし、より良い運用を通じて多くのコストを削減するだけでなく、他の組織にデータを売る新しい機会も意味する
- 組織がSnowflake Data Marketplace内のサードパーティデータとしてデータを販売しできる可能性がある
- 収益機会を増やし、より良い運用を通じて多くのコストを削減するだけでなく、他の組織にデータを売る新しい機会も意味する
- 要約すると
- 組織は全てのデータを取得し、Snowflakeないで簡単にアクセスできるようにする
- データのセキュリティとガバナンスを提供して、データを複数のチーム間で民主化できるようにする
- 拡張性と複数のワークロードを使用することで、組織は簡単に接続できる
- チームに関わらずデータから洞察を処理し、洞察の結果を利用できる
- 予測モデルは結果が得られ、アナリストはその結果をビジネスに反映させることができる
さいごに
『Bridging the analytics gap with the Snowflake Data Cloud』のレポートをお届けしました。