データアプリケーションの活用方法を知るためSnowflake Marketplaceで提供されている23種のNative Appsについて調べてみた
さがらです。
先月末にSnowflake Summit 2023が開催され、併せてNative Applications Frameworkがパブリックプレビューとなり、すでに23種のアプリケーションがSnowflake Marketplace上で使えるようになっています。
ただ、私自身も「データアプリケーションを提供する」ということに馴染みがなく、どういった活用方法があるのかイメージがつかないところがまだまだ多いです…
そこで、「データアプリケーションはどのように活用できるのか、どのように社外に提供して価値を生み出せるのか」今後の参考にしたいと思い、本記事で現在Snowflake Marketplaceで提供されている23種のアプリケーションを一通り確認してみます。2023年7月18日時点、Freeで使えるアプリケーションも多いため、ぜひ気になったアプリケーションはMarketplaceからインストールして試してみてください!
※以下、現在提供されているアプリケーション23種についてアルファベット順に記します。各アプリケーションの詳細までは触れず概要だけ記しますので、ご了承ください。
(Sample) Enterprise ESG Ready Investment Data Model with Streamlit Analytics
DisruptivData社によって提供されているアプリケーションで、投資データに関する分析画面が提供されています。
また、ユーザーが持つ資産に関するデータをマッピングすることで、ユーザーが持つデータと併せて、DisruptivData社が提供する分析画面で見ることが出来るようです。
Account Payable Analytics
NTT DATA社によって提供されているアプリケーションで、SAP Account Payableテーブルを用いて、重複支払いを防ぐための支払いに関する監査を行えるようです。
YouTubeも公開されていますので、併せてご覧ください。
Bond Synapze XI
Bond Brand Loyalty社によって提供されている、顧客に関する多角的な分析を行えるアプリケーションです。
Customer Genome module、Program Offer Optimization module、Program Benchmarking moduleといった各モジュールを用いて、顧客ロイヤルティを理解し最適化するための機能が備わっているようです。
CARTO Analytics Toolbox (Core)
CARTO社によって提供されており、インストールすることでSnowflake の地理空間機能を拡張するユーザー定義関数を使用することが出来ます。これらのユーザー定義関数を用いることにより、小売店の立地計画、サプライチェーン、マーケット分析、広告収入のグロース、などに役立つと述べられています。
現在は、QUADBIN_FROMLONGLAT、QUADBIN_TOCHILDREN、H3_POLYFILLなどの関数が提供されています。
Cost Optimizer for Snowflake
NTT DATA社によって提供されているアプリケーションで、ウェアハウス、クラスタリング、マテリアライズドビュー、Snowpipe、ストレージ、といった各観点でコスト削減できるところがないか分析できる機能を提供しております。
YouTubeも公開されていますので、併せてご覧ください。
CostNomics
Atgeir Solutions社によって提供されているアプリケーションで、Snowflakeのウェアハウスやストレージに関する分析だけでなく、分析結果から推奨事項を提案してくれる機能を提供しています。
Customer Growth Intelligence Application
Zeta社によって提供されているアプリケーションで、2億3500万人以上のアメリカ人のプロファイルを含むZetaのIDデータ等とAI機能を、ユーザーが保持するSnowflakeアカウント上に保持されているファーストパーティデータと組み合わせて、顧客に関する多様な分析を行うことができる機能を提供しています。
Cybersyn Consumer Spending Foundation App
Cybersyn社が提供するアプリケーションで、Cybersyn社が保持する米国内の5,000万枚以上のカードによる取引(クレジット/デビットなど)のデータを元に、売上・取引数・平均注文額などを年齢層や所得階層別など分類分けして分析を行える 機能を提供しています。
実際のアプリケーションの画面はすぐに見つからなかったのですが、取得できるデータに対するクエリサンプルなどは下記のドキュメントに記載があります。
Cybersyn eCommerce Benchmarks App
Cybersyn社が提供するアプリケーションで、年間GMVが2000億ドルを超える18000以上のeコマースのストアのデータを元に、売上高、トランザクション数などストアに関する指標だけでなく、Google Ad Networkの費用やインプレッション単価など広告指標も分析できるようです。
実際のアプリケーションの画面はすぐに見つからなかったのですが、取得できるデータに対するクエリサンプルなどは下記のドキュメントに記載があります。
Cybersyn Financial & Economic Essentials App
Cybersyn社が提供するアプリケーションで、Federal Deposit Insurance Corporation (FDIC)やFederal Reserve Economic Data (FRED)のデータを元に、銀行の財務、雇用数と失業数、インフレ指標、銀行の金利、など米国の金融業界の現状を分析することができるようです。
Cybersyn Shopify Benchmarks App
Cybersyn社が提供するアプリケーションで、世界中の何千ものShopify加盟店のパネルから得られたデータを元に、Shopifyのマーチャントの売上、ウェブサイトのエンゲージメント、広告の集計指標をマーチャントのカテゴリ、サブカテゴリ、および地域レベルで分析できるようです。
Dark Data Discovery
NTT DATA社が提供するアプリケーションで、Snowflake上に保管されながらも使用されていないデータ(Dark Data)を抽出して表示する機能を持っています。
実際には、ブロンズ・シルバー・ゴールドという段階を分けてオブジェクトごとにタグ付けをして使用状況をわかるようにしたり、アプリケーション上で視覚的にDark Dataの一覧を確認・分析できるようです。
DataGeir Candour
Atgeir Solutions社によって提供されているアプリケーションで、機械学習のモデルに関する監視を行えるツールです。
より具体的には、時間の経化に伴うデータ分布の変化を検出したり、データに欠損値やユニークな値がどれだけあるかなどの品質を確認したり、という学習に必要なデータの監視を行えるようです。
更には回帰テストも行えるようです。
DataGeir HawkEye
Atgeir Solutions社によって提供されているアプリケーションで、Snowflake上のデータを統計的に分析し、平均レコードサイズや重複しているレコードの数などのプロファイル、外れ値をもとにした異常値検出、などの機能があります。
Free ERP Sales Data Assessment Native App
Maxa社が提供するアプリケーションで、Snowflakeに蓄積されたERPのデータを分析する機能を備えており、顧客・製品・時間軸での購買トレンドの分析や、特定のニーズやチームに合わせてカスタマイズされたダッシュボードの構築ができるようです。
Health Check
SELECT社が提供するアプリケーションで、以下の3点の内容を返すストアドプロシージャが含まれています。
- 使われていないウェアハウスの一覧
- 過去24時間で最もクレジットを消費しているウェアハウスの一覧
- 過去24時間でのクエリーパターン上位5つ
IdentityQA
Simon Data社が提供するアプリケーションで、ユーザーが保持するIDデータをこのアプリケーションに含まれるストアドプロシージャに読み取らせることで、不正なメールアドレスや電話番号がないかを確認したり、実行可能な推奨事項がないかの提案を受けたり、ということが出来るようです。
License Patrol
Elementum社が提供するアプリケーションで、ソフトウェアのライセンス契約に関して、利用状況の把握、ビジネス部門ごとの消費状況、使用ユーザーの追跡が行えるようです。
アプリケーションのインストール後に指示に従ってユーザーが持つデータと接続させる必要がありますが、サンプルデータもあるため、どんなことが出来るかはインストールすることで試せそうです。
Mapbox
Mapbox社が提供するアプリケーションで、住所の文字列をジオコーディングして指定された住所の緯度経度を取得したり、MapboxのAPIを呼び出せるユーザー定義関数、緯度経度情報からboundary layerを取得するストアドプロシージャも含まれています。
OpsCenter
Sundeck社が提供するアプリケーションで、Snowflakeユーザーのためのウェアハウスとクエリ管理機能が備わっています。
ウェアハウスの曜日ごとの利用傾向を含む使用状況レポートや、特定のクエリパターンを設定してそのパターンが含まれたクエリが実行されたときにアラートを出す、といった機能があります。
Patient Treatment Optimizer
NTT DATA社が提供するアプリケーションで、2型糖尿病の患者/会員に治療計画を提案する機能が備わっているようです。
この治療提案エンジンは過去の患者記録を使用して、長期的な合併症と死亡率の低減における治療オプションのコストと効果の両方を考慮して、どのような治療が最良の結果となるかを提案してくれるようです。
Spark Connector (UATUS)
Coherent社が提供するアプリケーションで、Excel上で構築した計算式をAPIに変換し、外部関数として使用可能にすることができるようです。
元々Coherent社が提供するサービスのドキュメントを見ると、イメージが付くと思いますのでぜひ下記のドキュメントも併せてご覧ください。
Test Automation for Snowflake
NTT DATA社が提供するアプリケーションで、Snowflake内でのデータ品質に関わるテストケースを定義してスケジュール実行したり、実行されたテスト結果をダッシュボード上に可視化したり、といったことが可能です。
アプリケーションの内部構造やより詳細な説明についてはブログもありますので、ぜひ下記の記事も併せてご覧ください。
まとめ
現在Snowflake Marketplaceで提供されている23種のアプリケーションについて概要レベルで調べてみましたが、ざっとまとめてみると、大きく以下の4分類に分けられると思いました。
- アプリ提供元のノウハウを軸に、シンプルにユーザー定義関数やストアドプロシージャを提供する
- アプリ提供元のノウハウを軸に、アプリ利用者が保持するデータに関する分析を行えるグラフやダッシュボードを開発して提供する(例:SnowflakeのACCOUNT_USAGEのテーブルなど)
- アプリ提供元のデータとノウハウを軸に、ただデータを共有するのではなくダッシュボード等と併せて提供して価値を向上させて提供する
- アプリ提供元のデータとノウハウを軸に、アプリ提供元のデータやロジックだけでなく、アプリ利用者が保持するデータをかけあわせて、新たな価値を生み出せる仕組みを提供する
また、まだプレビューではないですが、これからのSnowflakeはSnowpark Container Serviceを使ったハイスペックなGPUを用いたコンテナアプリケーションもMarketplace上で使用可能になっていくはずです。(下記の動画のような、アプリ提供元が開発したLLMがパッケージ化されたアプリケーションなど)
皆様の自社内で閉じていた、データエンジニアリングに関する独自のロジックや分析ノウハウなどが新しいビジネスチャンスとなり得ますので、何か良いアイデアが浮かんだらぜひSnowflake Marketplaceでアプリケーションを提供してみてください!