Snowflake Marketplace上でxMap社が提供する日本のレストランデータのサンプルを試してみた #SnowflakeDB

2022.12.04

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

※本エントリは、Snowflakeをもっと使いこなそう! Advent Calendar 2022の4日目の記事となります。

さがらです。

Snowflake Marketplace上でxMap社が提供する日本のレストランデータのサンプルを試してみたので、その内容をまとめてみます。

Snowflake Marketplaceとは

Snowflake Marketplaceは、サードパーティのデータに簡単にアクセスすることが出来るSnowflake上の1機能です。

Snowflakeアカウントを持つユーザーであれば誰でも利用すること出来、世界中で公開されているデータの一覧を見て、すぐに利用申請を出すことが出来ます。(データは、すぐに無料で使うことが出来るものもあれば、一度データの管理元から承認を得た上で定期的に利用費用を払わないと使えないものもあります。)

日本市場でも徐々にSnowflake Marketplaceでデータを公開する企業が増えており、2022年10月24日には東芝テック社、インテージ社、Tangerine社、xMAP社、エム・データ社、メディカル・データ・ビジョン社、QUICK社、の7社がSnowflake Marketplaceでデータを公開することを発表しています。詳細は下記の記事をご覧ください。

この7社がSnowflake Marketplaceで公開しているデータのうち、サンプルデータが無料で公開されている内の1つを本記事にて試してみます。

xMap社の提供するデータについて

xMap社ですが、飲食業界に特化した60万件以上の全国の飲食店に関するロケーションデータを提供している企業です。

そのxMap社が、Snowflake Marketplace上でXMAP_RST_DATA_SAMPLESとして、xMap社がもつロケーションデータのサンプルを提供しています。

以下は、Snowflake Marketplaceで公開している情報の引用です。

xMap restaurants contain over 600,000 restaurants in Japan across the whole 47 prefectures. For each restaurant, we have about 170 attributes such as geolocation, number of seats, price range, and other information.
Our customers are fortune 500 FMCG and CPG companies using the data to empower their sales hunters.
Our data are used to empower machine learning models and add to the feature engineering process.
Our data can be used for restaurant investment, and best location allocation for franchise restaurants and chains.
For data shares: a list of 1-5 key schemas and tables and 5-10 key data fields.

※DeepL翻訳
xMapレストランは、日本全国47都道府県の60万店以上のレストランを収録しています。各レストランには、場所、席数、価格帯など、約170の属性があります。
私たちのお客様は、フォーチュン500にランクインしているFMCGやCPGの企業で、営業担当者を強化するためにこのデータを使用しています。
当社のデータは、機械学習モデルを強化し、特徴量エンジニアリングプロセスに追加するために使用されています。
レストランへの投資、フランチャイズレストランやチェーン店への最適なロケーションの割り当てに利用できます。
データ共有:1~5個のキースキーマとテーブル、および5~10個のキーデータフィールドのリスト。

試してみた

ということで、実際にSnowflake Maketplaceからデータを取得し、どんなデータが入っているのかを確かめてみます!

サンプルデータの取得

まず、使用するロールをIMPORT SHARE権限を持っているロールに変更してください。(デフォルトではACCOUNTADMINのみ保持しています)

Snowflake上でMarketplaceを押します。

続いて、一番上の検索BOXにxmapと入れて検索します。すると、XMAP_RST_DATA_SAMPLESが出てきますのでクリックします。

このページでは、データの説明やサンプルクエリを見ることが出来ます。

データを利用するためには、画面右の取得を押します。

すると、下図のようなポップアップが表示されます。オプションを開くと、アカウント上に作成するデータベース名を変更したり、現在使用しているロール以外にどのロールにこのデータへのアクセスを出来るようにするか設定が可能です。

これらの設定が終わったら、取得を押します。

この後、対象のデータベースができていれば準備は完了です!

サンプルデータを試してみる

まず、こちらのサンプルデータなのですが、XMAP_RST_SAMPLES_SCHEMAには4つのテーブルが入っております。この各テーブルにどんなデータが入っているか、見てみたいと思います。

SAMPLE1ですが、下図のようにレストランの店舗名、住所、デリバリー可否と費用、メニュー一覧(JSON)、店舗の緯度経度、メニューの平均価格、メニューの最低単価、などが掲載されています。ざっと見た感じはデリバリー対応のレストランの情報がまとまっているテーブルに感じました。

SAMPLE2ですが、下図のようにレストランの店舗名、緯度経度、利用可能な駅、家族・友達・一人など括りでどの用途で使えるかのフラグ、ディナー・ランチでの最高値&最安値、最寄り駅からの距離、営業時間、支払い方法、など店舗情報に関する100近いカラムがありました。

SAMPLE3ですが、下図のようにレストランの店舗名、電話番号、緯度経度、メニュー一覧、メニュー数、メニューの平均単価、レストランのカテゴリ、といった情報がまとまっていました。

SAMPLE4ですが、下図のようにレストランの店舗名、住所、緯度経度、デリバリー費用、デリバリーまでの想定時間、店舗の説明書き、店舗の分類、営業状況、といった情報がまとまっていました。

最後に

Snowflake Marketplace上でxMap社が提供している日本のレストランデータのサンプルを試してみました。

個人的に、想像以上のデータ量でレストランに関する情報はもうこれ使えばいいのでは?と感じてしまうレベルでした。プライベートでも使いたくなっちゃうデータですねw

気になる方はぜひSnowflake Marketplaceから申請頂き、触ってみてください!