【レポート】Spatial How-To: In Real Life – Alteryx Inspire 2023

2023.06.26

こんにちは、スズです。

現地時間の2023年5月22日(月)~5月25日(木)に、ラスベガスにてAlteryx Inspire 2023が開催されました。本記事では、Alteryx Inspire 2023で開催されたセッション『Spatial How-To: In Real Life』についてお届けします。

セッション概要(日本語訳)

Alteryx YouTubeの人気シリーズをベースに、Alteryxでの空間分析をガイドするセッションです。空間分析の始め方について興味がある方に向けたセッションです。

登壇者

  • David Bryson
    • Sr. Technical Marketing Manager, Alteryx
  • Samantha Hughes
    • Sales Engineer, Alteryx

セッションレポート

Building Geospatial Insights - YouTube Playlist

  • 数ヶ月前、地理空間インサイトを構築するというYouTubeの動画シリーズを作成した
  • Alteryxで5年間、製品マーケティングに携わってきた中で、多くの人々が空間分析について「使い方が難しい」と話しているのを耳にしてきた
  • このセッションはYouTubeで公開した動画とデモに基づいている

Types of Spatial Data

  • 空間データは大きく分けて3つのタイプがある
  • Points
    • 地球上の場所、興味のある場所、顧客の場所などを表現したもの
  • Lines
    • 道路、河川などの線
  • Polygons (Areas)
    • エリアを定義するための空間的な方法
    • 州や郵便番号のようなもの

  • 空間データを扱うには、主に3つのフォーマットがある
  • シェープファイル
    • CSVや空間ファイルのようなもの
    • .shpという拡張子で表現される
  • KMLファイル
    • Google Earthのフォーマットとして知られている
  • Alteryx yxdbファイル

Open Data

  • 空間データは何処で見つけることができるのか?
  • ここ10年ほどの間に、多くの公的機関がオープンデータのポータルサイトに投資するようになった
    • オープンデータポータルでは、シェープファイルやKMLファイルを無料でダウンロードできる
    • オープンデータを使ってビジュアライゼーションやモデル構築を始めることができる

DEMO

  • 「Open Data」をGoogleで検索することで見つけることができる
  • 世界中の多くの主要都市でオープンデータで用意されている
  • DMG、KML、CSVなどのファイル形式があり、選んでダウンロードする

  • ダウンロードしたシェープファイルにAlteryx Designerで接続する
  • 空間データは閲覧ツールを使って地図上で参照できる

  • このスプレッドシートは多くの人にとって見慣れたもの
  • これは空間データで、なぜ空間データであるかというと、4つの列があるため
    • 住所、都市、州、郵便番号

  • このデータをジオコーディングと呼ばれる処理で空間データにする
  • AlteryxのLocation Insightsパッケージでは、このデータの住所、都市、州、郵便番号を取得するツールがある

  • 住所などのデータが常に整形された状態とは限らない
  • アドレスパースツールを使うことで住所を解析して列を分割できる
    • また、州や郵便番号を特定できる
  • その他にも正規表現ツールを使ってパースすることもできる

  • 緯度と経度を空間オブジェクトに変換するポイント作成ツールがある
  • GPSデータは、通常、トラックなどにセンサーを取り付けた場合、センサーから取得する
  • GPSを使ってブレッドクラムと呼ばれるものを作る
  • Alteryxは緯度、経度、タイムスタンプ、アセットIDなどのデータを取得し、それらすべてをポイントにすることができる

Who are my customers and where can I find more like them?

  • Location Insightsパッケージには、人口統計分析というツールがある
  • 人口統計分析では、何百もの変数をデータに追加できる
  • 追加された変数名は直観的ではない場合は動的リネームツールで人が読みやすい名前に変更する

Trade Area Example

  • 商圏とは、ある特定のビジネスが顧客を集める地理的なエリアのこと
  • 商圏が重なるとカニバリゼーションが発生してしまう

  • 任意の商圏エリアを定義するだけであれば、商圏分析ツールで簡単に設定できる
  • 半径や所要時間など任意に設定できる

  • 顧客がどこにいて、どの店舗に行ったか分かっていて、店舗と店舗の所在地が分かれば、データセットを結合できる
  • 距離ツールを使って、顧客の場所から来店した店舗までの時間や距離を計算できる

Spatial Analytics in Snowflake

Need for Speed

  • データはどんどん大きくなり、ワークフローの実行時間は長くなっている
  • この状況でスピードが求められている

UPSERT using Output Tool

  • データを統合し、時間ごとにデータベースにパケットを出力する方法の場合、最初のパケットの後、応答があるまで次のパケットに進まない

Let's Understand a MERGE Process in Alteryx

  • 今回ご紹介したいのはSnowflakeのMERGE
  • MERGEを行うためにデータベースに移動するのでは意味がない

Writing a MERGE Statement

  • データの書き込み方は4つのセクションに分けられる
  1. テーブルと主キーを書き込む
  2. 主キーが一致した場合のアクション
  3. 主キーが一致しなかった場合のアクション
    新しい行を挿入し、最後にある行を呼び出す
  4. 一時テーブルの削除

Summary

  • データをバルクロードすることでスピードアップにつながる
  • 詳細はAlteryx Communityで公開しているブログをご確認ください

最後に

Alteryx Inspire 2023のセッション『Spatial How-To: In Real Life』のレポートをお届けしました。

参考