WebサービスとAlteryxでダミーの店舗マスタを作成してみた

WebサービスやChatGPTに頼って楽に作成
2023.10.31

はじめに

こんにちは。データアナリティクス事業本部 BIチームのkariyaです。
今回は架空のスーパーマーケットのデータを想定し、ダミーの店舗マスタを作成してみます。

今回欲しいデータ

  • 店舗IDがある(例:000001)
  • 店舗名がある(例:〇〇ストア××店)
  • 地方がある(例:関東)
  • 100店舗分のデータ

Webサイトで疑似個人情報を生成する

ランダムなデータを生成できるWebサイトを利用して個人情報を生成します。
疑似個人情報データ生成サービス

今回は住所が欲しいので、住所の漢字にチェックを入れます。

生成する件数を100件にし、使用許諾条件を確認した上で生成ボタンを押します。

結果をcsvでダウンロードします。

Alteryxでデータ確認&不足項目を追加

ここからはAlteryxで不足項目を追加していきます。ワークフローの全体図はこちらです。

まずはレコードIDツールを使い、6桁の店舗IDを作成します。

店舗IDが作成できました。

次にセレクトツールを使い、列名を変更していきます。
住所は複数列に分かれているので、都道府県名~建物名などの列名をつけます。
今回は都道府県名、市区町村名、町名までを残します。

列名を変更した結果です。

次に、フォーミュラツールで店舗名と地方を作成します。 店舗名は、「〇〇ストア」+ 市区町村名 + 町名 + 「店」で作成します。

地方は、都道府県から地方名を出力するIF文を記述して作成します。 47都道府県分のIF文を手書きするのは大変なので、ChatGPTに手伝ってもらいました。

北海道が東北に入っているなど、微修正は必要ですがすべて自分で書くよりも圧倒的に楽ですね。

これで店舗名と地方の作成ができました。

最後に、セレクトツールで出力が不要な列を削除し、列の順番を見やすいように入れ替えます。

以上で店舗マスタの作成は完了です。

おわりに

個人情報の疑似生成はWebサービスに、長いIf文はChatGPTに任せることで、簡単にダミーデータを作成することができました。
100件程度のデータであれば手作業の作成も無理ではないですが、500件、1000件など大量にダミーデータが欲しい場合や何度もダミーデータを作成したい場合は、今回のようにツール等でデータ作成処理を作ってしまうのが楽だと感じました。

この記事により、データ準備が少しでも楽になれば嬉しいです。

関連記事