ChatGPTにお願いして、Alteryxでワークフローを作成する際のダミーデータを生成してもらう

ダミーデータ作成のためにテキストインプットツールを使う日々からの卒業
2023.04.01

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは アライアンス統括部の兼本です。

みなさんはAlteryxでワークフローを作るときにダミーデータの準備が面倒くさいなと思ったことはありませんか?私はあります!

そんな時に亀井さんの「ChatGPTでダミーデータ作成が便利すぎる」というエントリーを読んで思いました。「これ使えるんちゃうか?」

やってみた

何はともあれ、実験してみましょう。ChatGPT(Open AI API)の呼び出しについては安原さんのエントリを丸パクリ参考にさせていただきました。

作成したワークフローがこちらです。

基本的に安原さんが例示したワークフローのままですが、一番のポイントはフォーミュラツールで文字列として作成しているChatGPT(Open AI API)に対して渡すメッセージです。

"以下の条件にマッチするダミーデータをCSV形式で作成してください。ユースケース:あなたはとあるECサイト運営会社のマーケティング担当者です。これから顧客の氏名、住所、電話番号、メールアドレス、直近6カ月の来店回数と来店時の購入金額に応じたマーケティング施策を検討したいと考えています。"

ワークフローを実行して得られた結果がこちらです。

え!これすごくないですか?もうダミーデータで悩む必要ないんですよ。

折角なので、得られたデータを整形する処理を追加します。何度か試行錯誤を繰り返すため、ダウンロードツールを右クリックして「ワークフローのキャッシュと実行」を行い、フロー実行の度にAPI呼び出しを行わないようにします。(トークンの無駄遣いを防ぐため)

整形した結果は以下の通りです。

まとめ

Alteryxでダミーデータを作成する際、従来はテキストインプットツールやダミーデータを含むExcelファイルなどを用意する必要がありましたが、ChatGPTを組み合わせることで、欲しいデータを言葉で指示できるのは大変便利ですね。 一方で、今回のワークフローの作成に当たって何度か試行錯誤をしましたが、適切なダミーデータを得るためには以下の点に留意する必要がありそうです。

  1. ダミーデータであることを強調する
  2. 欲しいデータについて、より具体的な指示を出す
  3. データの出力方式も指定する

特にダミーデータであることを明記せずに質問をすると、稀に個人情報に関連する質問とみなされて「禁則事項です」と言われるケースがありましたので、ご注意ください。

これからはワークフローの開発力だけではなくプロンプトエンジニアリング力も磨こうと思います。