Shift_JIS の txt, csv データをインプットするマクロのご紹介 #Alteryx #05 | Alteryx Advent Calendar 2016
はじめに
こんにちは。セールスの大場です。 当エントリは『Alteyx Advent Calendar 2016』の05日目のエントリでございます。
05日目は『Shift_JIS の txt, csv を取り込むためのマクロ』を紹介します。
さっそくですが、下記の記事で触れられているとおり、現在 Alteryx では Shift_JIS の文字コードで保存された txt データや csv データを取り込むことができません。そのため、これらのデータを扱う場合には、下記の記事でご紹介したような手順で文字コードを UTF8 に変更した上で取り込む必要があります。
- Alteryx上で日本語ファイルの(UTF-8への)文字コード変換を行う(Run Command Tool編)
- Alteryx上で日本語ファイルの(UTF-8への)文字コード変換を行う(Multi Field Formula Tool編)
この悩みを Alteryx 社のエンジニアに相談したところ、ひとまずエンコーダを作ってみたので正式にサポートされるまではこれで我慢してね、とサンプルのマクロをを提供してくれました。あくまでもサンプルという位置づけではありますが、きちんと Shift_JIS のデータが取り込めたのでご紹介をさせていただきます。
マクロファイルのダウンロード
エンコーダのマクロをこちらに用意しましたのでダウンロードしてください。 - Shift_JIS_Convert.yxzp
※ Zip 圧縮していますので解凍してご利用ください。
マクロを開いてみる
ダウンロードしたファイルを Alteryx で開いてみます。
- メニューバーの[File]-[Open Workflow]-[Browse]からダウンロードしたファイルを選択します。
- Package をインポートしてよいか聞かれますので「はい」をクリックします。
- インポート先のディレクトリを入力して「Import」をクリックします。
- Workflow を読み込むか聞かれますので「Yes」をクリックします。
以下のような Workflow が開きます。
input ツールをみてみると、Shift_JIS のサンプルデータが指定されていて、Alteryx 上では文字化けしていることが確認できます。
そのまま処理を走らせてみると、Macro Output で問題なくエンコードできていることが確認できます。
ツールパレットからツールとして使えるようにする
Alteryx では指定のマクロをツール化して利用することができます。 ここでは、上記のマクロをツールとしてツールパレットから使えるようにする手順を紹介します。
- メニューバーの[User Settings]-[Edit User Settings]を選択します。
- User Setting ウィンドウで Macros タブを選択して、画面右上の「+」ボタンをクリックします。
- 以下を入力する画面にて値を設定します。
- Category Name:どのツールパレットに所属させるか(今回は In/Out を指定しています)
- Seach Paths:WorkFlow が保存されているパスを指定します。
- 値が正しく設定されていることを確認して「OK」ボタンをクリックします。
- すると、In/Out に新たに JIS_Convert というツールが追加されたことが確認できます。
さっそく使ってみる
JIS_Convert のパラメータから Shift_JIS のファイルを選択します。
※ CSV を選択したのですが、ファイル指定画面でファイルの種類を「All Files」にしないと選択ができませんでした。
Browse ツールを繋いで実行してみると、無事に文字化けなく表示ができました。
まとめ
Alteryx で Shift_JIS のファイルをインプットするためのエンコードのご紹介でした。Shift_JIS を取り込む際に前処理をされているケースが多いかと思うのですが、このマクロが使えると手間が減って便利ですね。なお、ご紹介したマクロは txt や csv ファイルの変換はできるのですが、エクセルやシェープファイルの変換は対応していません。このあたりは今後のサポートに期待したいと思います。
ということで Alteryx Advent Calendar 2016 | シリーズ | Developers.IO の05日目のエントリでした。明日は弊社パートナーの truestar さんにゲストブロガーとして執筆いただきます。お楽しみに!!
こちらからは以上です。