AlteryxでTSVファイルとLTSVファイルを読み込む

こんにちは。Alteryxサポートエンジニアとして勉強中のスズです。

Alteryxでファイルからデータを読み込む際にはInput Dataツールを使用します。

2019.2からは、Input Dataツールでファイルを選択する際、Data Connectionsウィンドウにファイルの拡張子の一覧が表示されるようになりました。

拡張子をクリックすると、ファイルの種類としてその拡張子が選択されている状態でファイルの選択画面が表示されます。

Data Connectionウィンドウには、拡張子としてTSVやLTSVは表示されていません。今回は、TSVとLTSVのファイルのデータの読み取りについてご紹介いたします。

TSVとLTSVファイルの読み込み

TSV

以下のようなTSVファイルを用意しました。ちょっと分かりにくいですが、タブ区切りのデータになっています。このTSVファイルをAlteryxに読み込ませてみます。

Input DataツールのData ConnectionsウィンドウにTSVファイルをドラッグ&ドロップしようとしましたが、残念ながら禁止マークが表示されて読み込ませることはできませんでした。

ドラッグ&ドロップがだめでしたので、今度はSelect fileを試してみます。

ファイルの選択画面では、ファイルの種類にAll Filesを指定します。これでTSVファイルも選択できるようになりました。

ファイルを開くと、Resolve File Typeというウィンドウが表示されます。この画面でタブ区切りのデータであることを指定するため、Read it as a delimited text fileDelimiterTabを指定します。また、今回は初めの行にフィールド名(列名)があるため、First Row Contains Field Namesを有効にしています。

読み込んだデータは以下のように表示されました。

Input DataツールのConfigurationを見てみると、Delimitersには\tとしてタブで区切るように指定されています。

LTSV

LTSVは、Labeled Tab-Separated Values の略で、key:value形式のタブ区切りのテキストフォーマットです。主にログ、特に httpd のアクセスログなどに利用されるのが一般的です。 Amazon Athena LTSV形式のログファイルを探索する | DevelopersIO

主にログに使われるものということですが、今回はサンプルとして以下のようなデータを用意しました。

Alteryxに読み込む場合の手順はTSVと同じです。

Resolve File Typeウィンドウでは、Read it as a delimited text fileDelimiterTabを指定します。なお、フィールド名(列名)を示す行はないため、First Row Contains Field Namesは無効にしています。

読み込んだデータは以下のように表示されました。タブで区切られたデータがkey:value形式で表示されています。

最後に

今回はAlteryxでTSVファイルとLTSVファイルの読み込みについてご紹介しました。

Alteryxの導入なら、クラスメソッドにおまかせください

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400