AlteryxでTSVファイルとLTSVファイルを読み込む

AlteryxでTSVファイルとLTSVファイルを読み込む

2019.07.05

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは。Alteryxサポートエンジニアとして勉強中のスズです。

Alteryxでファイルからデータを読み込む際にはInput Dataツールを使用します。

2019.2からは、Input Dataツールでファイルを選択する際、Data Connectionsウィンドウにファイルの拡張子の一覧が表示されるようになりました。

拡張子をクリックすると、ファイルの種類としてその拡張子が選択されている状態でファイルの選択画面が表示されます。

Data Connectionウィンドウには、拡張子としてTSVやLTSVは表示されていません。今回は、TSVとLTSVのファイルのデータの読み取りについてご紹介いたします。

TSVとLTSVファイルの読み込み

TSV

以下のようなTSVファイルを用意しました。ちょっと分かりにくいですが、タブ区切りのデータになっています。このTSVファイルをAlteryxに読み込ませてみます。

Input DataツールのData ConnectionsウィンドウにTSVファイルをドラッグ&ドロップしようとしましたが、残念ながら禁止マークが表示されて読み込ませることはできませんでした。

ドラッグ&ドロップがだめでしたので、今度はSelect fileを試してみます。

ファイルの選択画面では、ファイルの種類にAll Filesを指定します。これでTSVファイルも選択できるようになりました。

ファイルを開くと、Resolve File Typeというウィンドウが表示されます。この画面でタブ区切りのデータであることを指定するため、Read it as a delimited text fileDelimiterTabを指定します。また、今回は初めの行にフィールド名(列名)があるため、First Row Contains Field Namesを有効にしています。

読み込んだデータは以下のように表示されました。

Input DataツールのConfigurationを見てみると、Delimitersには\tとしてタブで区切るように指定されています。

LTSV

LTSVは、Labeled Tab-Separated Values の略で、key:value形式のタブ区切りのテキストフォーマットです。主にログ、特に httpd のアクセスログなどに利用されるのが一般的です。 Amazon Athena LTSV形式のログファイルを探索する | DevelopersIO

主にログに使われるものということですが、今回はサンプルとして以下のようなデータを用意しました。

Alteryxに読み込む場合の手順はTSVと同じです。

Resolve File Typeウィンドウでは、Read it as a delimited text fileDelimiterTabを指定します。なお、フィールド名(列名)を示す行はないため、First Row Contains Field Namesは無効にしています。

読み込んだデータは以下のように表示されました。タブで区切られたデータがkey:value形式で表示されています。

最後に

今回はAlteryxでTSVファイルとLTSVファイルの読み込みについてご紹介しました。

Alteryxの導入なら、クラスメソッドにおまかせください

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400


データ分析基盤ならCSAにおまかせください!

クラスメソッドでは、データ分析に関わる皆様の作業コストを削減し、分析アクションを促進・効率化・自動化するためのデータ分析基盤「カスタマーストーリーアナリティクス」を提供・展開しています。興味をお持ち頂けた方は下記バナーをクリックし、詳細をご覧頂けますと幸いです。(各種問い合わせも承っております)

データ分析基盤を最短1ヶ月で導入可能


また、現在クラスメソッドでは毎週無料の相談会を開催しています。データ分析基盤の構築から、BIツール、データ統合など、ビッグデータ分析の導入や活用、技術についてお気軽にご相談ください。

データ分析相談会

この記事をシェアする

データ分析基盤を最短1ヶ月で導入できる

関連記事