Amazon QuickSight チュートリアル実践:ローカル端末のテキスト・EXCELファイルを使って分析を作成

2016.11.18

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

Amazon QuickSightのドキュメントには『チュートリアル』という形でデータセットや分析を作成する手順が豊富に用意されています。サービスの内容、機能の概要を把握するのであればまずは触ってみるのが一番!という事でこの部分についてもガンガン進めていきたいと思います。2つめチュートリアルはテキストファイルを使ったご紹介となります。また併せてEXCELファイルを使った形も軽くではありますがご紹介したいと思います。

テキストデータを使ってQuickSightで分析を作成

サンプルデータ

サンプルに用いるデータとして、以前ブログで投稿した時に使った下記のデータを利用してみたいと思います。2年前のプロ野球の年俸データです。 『NPB-Salaries.csv』というファイル名で保存したものを使います。

件数は然程多くありません。プロ野球選手の人数なので、ご覧の通り900件に満たない数ではあります。

$ wc NPB-Salaries.csv 
     879    1402   84628 NPB-Salaries.csv

ヘッダ項目を英字で追加して以下のような形でファイルを用意しました。

NPB-Salaries.csv

league,team,player_name,salary,position,years,age,birthday,height,weight,bloodtype,dominant-threw,dominant-batted,birthplace
セリーグ,巨人,阿部 慎之助,600000000,捕手,14,35,1979/3/20,180,97,A,右,左,千葉
セリーグ,巨人,杉内 俊哉,500000000,投手,13,34,1980/10/30,175,82,A,左,左,福岡
セリーグ,巨人,内海 哲也,400000000,投手,11,32,1982/4/29,186,93,A,左,左,京都
セリーグ,巨人,山口 鉄也,320000000,投手,9,30,1983/11/11,184,88,A,左,左,神奈川
セリーグ,巨人,村田 修一,300000000,内野手,12,33,1980/12/28,177,92,AB,右,右,福岡
セリーグ,巨人,西村 健太朗,180000000,投手,11,29,1985/5/10,184,94,A,右,右,広島
セリーグ,巨人,坂本 勇人,180000000,内野手,8,25,1988/12/14,186,82,AB,右,右,兵庫
セリーグ,巨人,長野 久義,180000000,外野手,5,29,1984/12/6,180,83,O,右,右,佐賀
セリーグ,巨人,ロペス,170000000,内野手,2,30,1983/11/24,183,93,不明,右,右,ベネズエラ
セリーグ,巨人,高橋 由伸,160000000,外野手,17,39,1975/4/3,180,87,O,右,左,千葉
セリーグ,巨人,セペダ,150000000,外野手,1,34,1980/4/8,178,93,不明,右,両,キューバ
:
:

取り込み・可視化実践

上記で作成したファイルを使ってQuickSightで分析を作成してみます。[New data set]を選択し、

amazon-quicksight-datasource_textfile_101

[Create a Data Set]から[Upload a file]を選択。

amazon-quicksight-datasource_textfile_102

上記で準備したcsvファイルを開き、取り込みを行います。

amazon-quicksight-datasource_textfile_103

上手く取り込めました!

amazon-quicksight-datasource_textfile_104

SPICEエンジンに取り込まれています。[Visualize]をクリックして先に進めます。

amazon-quicksight-datasource_textfile_105

取り込みも無事完了し、

amazon-quicksight-datasource_textfile_106

下記の様にグラフも作成する事が出来ました。

amazon-quicksight-datasource_textfile_107

日本語ヘッダ対応可否の確認

ちなみに日本語ヘッダ項目のデータは上手く取り込めるのでしょうか。以下に簡単なレイアウトではありますがCSVデータを手作りしてみました。

test.csv

日付,ID,名前
2016-11-18,1,AAA
2016-11-19,2,BBB
2016-11-20,3,CCC

上記同様の手順で取り込んでみます。行けてそうですね。

quicksight-japanese-header-data_01

EXCELデータを使ってQuickSightで分析を作成

サンプルデータ

Amazon QuickSightではEXCELデータも取り込む事が出来ます。サンプルデータとしてぱっと思い付くものとしてはやはりTableauのサンプルデータになるでしょうか。下記データをダウンロードし、

対象シートを[Orders]のみにした形で読み込んでみます。

amazon-quicksight-datasource_textfile_201

うまく読み込めました!

quicksight-japanese-header-data_02

なお、途中テーブルを選択する画面が表示されていた事から、EXCELは複数シートにも対応しているのではと思われます。ただ今回試してみたファイルでは『Error Uploading File』とエラーメッセージが出るのみで何が原因かまでは判明しませんでしたので詳細は後日確認するとしてここでは割愛します。

今回投入したのはOrdersシートのみなので当該シートを選択し、先に進めます。

amazon-quicksight-datasource_textfile_202

取り込みが完了し、可視化も問題無く行えました。

amazon-quicksight-datasource_textfile_301

まとめ

という訳で、テキストファイル(CSV)とEXCELをそれぞれ取り込んだ形でAmazon QuickSightの分析を作成してみるチュートリアルのご紹介でした。手持ちのデータさえあればあっという間にデータの可視化を行う事が出来るのは魅力ですね。こちらからは以上です。