Amazon QuickSight チュートリアル実践:ローカル端末のテキスト・EXCELファイルを使って分析を作成
Amazon QuickSightのドキュメントには『チュートリアル』という形でデータセットや分析を作成する手順が豊富に用意されています。サービスの内容、機能の概要を把握するのであればまずは触ってみるのが一番!という事でこの部分についてもガンガン進めていきたいと思います。2つめチュートリアルはテキストファイルを使ったご紹介となります。また併せてEXCELファイルを使った形も軽くではありますがご紹介したいと思います。
テキストデータを使ってQuickSightで分析を作成
サンプルデータ
サンプルに用いるデータとして、以前ブログで投稿した時に使った下記のデータを利用してみたいと思います。2年前のプロ野球の年俸データです。 『NPB-Salaries.csv』というファイル名で保存したものを使います。
件数は然程多くありません。プロ野球選手の人数なので、ご覧の通り900件に満たない数ではあります。
$ wc NPB-Salaries.csv 879 1402 84628 NPB-Salaries.csv
ヘッダ項目を英字で追加して以下のような形でファイルを用意しました。
league,team,player_name,salary,position,years,age,birthday,height,weight,bloodtype,dominant-threw,dominant-batted,birthplace セリーグ,巨人,阿部 慎之助,600000000,捕手,14,35,1979/3/20,180,97,A,右,左,千葉 セリーグ,巨人,杉内 俊哉,500000000,投手,13,34,1980/10/30,175,82,A,左,左,福岡 セリーグ,巨人,内海 哲也,400000000,投手,11,32,1982/4/29,186,93,A,左,左,京都 セリーグ,巨人,山口 鉄也,320000000,投手,9,30,1983/11/11,184,88,A,左,左,神奈川 セリーグ,巨人,村田 修一,300000000,内野手,12,33,1980/12/28,177,92,AB,右,右,福岡 セリーグ,巨人,西村 健太朗,180000000,投手,11,29,1985/5/10,184,94,A,右,右,広島 セリーグ,巨人,坂本 勇人,180000000,内野手,8,25,1988/12/14,186,82,AB,右,右,兵庫 セリーグ,巨人,長野 久義,180000000,外野手,5,29,1984/12/6,180,83,O,右,右,佐賀 セリーグ,巨人,ロペス,170000000,内野手,2,30,1983/11/24,183,93,不明,右,右,ベネズエラ セリーグ,巨人,高橋 由伸,160000000,外野手,17,39,1975/4/3,180,87,O,右,左,千葉 セリーグ,巨人,セペダ,150000000,外野手,1,34,1980/4/8,178,93,不明,右,両,キューバ : :
取り込み・可視化実践
上記で作成したファイルを使ってQuickSightで分析を作成してみます。[New data set]を選択し、
[Create a Data Set]から[Upload a file]を選択。
上記で準備したcsvファイルを開き、取り込みを行います。
上手く取り込めました!
SPICEエンジンに取り込まれています。[Visualize]をクリックして先に進めます。
取り込みも無事完了し、
下記の様にグラフも作成する事が出来ました。
日本語ヘッダ対応可否の確認
ちなみに日本語ヘッダ項目のデータは上手く取り込めるのでしょうか。以下に簡単なレイアウトではありますがCSVデータを手作りしてみました。
日付,ID,名前 2016-11-18,1,AAA 2016-11-19,2,BBB 2016-11-20,3,CCC
上記同様の手順で取り込んでみます。行けてそうですね。
EXCELデータを使ってQuickSightで分析を作成
サンプルデータ
Amazon QuickSightではEXCELデータも取り込む事が出来ます。サンプルデータとしてぱっと思い付くものとしてはやはりTableauのサンプルデータになるでしょうか。下記データをダウンロードし、
対象シートを[Orders]のみにした形で読み込んでみます。
うまく読み込めました!
なお、途中テーブルを選択する画面が表示されていた事から、EXCELは複数シートにも対応しているのではと思われます。ただ今回試してみたファイルでは『Error Uploading File』とエラーメッセージが出るのみで何が原因かまでは判明しませんでしたので詳細は後日確認するとしてここでは割愛します。
今回投入したのはOrdersシートのみなので当該シートを選択し、先に進めます。
取り込みが完了し、可視化も問題無く行えました。
まとめ
という訳で、テキストファイル(CSV)とEXCELをそれぞれ取り込んだ形でAmazon QuickSightの分析を作成してみるチュートリアルのご紹介でした。手持ちのデータさえあればあっという間にデータの可視化を行う事が出来るのは魅力ですね。こちらからは以上です。