EXCELユーザーのためのAlteryx入門 (1).ファイル入力編 #alteryx
日々の定形作業をEXCELで行うのは取っ付き易い一方でデータソースの種類や処理の内容が多岐に渡るとそれらのファイル操作に時間が掛かる...というケースは多くの読者の皆様も目にする事があるかと思います。以下のようなポイントに悩まされてきた、という方々も多いのではないでしょうか。
- 行列の設定やサイズの制限
- 複数のスプレッドシート間でのデータ結合
- エラーハンドリングを行うために複雑な条件式を盛り込む
- データの更新があった場合には設定した処理を再実行しなければならない
Alteryxでこれらの作業を置き換える事で、効率化・省力化を図る事が可能です。EXCELを使って手動で行っていた作業を「ワークフロー」に変換する事により、非構造化データを含む複数のデータソースを加工、結合、分析出来るようになります。また、作業をワークフローとして構成・設定してあるのでデータの変更時にはそのワークフローを再実行するだけで済みます。
当エントリではEXCELを使って作業を行うユーザーや分析を行うアナリストが普段行っているであろう一般的な作業・タスクを紹介し「それらをAlteryxで行うにはどうすれば良いか」という部分について解説していきたいと思います。EXCELユーザーが日々の作業をAlteryxのツールやワークフローにどう変換し、落とし込んで行けば良いのか、という部分の手助けとなれば幸いです。
目次
ファイル入力
まずは「入力データソースとしてEXCELファイルを開く」ところから。
EXCELの場合
EXCELの場合は任意のフォルダに格納されているファイルを起動するか、EXCELのメニューで「ファイル」→「開く」を指定し、
任意のフォルダに格納されているファイルを指定して「開く」事でファイルを開く事が出来ます。
ファイルの種別を絞り込むような場合だと、オプションで以下のような形で絞り込む事も可能ですね。
複数のファイルを一括で開く場合、EXCELでは以下の様に複数ファイルを選択した上でアプリケーションで開く等選択する事で、
一括で開くことが出来ます。(ですがまとめて1つのファイルとして...というのは出来ないですね)
Alteryxの場合
ではAlteryxの場合はどうでしょうか?
Alteryxでは、「Input Data」というツールを使ってファイルの入力情報の指定を行います。
Alteryx起動後、「In/Out」タブにある「Input Data」のツールアイコンを以下のようにドラッグ&ドロップ。
プルダウンで任意のデータ形式が選べますので「File」を選択し、
所定のフォルダにあるファイルを指定します。Alteryx側でもファイルの種別でデータソースを絞り込む事が可能です。
複数のEXCELファイルをAlteryxで開く場合はどうでしょうか。通常、Alteryxでファイルを開く場合は(開く場合も)下記の様にファイル選択ダイアログで任意の1ファイルを開く事で、単一ファイルに対して処理を行う事が出来ます。
Alteryxでは複数のデータソースやデータ構造に対する幅広いデータアクセスを提供しています。この「Input Data」ツールを使うことで以下のような様々なデータにアクセスする事が出来ます。
- EXCEL
- ACCESS
- XML
- SAS
- SPSS
- MapInfo
- 各種データベース
- HDFSに保存されているデータ
また、以下のような各種クラウドシステムに格納されたデータにアクセスするための各種コネクタも提供されています。
- Amazon S3
- Foursquare
- Marketo
- Salesforce
- Microsoft Sharepoint
- Amazon Redshift
- Impala
- Spark
まとめ
という訳で「EXCELユーザーのためのAlteryx利用ガイド」、"EXCELユーザーがAlteryxを使い始めるにあたって何をどうすれば良いのか"の「ファイル入力」に関するトピックのご紹介でした。今回の内容は以下シリーズでトピック毎にエントリを分けて紹介して行きますので、宜しければ他エントリについてもご参照頂けますと幸いです。
参考情報:
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。