Alteryx Inspire 2017 : 【レポート】エラー解決のための”ワークフローのささやき” #alteryx17

こんにちは、小澤です。

『Alteryx inspire 2017』が2017年6月5日(月)〜6月7日(水)、アメリカのラスベガス ARIA HOTELにて3日間開催されています。 当エントリでは、テクノロジートラックの、「The Workflow Whisperer」をレポートしたいと思います。

目次

 

セッションの概要

セッション概要は以下の内容となります。

登壇者: Engineer - Alteryx, Criston Schellenger - Sr. Customer Support Engineer - Alteryx

セッション概要:
If you've ever spent time trying to unravel a problem in your workflow, you don't want to miss this session. We'll help you understand exactly how data moves through the workflow, common errors you may encounter, and exactly how to rectify those errors. You'll leave this session knowing how to track backward in your workflow and whisper it into obedience.
 (ワークフローの問題を解決するために時間を費やしたことがある場合は、このセッションを逃したくありません。 ワークフローを通じてデータがどのように動くか、遭遇する可能性のある一般的なエラー、およびそれらのエラーを修正する方法を正確に理解するのに役立ちます。 このセッションでは、ワークフローの後ろを追う方法を熟知し、従順に耳を傾けます。)

Tracksより引用

セッションレポート

2017-06-06 20.04.32

本セッションでは、ワークフローを作成し、処理を実行する際に遭遇するエラーについてどのような情報を元に、どこを修正する必要があるかを解説していく内容になっています。

アジェンダとしては

  • Alteryx特有のトラブルシューティングについて
  • 各種ウインドウの項目
  • ワークフローがうまく動かない理由の特定
  • トラブルシューティングのベストプラクティス

となっています

Alteryx固有トラブルシューティングについて

最初にAlteryxでのトラブルシューティングでどういったことを考慮すべきを見ていきます。

2017-06-06 20.09.23

  • "言語"としてのAlteryx
  • 違うツールで同じ結果
  • Alteryのエラーか外部ツールのエラーか

AlteryxはExcelやSQLの処理に対応するようなツールがあり、それらを接続して一連の流れを構築していきます。 その流れがニュアンスとして言語のようなものということです。

また、Alteryxではある結果を得るのに方法は1つだけとは限りません。 ツールの組み合わせ次第で、異なる様々な方法で同じ結果を得ることができます。

Alteryxでは、データベースにしたりRを利用しり、APIを呼び出したりといった処理もあります。 その際、ワークフローが間違っていることに起因するのか、そらら外部のものが原因となっているかを判断する必要があります。

各種ウインドウの項目

Alteryxには様々なウインドウがあり、そこから情報が取得できます。

  • ワークフローの設定
  • ツールや接続のコネクタ
  • 処理結果
  • データのプロファイル
  • インターフェースデザイナーとデバッグウインドウ
  • Log出力

ワークフローのそのものの設定についてはツールを洗濯していない状態で(初期状態では)右側のConfigureウインドウに表示されます。 この中なの「Runtime」タブ下部にある項目はワークフローのエラーを追っていくのに非常に役立ちます。

2017-06-06 20.17.02

続いての出力ウインドウは普段からよく利用されるものかと思います。

2017-06-06 20.18.45

スライドにも記載されているように、メッセージはいくつかの種類に分かれています

  • 後続の処理を継続できないエラー
  • 継続は可能だが一部のデータの一部情報が失われてるなどのエラー
  • 意図しない動作をしているかもしれない警告
  • システムからのお知らせ情報
  • ファイルの入出力

となります。

処理結果も普段からよく利用される顔と思います。

2017-06-06 20.19.34

こちらにはBrowseツールの結果も同様のものとして含みます。 意図しない処理が行われてい行われた結果おかしな値になっていないかなど、出力結果をベースに確認できます。

Alteryx 11.0からの機能であるBrowseツールのプロファイルも有用です。

2017-06-06 20.21.48

データの型や欠損値、統計量などを確認できます。

その他にもマクロやアプリケーションを作る場合にはインターフェースデザイナーのデバッグ機能が使えます。 また、他にいい情報が無い場合の最後の手段やAlteryx Serverの情報を取得する際にはLog出力されたファイルも活用できるということでした。

ワークフローがうまく動かない理由の特定

"ワークフローがうまく動かない"というは以下の2種類の意味合いが含まれます。

  • エラーが出て最終的な出力が得られない
  • 出力は得られるが、意図した結果になっていない

エラーが出て最終的な出力が得られない場合、エラーがメッセージが表示されるのでまずはそれを確認します。 また、同様のエラーが出ていないか、コミュニティサイトやインターネット検索で調べてみるのも有用です。

その他、ドキュメントを見て使い方を確認したり、単純なサンプルデータで挙動を確認してみるのもいいでしょう。

2017-06-06 20.29.33

意図した結果になっていない場合、以下のような手順でトラブルシューティングを行うと効果的です。

  1. まずは結果のどの部分がどのようにうまくいってないのかを明確にします
  2. うまくいっていない理由を予測します
  3. 問題の原因を特定します
  4. 修正したもの動作を確認して無事解決となります

2017-06-06 20.33.44

トラブルシューティングのベストプラクティス

2017-06-06 20.37.29

最後にベストプラクティスの話になりますが、いずれも基本的なことになっています。

データのことを知っていないと知っていないと、分析結果を正しいものにするのも難しいでしょうし、 どのような処理を行っているのか人がみてわかりやすいようなワークフローを心がけましょう。

セッション資料

本セッションの発表資料と動画は以下になります。

終わりに

本セッションはAlteryxでワークフローを作成する際に実際に出会うことになるであろう予期せぬ挙動にどのように対処するべきかといったものになっていました。

タイトルの通り、うまく動かない理由をやみくもに探るのではなくまずはワークフローがささやきかけてくれている原因に耳を傾けてみましょう。