AlteryxでLOF(Local Outlier Factor)を使って異常値スコアを算出するツールを公開しました

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、小澤です。

AlteryxでLOFを使って異常値スコアを計算するツールを公開しました。

取得方法

このツールを利用するには、ワークフローの説明文か実行結果に含まれるリンクを選択してyxiファイルをダウンロードしてください。

ダウンロードしたyxiファイルを起動することで以下のような画面が表示されるので、「Install」を選択することでAlteryxから利用可能になります。

利用方法

インストールされたツールは、PredictiveカテゴリにあるLocal Outlier Factorツールとなります。

使い方は、他のツールからの出力となるデータをつないで、異常値検出に使う列を選択するのみとなります。 わかりやすくするために、x, yの二軸のみのデータに対していは、以下のように選択します。

ここで選択している2つの列を散布図にすると以下のようなデータになっています。

このデータに対して異常値検出を行うと以下のようなスコアが付与されます。 こちらのバブルチャートは、先ほどの散布図に対して異常値スコアを点の大きさにしたものになっています。

このスコアを元に、一定数以上などで異常値判定を行うことが可能です。

なお、今回作成したツールは数値の列のみが対象となっています。

おわりに

LOFを使って異常値スコアを算出するツールを作成しました。 ご興味のある方はぜひお試しください。

Alteryxの導入なら、クラスメソッドにおまかせください

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400