Alteryx v11.7：『予測』関連ツールの機能概要＆ブログエントリまとめ #alteryx

2017.12.12

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

Alteryxのワークフローを構成する「ツール」群は、バージョンを追う毎にその種類が増えて来ています。その数251種類(2017年12月、v11.7現在)。非常に数も多く内容のバリエーションに富んでいる為、全容把握はなかなかに大変です。そこで当エントリでは、その中から「予測」に関する処理を行うツール群について処理の概要や関連ドキュメント・また関連しているDevelopers.IOのエントリに関する情報についてまとめてみました。

・当エントリは、下記まとめエントリの「子エントリ」となります。 Alteryxで何が出来るのか – 実行可能全タスク251種概要紹介＆リファレンスまとめ(2017年12月改訂版) #alteryx ｜ Developers.IO

Predictive(予測)

分類モデルと回帰モデルの両方の一般的な予測モデル用ツール、モデル比較ツール、予測モデリングに関連する仮説テストツールが含まれています。

アイコン	ツール名	用途・用例
	Boosted Model (ブーストモデル)	Gradient Boostingメソッドに基づいて一般化されたブースト回帰モデルを作成。
		・Boosted Model Tool
		(※関連エントリはまだありません)
	Count Regression (カウント回帰)	非負の整数値（0,1,2,3など）の対象フィールド（対象変数）を、その対象に影響を与えると予想される1つ以上のフィールドに関連付ける回帰モデルを作成。
		・Count Regression Tool
		(※関連エントリはまだありません)
	Cross-Validation (交差検証)	クロスバリデーションのプロセスを使用して、1つまたは複数のAlteryxで生成された予測モデルのパフォーマンスを比較。
		・Cross-Validation Tool
		(※関連エントリはまだありません)
	DataRobot Automodel (DataRobotの自動化)	DataRobot Automodelツールを使用して、予測モデルを作成するDataRobotマシン学習プラットフォームにデータをアップロード。 DataRobotは、DataRobot Predict Toolを使用してAlteryxで適用できる予測モデルを作成して保存します。
		・DataRobot Automodel Tool
		(※関連エントリはまだありません)
	DataRobot Predict (DataRobotによる予測)	DataRobot Predictツールを使用して、DataRobotで生成された予測モデルを使用してデータにスコアを付与。(※予測モデルを生成するには、DataRobot Automodel Toolを使用します。)
		・DataRobot Predict Tool
		(※関連エントリはまだありません)
	Decision Tree (決定木)	デシジョンツリーの学習方法に基づいてモデル作成基準を最適化するためのif-then分割ルールのセットを作成。
		・Decision Tree Tool
		・決定木モデルを作る #alteryx #03 \| Alteryx Advent Calendar 2016 ｜ Developers.IO
	Forest Model (フォレストモデル)	1つまたは複数の予測変数に基づいてターゲット変数を予測する一連の決定木モデルを構築するモデルを作成。
		・Forest Model Tool
		(※関連エントリはまだありません)
	Gamma Regression (ガンマ回帰)	ターゲット変数に影響を及ぼすと予想される1つまたは複数の変数（予測変数）に、ガンマ分布の厳密に正の関心対象変数（ターゲット変数）を関連付ける。
		・Gamma Regression Tool
		(※関連エントリはまだありません)
	Lift Chart (リフトチャート)	異なるバイナリ（はい/いいえ）分類モデルの比較精度を視覚的に評価して新しいデータを予測し、新しいデータを予測するために使用される累積キャプチャされたレスポンスチャートとインクリメンタルレスポンス率グラフを生成。
		・Lift Chart Tool
		・AlteryxでPredictive系ツールを使う時の流れ｜ Developers.IO
	Linear Regression (線形回帰)	1つまたは複数の予測変数に基づいてターゲット変数を予測するモデルを作成する線形関数を構築。
		・Linear Regression Tool
		・線形回帰をしてみる #alteryx #07 \| Alteryx Advent Calendar 2016 ｜ Developers.IO
	Logistic Regression (ロジスティック回帰)	ターゲットバイナリ変数（yes / no、pass / failなど）を1つ以上のプレディクタ変数に関連付けるモデルを作成し、ターゲット変数に対する2つの可能な応答の推定確率を取得。
		・Logistic Regression Tool
		(※関連エントリはまだありません)
	Model Coefficients (モデル係数)	モデルの係数名と値の表を作成。
		・Model Coefficients Tool
		(※関連エントリはまだありません)
	Model Comparison (モデル比較)	検証（またはテスト）データセットの使用に基づいて、1つまたは複数の異なる予測モデルのパフォーマンスを比較。
		・Model Comparison Tool
		(※関連エントリはまだありません)
	Naive Bayes Classifier (単純ベイズ分類器)	予測変数のセットとカテゴリの目標変数の間の関係の二項または多項確率的分類モデルを作成。
		・Naive Bayes Classifier Tool
		・AlteryxのNaive Bayesツールの中身を見てみる｜ Developers.IO
	Nested Test (ネストされたテスト)	一方が他方に含まれる変数のサブセットを含む2つのモデルが、その予測能力に関して統計的に等価であるかどうかを調査。
		・Nested Test Tool
		・線形回帰をしてみる #alteryx #07 \| Alteryx Advent Calendar 2016 ｜ Developers.IO
	Network Analysis (ネットワーク分析)	ネットワークの対話型ダッシュボードを生成し、さまざまなノード間の関係を探索。
		・Network Analysis Tool
		・Alteryxでネットワーク分析｜ Developers.IO
	Neural Network (ニューラルネットワーク)	単一の隠れ層を持つフィードフォワードパーセプトロンニューラルネットワークモデルを作成。
		・Neural Network Tool
		(※関連エントリはまだありません)
	Score (スコア)	モデルの予測の品質を決定。モデルを評価し、モデルによって予測された値の精度を推定するスコアと呼ばれる評価列を作成します。
		・Score Tool
		・AlteryxでPredictive系ツールを使う時の流れ｜ Developers.IO
	Spline Model (スプラインモデル)	Friedmanの多変量適応回帰スプライン（またはMARS）アルゴリズムを提供。
		・Spline Model Tool
		(※関連エントリはまだありません)
	Stepwise (ステップワイズ)	線形、ロジスティック、およびその他の従来の回帰モデルのより大きな可能性のあるプレディクタ変数からモデルに含める最良の予測変数を決定。
		・Stepwise Tool
		(※関連エントリはまだありません)
	Support Vector Machine (サポートベクターマシン)	分類（カテゴリカルターゲット）の問題のために開発された初心者学習アルゴリズムの一般的なセットの機能を提供。
		・Support Vector Machine Tool
		・AlteryxでSVM ｜ Developers.IO
	Survival Analysis (サバイバル分析)	サバイバル分析の一般的な方法を実装。
		・Survival Analysis Tool
		(※関連エントリはまだありません)
	Survival Score (サバイバルスコア)	Survival Analysisツールを使用して推定することができるCox比例ハザードモデルに基づいて、推定相対リスクと制限平均生存時間の両方を提供。
		・Survival Score Tool
		(※関連エントリはまだありません)
	Test of Means	対照群と1つ以上の治療群との間の数値応答場の平均値の差のWelchの2つの試料t検定*を実行。
		・Test of Means Tool
		(※関連エントリはまだありません)
	Variance Inflation Factors (分散インフレ因子)	モデルインターセプト（常にVIFまたはGVIFが1に等しい）以外のすべての変数の分散インフレ率またはVIF（GVIF）の一般化バージョンを含む係数要約レポートを生成。
		・Variance Inflation Factors Tool
		(※関連エントリはまだありません)

Predictive Group(予測グループ)

このカテゴリには、レコードまたはフィールドを少数のグループにグループ化するためのツールが含まれています。

アイコン	ツール名	用途・用例
	Append Cluster (クラスタの追加)	K-Centroids Cluster Analysisツールからのクラスタ割り当てをデータストリームに追加。
		・Append Cluster Tool
		・Alteryxでk-means ｜ Developers.IO
	Find Nearest Neighbors (最近傍探索)	ユークリッド距離に基づいて、「クエリ」ストリーム内の各レコードに対応する「データ」ストリーム内の選択された数の最近傍を検出。
		・Find Nearest Neighbors Tool
		・Alteryxでk-nearest neighbor ｜ Developers.IO
	K-Centroids Cluster Analysis (K-Centroidsクラスター分析)	パーティショニングクラスタ分析と呼ばれる処理を行うアルゴリズムのクラスを提供。
		・K-Centroids Cluster Analysis Tool
		・Alteryxでk-means ｜ Developers.IO
	K-Centroids Diagnostics (K-Centroids診断)	データと選択されたクラスタリングアルゴリズム（K-Means、K-Medians、またはNeural Gas）を指定して、適切なクラスタ数を指定。
		・K-Centroids Diagnostics Tool
		(※関連エントリはまだありません)
	MB Affinity	「トランザクション」データを取り、各行がトランザクションであり、列がトランザクションに現れる「アイテム」のセットであるマトリックスを構成。
		・MB Affinity Tool
		(※関連エントリはまだありません)
	MB Inspect	MBルールツールのルールまたは項目セット出力を入力として受け取り、数または返されたルールまたは項目セットを管理可能な数に減らすために、いくつかの基準でフィルタリングできるルールのリストおよび分析を提供。
		・MB Inspect Tool
		・マーケット・バスケット分析をやってみた #alteryx #10 \| Alteryx Advent Calendar 2016 ｜ Developers.IO
	MB Rules	トランザクションデータを取り込み、データを変換した後、関連ルールセット*または頻出アイテムセットのいずれかを作成。
		・MB Rules Tool
		・マーケット・バスケット分析をやってみた #alteryx #10 \| Alteryx Advent Calendar 2016 ｜ Developers.IO ・Alteryxで共起カウントをする｜ Developers.IO
	Multidimensional Scaling (多次元スケーリング)	分散に基づいて単変量データを分離する方法を提供。
		・Multidimensional Scaling Tool
		(※関連エントリはまだありません)
	Principal Components (主要コンポーネント)	データベース内のディメンション（数値フィールドの数）を、元のフィールドセットをデータの分散（すなわち、情報）の大部分を占める小さなセットに変換することによって減らす。
		・Principal Components Tool
		・Alteryxで主成分分析をしてみる #alteryx #18 \| Alteryx Advent Calendar 2016 ｜ Developers.IO