
Alteryx Communityのインタラクティブレッスンに予測分析コースが追加されました
この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。
こんにちは。
データアナリティクス事業本部ソリューション部プリセールススペシャリストの兼本です。
Alteryx Communityのインタラクティブレッスンに予測分析コースが追加されました。このコースはもともと英語版のインタラクティブレッスンとして公開されていた内容を日本語化したものです。
早速コースを確認したところ、
- これからAlteryxを使いたい
 - いまAlteryxを使っていてデータ前処理だけではなく予測分析にも活用したいけど、どこから始めたらいいかわからない
 
という方向けにお勧めしたい内容でしたので、ご紹介します。 コースには以下5つのステップが用意されており、それぞれ20分程度の動画と理解を確認するための簡単なクイズで構成されています。
予測モデリング
- レッスンの目的: 予測モデリングとは何か、そのモデルで何ができるのか、予測モデルを作成するために必要な情報を学びます。
 - 推定時間: ~15 Minutes
 - トピック
- イントロダクション
 - モデルとは何か?
 - モデルの作成
 - ステップ1:質問
 - ステップ2:情報収集
 - ステップ3:データクレンジング
 - ステップ4:評価と検証
 - ステップ5:モデルオブジェクトの作成
 - ステップ6:デプロイメント
 - ステップ7:モデルの解釈
 - 結論(まとめ)
 
 

予測分析の基礎
- レッスンの目的: 予測モデリングとは何か、そのモデルで何ができるのか、予測モデルを作成するために必要な情報を学びます。
 - 推定時間: ~15 Minutes
 - トピック
- 基盤としてのデータ
 - データ vs 情報
 - 母集団とサンプル
 - モデルを構築し解釈するために知っておくべきこと
 - 多重共線性とは?
 - 変数間の関係
 - 適合度検定
 - なぜ過学習は問題か
 - 結果
 
 

データ調査の概念(アドバンスド)
- レッスンの目的: モデリング用のデータを準備する際の注意点と、役に立つデータ調査ツールについて説明します。
 - 推定時間: ~20 Minutes
 - トピック
- データ調査とは?
 - あなたのオプション
 - 注意すべき点
 - 特徴量エンジニアリング
 - フィールドサマリーツール
 - 度数分布表ツール
 - 散布図ツール
 - 相関(相関係数ツール、スピアマン相関ツール)
 - アソシエーション分析ツール
 
 

データ調査のテクニック
- レッスンの目的: レッスンに従ってDesigner で未知のデータセットを探索しましょう。
 - 推定時間: ~28 Minutes
 - トピック
- データセット
 - デッドウェイト
 - データを理解する
 - Null値と欠損
 - 特徴量エンジニアリング
 - 外れ値
 - バイアスの識別
 - データ内の相関関係の探索(数値相関、連続的及びカテゴリ的な関係、カテゴリ関係)
 
 

予測モデルの作成
- レッスンの目的: 一般的なモデリングプロセスのウォークスルーと、使用されるモデリングアルゴリズムの簡単な説明。
 - 推定時間: ~30 Minutes
 - トピック
- モデリングアルゴリズム
 - モデリングアルゴリズムの種類
 - データの分割
 - モデルの比較
 - 新しいデータセットのスコアリング
 - モデルのデプロイメント
 
 

まとめ
全体を通しても3時間程度で学べるボリュームですので、これで予測分析ができるようになるわけではありませんが、予測分析を行うために何を学ぶべきか、それをAlteryxで実装するにあたって何をするべきなのかという手法の基礎を知ることのできる、イントロダクションとして素晴らしいコンテンツです。
Alteryxで予測分析をしてみたいとお考えの方、Alteryxコミュニティのインタラクティブレッスンは無料で受講可能なオンライントレーニングですので、今すぐ受講しましょう。
さらに「基礎はわかった、次はどうする?」って方向けにはアジア初のAlteryxエキスパートであるじょんすみすが講師を務めるオンラインセミナー「データ分析スキルアップ講座~Alteryx編~」も以下のリンクからご視聴いただけます。(登録が必要です)
以上、最後までお読みいただきありがとうございました。









