Alteryxで何が出来るのか – 実行可能タスク全197種 概要紹介&リファレンスまとめ #alteryx
データブレンディング及び分析機能を有する『Alteryx』は昨年末から弊社でもパートナーシップ締結を行い、諸案件でも積極的に活用を推し進めているプロダクトですが、こちらのツールでは実に様々な処理を行う事が出来ます。
- データブレンディング&予測分析ツール『Alteryx』の米国:Alteryx社とのパートナーシップ締結に関するお知らせ | Developers.IO
- Alteryx Designer14日トライアル版の入手とインストール、サンプル実行まで | Developers.IO
- Alteryx Visual Analytics Kit for TableauでTableau&Alteryx連携を実現|Tableau Software Tips&Viz Advent Calendar 2014 #19 #tableau | Developers.IO
- Alteryxを使ってShapefileからTableauの色塗りマップを作成する | Developers.IO
『ツール』と呼ばれる処理アイコンをGUIベースでドラッグアンドドロップし、線で繋ぐ事で処理ワークフローを構築出来、再生ボタンを『ポチっとな』するだけで処理が実行出来るという分かり易さです。実行可能なサンプルも豊富に用意されているので、学習も比較的進めやすいと思います。
で、その『ツール』なのですが、現行Alteryx Designerとインストール作業で付随する『R Tool』のインストールで利用出来るようになる数のツール総数は何と197個もあります。ざっと見ていくだけでも結構な労力が掛かりそうです。そこで当エントリでは、『ひとまずAlteryxではどんな事が行えるのか』という観点で全容を把握するべく、カテゴリ別に分類されている『ツール』の一覧をご紹介してみたいと思います(おまけで対応データソース一覧・レポートフォーマット一覧も載せておきました)。各ツールの項目にはドキュメントヘルプの該当ページリンクを併記していますので、リファレンスページとしても御活用頂けますと幸いです。
目次
- alteryx 対応データソース一覧
- alteryx 対応レポートフォーマット一覧
- alteryx 実行可能タスク(ツール)一覧 / 全197種
- In/Out (入出力)
- Preparation (準備)
- Join (結合)
- Parse (解析)
- Transform (変換)
- Reporting (帳票)
- Documentation (文書)
- Spatial (空間情報)
- Interface (インタフェース)
- Data Investigation (データ調査)
- Predictive (予測)
- Time Series (時系列)
- Predictive Grouping (予測グループ)
- Connectors (コネクタ)
- Address (住所)
- Demographic Analysis (人口分析)
- Behavior Analysis (動作分析)
- Calgary (Cargaly Database)
- Developer (開発者向け)
- Social Media (ソーシャルメディア)
- Labolatory (研究室)
- まとめ
Alteryx 対応データソース一覧
過去にTableauを紹介した際にも『多種多彩なデータソースに対応しています!』という紹介はしましたが、Alteryxもそれ以上の多彩っぷりを発揮しております。詳細な内容は以下ページを参照。
以下にその一覧を羅列してみたいと思います。実に多岐に亘る種類に対応していますね。ぱっと見馴染みのない形式のものもあると思いますので注釈などを付与しています。
- Alteryx - Alteryxデータベースファイル(ファイル)
- Alteryx - Alteryx Calgaryデータベースファイル(ファイル)
- Alteryx - Spatial Zipファイル(ファイル)
- Alteryx - Webファイル(ファイル)
- Amazon - Redshift (DB接続)
- Amazon - S3(ツール)
- ASCII(ファイル)
- Apache Hadoop - Apache Avro(ファイル)
- Apache Hadoop - Hadoop分散ファイルシステム(ツール)
- Apache Hadoop - Hadoop Hive(DB接続)
- Autodesk(ファイル)
- ※Autodesk: CADツール。対象ファイルが.sdf(Spatial data file)との事なので、地理情報絡みのプロダクトに関連したファイルが該当か。
- Cloudera - Cloudera Impala (DB接続)
- Cloudera - Hadoop Hive (DB接続)
- CSV (ファイル)
- DataSift - DataSift (マクロ)
- ※DataSift: Twitter分析に特化。
- dBase - dBase (ファイル)
- ESRI - Esriファイル Geoデータベース (DB接続)
- ESRI - Esriパーソナル Geoデータベース (ファイル)
- ESRI - Esriシェイプファイル (ファイル)
- ※ベクトル形式の地理情報業界標準フォーマット。Esri 社製品他多くの GIS ソフトウェアで利用が可能。
- FourSquare - FourSquare (マクロ)
- GeoJSON - GeoJSON (ファイル)
- GIS - GIS (ファイル)
- Google - Google Analytics (マクロ)
- Google - Google BigQuery (DB接続)
- Google - Google Earth/Maps (File)
- Hortonworks - Hadoop Hive (DB接続)
- HP - HP Vertica (DB接続)
- IBM - IBM DB2 (DB接続)
- IBM - IBM Netezza/Pure Data Systems (DB接続)
- IBM - IBM SPSS (ファイル)
- ※統計解析ソフトウェア。
- MapInfo - MapInfo Professional Interchange Format (ファイル)
- MapInfo - MapInfo Professional Table (ファイル)
- ※MapInfo: 位置情報活用ソフトウェア。
- MapR - Hadoop Hive (DB接続)
- Marketo - Marketo (ツール)
- ※マーケティング自動化に特化したSaaS。
- Microsoft - Access (ファイル)
- Microsoft - EXCEL (ファイル)
- Microsoft - SharePoint (ツール)
- Microsoft - SQL Server (DB接続)
- MongoDB - MongoDB (ツール)
- OpenGIS - Geography Markup Language (ファイル)
- ※OpenGIS: 地理情報システム(GIS)関連技術の標準化を推進する業界団体の決めた規格。
- Oracle - Oracle (DB接続)
- Pivotal - Povotal Greenplum (DB接続)
- PostgreSQL - PostgreSQL (DB接続)
- Qlik - QlikView data eXchange (ツール)
- Salesforce.com - Salesforce (ツール)
- SAP - Sybase Adaptive Server Enterprise (DB接続)
- SAP - Sybase SQL Anywhere (DB接続)
- SAS - SAS (ファイル)
- ※SAS: Statistical Analysis System(統計分析システム)。様々な統計分析に利用されているソフト。
- SQLite - SQLite (DB接続)
- SRC Geography - SRC地理情報抽出
- Tableau - Tableau Data 抽出 (ファイル)
- ※Tableau接続データソースを圧縮して接続可能としたファイルデータ形式。
- Teradata - Teradata (DB接続)
- Teradata - Teradata Aster (DB接続)
- Twitter - Twitter (マクロ)
- Twitter - Twitter Gnip (マクロ)
- ※Gnip: ソーシャルデータの分析と販売を行う会社。
- XML - XML (ファイル)
Alteryx 対応レポートフォーマット一覧
Alteryxはレポート(帳票)についても様々なフォーマットに対応しています。以下がその対応フォーマットの一覧です。
- PNG
- HTML
- PCXML
- RTF(Rich Text Format)
- DOC/DOCX
- XLS/XLSX
- PPT/PPTX
Alteryx 実行可能タスク(ツール)一覧 / 全197種
そしてここからがAlteryxで実行可能なタスク(=ツール)となります。Alteryxではテーマ毎にツールが分類されています。
In/Out (入出力)
- Browse
- モジュール内の指定のデータ内容を表示。( 詳細:Browse Tool )
- Date Time Now
- 現在時間を返します。レポートの出力時間を表示する際等に便利です。( 詳細:Macro: Date Time Now )
- Directory
- 所定ディレクトリのファイル一覧を返します。( 詳細:Directory )
- Input Data
- 分析に使われるデータソース各種を入力ファイルとして指定します。DB等もここから指定。( 詳細:Input Data Tool )
- Map Input
- 地図情報を入力ファイルとして指定。( 詳細:MapInput )
- Output Data
- 分析に使うデータソース各種を出力ファイルとして指定します。( 詳細:Output Data tool )
- Text Input
- ユーザーがその場で入力可能なテキストボックスを用意します。 ( 詳細:Text Input Tool )
Preparation (準備)
- Auto Field
- 入力値全てのレコードを読み取り、列内に含まれるデータを元に、適切な最小のサイズのフィールドタイプを設定します。 ( 詳細:オートフィールドツール )
- Date Filter
- カレンダーベースのインタフェースを使用し、データを日付でフィルタリングします。 ( 詳細:DateFilterMacro )
- Filter
- データを任意の設定でフィルタリングします。 ( 詳細:Filter Tool )
- Fomula
- 式やデータから新しいデータフィールドを作成したり、既存フィールドを更新したりします。( 詳細:Formula Tool )
- Generate Rows
- 新しいデータ行を生成します。数字やトランザクション、日付のシーケンスを作成するのに役立ちます。( 詳細:Generate Rows Tool )
- Imputation
- 任意の数値データを別の値で置き換えます。( 詳細:Impute Values )
- Multi-Field Binning
- 予測ツールで用いるような、ビニングの為の数値フィールドを受け入れます。( 詳細:MultiFieldBinning )
- ビニングとは:ビニング関数
- Multi-Field Fomula
- 復数のフィールドに対する単一関数の実行をサポートします。( 詳細:Multi Field Formula Tool )
- Multi-Row Fomula
- 複数行に渡る数式ツール。複数行のデータを任意のルールや式で集計し、値を作成します。 ( 詳細:Multi Row Formula Tool )
- Random % Sample
- 入力データからサンプリングを行い、指定の数のレコードを返します。 ( 詳細:Macro: Random Records )
- Record ID
- レコードに対して一意となるID値を割り当てます。( 詳細:Record ID Tools )
- Sample
- 入力データからレコードの特定部分を抽出します。 ( 詳細:Sample Tool )
- Select
- ファイル内のフィールドソート、リネーム、フィールドタイプ変更等が行える多機能ユーティリティツール。( 詳細:Select Tool )
- Select Records
- ユーザーが選択したレコードを参照します。( 詳細:Macro:SelectRecords )
- Sort
- 指定フィールドの値をアルファベット順にソートします。( 詳細:Sort Tool )
- Tile
- データ内の範囲に基づいて値(タイル)を割り当てます。 ( 詳細:Tile tool )
- Unique
- 指定フィールドで並べ替えをした際に、重複した(後続の)値を排除した一意の値の一覧と重複した値の一覧を返します。( 詳細:Unique Tool )
Join (結合)
- Append Fields
- レコードにフィールドを追加します。( 詳細: Append Fields Tool)
- Find Replace
- 入力値から値を検索し、置き換えます。( 詳細:Find Replace Tool )
- Fuzzy Match
- 曖昧検索を行います。※ラテン文字セットのみ有効です。( 詳細:Fuzzy Match Tool )
- Join
- SQLでのテーブル結合の様に、2つの入力テーブルを結合します。( 詳細:Join Tool )
- Join Multiple
- 2つ以上のテーブルを結合します。( 詳細:Join Multiple Tool )
- Make Group
- データの関連性に基づいて、グループを作成します。( 詳細:Make Group Tool )
- Union
- 任意のストリームに復数のストリームを追加します。( 詳細:Union Tool )
Parse (解析)
- DateTime
- データを任意の日付時刻フォーマットに変換します。( 詳細:Date Time Tool )
- RegEx
- 正規表現ルールでデータをパースします。( 詳細:Reg Ex Tools )
- Text To Columns
- 区切り文字に基づいて列を分割し、復数の行または列として出力します。( 詳細:Text To Columns Tool )
- XML Parse
- XMLを読み込み、個々のフィールドとしてパースします。( 詳細:XML Parse Tool )
Transform (変換)
- Arrange
- データフィールドを任意のルールで並べ替えたり行列入れ替え等を行い、目的とする表示形式に変換します。( 詳細:Arrange Tool )
- Count Records
- レコード数を返します。( 詳細:Macro: Count Records )
- Cross Tab
- 列→行の変換を行います。( 翻訳:Cross Tab Tool )
- Running Total
- レコードごとに数値フィールド上の累積和を計算します。( 詳細:Running Total Tool )
- Summarize
- 集計を行います。グルーピング、合計、カウント、地理情報処理、文字列結合、等など。( 詳細:Summarize Tool )
- Transpose
- 行→列変換を行います。( 詳細:Transpose Tool )
- Weighted Average
- 入力データフィールドの加重平均を計算します。( 詳細:Macro: Weighted Average )
Reporting (帳票)
- Charting
- データを様々な形式でチャート表示します。( 詳細: Charting Tool )
- レコードごとに電子メールを送信するデータストリームを使用することができます。( 詳細:Email )
- Image
- 帳票に画像を追加することができます。( 詳細:Image Tool )
- Layout
- レポートのレイアウト調整を行う事が出来ます。( 詳細:Layout Tool )
- Map Legend Builder
- データから地図イメージの凡例(legend)を作成します。( 詳細:Legend Builder )
- Map Legend Splitter
- 凡例からデータを作成します。( 詳細:Legend Splitter )
- Overlay
- レポートに用いる要素(画像、文字、地図等)をオーバーレイ表示させる事が出来ます。( 詳細:Overlay Tool )
- Render
- 帳票内容を様々な形式で出力します。( 詳細:Render Tool )
- Report Footer
- レポートにフッターを配置します。( 詳細:ReportFooter )
- Report Header
- レポートにヘッダーを配置します。( 詳細:ReportHeader )
- Report Map
- 地図イメージを作成します。( 詳細:Map Tool )
- Report Text
- レポートやドキュメントにテキストを追加します。( 詳細:Text Tool )
- Table
- データからテーブルを作成する事が出来ます。( 詳細:Table Tool )
Documentation (文書)
- Comment
- 注釈を追加します。( 詳細:Text Comment )
- Explorer Box
- Webページやファイルのパスを入力し、その内容を表示します。( 詳細:Explorer Box Tool )
- Total Container
- モジュール内のツールを整理します。( 詳細:Tool Container )
Spatial (空間情報)
- Buffer
- ポリゴン(Polygon)やポリライン(Polyline)、空間オブジェクトを取得し、ユーザーが指定した値によってその内容を拡張または縮小させます。( 詳細:Buffer Tool )
- Create Points
- 緯度経度情報を指定する事で、ポイント(Point)型の空間情報オブジェクトを作成します。( 詳細:Create Points Tool )
- Distance
- 指定要素間の距離を算出します。( 詳細:Distance )
- Find Nearest
- 指定要素間の最短距離を特定します。( 詳細:Find Nearest Tool )
- Generalize
- ポリゴンやポリラインの粒度をよりシンプルにし、構成しているノード数を減少させます。( 詳細:Generalize Tool )
- Heat Map
- ヒートマップのポリゴンを作成します。( 詳細:Macro: Heat Map )
- Make Grid
- 指定された空間オブジェクト(ポイント又はポリゴン)に基づいてグリッドを作成します。( 詳細:Make Grid Tool )
- Poly-Build
- 空間オブジェクト(ポイント)から指定の順番で構成されるポリゴン(Polygon)やポリライン(Polyline)を作成します。( 詳細:Poly Build Tool )
- Poly-Split
- 取得したポリゴンやポリラインオブジェクトを点や線等のオブジェクトに分解します。( 詳細:Poly Split Tool )
- Smooth
- オブジェクトを構成する線に沿ってノードを追加する事により、ポリゴン(Polygon)やポリライン(Polyline)を滑らか加工します。("B-spline"という平準化アルゴリズムを利用)( 詳細:Smooth Tool )
- Spatial Info
- 空間オブジェクトに関するテーブル形式の情報を抽出します。( 詳細:Spatial Info Tool )
- Spatial Match
- 2つの空間オブジェクトのセット間関連(含む、交差する、接触している)を判断します。( 詳細:Spatial Match Tool )
- Spatial Process
- 高レベルな空間オブジェクトの編集を行います。( 詳細:Spatial Process Tool )
- Trade Area
- 入力ファイルで指定されたポイントオブジェクトの周りの領域を作成します。( 詳細:Trade Area Tool )
Interface (インタフェース)
- Action
- インタフェースからの質問に対する回答(値)により、モジュールの構成を更新します。( 詳細:Action Tool )
- Check Box
- チェックボックスオプションを表示します。( 詳細:CheckBoxGroup )
- Condition
- ユーザーが選択した状態・条件を判定します。true/falseいずれかの値が返ります。( 詳細:Condition )
- Control Parameter
- 全てのバッチマクロに対する入力パラメータの役目を果たします。( 詳細:ControlParameter )
- Date
- 日付情報を指定する為のカレンダーツールを表示します。( 詳細:Date )
- Drop Down
- ドロップダウンを表示します。( 詳細:DropDown )
- Error Message
- ユーザーの操作やマクロの挙動に対し、エラーメッセージを表示します。( 詳細:Error )
- File Browse
- ファイル参照を行うツールを表示します。( 詳細:FileBrowse )
- List Box
- リストボックスを表示します。( 詳細:ListBox )
- Macro Input
- マクロの入力パラメータを表示する為に使います。( 詳細:MacroInput )
- Macro Output
- マクロツールに出力の矢印を表示する為に使います。( 詳細:MacroOutput )
- Map
- アプリ/マクロでマップオブジェクトを描画/選択するための地図を表示します。( 詳細:Map )
- Numeric Up Down
- 数値コントロール(上向き(▲)/下向きの(▼)矢印で数値情報を操作)を表示します。( 詳細:NumericUpDown )
- Radio Button
- ラジオボタンを表示します。( 詳細:RadioButtonGroup )
- Text Box
- テキストボックスを表示します。( 詳細:TextBox )
- Tree
- アプリまたはマクロで編成されている階層データ構造を表示します。( 詳細:Tree )
Data Investigation (データ調査)
- Association Analysis ※要:R toolインストール
- アソシエーション分析を行います。( 詳細:Association Analysis )
- 参考:商品分析の手法|分析力をコアとするマーケティングソリューションカンパニー・株式会社ALBERT(アルベルト)
- 参考:アソシエーション分析(1)
- Contigency Table ※要:R toolインストール
- 『カイ二乗検定』と呼ばれる統計学的検定法で用いられるコンティンジェンシー(相関表)を出力します。( 詳細:ContingencyMacro )
- 参考:カイ二乗検定 - 大人になってからの再学習
- Create Samples
- 入力値を2つまたは3つのランダムなサンプルに分割します。( 詳細:Create Samples )
- Distribution Analysis ※要:R toolインストール
- 分布解析ツール。適合度(goodness of fit)の検定を行います。( 詳細:Distribution Analysis )
- 参考:適合度の検定とは - 統計学用語 Weblio辞書
- Field Summary
- 選択したデータフィールドの統計ユーザーサマリーレポートを提供します。( 詳細:Field Summary Report )
- Frequency Table
- ユーザーによって選択されたフィールド毎に分割表(frequency table)を作成します。( 詳細:Frequency Macro )
- Heat Plot ※要:R toolインストール
- ヒートマップを作成します。( 詳細:Heat Plot )
- Histogram ※要:R toolインストール
- ヒストグラムを作成します。( 詳細:Histogram )
- Oversample Field
- クラス分類を行う上で、クラスに属するサンプル数に偏りがある場合、正例(興味のあるクラス)を人工的に作成する(=オーバーサンプリング)際に用います。( 詳細:Oversample Field )
- 参考:不均衡データのクラス分類
- 参考:サンプリングについてのひとつのお話 - 社会学者の研究メモ
- Pearson Correlation
- ピアソン積率相関係数(2 つの確率変数の間の相関(類似性の度合い)を示す統計学的指標)に関するツールです。( 詳細:PearsonCorrelation )
- ピアソンの積率相関係数とは - 統計学用語 Weblio辞書
- Plot of Means ※要:R toolインストール
- ( 詳細:Plot_of_Means )
- Scatterplot ※要:R toolインストール
- 散布図を生成します。( 詳細:Scatterplot )
- Spearman Correlation
- 『スピアマンの順位相関係数』に関するツールです。( 詳細:Macro:Spearman Correalation Coefficient )
- 参考:スピアマンの順位相関係数 - Wikipedia
- Violin Plot ※要:R toolインストール
- バイオリンプロットを作成します。( 詳細:Violin Plot )
- 参考:ヴァイオリンプロット | 四分位点やデータの分布密度などが確認できる
- 参考:日々の気になる出来事: 可視化の金字塔[ヴァイオリンプロット]をRで描くのを流行らせたい
Predictive (予測)
- AB Analysis ※要:R toolインストール
- 同じ尺度を前年期間、もしくは指定の期間にわたってパフォーマンス測定を行い、性能指標の変化率を比較します。デフォルトでは『ウェルチのt検定』というものが使われる様です。( 詳細:AB Analysis )
- 参考:ウェルチのt検定 - Wikipedia
- 参考:等分散検定から t検定・分散分析(ANOVA)・ウェルチ(Welch)検定への問題点 - Yahoo!知恵袋
- AB Controls ※要:R toolインストール
- 『AB分析』( 詳細:AB Controls )
- AB Treatment ※要:R toolインストール
- ( 詳細:AB Treatment )
- AB Trend ※要:R toolインストール
- ( 詳細:AB Trend )
- Boosted Model ※要:R toolインストール
- Friedmanの勾配ブースディング (gradient boosting) に基づく一般化ブースト回帰モデルを提供します。( 詳細:Boosted Model )
- 参考:ブースティング - Wikipedia
- 参考:バッギング、ランダムフォレスト、ブースティング - iAnalysis ~おとうさんの解析日記~
- Count Regression ※要:R toolインストール
- ポアソン回帰分析(Poisson regression analysis)や負の二項分布 (negative binomial distribution)で用いるカウントデータの回帰モデルを提供します。( 詳細:Count Regression )
- 参考:統計学入門-第15章
- 参考:負の二項分布 - Wikipedia
- Decision Tree ※要:R toolインストール
- 決定木と呼ばれる、予測変数を呼ばれる 1 つまたは複数の変数を使用してターゲット変数を予測する統計的手法のクラスを提供します。( 詳細:Decision Tree )
- 参考:決定木 - Wikipedia
- Forest Model ※要:R toolインストール
- 機械学習アルゴリズムの1つであり、識別、回帰、クラスタリングに用いられる『ランダムフォレスト』を提供します。( 詳細:Forest Model )
- 参考:Random forest - Wikipedia
- 参考:機会学習ハッカソン:ランダムフォレスト
- Lift Chart ※要:R toolインストール
- ランダムな推測に対するマイニング モデルによる改善をグラフィカルに表示し、リフト スコアの観点で変化を測定する『Lift Chart』を提供します。( 詳細:Lift Chart )
- 参考:リフト チャート (Analysis Services - データ マイニング)
- Linear Regression ※要:R toolインストール
- 線形回帰ツールの機能を提供します。( 詳細:Linear Regression )
- 参考:線形回帰 - Wikipedia
- Logistic Regression ※要:R toolインストール
- ロジスティック回帰ツールの機能を提供します。( 詳細:Logistic Regression )
- 参考:ロジスティック回帰 - Wikipedia
- MB Inspect ※要:R toolインストール
- MB Rulesツールの入力規則やアイテムセットの出力を扱い、それらの情報を管理し易い形に減らす為の条件一覧と、規則のフィルタを適用する事が出来る分析機能を提供します。バスケット分析で用います。( 詳細:MB Inspect )
- MB Rules ※要:R toolインストール
- バスケット分析に於けるアソシエーションルールに関する機能を提供します。( 詳細:MB Rules )
- 参考:アソシエーション分析(1)
- 参考:アソシエーション分析(2)
- Naive Bayes Classifier ※要:R toolインストール
- 『単純ベイズ分類器ツール』の機能を提供します。( 詳細:Naive Bayes Classifier )
- 参考:単純ベイズ分類器 - Wikipedia
- 参考:はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
- Nested Hypothesis Test ※要:R toolインストール
- 『入れ子型仮説』に関する機能を提供します。( 詳細:Nested Hypothesis Test )
- 参考:計量経済学 - Wikipedia
- Neural Network ※要:R toolインストール
- ニューラルネットワーク(神経回路網):脳機能に見られるいくつかの特性を計算機上のシミュレーションによって表現することを目指した数学モデルを提供します。( 詳細:Neural Network )
- 参考:ニューラルネットワーク - Wikipedia
- Score ※要:R toolインストール
- ( 詳細:Score )
- Spline Model ※要:R toolインストール
- MARS (Multivariate Adaptive Regression Splines):正確で理解しやすい回帰モデルの開発・展開ツールの機能を提供します。( 詳細:Spline Model )
- 参考:HULINKS | MARS
- 参考:Multivariate adaptive regression splines - Wikipedia, the free encyclopedia
- Stepwise Regression ※要:R toolインストール
- ステップワイズ法に関する機能を提供します。( 詳細:Stepwise Regression )
- 参考:ゆりゆり SPSSによる重回帰分析[ステップワイズ法]
- 参考:SPSSで重回帰分析を行う
- Support Vector Machine ※要:R toolインストール
- サポートベクターマシン(英: support vector machine、SVM):教師あり学習を用いるパターン認識モデルの一つであり、識別や回帰分析へ適用できる機能を提供します。( 詳細:Support Vector Machine )
- 参考:サポートベクターマシン - Wikipedia
- Test of Means ※要:R toolインストール
- ( 詳細:Test of Means )
Time Series (時系列)
- ARIMA※要:R toolインストール
- 統計学に於いて時系列データに適用されるモデルの『自己回帰移動平均モデル(ARIMAモデル)』に関する機能を提供します。( 詳細:ARIMA )
- 参考:自己回帰移動平均モデル - Wikipedia
- 参考:Rで計量時系列分析:AR, MA, ARMA, ARIMAモデル, 予測 - 銀座で働くデータサイエンティストのブログ
- ETS ※要:R toolインストール
- 時系列予測に於ける予測指数平滑法(ETS)に関する機能を提供します。( 詳細:ETS )
- 参考:予測 - ETS + STL | Azure
- 参考:予測指数平滑法 | Azure
- 参考:指数平滑法による予測ツールの作成 with Excel
- TS Compare ※要:R toolインストール
- ETSもしくはARIMAで作成された時系列モデルの内容を比較します。( 詳細:TS Compare )
- TS Covariate Forecast ※要:R toolインストール
- ユーザーが指定した将来に於ける期間の予測を行います。(※ARIMAモデルにて)( 詳細:TS Covariate Forecast )
- TS Filler
- 時系列データの任意のギャップを『埋める』機能を提供します。( 詳細:TS Filler )
- TS Forecast ※要:R toolインストール
- ARIMA又はETSモデルに於いて将来の期間の数を指定し、予測を行います。( 詳細:TS Forecast )
- TS Plot ※要:R toolインストール
- 時系列データのプロットを提供します。( 詳細:TS Plot )
Predictive Grouping (予測グループ)
- Append Cluster ※要:R toolインストール
- K重心法クラスタ分析ツールからのクラスタの割り当てをデータストリームに追加します。( 詳細:Append Cluster )
- Find Nearest Neighbors ※要:R toolインストール
- K近傍法(k-nearest neighbor)に関する機能を提供します。( 詳細:Find Nearest Neighbors )
- 参考:k近傍法 - Wikipedia
- K-Centroids Cluster Analysis ※要:R toolインストール
- 重心法によるクラスタリング分析(各クラスタの重心(平均)を求めて、重心間の距離をクラスターの距離とする)の機能を提供します。平均法(k-means)、メジアン法(k-medians)、ニューラルガス(Neural Gas)に関する分析が行える様です。( 詳細:K-Centroids Cluster Analysis )
- 参考:クラスタリング手法 - sappari wiki
- 参考:Furukawa Laboratory - ニューラルガス(NG:Neural Gas)とは
- K-Centroids Diagnostics ※要:R toolインストール
- このツールを使い、与えられたデータと選択したクラスタリング アルゴリズムを指定する事で、ユーザーはクラスタの適切な数の評価が出来るようになります。( 詳細:K-Centroids Diagnostics )
- Principal Components ※要:R toolインストール
- データベースのディメンション(数値フィールドの数)を減少させる事が出来ます。( 詳細:Principal Components )
Connectors (コネクタ)
- Amazon S3 Download
- Amazon S3に格納されたデータを取得します。( 詳細:Amazon S3 Download )
- Amazon S3 Upload
- Amazon S3へデータを格納します。( 詳細:Amazon S3 Upload )
- Download
- 任意のURLからデータを取得し、ファイルとして保存します。( 詳細:Download )
- Google Analytics
- Google Analyticsによって収集されたデータから派生した統計情報を返します。( 詳細:Google Analytics )
- HDFS Input
- Hadoop分散ファイルシステムからデータを読み取ります。( 詳細:HDFS Input )
- HDFS Output
- Hadoop分散ファイルシステムへデータを書き出します。( 詳細:HDFS Output )
- Marketo Append
- Marketo(マーケティングオートメーションプラットフォーム)のレコードを収集し、着信データストリームへデータを追加します。( 詳細:Marketo Append )
- 参考:マーケティングオートメーションプラットフォーム | マルケト
- Marketo Input
- 指定した日付範囲のMarketoレコードを読み取ります。( 詳細:Marketo Input )
- Marketo Output
- Marketo API関数を呼び出す事で、Marketoへのデータ出力を行います。( 詳細:Marketo Output )
- Mongo DB Input
- MongoDBのデータを読み取ります。( 詳細:Mongo DB Input )
- Mongo DB Output
- MongoDBへデータを書き込みます。( 詳細:Mongo DB Output )
- Salesforce Input
- Salesforce.comからのテーブルデータを取得します。( 詳細:Salesforce Input )
- Salesforce Output
- AlteryxからSalesforce.comへのデータを書き込みます。( 詳細:Salesforce Output )
- SharePoint Input
- モジュール内のデータの入力として、Sharepointからリストを読み取ります。( 詳細:SharePoint Input )
- SharePoint Output
- SharePointリストにデータ情報を書き込みます。( 詳細:SharePoint Output )
Address (住所)
- CASS
- 入力としてアドレスファイルを受け取り、チェックを行います。USPS(United States Postal Service)のCoding Accuracy Support System(=CASS)のチェックを行います。(※って事は米国国内のみで利用可能な機能?別途ライブラリも必要そうです)( 詳細:CASS )
- Parse Address
- 住所情報をストリート名や番地、方向などの細かい情報に分割します。(※米国国内のみで利用可能な機能?)( 詳細:Parse Address )
- Street Geocoder
- 特定の場所を地理的座標に関連付けます。(※米国国内のみで利用可能な機能?)( 詳細:Street Geocoder )
- US ZIP9 Coder
- 5,7,9桁の郵便番号情報の座標(緯度・経度)を決定します。(※米国国内のみで利用可能な機能?)( 詳細:US ZIP + 4 Coder )
Demographic Analysis (人口分析)
- Allocate Apend
- 既存の内容に人口統計学のフィールドを追加出来ます。( 詳細:Allocate Apend )
- Allocate Input
- ユーザーのシステムにインストールされた割り当てデータセットから地域とデータ変数をユーザーが選択する事が出来ます。( 詳細:Allocate Input )
- Allocate MetaInfo
- インストールした割り当てデータセットに関する関連情報を返します。( 詳細:Allocate MetaInfo )
- Allocate Report
- 割り当てに関連付けられたレポートを作成できます。( 詳細:Allocate Report )
Behavior Analysis (動作分析)
- Behavior MetaInfo
- 動作解析データセットについての関連情報を返します。( 詳細:Behavior MetaInfo )
- Cluster Code
- ブロックグループキーの様に、クラスターレベルIDを使ってクラスタコードフィールドをレコードのストリームに追加します。 ( 詳細:Cluster Code )
- Compare Behavior
- 2つのプロファイルセットを比較して分析します。( 詳細:Compare Behavior )
- Create Profile
- データストリームの内容から、動作プロファイルを構築します。( 詳細:Create Profile )
- Detail Fields
- 特定のクラスタまたはグループレベルでの詳細なフィールドの情報を返します。 ( 詳細:Detail Fields )
- Profile Input
- モジュール内で入力として使うためのプロファイルセットとして知られている任意のデータセットのタイプを選択する事が出来ます。( 詳細:Profile Input )
- Profile Output
- プロファイルまたはプロファイルのコレクションを含む着信データストリームを取得し、プロファイル設定の*.scdファイルを書き込みます。( 詳細:Profile Output )
Calgary(Calgary Database)
(Calgary Databaseってこのエントリで始めて存在を知った訳なのですが、これは一体何でしょう?Oracle/MySQL/PostgreSQLのような感じの製品なのでしょうか。以下に詳細な解説をしてそうなエントリがあったのでリンクを貼っときます...)
- Calgary Input
- Calgary Databaseを照会する事が出来ます。( 詳細:Calgary Input )
- Calgary Join
- カルガリー データベースに対する結合を実行する能力を持つユーザーを提供します。( 詳細:Calgary Join )
- Calgary Loader
- あらゆる種類の入力ファイルからCalgary Database(*.cydb)を作成出来ます。( 詳細:Calgary Loader )
- Calgary Cross Count
- レコードグループ毎のカウントを返す為に複数のCalgary Databaseフィールドを跨いでデータを集計出来ます。( 詳細:Calgary Cross Count )
- Calgary Cross Count Append
- 入力ファイルを取り、Calgary Databaseに参加しているレコードにカウントを追加する能力を提供します。( 詳細:Calgary Cross Count Append )
Developer (開発者向け)
- API Output
- (特に設定無し。詳細な情報はAPI Helpをご参照ください。)( 詳細:API Output )
- Base64 Encoder
- 指定の文字列フィールドに対するBase64エンコードを行います。( 詳細:Base64 Encoder )
- Block Until Done
- 最後のレコードが到着するまで、ダウンストリーム処理を停止します。( 詳細:Block Until Done )
- Detour
- 開発者がユーザーにプロセスをバイパスする事を求める事が出来ます。分析アプリまたはマクロモジュールを構築するのに役立ちます。( 詳細:Detour )
- Detour End
- 分析アプリケーション及びマクロモジュールの更なる分析のために用意された単一のストリームにプロセスを統一します。( 詳細:Detour End )
- Dynamic Input
- 実行時にデータベースからユーザーが読み取る内容を動的に選択出来ます。( 詳細:Dynamic Input )
- Dynamic Rename
- 様々なメソッドを使用して即座に任意または全てのフィールドの名前を変更する事が出来ます。また、実行時に動的にor未知のフィールドの名前を変更する事が出来ます。( 詳細:Dynamic Rename )
- Dynamic Replace
- 一連の条件に基いてフィールドのデータ値を置き換える事が出来ます。( 詳細:Dynamic Replace )
- Dynamic Select
- フィールドの型または数式を介してフィールドを選択した状態(または選択解除)にします。( 詳細:Dynamic Select )
- Field Info
- 表形式で表示するユーザー、フィールドの順序と同様に、データ ストリーム内のフィールドの名前 フィールドの型とフィールド サイズ等を表示する事が出来ます。( 詳細:Field Info )
- JSON Parse
- JSONテキストファイルをダウンストリーム処理の目的の為にテーブルスキーマに分割します。( 詳細:JSON Parse )
- Message
- 出力ウインドウに、特定のプロセスに関するメッセージをレポートさせる事が出来ます。( 詳細:Message )
- R
- 基本的な統計、及び予測分析に使用するRの機能を提供します。( 詳細:R )
- Run Command
- Alteryx内部で、外部コマンドプログラムを実行する事が出来ます。( 詳細:Run Command )
- Test
- あるデータやプロセスに関しての仮定のテストに役立ちます。ユーザーが指定した条件を満たさない場合、エラーをスローします。( 詳細:Test )
Social Media (ソーシャルメディア)
- DataSift Connector
- 世界有数のソーシャルネットワーク上にある公共の数十億規模のやり取りから気付き・洞察を集計、フィルタ、抽出するためのDataSiftのデータプラットフォームと対話することが出来ます。( 詳細:DataSift Connector )
- 参考:DataSift | Human Data Intelligence
- Foursquare Search
- 返されたデータを強化する為の複数のオプションを使い、場所によるFourSquare会場APIでの検索を行う事が出来ます。( 詳細:Foursquare Search )
- 参考:foursquare APIでできること #4sqdevjp - Qiita
- Gnip Search
- クエリを複数の構成オプションのGip検索APIからデータをダウンロード出来ます。 ※Gnip:ソーシャルメディアAPIアグリゲーションを提供する企業。( 詳細:Gnip Search )
- 参考:The Source for Social Data - Gnip
- 参考:Gnipに学ぶソーシャルデータ分析市場のエコシステム―Social Big Data Conference Tokyo 2014 | IT Leaders
- Twitter Search
- 指定のフレーズでTwitter検索を行う事が出来ます。( 詳細:Twitter Search )
Labolatory (研究室)
- Blob Convert
- バイナリラージオブジェクトをBlobに、またはその逆の変換を行います。( 詳細:Blob Convert )
- Blob Input
- ファイルの直接参照、または読み込むファイルのリストを渡す事により、イメージやメディアファイル等のバイナリラージオブジェクトを読み取ります。( 詳細:Blob Input )
- Blob Output
- レコード内容をそれぞれ別のファイルに書き出します。( 詳細:Blob Output )
- JSON Build
- JSON解析ツールのテーブルスキーマを扱い、JSONオブジェクトを生成します。( 詳細:JSON Build )
- Make Columns
- 複数の列にレコードをラップする事によって行データを取得し、整理します。( 詳細:Make Columns )
- Throttle
- このツールを介してレコードを数を制限する事により、下流(で用いる)ツールの処理速度(負荷?)を緩めます。( 詳細:Throttle )
まとめ
以上、Alteryxで利用可能な『ツール』のご紹介でした。これだけレパートリーがあるとどれから学ぶべきか悩んでしまいますが、実際業務等で使う部分から着手して徐々に守備範囲を広げてマスターして行きたいですね。AWSとの連携も勿論可能ですし、Tableauとの連携も先日のブログエントリでご紹介した通りです。AWS x Tableau x Alteryxの組み合わせで分析作業を加速させて行きましょう!こちらからは以上です。
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。