Alteryxで何が出来るのか – 実行可能タスク全197種 概要紹介&リファレンスまとめ #alteryx

2015.02.03

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

当エントリの最新アップデート版まとめエントリを以下で展開しています。 - Alteryx v11.7 実行可能全タスク251種 機能概要&ブログエントリ総まとめ #alteryx | Developers.IO

データブレンディング及び分析機能を有する『Alteryx』は昨年末から弊社でもパートナーシップ締結を行い、諸案件でも積極的に活用を推し進めているプロダクトですが、こちらのツールでは実に様々な処理を行う事が出来ます。

『ツール』と呼ばれる処理アイコンをGUIベースでドラッグアンドドロップし、線で繋ぐ事で処理ワークフローを構築出来、再生ボタンを『ポチっとな』するだけで処理が実行出来るという分かり易さです。実行可能なサンプルも豊富に用意されているので、学習も比較的進めやすいと思います。

alteryx-sample

で、その『ツール』なのですが、現行Alteryx Designerとインストール作業で付随する『R Tool』のインストールで利用出来るようになる数のツール総数は何と197個もあります。ざっと見ていくだけでも結構な労力が掛かりそうです。そこで当エントリでは、『ひとまずAlteryxではどんな事が行えるのか』という観点で全容を把握するべく、カテゴリ別に分類されている『ツール』の一覧をご紹介してみたいと思います(おまけで対応データソース一覧・レポートフォーマット一覧も載せておきました)。各ツールの項目にはドキュメントヘルプの該当ページリンクを併記していますので、リファレンスページとしても御活用頂けますと幸いです。

『ざっくりどんな事が出来るのか』という観点で切り口のため、各ツールの紹介文もざっくり書いてます。また(特に)分析周りのタスクについては関連分野の知識に乏しい事もあり、専門用語の訳等はかなり自信がありません(^^; )『このツールはこういう使い方なのでは』『そもそも用語の書き方間違ってるんじゃない?』と言うような御指摘などありましたら是非頂けますと幸いです。

目次

Alteryx 対応データソース一覧

過去にTableauを紹介した際にも『多種多彩なデータソースに対応しています!』という紹介はしましたが、Alteryxもそれ以上の多彩っぷりを発揮しております。詳細な内容は以下ページを参照。

以下にその一覧を羅列してみたいと思います。実に多岐に亘る種類に対応していますね。ぱっと見馴染みのない形式のものもあると思いますので注釈などを付与しています。

  • Alteryx - Alteryxデータベースファイル(ファイル)
  • Alteryx - Alteryx Calgaryデータベースファイル(ファイル)
  • Alteryx - Spatial Zipファイル(ファイル)
  • Alteryx - Webファイル(ファイル)
  • Amazon - Redshift (DB接続)
  • Amazon - S3(ツール)
  • ASCII(ファイル)
  • Apache Hadoop - Apache Avro(ファイル)
  • Apache Hadoop - Hadoop分散ファイルシステム(ツール)
  • Apache Hadoop - Hadoop Hive(DB接続)
  • Autodesk(ファイル)
    • ※Autodesk: CADツール。対象ファイルが.sdf(Spatial data file)との事なので、地理情報絡みのプロダクトに関連したファイルが該当か。
  • Cloudera - Cloudera Impala (DB接続)
  • Cloudera - Hadoop Hive (DB接続)
  • CSV (ファイル)
  • DataSift - DataSift (マクロ)
    • ※DataSift: Twitter分析に特化。
  • dBase - dBase (ファイル)
  • ESRI - Esriファイル Geoデータベース (DB接続)
  • ESRI - Esriパーソナル Geoデータベース (ファイル)
  • ESRI - Esriシェイプファイル (ファイル)
    • ※ベクトル形式の地理情報業界標準フォーマット。Esri 社製品他多くの GIS ソフトウェアで利用が可能。
  • FourSquare - FourSquare (マクロ)
  • GeoJSON - GeoJSON (ファイル)
  • GIS - GIS (ファイル)
  • Google - Google Analytics (マクロ)
  • Google - Google BigQuery (DB接続)
  • Google - Google Earth/Maps (File)
  • Hortonworks - Hadoop Hive (DB接続)
  • HP - HP Vertica (DB接続)
  • IBM - IBM DB2 (DB接続)
  • IBM - IBM Netezza/Pure Data Systems (DB接続)
  • IBM - IBM SPSS (ファイル)
    • ※統計解析ソフトウェア。
  • MapInfo - MapInfo Professional Interchange Format (ファイル)
  • MapInfo - MapInfo Professional Table (ファイル)
    • ※MapInfo: 位置情報活用ソフトウェア。
  • MapR - Hadoop Hive (DB接続)
  • Marketo - Marketo (ツール)
    • ※マーケティング自動化に特化したSaaS。
  • Microsoft - Access (ファイル)
  • Microsoft - EXCEL (ファイル)
  • Microsoft - SharePoint (ツール)
  • Microsoft - SQL Server (DB接続)
  • MongoDB - MongoDB (ツール)
  • OpenGIS - Geography Markup Language (ファイル)
    • ※OpenGIS: 地理情報システム(GIS)関連技術の標準化を推進する業界団体の決めた規格。
  • Oracle - Oracle (DB接続)
  • Pivotal - Povotal Greenplum (DB接続)
  • PostgreSQL - PostgreSQL (DB接続)
  • Qlik - QlikView data eXchange (ツール)
  • Salesforce.com - Salesforce (ツール)
  • SAP - Sybase Adaptive Server Enterprise (DB接続)
  • SAP - Sybase SQL Anywhere (DB接続)
  • SAS - SAS (ファイル)
    • ※SAS: Statistical Analysis System(統計分析システム)。様々な統計分析に利用されているソフト。
  • SQLite - SQLite (DB接続)
  • SRC Geography - SRC地理情報抽出
  • Tableau - Tableau Data 抽出 (ファイル)
    • ※Tableau接続データソースを圧縮して接続可能としたファイルデータ形式。
  • Teradata - Teradata (DB接続)
  • Teradata - Teradata Aster (DB接続)
  • Twitter - Twitter (マクロ)
  • Twitter - Twitter Gnip (マクロ)
    • ※Gnip: ソーシャルデータの分析と販売を行う会社。
  • XML - XML (ファイル)

Alteryx 対応レポートフォーマット一覧

Alteryxはレポート(帳票)についても様々なフォーマットに対応しています。以下がその対応フォーマットの一覧です。

  • PNG
  • HTML
  • PCXML
  • PDF
  • RTF(Rich Text Format)
  • DOC/DOCX
  • XLS/XLSX
  • PPT/PPTX

Alteryx 実行可能タスク(ツール)一覧 / 全197種

そしてここからがAlteryxで実行可能なタスク(=ツール)となります。Alteryxではテーマ毎にツールが分類されています。

In/Out (入出力)

alteryx-tools-input

Browse
モジュール内の指定のデータ内容を表示。( 詳細:Browse Tool )
Date Time Now
現在時間を返します。レポートの出力時間を表示する際等に便利です。( 詳細:Macro: Date Time Now )
Directory
所定ディレクトリのファイル一覧を返します。( 詳細:Directory )
Input Data
分析に使われるデータソース各種を入力ファイルとして指定します。DB等もここから指定。( 詳細:Input Data Tool )
Map Input
地図情報を入力ファイルとして指定。( 詳細:MapInput )
Output Data
分析に使うデータソース各種を出力ファイルとして指定します。( 詳細:Output Data tool )
Text Input
ユーザーがその場で入力可能なテキストボックスを用意します。 ( 詳細:Text Input Tool )

Preparation (準備)

alteryx-tools-preparation-01

alteryx-tools-preparation-02

alteryx-tools-preparation-03

Auto Field
入力値全てのレコードを読み取り、列内に含まれるデータを元に、適切な最小のサイズのフィールドタイプを設定します。 ( 詳細:オートフィールドツール )
Date Filter
カレンダーベースのインタフェースを使用し、データを日付でフィルタリングします。 ( 詳細:DateFilterMacro )
Filter
データを任意の設定でフィルタリングします。 ( 詳細:Filter Tool )
Fomula
式やデータから新しいデータフィールドを作成したり、既存フィールドを更新したりします。( 詳細:Formula Tool )
Generate Rows
新しいデータ行を生成します。数字やトランザクション、日付のシーケンスを作成するのに役立ちます。( 詳細:Generate Rows Tool )
Imputation
任意の数値データを別の値で置き換えます。( 詳細:Impute Values )
Multi-Field Binning
予測ツールで用いるような、ビニングの為の数値フィールドを受け入れます。( 詳細:MultiFieldBinning )
ビニングとは:ビニング関数
Multi-Field Fomula
復数のフィールドに対する単一関数の実行をサポートします。( 詳細:Multi Field Formula Tool )
Multi-Row Fomula
複数行に渡る数式ツール。複数行のデータを任意のルールや式で集計し、値を作成します。 ( 詳細:Multi Row Formula Tool )
Random % Sample
入力データからサンプリングを行い、指定の数のレコードを返します。 ( 詳細:Macro: Random Records )
Record ID
レコードに対して一意となるID値を割り当てます。( 詳細:Record ID Tools )
Sample
入力データからレコードの特定部分を抽出します。 ( 詳細:Sample Tool )
Select
ファイル内のフィールドソート、リネーム、フィールドタイプ変更等が行える多機能ユーティリティツール。( 詳細:Select Tool )
Select Records
ユーザーが選択したレコードを参照します。( 詳細:Macro:SelectRecords )
Sort
指定フィールドの値をアルファベット順にソートします。( 詳細:Sort Tool )
Tile
データ内の範囲に基づいて値(タイル)を割り当てます。 ( 詳細:Tile tool )
Unique
指定フィールドで並べ替えをした際に、重複した(後続の)値を排除した一意の値の一覧と重複した値の一覧を返します。( 詳細:Unique Tool )

Join (結合)

alteryx-tools-join

Append Fields
レコードにフィールドを追加します。( 詳細: Append Fields Tool)
Find Replace
入力値から値を検索し、置き換えます。( 詳細:Find Replace Tool )
Fuzzy Match
曖昧検索を行います。※ラテン文字セットのみ有効です。( 詳細:Fuzzy Match Tool )
Join
SQLでのテーブル結合の様に、2つの入力テーブルを結合します。( 詳細:Join Tool )
Join Multiple
2つ以上のテーブルを結合します。( 詳細:Join Multiple Tool )
Make Group
データの関連性に基づいて、グループを作成します。( 詳細:Make Group Tool )
Union
任意のストリームに復数のストリームを追加します。( 詳細:Union Tool )

Parse (解析)

alteryx-tools-parse

DateTime
データを任意の日付時刻フォーマットに変換します。( 詳細:Date Time Tool )
RegEx
正規表現ルールでデータをパースします。( 詳細:Reg Ex Tools )
Text To Columns
区切り文字に基づいて列を分割し、復数の行または列として出力します。( 詳細:Text To Columns Tool )
XML Parse
XMLを読み込み、個々のフィールドとしてパースします。( 詳細:XML Parse Tool )

Transform (変換)

alteryx-tools-transform

Arrange
データフィールドを任意のルールで並べ替えたり行列入れ替え等を行い、目的とする表示形式に変換します。( 詳細:Arrange Tool )
Count Records
レコード数を返します。( 詳細:Macro: Count Records )
Cross Tab
列→行の変換を行います。( 翻訳:Cross Tab Tool )
Running Total
レコードごとに数値フィールド上の累積和を計算します。( 詳細:Running Total Tool )
Summarize
集計を行います。グルーピング、合計、カウント、地理情報処理、文字列結合、等など。( 詳細:Summarize Tool )
Transpose
行→列変換を行います。( 詳細:Transpose Tool )
Weighted Average
入力データフィールドの加重平均を計算します。( 詳細:Macro: Weighted Average )

Reporting (帳票)

alteryx-tools-reporting-01

alteryx-tools-reporting-02

Charting
データを様々な形式でチャート表示します。( 詳細: Charting Tool )
Email
レコードごとに電子メールを送信するデータストリームを使用することができます。( 詳細:Email )
Image
帳票に画像を追加することができます。( 詳細:Image Tool )
Layout
レポートのレイアウト調整を行う事が出来ます。( 詳細:Layout Tool )
Map Legend Builder
データから地図イメージの凡例(legend)を作成します。( 詳細:Legend Builder )
Map Legend Splitter
凡例からデータを作成します。( 詳細:Legend Splitter )
Overlay
レポートに用いる要素(画像、文字、地図等)をオーバーレイ表示させる事が出来ます。( 詳細:Overlay Tool )
Render
帳票内容を様々な形式で出力します。( 詳細:Render Tool )
Report Footer
レポートにフッターを配置します。( 詳細:ReportFooter )
Report Header
レポートにヘッダーを配置します。( 詳細:ReportHeader )
Report Map
地図イメージを作成します。( 詳細:Map Tool )
Report Text
レポートやドキュメントにテキストを追加します。( 詳細:Text Tool )
Table
データからテーブルを作成する事が出来ます。( 詳細:Table Tool )

Documentation (文書)

alteryx-tools-documentation

Comment
注釈を追加します。( 詳細:Text Comment )
Explorer Box
Webページやファイルのパスを入力し、その内容を表示します。( 詳細:Explorer Box Tool )
Total Container
モジュール内のツールを整理します。( 詳細:Tool Container )

Spatial (空間情報)

alteryx-tools-spatial-01

alteryx-tools-spatial-02

Buffer
ポリゴン(Polygon)やポリライン(Polyline)、空間オブジェクトを取得し、ユーザーが指定した値によってその内容を拡張または縮小させます。( 詳細:Buffer Tool )
Create Points
緯度経度情報を指定する事で、ポイント(Point)型の空間情報オブジェクトを作成します。( 詳細:Create Points Tool )
Distance
指定要素間の距離を算出します。( 詳細:Distance )
Find Nearest
指定要素間の最短距離を特定します。( 詳細:Find Nearest Tool )
Generalize
ポリゴンやポリラインの粒度をよりシンプルにし、構成しているノード数を減少させます。( 詳細:Generalize Tool )
Heat Map
ヒートマップのポリゴンを作成します。( 詳細:Macro: Heat Map )
Make Grid
指定された空間オブジェクト(ポイント又はポリゴン)に基づいてグリッドを作成します。( 詳細:Make Grid Tool )
Poly-Build
空間オブジェクト(ポイント)から指定の順番で構成されるポリゴン(Polygon)やポリライン(Polyline)を作成します。( 詳細:Poly Build Tool )
Poly-Split
取得したポリゴンやポリラインオブジェクトを点や線等のオブジェクトに分解します。( 詳細:Poly Split Tool )
Smooth
オブジェクトを構成する線に沿ってノードを追加する事により、ポリゴン(Polygon)やポリライン(Polyline)を滑らか加工します。("B-spline"という平準化アルゴリズムを利用)( 詳細:Smooth Tool )
Spatial Info
空間オブジェクトに関するテーブル形式の情報を抽出します。( 詳細:Spatial Info Tool )
Spatial Match
2つの空間オブジェクトのセット間関連(含む、交差する、接触している)を判断します。( 詳細:Spatial Match Tool )
Spatial Process
高レベルな空間オブジェクトの編集を行います。( 詳細:Spatial Process Tool )
Trade Area
入力ファイルで指定されたポイントオブジェクトの周りの領域を作成します。( 詳細:Trade Area Tool )

Interface (インタフェース)

alteryx-tools-interface01

alteryx-tools-interface02

alteryx-tools-interface03

Action
インタフェースからの質問に対する回答(値)により、モジュールの構成を更新します。( 詳細:Action Tool )
Check Box
チェックボックスオプションを表示します。( 詳細:CheckBoxGroup )
Condition
ユーザーが選択した状態・条件を判定します。true/falseいずれかの値が返ります。( 詳細:Condition )
Control Parameter
全てのバッチマクロに対する入力パラメータの役目を果たします。( 詳細:ControlParameter )
Date
日付情報を指定する為のカレンダーツールを表示します。( 詳細:Date )
Drop Down
ドロップダウンを表示します。( 詳細:DropDown )
Error Message
ユーザーの操作やマクロの挙動に対し、エラーメッセージを表示します。( 詳細:Error )
File Browse
ファイル参照を行うツールを表示します。( 詳細:FileBrowse )
List Box
リストボックスを表示します。( 詳細:ListBox )
Macro Input
マクロの入力パラメータを表示する為に使います。( 詳細:MacroInput )
Macro Output
マクロツールに出力の矢印を表示する為に使います。( 詳細:MacroOutput )
Map
アプリ/マクロでマップオブジェクトを描画/選択するための地図を表示します。( 詳細:Map )
Numeric Up Down
数値コントロール(上向き(▲)/下向きの(▼)矢印で数値情報を操作)を表示します。( 詳細:NumericUpDown )
Radio Button
ラジオボタンを表示します。( 詳細:RadioButtonGroup )
Text Box
テキストボックスを表示します。( 詳細:TextBox )
Tree
アプリまたはマクロで編成されている階層データ構造を表示します。( 詳細:Tree )

Data Investigation (データ調査)

alteryx-tools-data-investigation01

alteryx-tools-data-investigation02

Association Analysis ※要:R toolインストール
アソシエーション分析を行います。( 詳細:Association Analysis )
参考:商品分析の手法|分析力をコアとするマーケティングソリューションカンパニー・株式会社ALBERT(アルベルト)
参考:アソシエーション分析(1)
Contigency Table ※要:R toolインストール
『カイ二乗検定』と呼ばれる統計学的検定法で用いられるコンティンジェンシー(相関表)を出力します。( 詳細:ContingencyMacro )
参考:カイ二乗検定 - 大人になってからの再学習
Create Samples
入力値を2つまたは3つのランダムなサンプルに分割します。( 詳細:Create Samples )
Distribution Analysis ※要:R toolインストール
分布解析ツール。適合度(goodness of fit)の検定を行います。( 詳細:Distribution Analysis )
参考:適合度の検定とは - 統計学用語 Weblio辞書
Field Summary
選択したデータフィールドの統計ユーザーサマリーレポートを提供します。( 詳細:Field Summary Report )
Frequency Table
ユーザーによって選択されたフィールド毎に分割表(frequency table)を作成します。( 詳細:Frequency Macro )
Heat Plot ※要:R toolインストール
ヒートマップを作成します。( 詳細:Heat Plot )
Histogram ※要:R toolインストール
ヒストグラムを作成します。( 詳細:Histogram )
Oversample Field
クラス分類を行う上で、クラスに属するサンプル数に偏りがある場合、正例(興味のあるクラス)を人工的に作成する(=オーバーサンプリング)際に用います。( 詳細:Oversample Field )
参考:不均衡データのクラス分類
参考:サンプリングについてのひとつのお話 - 社会学者の研究メモ
Pearson Correlation
ピアソン積率相関係数(2 つの確率変数の間の相関(類似性の度合い)を示す統計学的指標)に関するツールです。( 詳細:PearsonCorrelation )
ピアソンの積率相関係数とは - 統計学用語 Weblio辞書
Plot of Means ※要:R toolインストール
( 詳細:Plot_of_Means )
Scatterplot ※要:R toolインストール
散布図を生成します。( 詳細:Scatterplot )
Spearman Correlation
『スピアマンの順位相関係数』に関するツールです。( 詳細:Macro:Spearman Correalation Coefficient )
参考:スピアマンの順位相関係数 - Wikipedia
Violin Plot ※要:R toolインストール
バイオリンプロットを作成します。( 詳細:Violin Plot )
参考:ヴァイオリンプロット | 四分位点やデータの分布密度などが確認できる
参考:日々の気になる出来事: 可視化の金字塔[ヴァイオリンプロット]をRで描くのを流行らせたい

Predictive (予測)

alteryx-tools-predictive01

alteryx-tools-predictive02

alteryx-tools-predictive03

alteryx-tools-predictive04

AB Analysis ※要:R toolインストール
同じ尺度を前年期間、もしくは指定の期間にわたってパフォーマンス測定を行い、性能指標の変化率を比較します。デフォルトでは『ウェルチのt検定』というものが使われる様です。( 詳細:AB Analysis )
参考:ウェルチのt検定 - Wikipedia
参考:等分散検定から t検定・分散分析(ANOVA)・ウェルチ(Welch)検定への問題点 - Yahoo!知恵袋
AB Controls ※要:R toolインストール
『AB分析』( 詳細:AB Controls )
AB Treatment ※要:R toolインストール
( 詳細:AB Treatment )
AB Trend ※要:R toolインストール
( 詳細:AB Trend )
Boosted Model ※要:R toolインストール
Friedmanの勾配ブースディング (gradient boosting) に基づく一般化ブースト回帰モデルを提供します。( 詳細:Boosted Model )
参考:ブースティング - Wikipedia
参考:バッギング、ランダムフォレスト、ブースティング - iAnalysis ~おとうさんの解析日記~
Count Regression ※要:R toolインストール
ポアソン回帰分析(Poisson regression analysis)や負の二項分布 (negative binomial distribution)で用いるカウントデータの回帰モデルを提供します。( 詳細:Count Regression )
参考:統計学入門-第15章
参考:負の二項分布 - Wikipedia
Decision Tree ※要:R toolインストール
決定木と呼ばれる、予測変数を呼ばれる 1 つまたは複数の変数を使用してターゲット変数を予測する統計的手法のクラスを提供します。( 詳細:Decision Tree )
参考:決定木 - Wikipedia
Forest Model ※要:R toolインストール
機械学習アルゴリズムの1つであり、識別、回帰、クラスタリングに用いられる『ランダムフォレスト』を提供します。( 詳細:Forest Model )
参考:Random forest - Wikipedia
参考:機会学習ハッカソン:ランダムフォレスト
Lift Chart ※要:R toolインストール
ランダムな推測に対するマイニング モデルによる改善をグラフィカルに表示し、リフト スコアの観点で変化を測定する『Lift Chart』を提供します。( 詳細:Lift Chart )
参考:リフト チャート (Analysis Services - データ マイニング)
Linear Regression ※要:R toolインストール
線形回帰ツールの機能を提供します。( 詳細:Linear Regression )
参考:線形回帰 - Wikipedia
Logistic Regression ※要:R toolインストール
ロジスティック回帰ツールの機能を提供します。( 詳細:Logistic Regression )
参考:ロジスティック回帰 - Wikipedia
MB Inspect ※要:R toolインストール
MB Rulesツールの入力規則やアイテムセットの出力を扱い、それらの情報を管理し易い形に減らす為の条件一覧と、規則のフィルタを適用する事が出来る分析機能を提供します。バスケット分析で用います。( 詳細:MB Inspect )
MB Rules ※要:R toolインストール
バスケット分析に於けるアソシエーションルールに関する機能を提供します。( 詳細:MB Rules )
参考:アソシエーション分析(1)
参考:アソシエーション分析(2)
Naive Bayes Classifier ※要:R toolインストール
『単純ベイズ分類器ツール』の機能を提供します。( 詳細:Naive Bayes Classifier )
参考:単純ベイズ分類器 - Wikipedia
参考:はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
Nested Hypothesis Test ※要:R toolインストール
『入れ子型仮説』に関する機能を提供します。( 詳細:Nested Hypothesis Test )
参考:計量経済学 - Wikipedia
Neural Network ※要:R toolインストール
ニューラルネットワーク(神経回路網):脳機能に見られるいくつかの特性を計算機上のシミュレーションによって表現することを目指した数学モデルを提供します。( 詳細:Neural Network )
参考:ニューラルネットワーク - Wikipedia
Score ※要:R toolインストール
( 詳細:Score )
Spline Model ※要:R toolインストール
MARS (Multivariate Adaptive Regression Splines):正確で理解しやすい回帰モデルの開発・展開ツールの機能を提供します。( 詳細:Spline Model )
参考:HULINKS | MARS
参考:Multivariate adaptive regression splines - Wikipedia, the free encyclopedia
Stepwise Regression ※要:R toolインストール
ステップワイズ法に関する機能を提供します。( 詳細:Stepwise Regression )
参考:ゆりゆり SPSSによる重回帰分析[ステップワイズ法]
参考:SPSSで重回帰分析を行う
Support Vector Machine ※要:R toolインストール
サポートベクターマシン(英: support vector machine、SVM):教師あり学習を用いるパターン認識モデルの一つであり、識別や回帰分析へ適用できる機能を提供します。( 詳細:Support Vector Machine )
参考:サポートベクターマシン - Wikipedia
Test of Means ※要:R toolインストール
( 詳細:Test of Means )

Time Series (時系列)

alteryx-tools-time-series

ARIMA※要:R toolインストール
統計学に於いて時系列データに適用されるモデルの『自己回帰移動平均モデル(ARIMAモデル)』に関する機能を提供します。( 詳細:ARIMA )
参考:自己回帰移動平均モデル - Wikipedia
参考:Rで計量時系列分析:AR, MA, ARMA, ARIMAモデル, 予測 - 銀座で働くデータサイエンティストのブログ
ETS ※要:R toolインストール
時系列予測に於ける予測指数平滑法(ETS)に関する機能を提供します。( 詳細:ETS )
参考:予測 - ETS + STL | Azure
参考:予測指数平滑法 | Azure
参考:指数平滑法による予測ツールの作成 with Excel
TS Compare ※要:R toolインストール
ETSもしくはARIMAで作成された時系列モデルの内容を比較します。( 詳細:TS Compare )
TS Covariate Forecast ※要:R toolインストール
ユーザーが指定した将来に於ける期間の予測を行います。(※ARIMAモデルにて)( 詳細:TS Covariate Forecast )
TS Filler
時系列データの任意のギャップを『埋める』機能を提供します。( 詳細:TS Filler )
TS Forecast ※要:R toolインストール
ARIMA又はETSモデルに於いて将来の期間の数を指定し、予測を行います。( 詳細:TS Forecast )
TS Plot ※要:R toolインストール
時系列データのプロットを提供します。( 詳細:TS Plot )

Predictive Grouping (予測グループ)

alteryx-tools-predictive-grouping

Append Cluster ※要:R toolインストール
K重心法クラスタ分析ツールからのクラスタの割り当てをデータストリームに追加します。( 詳細:Append Cluster )
Find Nearest Neighbors ※要:R toolインストール
K近傍法(k-nearest neighbor)に関する機能を提供します。( 詳細:Find Nearest Neighbors )
参考:k近傍法 - Wikipedia
K-Centroids Cluster Analysis ※要:R toolインストール
重心法によるクラスタリング分析(各クラスタの重心(平均)を求めて、重心間の距離をクラスターの距離とする)の機能を提供します。平均法(k-means)、メジアン法(k-medians)、ニューラルガス(Neural Gas)に関する分析が行える様です。( 詳細:K-Centroids Cluster Analysis )
参考:クラスタリング手法 - sappari wiki
参考:Furukawa Laboratory - ニューラルガス(NG:Neural Gas)とは
K-Centroids Diagnostics ※要:R toolインストール
このツールを使い、与えられたデータと選択したクラスタリング アルゴリズムを指定する事で、ユーザーはクラスタの適切な数の評価が出来るようになります。( 詳細:K-Centroids Diagnostics )
Principal Components ※要:R toolインストール
データベースのディメンション(数値フィールドの数)を減少させる事が出来ます。( 詳細:Principal Components )

Connectors (コネクタ)

alteryx-tools-connectors01 alteryx-tools-connectors02

alteryx-tools-connectors03

Amazon S3 Download
Amazon S3に格納されたデータを取得します。( 詳細:Amazon S3 Download )
Amazon S3 Upload
Amazon S3へデータを格納します。( 詳細:Amazon S3 Upload )
Download
任意のURLからデータを取得し、ファイルとして保存します。( 詳細:Download )
Google Analytics
Google Analyticsによって収集されたデータから派生した統計情報を返します。( 詳細:Google Analytics )
HDFS Input
Hadoop分散ファイルシステムからデータを読み取ります。( 詳細:HDFS Input )
HDFS Output
Hadoop分散ファイルシステムへデータを書き出します。( 詳細:HDFS Output )
Marketo Append
Marketo(マーケティングオートメーションプラットフォーム)のレコードを収集し、着信データストリームへデータを追加します。( 詳細:Marketo Append )
参考:マーケティングオートメーションプラットフォーム | マルケト
Marketo Input
指定した日付範囲のMarketoレコードを読み取ります。( 詳細:Marketo Input )
Marketo Output
Marketo API関数を呼び出す事で、Marketoへのデータ出力を行います。( 詳細:Marketo Output )
Mongo DB Input
MongoDBのデータを読み取ります。( 詳細:Mongo DB Input )
Mongo DB Output
MongoDBへデータを書き込みます。( 詳細:Mongo DB Output )
Salesforce Input
Salesforce.comからのテーブルデータを取得します。( 詳細:Salesforce Input )
Salesforce Output
AlteryxからSalesforce.comへのデータを書き込みます。( 詳細:Salesforce Output )
SharePoint Input
モジュール内のデータの入力として、Sharepointからリストを読み取ります。( 詳細:SharePoint Input )
SharePoint Output
SharePointリストにデータ情報を書き込みます。( 詳細:SharePoint Output )

Address (住所)

alteryx-tools-address

CASS
入力としてアドレスファイルを受け取り、チェックを行います。USPS(United States Postal Service)のCoding Accuracy Support System(=CASS)のチェックを行います。(※って事は米国国内のみで利用可能な機能?別途ライブラリも必要そうです)( 詳細:CASS )
Parse Address
住所情報をストリート名や番地、方向などの細かい情報に分割します。(※米国国内のみで利用可能な機能?)( 詳細:Parse Address )
Street Geocoder
特定の場所を地理的座標に関連付けます。(※米国国内のみで利用可能な機能?)( 詳細:Street Geocoder )
US ZIP9 Coder
5,7,9桁の郵便番号情報の座標(緯度・経度)を決定します。(※米国国内のみで利用可能な機能?)( 詳細:US ZIP + 4 Coder )

Demographic Analysis (人口分析)

alteryx-tools-demographic-analysis

Allocate Apend
既存の内容に人口統計学のフィールドを追加出来ます。( 詳細:Allocate Apend )
Allocate Input
ユーザーのシステムにインストールされた割り当てデータセットから地域とデータ変数をユーザーが選択する事が出来ます。( 詳細:Allocate Input )
Allocate MetaInfo
インストールした割り当てデータセットに関する関連情報を返します。( 詳細:Allocate MetaInfo )
Allocate Report
割り当てに関連付けられたレポートを作成できます。( 詳細:Allocate Report )

Behavior Analysis (動作分析)

alteryx-tools-behavior-analysis

Behavior MetaInfo
動作解析データセットについての関連情報を返します。( 詳細:Behavior MetaInfo )
Cluster Code
ブロックグループキーの様に、クラスターレベルIDを使ってクラスタコードフィールドをレコードのストリームに追加します。 ( 詳細:Cluster Code )
Compare Behavior
2つのプロファイルセットを比較して分析します。( 詳細:Compare Behavior )
Create Profile
データストリームの内容から、動作プロファイルを構築します。( 詳細:Create Profile )
Detail Fields
特定のクラスタまたはグループレベルでの詳細なフィールドの情報を返します。 ( 詳細:Detail Fields )
Profile Input
モジュール内で入力として使うためのプロファイルセットとして知られている任意のデータセットのタイプを選択する事が出来ます。( 詳細:Profile Input )
Profile Output
プロファイルまたはプロファイルのコレクションを含む着信データストリームを取得し、プロファイル設定の*.scdファイルを書き込みます。( 詳細:Profile Output )

Calgary(Calgary Database)

alteryx-tools-calgary

(Calgary Databaseってこのエントリで始めて存在を知った訳なのですが、これは一体何でしょう?Oracle/MySQL/PostgreSQLのような感じの製品なのでしょうか。以下に詳細な解説をしてそうなエントリがあったのでリンクを貼っときます...)

Calgary Input
Calgary Databaseを照会する事が出来ます。( 詳細:Calgary Input )
Calgary Join
カルガリー データベースに対する結合を実行する能力を持つユーザーを提供します。( 詳細:Calgary Join )
Calgary Loader
あらゆる種類の入力ファイルからCalgary Database(*.cydb)を作成出来ます。( 詳細:Calgary Loader )
Calgary Cross Count
レコードグループ毎のカウントを返す為に複数のCalgary Databaseフィールドを跨いでデータを集計出来ます。( 詳細:Calgary Cross Count )
Calgary Cross Count Append
入力ファイルを取り、Calgary Databaseに参加しているレコードにカウントを追加する能力を提供します。( 詳細:Calgary Cross Count Append )

Developer (開発者向け)

alteryx-tools-developer01 alteryx-tools-developer02

alteryx-tools-developer03

API Output
(特に設定無し。詳細な情報はAPI Helpをご参照ください。)( 詳細:API Output )
Base64 Encoder
指定の文字列フィールドに対するBase64エンコードを行います。( 詳細:Base64 Encoder )
Block Until Done
最後のレコードが到着するまで、ダウンストリーム処理を停止します。( 詳細:Block Until Done )
Detour
開発者がユーザーにプロセスをバイパスする事を求める事が出来ます。分析アプリまたはマクロモジュールを構築するのに役立ちます。( 詳細:Detour )
Detour End
分析アプリケーション及びマクロモジュールの更なる分析のために用意された単一のストリームにプロセスを統一します。( 詳細:Detour End )
Dynamic Input
実行時にデータベースからユーザーが読み取る内容を動的に選択出来ます。( 詳細:Dynamic Input )
Dynamic Rename
様々なメソッドを使用して即座に任意または全てのフィールドの名前を変更する事が出来ます。また、実行時に動的にor未知のフィールドの名前を変更する事が出来ます。( 詳細:Dynamic Rename )
Dynamic Replace
一連の条件に基いてフィールドのデータ値を置き換える事が出来ます。( 詳細:Dynamic Replace )
Dynamic Select
フィールドの型または数式を介してフィールドを選択した状態(または選択解除)にします。( 詳細:Dynamic Select )
Field Info
表形式で表示するユーザー、フィールドの順序と同様に、データ ストリーム内のフィールドの名前 フィールドの型とフィールド サイズ等を表示する事が出来ます。( 詳細:Field Info )
JSON Parse
JSONテキストファイルをダウンストリーム処理の目的の為にテーブルスキーマに分割します。( 詳細:JSON Parse )
Message
出力ウインドウに、特定のプロセスに関するメッセージをレポートさせる事が出来ます。( 詳細:Message )
R
基本的な統計、及び予測分析に使用するRの機能を提供します。( 詳細:R )
Run Command
Alteryx内部で、外部コマンドプログラムを実行する事が出来ます。( 詳細:Run Command )
Test
あるデータやプロセスに関しての仮定のテストに役立ちます。ユーザーが指定した条件を満たさない場合、エラーをスローします。( 詳細:Test )

Social Media (ソーシャルメディア)

alteryx-tools-socialmedia

DataSift Connector
世界有数のソーシャルネットワーク上にある公共の数十億規模のやり取りから気付き・洞察を集計、フィルタ、抽出するためのDataSiftのデータプラットフォームと対話することが出来ます。( 詳細:DataSift Connector )
参考:DataSift | Human Data Intelligence
Foursquare Search
返されたデータを強化する為の複数のオプションを使い、場所によるFourSquare会場APIでの検索を行う事が出来ます。( 詳細:Foursquare Search )
参考:foursquare APIでできること #4sqdevjp - Qiita
Gnip Search
クエリを複数の構成オプションのGip検索APIからデータをダウンロード出来ます。 ※Gnip:ソーシャルメディアAPIアグリゲーションを提供する企業。( 詳細:Gnip Search )
参考:The Source for Social Data - Gnip
参考:Gnipに学ぶソーシャルデータ分析市場のエコシステム―Social Big Data Conference Tokyo 2014 | IT Leaders
Twitter Search
指定のフレーズでTwitter検索を行う事が出来ます。( 詳細:Twitter Search )

Labolatory (研究室)

alteryx-tools-laboratory

Blob Convert
バイナリラージオブジェクトをBlobに、またはその逆の変換を行います。( 詳細:Blob Convert )
Blob Input
ファイルの直接参照、または読み込むファイルのリストを渡す事により、イメージやメディアファイル等のバイナリラージオブジェクトを読み取ります。( 詳細:Blob Input )
Blob Output
レコード内容をそれぞれ別のファイルに書き出します。( 詳細:Blob Output )
JSON Build
JSON解析ツールのテーブルスキーマを扱い、JSONオブジェクトを生成します。( 詳細:JSON Build )
Make Columns
複数の列にレコードをラップする事によって行データを取得し、整理します。( 詳細:Make Columns )
Throttle
このツールを介してレコードを数を制限する事により、下流(で用いる)ツールの処理速度(負荷?)を緩めます。( 詳細:Throttle )

まとめ

以上、Alteryxで利用可能な『ツール』のご紹介でした。これだけレパートリーがあるとどれから学ぶべきか悩んでしまいますが、実際業務等で使う部分から着手して徐々に守備範囲を広げてマスターして行きたいですね。AWSとの連携も勿論可能ですし、Tableauとの連携も先日のブログエントリでご紹介した通りです。AWS x Tableau x Alteryxの組み合わせで分析作業を加速させて行きましょう!こちらからは以上です。

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400

参考情報