Alteryx v11.7:『入出力・DB』関連ツールの機能概要&ブログエントリまとめ #alteryx

2017.12.12

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

Alteryxのワークフローを構成する「ツール」群は、バージョンを追う毎にその種類が増えて来ています。その数250種類(2017年12月末、v11.7現在)。非常に数も多く内容のバリエーションに富んでいる為、全容把握はなかなかに大変です。そこで当エントリでは、その中から「入出力」や「データベース周り」の処理を行うツール群について処理の概要や関連ドキュメント・また関連しているDevelopers.IOのエントリに関する情報についてまとめてみました。

目次

当エントリではデータ加工、ETLにおける処理として、公式ドキュメントで紹介されている「In/Out(入出力)」「In-Database(DB関連)」「Calgary(CalgaryDB)」「Connectors(コネクタ)」について内容を紹介しています。

In/Out(入出力)

各ワークフローには入力と出力が必要となります。In/Out(入出力)では、入力と出力双方のファイルの種類に応じたツール群を提供しています。

アイコン ツール名 用途・用例
Browse (内容確認) 接続されたツールのデータ、データ内のデータプロファイル情報、マップ、レポートのスニペット、および動作解析情報などを表示します。
Date Time Now (現在時刻の取得) ワークフローランタイムの日付と時刻の1つのレコードを返し、その値をユーザーが選択した文字列形式に変換。レポートの日付時間見出しを簡単に追加するのに便利なツールです。
Directory (対象ディレクトリ内のファイルリストを取得) 指定されたディレクトリー内のすべてのファイルのリストを取得。ファイル名とともに、ファイルサイズ、作成日、最終更新日など、各ファイルに関する他の関連情報を得ることが出来ます。
Input Data (入力データ定義) ファイルまたはデータベースに接続することで、ワークフローにデータを取り込む事が出来る。
Map Input (地図情報の入力) ワークフローの入力として使用する目的のマップオブジェクトを描画または選択。参照ベースマップ(TomTomまたはDigitalGlobeなど)を表示しているマップから、ポイント、ライン、またはポリゴンを描画または選択する事が可能。
Output Data (出力データの定義) ワークフローの結果をファイルまたはデータベースに書き込む。出力データツールを使用して、次のサポートされているデータソースに結果を書き込みます。
Text Input (テキスト入力データの定義) 入力用の小さなデータファイルを作成するためにテキストを手動で入力することが出来る。テキスト入力ツールから入力されたデータはワークフローとともに保存されるため、ユーザーはワークフローを他のユーザーと共有することができ、ワークフローを実行するために入力データを必要としません。
XDF Input (XDF形式の入力データ定義) XDF(.xdf)ファイルからデータを読み取る。これは予測分析のスケーリングにMicrosoft R ScaleR関数が使用する形式です。
XDF Output (XDF形式の出力データ定義) AlteryxのデータストリームをXDF(.xdf)ファイルに書き込む。これは予測分析のスケーリングにMicrosoft R ScaleR関数が使用する形式です。

In-Database(DB関連)

データベースへの接続、データのブレンドと表示、および他のデータをデータベース内のワークフローに持ち込み、データをデータベースに直接書き込むためのツールが含まれます。

アイコン ツール名 用途・用例
Browse In-DB (DB内のデータを表示) DB内ワークフローの任意のポイントでデータを表示。
Connect In-DB (DB接続の作成) ワークフロー内でデータベース内の接続を作成。このツールを使用して、新規または既存の接続に接続する事が出来ます。
Data Stream In (ワークフロー→In-DBのデータ連携) Alteryx DesignerからIn-DBワークフローにデータを連携。
Data Stream Out (In-DB→ワークフローのデータ連携) In-DBワークフローからAlteryx Designerにデータをストリーム。
Dynamic Input In-DB (DB接続&クエリ実行) 標準のデータストリームからIn-DB接続名とクエリフィールドを取り込み、In-DBデータストリームに入力。所定のDBに対してクエリを実行出来ます。
Dynamic Output In-DB (In-DBワークフロー情報の出力) In-DBワークフローに関する情報をPredictive In-DBの標準ワークフローに出力。
Filter In-DB (レコードをフィルタリング) SQLなどのデータベースのネイティブ言語を使用して、基本フィルタまたはカスタム式でレコードをフィルタリング。レコードを照会し、指定された基準を満たすレコードを返すには、DB内フィルターツールを使用します。
Formula In-DB (SQL式を使ったデータの作成・更新) SQLなどのデータベースのネイティブ言語を使用して、式を使用してIn-DBデータストリームのフィールドを作成または更新を実施。数式内のDBツールを使用して、式またはデータの関係に基づいてデータベース内のデータを変更することが可能です。
Join In-DB (2つのDB内データを結合) 外部または内部結合を実行して共通フィールドに基づいて2つのDB内データストリームを結合。
Macro Input In-DB (In-DBに対するマクロ入力) マクロにIn-DB入力接続を作成し、それにプレースホルダ値を設定。
Macro Output In-DB (マクロ内でDB内出力接続を作成) マクロ内でDB内出力接続を作成。
Sample In-DB (DBデータのサンプリング) DB内ストリームをレコードの数または割合に制限します。サンプリングされたレコードを指定されたフィールドソート順に基づいて作成するオプションもあり。
Select In-DB (DBデータの選択など) DB内ワークフローのフィールドの選択、選択解除、名前の変更、および並べ替えを実施。
Summarize In-DB (DBデータのサマリ) グループ化、集計、カウント、個別フィールドのカウントなどのデータを集計。(※出力には計算結果のみが含まれる形となります)
Union In-DB (DBデータの統合) 複数のIn-DBデータストリームを、フィールド名またはフィールド位置に基づく類似のデータ構造と統合。出力には、各列に各入力のデータが格納されます。
Write Data In-DB (DBへのデータ書き込み) DB内で直接テーブルを作成または更新を実施。

Calgary(CalgaryDB)

CalgaryDBは数百万のレコードを含む大規模データベースの分析を行うために設計されたリストカウントデータ検索エンジンです。関連する機能群を提供しています。

アイコン ツール名 用途・用例
Calgary Input (Calgary DBへの問い合わせ) Calgary DBへの問い合わせを実施。
Calgary Join (Calgary DBでの結合) 入力ファイルを取得し、Calgaryデータベースに対して結合を実行する機能を提供。
Calgary Loader (入力ファイルからCalgary DB作成) 任意のタイプの入力ファイルからCalgaryデータベース(* .cydb)を作成。
Cross Count (Calgary DBで件数取得) 複数のCalgaryデータベースフィールドにまたがってデータを集約し、レコードグループごとのカウントを取得。
Cross Count Append (Calgary DBにカウント追加) 入力ファイルを取得し、カルガリーデータベースに参加するレコードにカウントを追加する機能をユーザーに提供。

Connectors(コネクタ)

データを取得したり、データをクラウドまたはインターネット/イントラネット環境にプッシュするためのツール群です。

アイコン ツール名 用途・用例
Adobe Analytics アクセス可能なAdobe Analyticsレポートスイートを認証し、Adobe Analytics Reporting APIバージョン1.4を使用して複数のパラメータに基づいてアドホックレポートを生成。
WDC for Tableau Tableau用のAlteryx Webデータコネクタ(WDC)を使用し、分析アプリケーションをTableau(バージョン9.1以降)のデータソースとして使用可能な状態にします。
Amazon S3 Download (Amazon S3データのダウンロード) Amazon S3によってホストされている、クラウドに格納されているデータを取得。
Amazon S3 Upload (Amazon S3データのアップロード) AlteryxからAmazon S3によってホストされているクラウドにデータを転送。
Cognitive Services Text Analytics (Cognitive Services テキスト解析) Cognitive Servicesのテキスト解析APIを使用して、センチメント分析、キーフレーズ抽出、および言語検出を実行。
Download (ダウンロード) 指定されたURLからダウンストリーム処理で使用される、またはファイルに保存されるデータを取得。ダウンロードツールは、FTPとSFTPを介してデータをダウンロードまたはアップロードすることも可能。
Foursquare Search (Foursquare検索) データを拡張するための複数のオプションを備えたFoursquare Venues APIを特定の場所で検索。
Google Analytics GoogleアナリティクスのデータをAlteryxワークフローに直接ダウンロードし、技術者ではないビジネスユーザーがGoogleアナリティクスAPIを利用出来るようにします。
Google Sheets Input (入力データにGoogleスプレッドシートを指定) GoogleスプレッドシートからAlteryxワークフローに直接ダウンロード。
Google Sheets Output (出力先にGoogleスプレッドシートを指定) AlteryxワークフローのデータをGoogleスプレッドシートに公開。
Marketo Append Tool (Marketoデータから対応するレコードを取得) 指定した受信データストリームを使用して、Marketoインスタンスから対応するレコードを取得。
Marketo Input Tool (入力元にMarketoを指定) 特定のパラメータに基づいてMarketoレコードを読み取る。
Marketo Output Tool (出力先にMarketoを指定) Marketo REST APIエンドポイント:Create / Update Leadsを呼び出す。設定で選択したアクションに基づいて、Marketoにデータが出力されます。
MongoDB Input (入力元にMongoDBを指定) MongoDBデータベースに格納されたデータを読み込む。
MongoDB Output (出力先にMongoDBを指定) MongoDBデータベースへのデータの書き込みを行う。
Publish To Power BI (PowerBIへのパブリッシュ) Power BI REST APIを使用して、AlteryxワークフローからPower BI Webアプリケーションにデータテーブルをアップロード。
Publish to Tableau Server (Tableau Serverへのパブリッシュ) Tabletデータソース(.tde)ファイルとして、TabletのインスタンスにAlteryxのデータストリームを公開する機能を提供。
Salesforce Input (入力元にSalesforceを指定) Salesforce.comのテーブルをクエリし、それらをAlteryxに読み込む。
Salesforce Output (出力先にSalesforceを指定) Salesforce.comのテーブルをAlteryxから書き込む。
Salesforce Wave Output (出力先にSalesforce Waveを指定) Wave AnalyticsのデータセットとしてAlteryxワークフローのデータを公開。
SharePoint List Input SharePointからリストを読み込んで、ワークフローのデータ入力として使用。
SharePoint List Output データストリームのコンテンツをSharePointリストに書き込む。
Twitter Search (Twitter検索) 任意のプロパティとして場所を指定し検索条件でツイートを検索。(検索は過去7日間のつぶやきだけを検索可能)

まとめ

という訳で、Alteryxツール 機能概要&関連ブログエントリまとめ『入出力・DB編』のツール群の内容ご紹介でした。当エントリで紹介した内容の他にも以下エントリでテーマ・トピック毎にツール群の紹介をまとめていますので併せてご参照頂けますと幸いです。

参考情報: