Alteryxのデータキャッシュ機能

2020.04.24

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

(English version is here)

はじめに

Alteryx使う際に読み込むデータの容量が多い場合は実行時間が延びます。ワークフローの途中でデータ確認する時にもし実行待ち時間が長くなると ”ワークフローのキャッシュと実行” 機能使うのが便利です。この機能を使うと選択したツールまではデータがキャッシュされ次回の実行時間が早くなります。

方法

ワークフローをAlteryx Designerで開き、データをキャッシュした所のツールに右クリックします。”ワークフローのキャッシュさと実行” を選んだらそのツールまでのデータがキャッシュされます。一度キャッシュ化されたら実行時間が減らせます。

キャッシュされたツールが変化しキャッシュされてないツールが普通に現れます。

元のデータも汲み取る際にキャッシュを削除することも出来ます。

キャッシュ不可なツールもいくつかあります。全てのツールにはキャッシュ機能使えないだが、下流処理で別なツールを選択すればキャッシュ機能が使えます。

(a)二つ以上の出力:出力プラグが二つ以上のツールの場合はデータのキャッシュが出来ない。例えばフィルタツール、結合ツールなど。

(b)巻き込まれたツール:ワークフローの中に巻き込まれたツールがあればそのツールもキャッシュ機能使えません。以下の図で示した通り注目のツールがもし周りのツールで巻き込まれた場合はキャッシュ不可になります。

(c)特例:特別な事例として一部のツールはキャッシュ出来です。例えば:予測 R ベースのツール、Python ツール、Rツール。

終わりに

キャッシュ機能の利用によってワークフローの実行時間を短くすることが出来ます、特にデータの容量が多い際にこの機能が役立ちます。全てのツールにはキャッシュ機能使えないだが、下流処理で別なツールを選択すればキャッシュ機能が使えます。

Alteryxの導入なら、クラスメソッドにおまかせください

日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。

alteryx_960x400