Alteryx Designer 2025.1 の新ツール「データクレンズPro」ツールを使ってみた

Alteryx Designer 2025.1 の新ツール「データクレンズPro」ツールを使ってみた

2025.10.15

こんにちは、まつおかです。

2025年5月にリリースされた Alteryx Designer 2025.1 では新たに「データクレンズPro」ツールが追加されました。
今回は既存の「データクレンジング」ツールとの違いや追加された機能についてご紹介します。

既存の「データクレンジング」ツールとの違い

「データクレンズPro」ツールは、今まであった「データクレンジング」ツールの進化版のようなツールです。
従来のツールはマクロ形式で作成されていて、特に大量のデータを処理する際の速度に問題がありましたが、新しい「データクレンズPro」ツールはネイティブツールとして提供されおり、処理速度が大幅に向上しています。
また、新たな前処理機能も追加されてより効率的なクレンジング処理ができるようになっています。

https://help.alteryx.com/current/ja/designer/tools/preparation/data-cleanse-pro-tool.html

https://help.alteryx.com/current/ja/designer/tools/preparation/data-cleansing-tool.html

補足

  • 「データクレンズPro」ツールは、AMPエンジンが有効な場合のみ使用することができます
  • 既存の「データクレンジング」ツールも引き続き利用可能です

追加機能について

「データクレンズPro」ツールでは、従来の機能に加え以下の機能が追加されています。

  • 列の絞り込み機能
  • 文字の削除機能の強化
  • 文字列及び数値列の置換機能

それぞれについて詳細を見ていきます。

alteryx-data-cleans-pro01

■ 列の絞り込み機能

クレンジング対象のフィールドを選択する際、データクレンジングツールは全て選択するか全ての選択を解除するかの2択でしたが、データクレンズProでは列を絞り込める機能が追加されています。

▼データ型でのフィルタリング
データ型を指定して対象のフィールドを選択することができます。

alteryx-data-cleans-pro02

▼列名による検索
フィールド数が多い場合も「検索」ボックスにフィールド名を入力することで効率的にフィールドを選択することができます。

▼「Unknown」の追加
入力データのフィールドが増えた際に処理対象とするかどうかを指定できるようになりました。

■ 文字の削除機能の強化

文字削除の対象として、新たにHTMLタグ不可視文字が追加されました。
また、文字・数字・特殊文字を削除する際、削除除外対象文字を指定することができるようになりました。

<HTMLタグの削除>

アングルブラケット(山括弧)で囲まれた文字を削除します。

alteryx-data-cleans-pro03

  • 入力データ

alteryx-data-cleans-pro04

  • 出力データ

alteryx-data-cleans-pro05

<不可視文字の削除>

不可視文字とは、画面上には表示されないがデータとして存在する文字のことで、例えば、改行やゼロ幅スペース、制御文字などがそれにあたります。

alteryx-data-cleans-pro06

<特定の文字や数字の除外>

▼文字の削除
文字を削除する際、除外する文字を指定できるようになりました。
複数の文字を入力した場合は、OR条件(いずれかに一致) として扱われます。また、大文字、小文字は区別されます。

【例:以下の通り設定した場合】

alteryx-data-cleans-pro07

  • 入力データ

alteryx-data-cleans-pro08

  • 出力データ
    • 大文字・小文字が区別されていることがわかります
    • 数字や句読点、特殊文字を削除する場合は、別のオプション指定が必要です

alteryx-data-cleans-pro09

▼数字の削除
数字を削除する際、除外する文字を指定できるようになりました。

【例】以下の通り設定した場合

alteryx-data-cleans-pro10

  • 入力データ

alteryx-data-cleans-pro11

  • 出力
    • 除外に指定したアラビア数字(3)やローマ数字(Ⅳ)、分数(½)が削除対象から除外されていることがわかります
    • ID7の「١٢٣٤」はあまり馴染みがないですがアラビア語の数字です。こちらもUnicodeで数字に分類されていますので削除されます

alteryx-data-cleans-pro12

▼句読点と特殊文字の削除
句読点と特殊文字を削除する際、除外する文字を指定できるようになりました。

【例】以下の通り設定した場合

alteryx-data-cleans-pro13

  • 入力データ

alteryx-data-cleans-pro14

  • 出力データ
    • 除外に指定した句読点(!”)と特殊文字($=)が削除対象から除外されていることがわかります

alteryx-data-cleans-pro15

■ 文字列及び数値列の置換機能

▼文字列の列を置換
データクレンジングツールでは「Nullの場合空白に置換」することはできましたが、データクレンズProツールでは、その逆の処理である「空白の場合Nullに置換」することもできるようになりました。

alteryx-data-cleans-pro16

  • 入力データ

alteryx-data-cleans-pro17

  • 出力データ

alteryx-data-cleans-pro18

▼数値列を置換
データクレンジングツールでは「Nullの場合0に置換」することはできましたが、データクレンズProツールでは、その逆の処理である「0の場合Nullに置換」することもできるようになりました。

alteryx-data-cleans-pro19

  • 入力データ

alteryx-data-cleans-pro20

  • 出力データ

alteryx-data-cleans-pro21

さいごに

以上、Alteryx Designer 2025.1で追加された「データクレンズPro」ツールについて、既存の「データクレンジングツール」との比較と追加機能についてのご紹介でした。
従来のツールと比べて処理速度が向上し、さらに列選択の柔軟性、文字記号などを削除する際の削除除外設定など、新機能が追加されより便利なツールになりました。
ぜひこの機会に、最新バージョンである Alteryx Designer 2025.1 をインストールして、データの前処理やAI活用のためのクレンジングにご活用いただければと思います!

この記事をシェアする

FacebookHatena blogX

関連記事