Alteryx Designer Cloudのツール紹介:Data Cleasingツール #Alteryx

Alteryx Analytics CloudのDesigner CloudのData Cleasingツールについてご紹介します。
2023.03.19

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、スズです。

本記事では、Alteryx Analytics CloudのDesigner CloudにあるData Cleasingツールについてご紹介します。

Data Cleasingツールの概要

Data Cleasingツールは、Preparationのカテゴリの中にあります。

Data Cleansingツールは、Nullの置換、空白や句読点の削除、アルファベットの大文字または小文字の変更などが行えます。

Data Cleasingツールの設定

Data Cleansingツールは、クレンジングの方法や対象の列を選択するだけで処理を行えます。

ここでは、各項目ごとにオプションの動作をご紹介していきます。

Remove Null Data

Remove Null Dataでは、Remove null rowsにチェックを入れると、Nullになっている行全体を削除します。

以下のデータセットでは、Row IDが2になっている行全体がNullになっています。

[Remove null rows]の処理を行うと、Nullになっていた行が削除されます。

Select Fields to Cleanse

Select Fields to Cleanseでは、クレンジングの対象のとなる列を選択します。各列ごとに選択できるほか、Check Allでは全ての列の選択のオン/オフを切り替えることができます。

Replace Nulls

Replace Nullsでは、Nullの置換を行います。

  • Replace with Blanks (String Fields):Nullを空文字に置換
  • Replace with 0 (Numeric Fields):Nullを0に置換

以下のデータセットにはNullが含まれています。id列は数値型、その他の列は文字列型になっています。

[Replace with Blanks]と[Replace with 0]で処理を行うと、Nullが0または空文字に置換されます。

Remove Unwanted Characters

Remove Unwanted Charactersでは、不要な文字を削除します。不要な文字は、以下のオプションから選択できます。

  • Leading and Trailing Whitespace:先頭と末尾の空白を削除
  • Tabs, Line Breaks, and Duplicate Whitespace:空白を1つに置換(行末、タブ、マルチスペース、その他連続した空白を含む)
  • All Whitespace:空白を削除
  • Letters:文字を削除
  • Numbers:数字を削除
  • Punctuation:句読点(! " # $ % & ' ( ) * + , \ - . / : ; ? @ [ / ] ^ _ ` { | })を削除

以下のデータセットには、一部の値に空白やタブが含まれています。

[All Whitespace]で処理を行うと、空白やタブが削除されます。

Modify Case

Modify Caseでは、アルファベットの大文字と小文字を変換することができます。

  • Upper Case:全ての文字を大文字に変換
  • Lower Case:全ての文字を小文字に変換
  • Title Case:単語の最初の文字を大文字に変換

以下のデータセットでは、item列に文字列の値があり、全て小文字で記載されています。

[Title Case]の処理を行うと、各文字列の先頭の文字が大文字に変換されます。

最後に

Alteryx Analytics CloudのDesigner CloudのData Cleasingツールについてご紹介しました。

参考