AlteryxでExcelファイルを読み込んだ際に全部nullの行や列が入る場合の対応
こんにちは、小澤です。
Alteryxでは、Excelファイルをそのまま読み込むことが可能です。 データ分析をする際にたびたび「頼むからCSVにしてくれよー」となる、Excelファイルをそのまま読み込めるのは非常に便利ですが、 Excelファイルを読み込む際に時々困った事態が発生することもあります。
今回は、そんな中の1つである「謎の全部nullな行や列が入る」現象について解説します。
「謎の全部nullな行や列が入る」現象とは
これはどういった現象かということはまず解説します。 以下の内容のExcelファイルをAlteryxで読み込んでみます。
このデータをAlteryxで読み込むと以下のようになります。
2つほどの何もない列が余分に読み込まれてしまっているのが確認できます。 この現象が発生した際には、不要な列であればSelectツール、行であればFormulaツールを使って簡単に削除できますが、入ってしまうこと自体あまり気持ちのいいものではありませんね。。
なぜこんなことが起こるのかの元を断つ
さて、先ほどのデータは実は意図的にそうなるように仕向けたものです。 意図的にやったということは、明確な原因があり、それを起こさない方法もあるということです。
では、まずはわかりやすく同じ現象を起こしてみましょう。 こんな感じのExcelファイルを用意してみました。
このファイルをAlteryxで読み込むと以下のようになります。
下2行がすべてnullのデータになっています。 このすべてnullの行はExcelでは背景を黄色にした部分に対応しています。 このように、データ以外にも何らかの書式設定が施されている部分はAlteryxで読み込んだ際に、"そこに何かあるもの"として含まれてしまいます。 この例では、背景を黄色くしてわかりやすくしていますが、白背景に設定してあったり、罫線なしを選択していたりすると人間の目ではなかなか判別がつかず、結果的によくわからないものを読み込んでいる状態になってしまいます。
"人間の目では判別しづらいもの"ということで、何らかの理由で一部のデータを削除する際に、行や列そのものを削除するのではなく、データを消して書式を何もなかった風にしたなどの操作をするとこの状態が発生していしまいます。
これを解消するには、ちゃんとこれらの行や列そのものを削除するようにする、というのが最もいいやり方となるでしょう。
そのほかにも読み込む範囲を名前を付けるというのも考えられます。 セルの範囲に名前を付けておくと、Alteryxで以下のようにそれを使って読み込む範囲を限定できます。
おわりに
今回は、Excelファイルを読み込んだ際に発生することがある、謎の行や列について解説しました。 Excelは自由度が高いゆえに、データと見た目のレイアウトを分離せずに利用してしまうことも多いですが、きちんと分離させておくことの重要性がうかがえますね。
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。