Azure Machine Learning のDesignerが一般提供開始(GA)されました #Azure #AzureMachineLearning

2020.09.23

こんにちは、Mr.Moです。

ついにAzure Machine LearningのDesignerが一般提供開始(GA)されましたね。せっかくですので改めて少し触りながら確認をしていきたいと思います。

Azure Machine Learning Designerとは

image.png

いわゆるGUIで機械学習ができてしまうサービスです。Azure Machine Learning Designerを使用するとインタラクティブなキャンバス上のデータセットとモジュールを視覚的に接続して機械学習モデルを作成できます。

ちなみに、2015年にリリースされた最初のGUIで機械学習できるサービスは現在、Machine Learning Studio(classic)として存在していますが、これから新しく始める場合は今回GAされたDesignerを使うことが推奨されているようです。詳しくは下記の公式ドキュメントをご覧ください。

下記の公式ドキュメントには旧・新のサービスの比較情報も記載されています。

一般提供開始(GA)の公式アナウンス情報を確認

Azure_Machine_Learning_updates_Ignite_2020___Azure_updates___Microsoft_Azure_and_Home_-_Microsoft_Azure (1).png

上記のリンクが公式から出ているアナウンス情報です。他にもGAされているサービスがありそうです。さらにEnterprise Editionは、2020年9月22日にBasic Editionに統合されてEnterprise Editionは2021年1月1日に廃止されるとの記載もありますね。下記のリンクにも情報が記載されているのでご確認ください。(ちなみに、私はEnterprise Editionで作成したワークスペースを持っていたので、メールで自動的に移行されるという案内が来ていました。移行中にダウンタイムが発生することも無いそうで)

さっそく記念に使ってみる

公式のチュートリアルを実施しながら見ていきます。

まずは左メニューからデザイナーを選択し、新しいパイプラインを作成します。

image.png

次にパイプラインを実行するコンピューティング先を設定します。ここでは既存のものを選択してますが、無い場合は新規作成を選びます。

image.png

次にデータセットを設定します。今回はサンプルとして用意されている「Automobile price data (Raw) 」のデータセットを使用します。左メニューからドラッグ&ドロップして持ってきます。なお、右クリックでデータセットを視覚化して確認することもできます。

image.png

モデルのトレーニング前に欠損値に対する処置が必要です。ここでは欠損値が多い列「normalized-losses」を「Select Columns in Dataset」のモジュールを用いて除去します。保存ボタンを押したら、先程のデータセットと線でつなげましょう。

image.png

しかし、他の列にも欠損値はわずかながら存在しています。今度は「Clean Missing Data」モジュールを使用して、欠損値を含んでいる行を除去していきます。

image.png

image.png

また、データセットをトレーニング用とテスト用にわけたいですので、「Split Data」モジュールを使って実施します。トレーニング用70%、テスト用30%の割合にするので、「Fraction of rows in the first output dataset」の項目には0.7と入力します。

image.png

次にトレーニングで使用するアルゴリズムの選択です。今回は連続値の予想なので「Linear Regression(線形回帰)」を選びます。

image.png

ここまできたら、トレーニングを実行するモジュール「Train Model」を追加します。今回は価格の予測がしたいので列名には「price」を入力します。

image.png

トレーニング結果の評価も行いたいので、「Score Model」と「Evaluate Model」のモジュールを追加します。「Score Model」には先程、データセットで分割したテスト用の30%を使用してスコアをつけます。全ての設定が完了したが画面上にある「送信」ボタンを押してパイプラインを実行しましょう。トレーニング完了までは少し時間がかかります。

image.png

トレーニングが完了したら、さっそく結果の確認を行います。評価指標はこちらにも記載されていますが、Coefficient of Determination(決定係数)は1に近いほど誤差が少ないことを意味しますので、こういった値を参考に精度の高いモデルを構築していく流れです。

image.png

まとめ

やはりGUIでポチポチするだけで機械学習のモデルが構築できるのはDesignerの強みですね!今回の公式アナウンス情報では他にもGAになったサービスがありそうですので、別の機会に触ってまとめたいと思います!

そして今 Microsoft Igniteが開催中ですが、IgniteでもSkills Challengeが開催されていてMicrosoft認定試験が無料で受けられるプレゼントがありそうです!...

参考