機械学習はもはやエンジニアのものですらない。ノーコードで機械学習モデルが作れる「Sagemaker Canvas」が発表! #reinvent
せーのでございます。たった今re:Invent2021初日のキーノートが終了したところです。
今年も初日から色々なサービスが出ました。このエントリではその中からビジネスアナリスト向けの機械学習サービス「Sagemaker Canvas」を速報にてご紹介します。
より直感的なモデル作成へ
SagemakerといえばAWSが誇る機械学習の作成ツールとなりますが、このサービスを使いこなすには機械学習の基本的な知識やJupyter notebook、ECRコンテナサービス、機械学習フレームワーク、ハイパーパラメータなどの基礎知識が必要になります。
そこで機械学習を触ったことのないエンジニアでも手軽に触れるように、と数々のベースモデルやコードなどを用意してポチポチクリックしながら進めていけるサービスがSagemaker Jumpstartとなります。それでもPythonやJupyter Notebookなどの知識は必要になります。
今回はこれを更にもう一歩進ませ、完全ノーコードで、準備されているデータセットをドサッと入れてクリックしていくだけで機械学習のモデルや予測精度、モデルの作成に関わっている情報などを表示してくれる、という、もはやエンジニアでなくても全然触れてしまうサービスがこの「Sagemaker Canvas」になります。
これをAWSのCEO、Adam Selipsky氏は「機械学習の民主化」と表現しました。なるほど、まさに一部の専門家の領域だった機械学習を広く誰でも使えるようにするにはもってこいのサービスです。
データを用意して、つなげて、学習
Sagemaker CanvasのUIはとてもわかりやすいです。既にオハイオ、バージニア、オレゴン、フランクフルト、アイルランドの各リージョンでは触れるようになっています。
マネージメントコンソールからSagemakerを開くと左ペインに「Canvas」の文字が見えますね。
クリックしてみるとドメインを作るように促されました。Sagemaker Studioを初めて使うときも同様の画面が出てきます。でもQuick setupが用意されているので、そのまま作成ボタンを押してしばらく待てばドメインが出来上がります。
ドメイン作成後、出来上がったドメインの横を見てみると、今までSagemaker Studioを起動するリンクがプルダウンに変わっています。ここからStudioかCanvasを選べるようです。
Canvasを選択するとStudio同様、独自のUIが立ち上がって
しばらく待つと、トップ画面が表示されます。
選択肢もモデルを作るかデータセットをインポートするか、の2択という超シンプルUIです。
データセットを押してみると、、インポート元のサービスが選べます。S3、Redshift、Snowflakeなどがあります。直接アップロードすることもできますね。
この後の流れをドキュメントで確認してみると、データをインポートしたら、結合して
予測する対象のカラムを指定してデータセットの中身を分析。この時点で右下に、この精度予測に深く関わったデータカラムを順番に表示してくれます。例えばここで予測時に手に入らないデータが大きくモデル構築に関与している場合はチェックを外してしまうだけで関与しなくなる、という、BIツールを触ったことのある方ならおなじみのUIでサクサク準備ができます。
納得の行く精度とデータカラムが確認できたらモデル作成をクリックしてしばらく待つと自動的にモデルが作成されます。
出来上がったモデルはその場でデータを入力して推論させてみることもできますし、ダウンロードしてSagemaker Studioに入れてエンジニアにわたすこともできます。
モデルを作成するのにベースモデルがあるとエンジニアとしても非常に便利ですし、アナリストの方である程度方向性を見ながらモデルを作成できると、最終的なゴールやパラメータも大きくブレることなく進めます。一回やってみるには非常に便利なサービスですね。
まとめ
以上、速報にてSagemaker Canvasをご紹介しました。
ビジネスアナリスト向けでもありますが、本格的な機械学習環境の構築の前に一旦必要なデータセットあたりを付けておく、という使い方でもとても直感的で便利だと思いました。
ある程度の量のデータを持っている方は一旦ためしてみてはいかがでしょうか。