[速報]RedshiftのSQLで機械学習(ML)モデルの作成、トレーニング、デプロイが実行できる・・だと!?Amazon Redshift MLが登場しました #reinvent

2020.12.09

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

どーもsutoです。

re:InventのMachine LearningキーノートにてAmazon Redshift MLが発表されました!

なんとRedshiftのSQLコマンドで機械学習モデルの作成、トレーニング、デプロイが実行できるというものです。

これまでのデータベースに格納しているデータを用いて機械学習を行うには、

  1. 学習データをS3バケットにエクスポート
  2. Sagemakerノートブックインスタンスでモデルをトレーニング、予測を行う
  3. 予測されたデータをデータベースにインポート

という手順が必要となり、その過程でSagemakerの扱いやプロブラミング言語(PythonやR)のスキルが必要でした。

Amazon Redshift MLの登場により、Pythonはあまり詳しくないがSQLに精通しているデータベース開発者の方々が機械学習処理の構築に参入しやすくなったと言えるでしょう!

また上記プロセスを反復するにはそれなりの手間がかかるため、RedshiftのSQLのみで済むことでフローが簡略化できると思います。

Amazon RedshiftMLの利点

Amazon Redshift MLには、次の利点があります。

  • 外部ツールを習得しなくても、簡単なSQLコマンドを使用してMLモデルを作成およびトレーニングできます
  • 自動アルゴリズム選択を使用する柔軟性を提供します
  • データを自動的に前処理し、モデルを作成、トレーニング、および展開します
  • 上級ユーザーが問題の種類を指定できるようにします
  • データサイエンティストなどのMLエキスパートが、XGBoostなどのアルゴリズムを選択し、ハイパーパラメータとプリプロセッサを指定できるようにします
  • データウェアハウスの外部にデータを送信することなく、SQLを使用して予測を生成できます
  • トレーニングに対してのみ支払うことができます。予測はクラスターのコストに含まれます(通常、ML予測は本番環境のコストを促進します)

Amazon RedshiftMLを有効にしたクラスターの作成

実際にAWSコンソールで確認してみると、以下のとおり「sql_preview」を選択することで有効になるようです。(詳しい作成方法については別途記事で検証することにします。)

※東京リージョンでも選択可能でした。

価格について

モデルの作成または使用に追加のAmazonRedshift料金はかかりません。また、予測はAmazon Redshiftクラスターでローカルに行われるため、クラスターのサイズを変更する必要がない限り、追加料金を支払う必要はありません。Amazon Redshift MLは、Amazon SageMakerを使用してモデルをトレーニングしますが、これには追加の関連コストがかかります。詳細については、Redshiftの価格ページをご覧ください。

(What's News記事より抜粋)

AWS re:Invent 2020 は現在絶賛開催中です!

随時さまざまな新機能、セッション、アップデートが発表されています。

参加がまだの方は、この機会に是非こちらのリンクからレジストレーションして豊富なコンテンツを楽しみましょう!

AWS re:Invent | Amazon Web Services