【2020年】GCPのAI/ML系のサービスまとめてみた

2020.05.01

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは、Mr.Moです。

Google Cloud Platform(GCP)にはたくさんの優れたサービスがありますがAI/ML系のサービスも熱いですね!Updateもガンガン来ているようなので現時点で情報をまとめておきたいと思います。

GCPのAI/ML系のサービス

GCPでは多くのAI/ML系のサービスがリリースされていますが、今は大きく下記の2つで区別されているようです。

AI Building Blocks

image.png

AI Building Blocksには、カスタムモデル事前トレーニング済みモデルの 2 種類があり、開発者は視覚認識能力、言語能力、会話能力、構造化データをアプリケーションに簡単に組み込めます。

事前トレーニング済みモデル

image.png

事前トレーニング済みのモデルをAPI経由で利用できるサービス群です。汎用的な機能でも良いというケースでしたらすぐ使えるので機械学習の機能を導入する上で一番ハードルが低い方法になります。下記に簡単に各サービスの説明を記載していきます。

Vision API

画像を何千ものカテゴリ(「ヨット」や「エッフェル塔」など)に素早く分類し、個々の物体、顔、単語を認識します。 この機能の例としては、画像ラベリング、顔やランドマークの検出、光学式文字認識(OCR)、不適切なコンテンツへのタグ付など。

Video Intelligence API

メタデータの抽出、重要な名詞の識別、動画コンテンツへのアノテーションの追加が行えます。このアノテーションは、動画全体、セグメント単位、ショット単位、フレーム単位で設定できます。

Natural Language API

機械学習を使用してテキストの構造や意味を明らかにします。人、場所、イベントに関する情報を抽出し、ソーシャル メディアの感情やコールセンターの会話について理解を深められます。感情分析、エンティティ分析、エンティティ感情分析、コンテンツ分類、構文解析などの言語理解機能を提供します。

Translation API

事前トレーニング済みニューラル機械翻訳を使用することで、100 を超える言語と数千もの言語ペアでテキストを高速かつ動的に翻訳できます。

Cloud Speech-to-Text API

音声を文字テキストに変換できます。しかも 120 もの言語と方言を認識します。例えばコールセンターの音声文字変換処理などに利用でき、リアルタイム ストリーミング音声も録音された音声も処理できます。

Cloud Text-to-Speech

テキストまたは音声合成マークアップ言語(SSML)入力を自然な人間の音声の音声データに変換します。複数の言語による 32 の音声で、人間の声に非常に近い自然な音声を合成できます。

Dialogflow

会話型のユーザー インターフェースの設計と、モバイルアプリ、ウェブ アプリケーション、IoT デバイス、チャットボット、対話型の音声応答システムなどへの統合を容易にする自然言語理解プラットフォームです。

Cloud Inference API

入力された時系列のデータセットからリアルタイムで分析情報を収集できます。最も一般的な使用例には、小売店での客足とコンバージョンの分析、データ異常の検出、リアルタイムでのセンサーデータの相関の特定、高品質なおすすめ情報の生成などがあります。

Recommendations AI

Googleが各種サービス(Google 検索、Google 広告、YouTubeなど)でおすすめのコンテンツを提供してきた実績・知見を活かし、Recommendations AIを通じてパーソナライズされたおすすめ情報を提供します。

Media Translation

音声ファイル、音声のストリームの翻訳を実施します。

カスタムモデル

image.png

事前トレーニング済みモデルに対して、やっぱり独自のモデルを使いたい!という場合に使えるサービスです。独自のデータを用意すれば学習自体はサービスに任せることができるのでAI/MLの専門的な知識が無くても独自のモデルを構築できます。

AutoML Vision

機械学習の専門知識があまりなくとも、特定のニーズに合わせたカスタムモデルを簡単に構築してトレーニングできます。これにより独自に定義したラベルに従った画像分類が可能になります。

AutoML Video Intelligence

事前トレーニング済みのVideo Intelligence APIでカバーされていないプロジェクトのカスタムモデルをトレーニングできます。独自に定義したラベルに従って動画のショットやセグメントを分類するといったことが可能になります。また、両方のプロダクトを同時に使用すれば、より精緻な結果が得られます。

AutoML Natural Language

カスタムの機械学習モデルを構築してデプロイし、コンテンツの分類、感情分析、エンティティ分析、構文解析などの言語理解機能を提供します。

AutoML Translation

カスタム翻訳モデルを独自に作成して、翻訳クエリに対して各自の分野に固有の結果を返すことができます。

AutoML Tables

構造化データに対する最先端の機械学習モデルのビルドとデプロイを、非常に高速かつ大規模な水準で容易に行えるようになります。

サービス状況

サービス名 Generally Available(GA) Tokyo Region Release Date
Vision API - May 18, 2017
Video Intelligence API × November 30, 2017
Natural Language API - November 15, 2016
Translation API - April 06, 2017
Cloud Speech-to-Text API - April 18, 2017
Cloud Text-to-Speech - August 28, 2018
Dialogflow April 17, 2018
Cloud Inference API Alpha ? -
Recommendations AI Beta ? -
Media Translation Beta ? -
AutoML Vision November 20, 2019
AutoML Video Intelligence
・Classification documentation
・Object Tracking documentation
Beta
Beta
? -
AutoML Natural Language
・Text & Document Classification
・Sentiment Analysis
・Entity Extraction


- December 12, 2019
AutoML Translation - October 14, 2019
AutoML Tables Beta October 14, 2019

※ 正確な情報は公式のドキュメントをご参照ください

AI Platform

image.png

AI Platformは所謂コードベースのAI/MLの開発環境を提供するサービスです。AI/MLプロジェクトの構想からデプロイまで一貫した工程を強力にサーポートしてくれます。

AI Hub

AI Hubは、人工知能(AI)システムを構築する開発者やデータサイエンティストのためのアセットのコレクションを提供しています。機械学習(ML)モデルをノートブックでトレーニングしたり、管理されたサービスにデプロイしたりできます。

AI Platform Training

ハイパー パラメータを自動調整できる分散型トレーニング。TensorFlow、scikit-learn、XGBoost のトレーニング アプリケーションをクラウドで実行します。カスタム コンテナを使用して、他の機械学習フレームワークでトレーニング ジョブを実行することもできます。

AI Platform Prediction

サーバーレス スケーリングが可能なモデル ホスティング サービス。トレーニング済みモデルをホストできるため、新しいデータのターゲット値を推定し送信できます。

AI Platform Optimizer

AI Platform Optimizerは、複雑な機械学習モデルのハイパーパラメータのチューニングを支援するブラックボックス最適化サービスです。AI Platform Optimizerを使用して、Google Cloudのリソースを使用して機械学習モデルを最適化することができます。

AI Platform Notebooks

最新のデータ サイエンスと機械学習フレームワークがプリインストールされたマネージド サービスです。統合開発環境である JupyterLab によってインスタンスの作成が簡単にでき、BigQuery、Cloud Dataproc、Cloud Dataflow と統合されているため開発とデプロイも容易です。

AI Platform Data Labeling Service

AI Platform Data Labeling Service を使用すると、ラベル付け担当者が、機械学習モデルで使用できる一連のデータの高精度なラベルを生成でき、機械学習モデルのトレーニング用データの準備が容易になります。

AI Platform Deep Learning Containers

ディープ ラーニング環境向けに最新の機械学習データサイエンスフレームワーク、ライブラリ、ツールがプリインストールされた、最適化されたコンテナです。移植可能で一貫性のある環境を使用して、ディープ ラーニング プロジェクトを短時間で構築できます。

AI Platform Deep Learning VM Images

ディープ ラーニング アプリケーション向けに主要なML フレームワークとツールがプリインストールされてされた仮想マシンです。ワンクリックで Cloud TPU と GPU サポートを追加できます。

AI Platform Pipelines

堅牢で再現可能な機械学習パイプラインをデプロイする方法だけでなく、モニタリング、監査、バージョン トラッキングの各機能や、再現性を提供します。また、ML ワークフローのための、エンタープライズ対応でインストールしやすい安全な実行環境を実現します。

サービス状況

サービス名 Generally Available(GA) Tokyo Region/日本語 Release Date
AI Hub Beta - -
AI Platform Training Beta -
AI Platform Prediction Beta -
AI Platform Optimizer Beta -
AI Platform Notebooks March 31, 2020
AI Platform Data Labeling Service Beta × -
AI Platform Deep Learning Containers Beta -
AI Platform Deep Learning VM Images December 19, 2018
AI Platform Pipelines Beta -

※ 正確な情報は公式のドキュメントをご参照ください

(上記以外にBigQuery MLもありますね)

まとめ

いったんまとめてみました。用途によって使い分けられるようGCPのAI/ML系のサービスは展開されているんですねぇ。今後も随時Updateしていきたいと思います。 また、各サービスの詳細は別途記事にしていきたいと思ってます! (ちなみにTokyo RegionとRelease Dateの情報は参考程度に見ていただけますと^^;)

参考