Amazon Comprehendでサクッと自然言語処理をやってみる #Comprehend #reInvent

2017.11.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

こんにちは!
re:Invent2017期間限定で投稿させていただいてる 久住(くすみ)です。

今回はキーノートで発表されたAmazon Comprehendを 触ってみたいと思います。

Amazon Comprehendとは

入力言語を自動的に識別して、処理してくれます。
(関連記事: 【速報】AWSの自然言語処理サービス、Amazon Comprehendが発表されました! #reinvent

対応言語

  • 英語
  • スペイン語

対応リージョン

現地時間11/29 12:00現在では下記リージョンが対応しています。
※リージョン対応表にはまだ載ってませんでした!

  • us-east-1:米国東部 (バージニア北部)
  • us-east-2:米国東部 (オハイオ)
  • us-west-1:米国西部 (北カリフォルニア)
  • us-west-2:米国西部 (オレゴン)
  • eu-west-1:EU (アイルランド)

今回はus-east-1:米国東部 (バージニア北部)で試してみます。

触ってみた

Amazon comprehendにアクセス

下記ページから入ります

Amazon Comprehend

アクセス

AWSアカウントにログインするとAmazon Comprehendに遷移

Get started をクリック

GetStarted

初期表示される画面

サンプルのテキスト分析結果がデフォルトで表示されています。

サンプル

テキスト分析(English ver.)

実際にやってみました。

サンプルのテキストをクリア

Clear text をクリックするだけです。 クリア

分析したい英文をコピペ

今回は試しに、BBC NEWSから良さそうな英文を取ってきました。
コピペしたら、 Analyze をクリック

分析結果

完成!

右側に分析結果が表示されました。
「Donald Trump」がPersonにカテゴライズされる等
正確に情報の抽出が出来ているようにみえます。

アクセス

表示形式は3つから選択

「Entity(エンティティ)」の表示形式は List , Tiles, JSON の3つから選択できます。

エンティティ表示

テキスト分析(Spanish ver.)

せっかくなので、もう一つの対応言語であるスペイン語も 試してみました!

スペイン語

すみません、全く読めなくて結果がわかりませんでした・・・

しかし、左下に「Detected language: Spanish」と表示され
数字は「Quantity」に分類されているため、どうやら正しく抽出されているようです。

まとめ

簡単な操作で自然言語処理による情報の分類が出来ました。
日本語対応が待ち遠しいです!

今年のre:Inventで同じく発表された
翻訳サービスのAmazon Translateや文字起こしサービスの
Amazon Transcribeと組み合わせれば、ライブや映像の言葉を
リアルタイムで自然言語処理できるようになりそうですね。