[速報] Amazon QuickSight Q が自動データプリパレーションのサポートを開始しました! #reinvent

2022.11.30

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

データアナリティクス事業本部のコンサルティングチームの石川です。数時間前のAdam Selipskyさんのキーノートで「“Why” questions with Q」「ML-powered forecasting with Q」がリリースされたAmazon QuickSight Q ですが、更に自動データプリパレーションのサポートを開始しました。

自動データプリパレーションとは

Amazon QuickSight Q は、人工知能 (AI) で強化された自動データプリパレーションが含まれるようになり、自然言語の質問に対する既存のダッシュボードを迅速かつ簡単に拡張できるようになりました。

データセットにセマンティック情報を自動的に推論して追加し、自然言語でデータに関する質問を開始するために必要な時間と労力を削減します。Qは、事前に学習したMLモデルと既存のアセット(ダッシュボードやレポート)を用いて、データセットに意味情報を自動的に推測、追加します。これにより、BIチームが自然言語クエリのためにデータを準備する時間を、数週間から数分に短縮することができます。

自動データプリパレーションはどのように機能するか

分析からの作成

Q の新しい自動データプリパレーションは、分析からトピックを作成する機能を有効にするとMLでトレーニングされたモデルを用いて、問題のデータフィールドの同義語と一般的な用語を見つけようとし、さらに、最も関連性の高い列を選択する代わりに、分析での使用方法に基づいて価値の高い列を自動的に選択します。次に、トピックをこの既存の分析のデータセットにバインドし、データ内の一意の文字列値のインデックスを準備して、自然言語検索を有効にします。

自動化されたフィールドの選択と分類

Q の自動化されたデータプリパレーションが高価値の列を選択には、レポートやダッシュボードなどの既存の QuickSight アセットからのシグナルに基づいて列の選択を自動化し、ビジネス ユーザーに関連するトピックを作成するのに利用します。データセットから価値の高いフィールドを選択するだけでなく、Q の自動データプリパレーションでは、作成者が分析で作成した新しい計算フィールドもインポートするため、トピックでこれらを再作成する必要がありません。

自動化された言語設定

ビジネス ユーザーにとって直感的ではない技術的な名前を翻訳するのに時間を費やす代わりに、一般的な用語を使用したわかりやすい名前と同義語で列名が自動的に更新されます。データセットにはわかりやすい名前といくつかの同義語が割り当てられています。シノニムが列に自動的に追加され (さらにカスタマイズするオプションあり)、ビジネス ユーザーに関連する可能性のある幅広い語彙をサポートします。

Q は、これらを自動化することによって、自然言語の質問をサポートするためにデータを準備する時間が短縮されます。

リージョン

  • バージニア北部リージョン(us-east-1)
  • オハイオリージョン(us-east-2)
  • オレゴンリージョン(us-west-2)
  • アイルランドリージョン(eu-west-1)
  • アジアパシフィック (ap-south-1)
  • アジアパシフィック (ap-southeast-1)
  • アジアパシフィック (ap-southeast-2)
  • カナダ (ca-central-1)
  • ヨーロッパ (eu-central-1)
  • ヨーロッパ (eu-west-1)
  • ヨーロッパ (eu-west-2)

※ 東京リージョン(ap-northeast-1)は対象外です。

利用費

Q の自動データプリパレーションは、QuickSight Q サブスクリプションで追加料金なしで利用できます。Amazon QuickSight Qの無料トライアルを開始します。

最後に

Qは、とても便利な機能ですが設定が大変だろうと思っていたところ、この機能が発表されました。現在は、恐らく英語のみのため、東京リージョン(ap-northeast-1)は対象外となっていると考えられます。

日本語で使えるかはともかく、自動データプリパレーションの仕組みを理解するのは大変興味深いところです。英語でも良いので、一度試してみたいところです。

合わせて読みたい

参考文献