[アップデート] Q in QuickSight Scenarios が GA しました
コーヒーが好きな emi です。
日本時間 2025/3/25、Q in QuickSight Scenarios が GA しました。
re:Invent 2024 でパブリックプレビューされてから約 4 ヶ月でしたね。パブリックプレビュー時から何か変わったか見ていきます。
GA リージョン
2025/3/26 時点の GA リージョンは以下です。
- 米国東部 (バージニア北部)
- 米国西部 (オレゴン)
- 欧州 (フランクフルト)
- 欧州 (アイルランド)
パブリックプレビュー時はバージニア北部とオレゴンのみでしたが、フランクフルトとアイルランドも増えましたね。
気づいた変更点
ドキュメントはこちらです。
プレビュー時のブログを確認すると、シナリオで使用されるデータの制限で、以前は「各データソースには最大 100 万行を含めることができる」と書かれていたはずです。
それが、GA された現在は「データソースには最大 200 列を含めることができる(Data sources can have up to 200 columns.)」に変わっているようです。
サッとドキュメントに目を通したところ、変更点はこれくらいで、あとはパブリックプレビュー時と変わらないようでした。
シナリオの作成、スレッドの操作等は変わらずできそうです。
やってみる
バージニア北部リージョンで見てみますと、Scenarios が「新着」と書かれていますね。(以前は「ベータ」と書かれていました。)
シナリオの作成
NEW SCENARIO をクリックすると、クロスリージョン推論を確認する画面になりました。ここはパブリックプレビュー時と変わらないですね。
クロスリージョン推論の確認
Amazon Q in QuickSight Scenarios
Scenarios enable business users to automate data tasks and answer complex questions using simple natural language prompts. With the help of AI, users can overcome challenges with using spreadsheets to combine and manipulate data, and can dive deeper into their data than spreadsheets allow. As part of this new analysis experience, your data may be subject to cross-region inferencing within the United States. This means your data may be inferenced in us-east-1 or us-west-2 depending on relative load. Your data will not leave the United States. By using the new analysis experience you are acknowledging that your data is subject to this cross-region inferencing.
(機械翻訳)Amazon Q in QuickSight シナリオシナリオは、ビジネスユーザーがデータタスクを自動化し、シンプルな自然言語プロンプトを使用して複雑な質問に答えることを可能にします。AIの助けを借りて、ユーザーはデータを組み合わせて操作するためにスプレッドシートを使用する際の課題を克服し、スプレッドシートが可能にするよりも深くデータを掘り下げることができます。この新しい分析体験の一環として、あなたのデータは米国内のクロスリージョン推論の対象となる可能性があります。これは、相対的な負荷に応じて、データがus-east-1またはus-west-2で参照される可能性があることを意味します。お客様のデータが米国外に出ることはありません。新しい解析エクスペリエンスを使用することで、お客様のデータがこのクロスリージョン推論の対象となることを認めることになります。
ACKNOWLEDGE をクリックしてシナリオ作成画面に遷移します。既存のダッシュボードが無かったので、ファイルアップロードでシナリオを作成します。
使用する CSV ファイルは以下ブログでも使用した 作成した CSV です。
読み込み中…
読み込めました。以前は 3KB ほどのファイルで 3 分ほどかかっていた記憶ですが、今回は 1 分かからないくらいで終わりました。
では、いきなりですが日本語でプロンプトを唱えてみます。「おせんべいの枚数は?」と唱えて START ANALYSIS をクリックします。
すると、いくつか候補の質問が出てきました。ここは英語なんですね。まあいいでしょう、「Show the number of osenbei consumed by each department」を選択し SUBMIT します。
回答が得られました。これも 1 分程度でした。おせんべいの枚数がちゃんと出ています。
「+」を押下してスレッドを続けます。
「Compare the consumption of osenbei, chocolate, and donuts across departments」という候補がでてきたので、これを日本語に直して、回答も日本語にするようお願いしました。
「おせんべい、チョコレート、ドーナツの消費量を部門間で比較してください。回答は日本語でお願いします。」
3 分程で回答が得られました。回答は日本語になっています!!
いいですね、Step1 では各部門ごとにお菓子の消費量を集計しています。
計算するだけでなく、この時点でどの部署の消費が多いか等の傾向も示してくれています。
Step 1
Step 1: 各部門ごとにおせんべい、チョコレート、ドーナツの消費量を集計します。
データベース部が最もおせんべいの消費量が多く(234個)、ストレージ部がチョコレートの消費量が最も多い(144個)結果となりました。ドーナツの消費量は、データベース部が最も多く127個でした。全体的に、データベース部が3種類のお菓子の消費量が最も多い傾向が見られます。
Step2 では分析結果をまとめて提案をしてくれました。
Step 2
Step 2: 分析結果をまとめ、部門間のスナック消費パターンの主な違いを強調します。各部門のスナックタイプごとの総消費量と割合を含めます。
各部門のスナック消費パターンを分析した結果、以下のような特徴が見られました:
- データベース部:
- おせんべい:234個 (48.2%)
- チョコレート:124個 (25.5%)
- ドーナツ:127個 (26.2%)
- 合計:485個
データベース部は、おせんべいの消費が突出して多く、全体の約半分を占めています。ドーナツとチョコレートはほぼ同じ割合で消費されています。
- ストレージ部:
- おせんべい:210個 (44.3%)
- チョコレート:144個 (30.4%)
- ドーナツ:120個 (25.3%)
- 合計:474個
ストレージ部は、3つのスナックをバランスよく消費していますが、チョコレートの消費量が他の部門と比べて最も多くなっています。
- コンピューティング部:
- おせんべい:189個 (51.8%)
- チョコレート:123個 (33.7%)
- ドーナツ:53個 (14.5%)
- 合計:365個
コンピューティング部は、おせんべいとチョコレートの消費が多い一方で、ドーナツの消費が他の部門と比べて著しく少なくなっています。
全体的な傾向:
- おせんべいは全ての部門で最も人気のあるスナックで、各部門の総消費量の44%以上を占めています。
- チョコレートの消費量は3部門でほぼ同じですが、ストレージ部がわずかに多くなっています。
- ドーナツの消費パターンは部門によって大きく異なり、データベース部とストレージ部では比較的多く消費されていますが、コンピューティング部では極端に少なくなっています。
これらの結果から、部門ごとに異なるスナック嗜好があることが分かります。特にコンピューティング部のドーナツ消費が少ないことは注目に値し、何か特別な理由があるかもしれません。
その他の機能
ブロックの編集、複製、削除、折り畳み等はプレビュー時と変わらずできそうです。
スレッドの分岐もいけますね。
少し頭を使う問いを日本語で
日本語で、「もし各セクションのおせんべいの供給量を20%増やしたら、消費量にどのような影響があるでしょうか?」と問いかけてみました。
推論が始まると、各ステップの出力は英語になってしまいました。
推論が終わるまで 4 分程かかりました。長い右側のブロックです。
少し頭を使う問いかけをした際の推論にかかる時間やブロックの長さやはプレビュー時とさほど変わっていないようです。
さて、見てみると Step2、3 は英語で回答していますね。
英語になってしまった Step 2、3
Step 2: 各セクションの新しい供給量(20%増加)を計算します。
Still analyzing... Hang tight...
The estimated new supply of osenbei for each section has been calculated by increasing the current consumption by 20%. The average quantity (including both current consumption and estimated supply) is now 77.4 osenbei, with a minimum of 57 and a maximum of 100.8 osenbei per section.
Step 3: 新しい供給量に基づいて予想される新しい消費量を推定し、同時に各セクションの消費量の変化率を計算します。
Still analyzing... Hang tight...
The analysis shows that with a 20% increase in supply, the estimated new consumption for each section also increases by 20%, ranging from 68.4 to 100.8 osenbei. This indicates full utilization of the additional supply across all sections.
最後の Step4 では分析結果と提案をしてくれていますが、ここは日本語です。最後が日本語なのは一番嬉しいです。
Step 4
Step 4: 分析結果をまとめ、最も大きな変化が見られたセクションや興味深いパターンを強調します。おせんべいの供給量20%増加が各部門とセクションに与える影響について洞察を含めます。
分析結果から、おせんべいの供給量を20%増やした場合の影響について、以下のような洞察が得られました:
- 全体的な傾向:
• すべてのセクションで、おせんべいの消費量が20%増加しました。これは、追加供給されたおせんべいがすべて消費されたことを示しています。- 最大の消費量増加:
• 絶対数で見ると、EFS課とDocumentDB課が最も大きな増加を示しました。両セクションとも84個から100.8個へと、16.8個の増加が見られました。- 最小の消費量増加:
• EC2課とS3課は、57個から68.4個へと11.4個の増加で、絶対数では最も小さな増加でした。- 部門別の傾向:
• データベース部:全体的に高い消費量を維持しており、増加後も最も多くのおせんべいを消費しています。
• ストレージ部:EFS課が突出して多く、他の2課との差が大きくなっています。
• コンピューティング部:3つの課で比較的均等な消費量を示していますが、他の部門と比べると全体的に少ない傾向にあります。- 需要と供給のバランス:
• すべてのセクションで供給量の増加に応じて消費量が増えたことから、これまでの供給量が需要を満たしていなかった可能性が高いです。- 今後の検討事項:
• 消費量の少ないセクション(EC2課、S3課など)では、なぜ消費量が少ないのか、あるいは追加の需要があるのかを調査する必要があるかもしれません。
• 高消費セクション(EFS課、DocumentDB課、RDS課)では、さらなる需要がある可能性があるため、追加の増量を検討する価値があるかもしれません。
この分析結果は、各部門・セクションのおせんべい需要をより正確に把握し、効率的な供給計画を立てるための有用な情報となります。
感想
日本語での回答精度が上がっていると感じました。
ある程度簡単な問いかけであれば回答も日本語で返してくれますが、データから未来の予測をさせたいとか、何か考えられる原因はないか等、高度なことを聞くと英語が混じってしまうのはパブリックプレビュー時と変わりません。
簡単な問いかけであれば回答も早いですが、推論が完了するまでに 3~5 分ほどかかる場合もあるところもパブリックプレビュー時と変わりない印象です。
データからインサイトを得るとてもいい機能だと思うので、日本での GA が待ち遠しいです。
参考