
Amazon Nova Act Playgroundで数字認識と計算を試してみた #AWSreInvent
re:Invent2025に現地参加しています。Amazon Nova ActのPlaygroundを使って、検証サイトに表示されるランダムな2桁の整数の足し算を試してみました。Playgroundの利用には米国Amazonのアカウントが必要で、アクセスは米国内に限られるようです。
CloudFrontとS3による検証環境の作成
事前にCloudFrontとS3を作成しておきます。CloudFront Functionsでレスポンスを生成するため、S3は空で問題ありません。以下のCloudFront Functionsを作成し、Viewer Requestイベントに関連付けます。
function handler(event) {
var random1 = Math.floor(Math.random() * 90) + 10;
var random2 = Math.floor(Math.random() * 90) + 10;
var response = {
statusCode: 200,
statusDescription: 'OK',
headers: {
'content-type': { value: 'text/plain; charset=utf-8' }
},
body: '整数1: ' + random1 + '\n整数2: ' + random2
};
return response;
}
この関数は「整数1: 43 整数2: 72」のようにランダムな2桁の整数を表示します。

Playgroundから足し算をお願いする
https://nova.amazon.com/act に接続し、新しいエージェントを作ります。CloudFrontのURLを入力、アクションを「サイトにアクセスする」「整数1の値を確認する」「整数2の値を確認する」「整数1+整数2の結果を返す」と指定します。

実行ボタンを押すと、Nova Actがサイトにアクセスする様子が表示されます。19と62が表示されましたが、Return 81とあるように、足し算をしてくれました。

日本語の認識を試すために、「名前: すずき なおき」のようにランダムな名前を表示する関数にしてみました。「名前:」以降の文字列を取得し、返す。と指示すると、「Return: ささき なおき」と表示されました。おしいです。

Agent Output Windowには、Agentの思考が表示されます。「 My task is to return the string after '名前:'.」とあるように、こちらの指示を理解してくれています。試すタイミングや指示の仕方によっては期待通りにいくかもしれません。
SDKから足し算を試す
ローカルで「pip install nova-act」を実行しておきます。Download Nova Act Python Fileを選択します。整数1+整数2というシンプルな指示にしました。

コメントを除いてますが、以下のPythonファイルをダウンロードできます。
from nova_act import NovaAct
import os
os.environ["NOVA_ACT_BROWSER_ARGS"] = "--remote-debugging-port=9222"
nova = NovaAct(starting_page="https://*mask-url*.cloudfront.net/", headless=True, tty=False)
nova.start()
nova.act("整数1+整数2の結果を返す. ")
ローカルで「python test_nova.py」を実行すると、足し算の結果を返してくれました。

まとめ
Amazon Nova Actを使って足し算とひらがなの取得を試してみました。数字の認識・計算は高精度で動作し、Python SDKでローカル環境からも容易に実行できました。日本語の認識精度には改善の余地がありますが、自然言語でブラウザ操作を自動化できる点は非常に魅力的です。今後の日本語対応の向上に期待したいと思います。









