生成AI

最終更新日:2025/04/08
Amazonは、ウェブブラウザ上で自動的にタスクを実行できるAIモデル「Amazon Nova Act」を2025年4月1日に発表しました。
このニュースのポイント
Amazonは、ウェブブラウザ上でユーザーに代わってタスクを実行するAIエージェント「Amazon Nova Act」を発表しました。併せて、開発者向けに「Amazon Nova Act SDK」をリサーチプレビューとして提供。開発者が実際に試すことができ、エージェント技術の開発を支援します。
従来のエージェント技術は、APIを通じた情報の取得や実行に依存するケースが多く、対応範囲が限られていました。しかし「Amazon Nova Act SDK」はウェブブラウザ内での直接操作が可能なため、APIが整備されていない環境でも、画面上の情報を理解し、タスクを遂行できます。
例えば、社内システムでの不在届提出、カレンダーへの予定登録、不在時の自動返信メール設定などが可能です。
Nova Act SDKは、開発者が複雑なワークフローを構築できるよう、さまざまな機能を提供します。例えば、検索を行ったり、画面上の質問に回答したりする基本的なコマンドの実行が可能です。また、「特定のオプションを選択しない」といった細かな指示の追加にも対応しています。
さらに、APIの呼び出しやPlaywrightを活用したブラウザ操作も可能で、より高度なタスクの自動化を支援します。加えて、Pythonとの統合を通じて、テストの実施、ブレークポイントの設定、並列処理の実装など、より柔軟な開発が可能となります。
現在、エージェントのWebブラウザ上でのタスク完了率は30〜60%程度ですが、Nova Actは90%以上の正確性を目指して開発されており、特に日付選択やドロップダウンメニューの処理、ポップアップ対応において高精度を実現しています。
実際に、「ScreenSpot」や「GroundUI Web」などのベンチマークにおいて、最高クラスの性能を達成しています。
また、Nova Actはヘッドレスモードでの実行やAPI統合、スケジュールに基づく非同期実行が可能で、特定の時間にタスクを自動化することもできます。
さらに、未知のウェブUIにも適応でき、例えば、経験のないウェブゲームの操作にも成功した実績があります。
Amazonは、Nova Actを「Alexa+」に統合し、APIがない場合でもウェブ上でタスクを実行できるようにします。今後は強化学習を活用してエージェントが高度なタスクを自律的に行えるように開発を進める予定で、Nova Act SDKのリサーチプレビューを通じて開発者との共同開発を促進していく方針です。
出典:Amazon
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら