AI

Google Gemini Spark自律型AIエージェント発表、デバイス閉じても稼働

GoogleはGoogle I/O 2026で自律型AIエージェント「Gemini Spark」を発表。クラウド上で24時間稼働し、ユーザー指示のもと能動的に行動。Workspaceや外部ツール連携で複雑なワークフローを代行する。

7分で読める SINGULISM 編集チームが確認・編集

Google Gemini Spark自律型AIエージェント発表、デバイス閉じても稼働
Photo by Growtika on Unsplash

Google I/O 2026で衝撃発表──自律型AIエージェント「Gemini Spark」登場 2026年5月20日、Googleは開発者会議「Google I/O 2026」

において、パーソナルAIエージェント「Gemini Spark」を正式に発表した。これは単なるチャットボットの進化版ではなく、ユーザーの指示のもとで自律的に行動し、複雑なデジタルワークフローを代行する次世代AIアシスタントである。最大の特徴は、スマートフォンやPCのデバイスを閉じても、クラウド上で24時間稼働し続ける点にある。ユーザーが眠っている間にも、AIが能動的にタスクを実行するというコンセプトは、個人の生産性向上に新たな可能性を切り拓くものだ。

Gemini

Sparkの中核技術──Gemini 3.5とAntigravityフレームワーク Gemini Sparkは、Googleの最新AIモデル「Gemini 3.5」と、専用のエージェント開発フレームワーク「Antigravity」を基盤として構築されている。Antigravityは、AIエージェントが複数のツールやサービスを連携させながら自律的に判断・実行するための基盤技術とされる。これにより、従来のAIアシスタントが「質問に答える」ことにとどまっていたのに対し、Gemini Sparkは「指示に基づいて実際の行動を起こす」ことが可能になる。具体的には、Google Cloud上の専用仮想マシン環境で動作し、ユーザーのデバイス状態に依存せずにタスクを継続できる。

デバイスを閉じてもバックグラウンドでタスク実行 Gemini

Sparkの画期的な点は、ユーザーがノートPCの蓋を閉じたり、スマートフォンの画面をロックしたりしても、バックグラウンドでタスクが継続されることだ。AndroidとiOSの両方に対応しており、すべてのタスクのステータスがデバイス間でリアルタイムに同期される。例えば、出張の予定確認から経費精算のためのスプレッドシート作成まで、複数のステップにわたる作業をAIが一貫して処理する。ユーザーは後から専用のダッシュボードで進捗を確認でき、AIがどのように行動したかをトレースできる設計になっている。

Google

Workspaceとの深い連携──複雑なワークフローを自動化 Gemini Sparkは、Gmail、Googleドキュメント、Googleスプレッドシート、GoogleドライブなどのGoogle Workspaceツールとシームレスに連携する。発表会で示された具体例は印象的だ。例えば、イベントの出欠確認メールがGmailに届いた場合、Gemini Sparkは自動的に内容を解析し、スプレッドシートの出欠表に反映する。さらに、返信を待っている相手にはリマインダーメールを送信し、回答期限が近づけばユーザーに通知する。こうした複数のアプリケーションにまたがる作業を、AIが一つのワークフローとして完結させるのだ。 また、「Ghostwriter」と呼ばれる機能では、ユーザーが過去に書いた文章を学習し、本人らしいトーンやスタイルで文書作成を支援する。例えば、週次報告書の下書きを自動生成する際、単なるテンプレート埋めではなく、ユーザーの個性を反映した自然な文章を作成できるという。さらに、「プランナー」機能を使えば、複数のタスクをまとめて指示するだけで、AIが最適な順序と方法で実行計画を立案し、逐次実行していく。

外部サービスとの拡張──MCPプロトコルでエコシステム構築 Google

Workspaceに留まらず、Gemini Sparkは外部のサードパーティツールとも連携する。その鍵となるのが「MCP(Model Context Protocol)」と呼ばれる標準プロトコルだ。これにより、Canva、OpenTable、Instacartなどのサービスと接続し、例えばデザイン作成、レストラン予約、食材の注文といった生活領域のタスクまで自動化できる。MCPはエージェントが外部APIを安全に呼び出すための共通インターフェースとして機能し、今後対応サービスが拡大する見込みだ。 将来的には、Chromeブラウザ上で直接Gemini Sparkを動作させる「エージェントタブブラウザ」機能も計画されている。Webサイトを巡回しながら情報を収集したり、フォームに入力したりするなど、ブラウザベースのタスクもエージェントが担えるようになるという。

安全性とユーザーコントロール──重要な行動前には確認必須 自律型エージェントが能動的に行動するからこそ、安全性と透明性が重視されている。

Gemini

Sparkは、予約の追加やキャンセル、金銭が発生するような取引など、影響の大きい行動を実行する前に、必ずユーザーに確認を求める設計になっている。また、バックグラウンドで実行中のタスクは、専用のアプリケーションダッシュボードからリアルタイムで確認でき、必要に応じて一時停止やキャンセルも可能だ。ユーザーがAIの行動を逐一監視し、制御できる点が、信頼性確保の重要なポイントとされる。

提供スケジュールと今後の展望 Gemini

Sparkはまず、テスター向けに提供が開始される。一般向けには、サブスクリプションサービス「Google AI Ultra」の加入者を対象に、段階的に開放される予定だ。Googleは、Gemini Sparkを単なるツールとしてではなく、ユーザーのデジタルライフを支える「パーソナルエージェント」と位置づけており、今後は音声インターフェースや拡張現実(AR)環境への統合も視野に入れている。 この発表は、AIが「対話」から「行動」へとパラダイムシフトする象徴的な事例と言える。個人の生産性を飛躍的に高める一方で、AIの自律性と人間のコントロールのバランスが、今後の大きな議論となるだろう。Googleは、エージェントが人間の拡張として機能する「協調型AI」の実現を目指しており、Gemini Sparkはその第一歩と位置づけられている。

よくある質問

Gemini Sparkはどのように動作するのですか?
Gemini SparkはGoogle Cloud上の専用環境で24時間稼働し、ユーザーの指示に基づいて自律的にタスクを実行します。スマートフォンやPCのデバイスを閉じてもバックグラウンドで作業が継続され、AndroidとiOSの両方でステータスが同期されます。
どのようなサービスと連携できるのでしょうか?
Google Workspaceのツール(Gmail、ドキュメント、スプレッドシートなど)と深く連携するほか、MCPプロトコルを通じてCanva、OpenTable、Instacartなどの外部サービスとも接続可能です。これにより、仕事から生活まで幅広いタスクを自動化できます。
安全性は確保されているのでしょうか?
はい。重要な行動を実行する前には必ずユーザーに確認を求める設計になっています。また、バックグラウンドで実行中のタスクはリアルタイムで確認・管理でき、ユーザーがいつでもコントロールできるようになっています。
出典: ITmedia News

コメント

← トップへ戻る