AI

Google I/O 2026、AIモデル「Gemini Omni」発表。動画生成と開発を革新

Google I/O 2026で「Gemini Omni」と「Gemini 3.5 Flash」が登場。動画生成の新たな地平と、圧倒的な速度でコードを書くエージェント開発ツールが公開された。検索もエージェント化へ進化する。

11分で読める SINGULISM 編集チームが確認・編集

Google I/O 2026、AIモデル「Gemini Omni」発表。動画生成と開発を革新
Photo by Abid Shah on Unsplash

Google I/O 2026、AIがすべてのプロダクトの中心に

本日のGoogle I/Oカンファレンスは、文字通りAIに彩られた一幕となった。Google CEOのデミス・ハサビス氏が最初に示したのは、同社のAI基盤「Gemini」の驚異的な成長データだった。Gemini Appの月間アクティブユーザーは9億を超え、毎月処理されるトークン量は3200兆に達する。画像生成モデル「Imagen」は500億枚以上の画像を生成してきた。これらの数字は、AIがもはやGoogleの一部ではなく、すべての製品とサービスの中核にあることを雄弁に物語っている。 発表は、モデルのアップデートからスタートし、コーディングツール、そして検索サービスの刷新へと展開された。その核心にあるのが、新世代のマルチモーダルモデル「Gemini Omni」と、超高速・高効率を謳う「Gemini 3.5 Flash」である。これらは単なる性能向上にとどまらず、動画生成の概念を変え、ソフトウェア開発のワークフローを根本から変革する可能性を秘めている。

Gemini Omni:動画生成の「Imagen的瞬間」到来

発表会で最初にスポットライトを浴びたのは「Gemini Omni」だった。DeepMind CEOはこれを「あらゆる入力からあらゆるコンテンツを創造できる」新世代モデルと説明した。これは、Geminiの高度な推論能力と、Googleがこれまでに開発してきた動画生成モデル「Veo」、画像生成モデル「Imagen」、インタラクティブシミュレーションモデル「Genie」などの技術を統合し、さらに進化させたものだ。 その目標は、単に映像を生成するだけでなく、重力や運動エネルギーといった物理法則を理解し、より現実に近い「世界モデル」へと到達することにある。デモでは、ユーザーが「たんぱく質折りたたみについての粘土アニメーション解説を生成」とプロンプトを入力するだけで、抽象的な科学概念がわかりやすい動画コンテンツに変換される様子が披露された。また、既存の動画をアップロードし、「この円形をブラックホールに変えて」「夜の散歩シーンをよりドラマチックに」といった対話形式での編集も可能だという。 重要なのは、Omniが動画生成に特化したモデルではないという点だ。Googleはこれを「世界モデル」として位置づけ、将来的には「任意の入力から任意の出力」へと進化させる構想を持つ。つまり、モデルは映像を生成するだけでなく、その中の物体同士の関係やシーンの論理的な整合性を理解する必要があるというわけだ。この能力は、Gemini App、動画制作ツール「Google Flow」、YouTube Shortsなどに統合され、ユーザーの創作体験を画像編集の域から動画編集へと押し上げる。 最初のファミリーモデルとなる「Gemini Omni Flash」はすでに各製品に統合されており、より高性能な「Omni Pro」についても今後詳細が発表される予定だ。Gemini App内のOmni機能は、Google AI Plus、Pro、Ultraのサブスクライバーに開放されている。

Gemini 3.5

FlashとAntigravity 2.0:AIがコードを書き、OSを構築する 生成と編集を担うOmniに対し、「Gemini 3.5 Flash」は速度、コスト、そして実行能力に特化したモデルとして発表された。GoogleはこれをGemini 3.5シリーズの先駆けと位置づけ、特にエージェント型のコーディングや長期にわたる複雑なタスク、実際のワークフローへの適用に重点を置いている。 前世代の3.1 Proと比較して、3.5 Flashはほぼすべてのベンチマークで大幅な性能向上を見せている。特にコード生成能力や、実世界の経済タスクに近い評価において顕著な差がついた。驚くべきはその処理速度で、他の最先端モデルと比較してトークンの出力速度が4倍速く、専用の開発環境で最適化後は12倍の速度に達するとされる。 Googleは、モデルの改善において「フィードバックループ」の重要性を強調した。今年3月時点で同社の内部開発タスクが1日あたり約5000億トークンを処理していたのが、数週間ごとに倍増し、現在では1日あたり3兆トークンを超えているという。この大規模な実使用データが、モデルの継続的な改善を駆動しているというわけだ。 モデルと同時に発表されたのが、エージェント駆動型の統合開発環境(IDE)「Antigravity」の大幅アップグレード、バージョン2.0である。これは従来のIDEの概念を越え、独立したデスクトップアプリケーションへと進化した。重点は「エージェントファースト」へとシフトし、ユーザーはAIにコード補完をさせるだけでなく、エージェントとの対話、エージェントによる生成物の作成、複数エージェントの協調を通じて開発タスクを完了させる。 Antigravity 2.0には、完全なコマンドラインインターフェース(CLI)やソフトウェア開発キット(SDK)が追加され、Geminiの音声モデルをネイティブにサポートする。Android、Firebase、Google AI Studioなどのサービスとの統合も進んでおり、すでに世界中のユーザーに公開されている。 発表会では、このツールのポテンシャルを示す圧巻のデモが行われた。それは、エージェントにゼロから実行可能なオペレーティングシステム(OS)を構築させるというものだ。このタスクは93個のサブエージェントによって並列実行され、12時間にわたって続けられた。その過程で1.5万回以上のモデルリクエストが発行され、26億トークンが処理された結果、空のプロジェクトからスケジューラ、メモリ管理、ファイルシステムなどのコアモジュールが生成されたのである。 Googleによれば、この複雑なタスクは前の世代のGemini 3.1 Proでは完了できなかったが、3.5 Flashを使用した場合、API利用料として1000ドルもかからなかったという。会場ではさらに、この構築されたOS上でSLミニ列車のシミュレーションプログラムや、経典シューティングゲーム「Doom」が動作する様子がデモされた。当初はビデオドライバーやキーボードドライバーがなかったため、Antigravityがさらにコードを生成・修正し、Doomを実行可能にしたというエピソードも紹介された。 Googleは、同様の方法でフォト編集スイートやリアルタイムメッセージアプリ、マルチユーザーコラボレーションプラットフォームなどのプロジェクトもテスト済みだと述べた。かつて数日を要したエンジニアリング作業が、数時間、あるいはそれ以下にまで短縮された事例がすでに存在するという。 Gemini 3.5 Flashはすでにすべてのユーザーに開放されており、Google製品やAPIを通じて利用できる。より高性能な「Gemini 3.5 Pro」は現在内部で使用・改善が行われており、来月一般公開される予定だ。

検索が「情報エージェント」に進化する モデルと開発ツールの発表の後、Googleはプレゼンテーションを自社の中核事業である検索へと移した。

AIを統合した検索体験の刷新である。

Googleは、AIを活用した検索モード「AI Mode」がすでに月間アクティブユーザー数10億を超え、クエリ量は導入以来四半期ごとに倍増していると発表した。この日から、AI Modeは最新のGemini 3.5にアップグレードされる。また、テキスト、画像、ファイル、動画の入力をサポートする新しいスマート検索ボックスも配信開始となった。ユーザーが質問を入力する際にAIによる提案を提供するものだ。 検索体験の統合も進む。ユーザーはまずメインの検索結果ページでAIによる概要回答を確認し、そこからAI Modeにシームレスに移行してさらに深い質問を続けることができる。コンテキストは保持されるため、会話の流れが途切れない。この新しい検索体験は発表当日に世界中のデスクトップとモバイル向けに公開された。 しかし、より大きな変化は「検索エージェント」の導入だ。Googleによると、ユーザーは今年の夏からSearch内で自分専用の情報エージェントを作成し、特定の種類の情報を継続的に追跡・監視させることができるようになるという。 例えば、「株価収益率が15以下でキャッシュフローがプラス、負債が低い大手バイオテクノロジー株」を監視させたり、長期的に賃貸物件の情報、限定スニーカーのコラボレーション情報、特定カテゴリの新商品の入荷情報を追跡させたりできる。条件に合致する情報が変化した場合、エージェントはユーザーに総合的な更新情報を通知する。 さらに、Antigravityで培われたエージェント型のコーディング能力が検索にも応用される計画だ。これにより、検索はウェブページのリンクや要約、情報を返すだけでなく、ユーザーの具体的な質問に対してインタラクティブなインターフェースや可視化を動的に生成することも可能になる。例えば、「ブラックホールは時空にどのように影響するのか」と質問すれば、検索が理解を助けるインタラクティブなシミュレーションを生成する未来が描かれている。

まとめ:Googleの生態系全体を貫くAIエージェントの時代

今回のGoogle I/Oで示されたのは、AIが「モデル」として存在する段階から、ユーザーのあらゆるデジタル活動に深く組み込まれ、能動的にタスクを実行する「エージェント」へと進化しようとしている姿だ。 動画生成の新しい地平を開くGemini Omni、開発者の生産性を飛躍的に高めるGemini 3.5 FlashとAntigravity 2.0、そして情報検索を情報収集・管理のエージェントへと変貌させるAI Mode。これらの発表はすべて、Googleの広大なエコシステム——検索、アプリ、ブラウザ、開発者ツール、さらには次世代のXRメガネやECシーン——に統合されることを前提としている。 デミス・ハサビス氏が示した処理トークン量の急成長は、このエコシステム全体がAIによって駆動され、同時にAIを改善するための巨大なフィードバックループへと変化しつつあることを意味する。「AIがAIを殺す」という表現がふさわしい、自己増殖的な進化の次のステージが、ここから始まろうとしている。

よくある質問

Gemini Omniは具体的にどんなことができますか?
Gemini Omniは、テキストや画像などの入力から、物理法則を考慮した高品質な動画を生成・編集できる新世代AIモデルです。例えば、科学概念の解説動画を自動生成したり、既存の動画のスタイルや内容を対話形式で編集したりすることが可能です。今後、Googleの各種サービスに統合されます。
Antigravity 2.0はプログラマー以外にも役立ちますか?
現時点では主にソフトウェア開発者向けのツールですが、そのエージェント能力は将来的に幅広いタスクの自動化に応用される可能性があります。デモではOSをゼロから構築する様子が披露され、複雑なプロジェクトの初期セットアップやコード生成を劇的に効率化できるポテンシャルを示しています。
Google検索の「エージェント」機能はいつ使えますか?
Googleは、ユーザーが検索内で情報エージェントを作成できる機能を、今年の夏から導入する計画を発表しました。株価、賃貸情報、商品の入荷通知など、特定の条件で情報を継続的に監視・通知してくれる機能です。
出典: 爱范儿

コメント

← トップへ戻る