開発

Alibaba Cloud、エージェント時代のクラウド基盤を全面再構築

Alibaba Cloudがエージェント時代に向け、チップ・クラウド・モデルを一体化した基盤構築を進める。Agentic Cloud of 全貌と自社チップ of 最新ロードマップに迫る。

14分で読める SINGULISM 編集チームが確認・編集

Alibaba Cloud、エージェント時代のクラウド基盤を全面再構築
Photo by Growtika on Unsplash

エージェントがクラウドの「顧客」になる時代

Google I/OでもAWS re:Inventでも、今や世界のテックカンファレンスの中心テーマは「エージェント」だ。

インテリジェントエージェントが検索、ブラウザ、スマートフォン、さらにはスマートグラスにまで浸透し、単なる対話アシスタントから24時間自律的にタスクを実行する存在へと進化しつつある。この潮流の中で、クラウドプロバイダー各社が直面している根本的な問いがある。従来のクラウドインフラは、人間のエンジニアが操作することを前提に設計されていた。しかし、エージェントが主要な利用者になる未来において、その前提は通用するのか。 2026年5月20日に開催されたAlibaba Cloud Summitで、Alibaba Cloudはこの問いに対する明確な回答を示した。それは、クラウド、チップ、モデルを真の意味で一体化したパッケージとして再構築するという、極めて大胆な戦略だ。Alibaba Cloudのシニアバイスプレジデントである劉偉光氏は、「エージェントが臨界点を突破すると、24時間休まずに作業でき、AIとクラウドへの需要は無限になる」と述べ、この再構築の必然性を強調した。

従来のクラウドとエージェント時代のクラウドは「別物」

この再構築の背景にあるのは、エージェントの負荷特性と従来のクラウドコンピューティングの負荷特性が、根本的に異なるという認識だ。

従来のクラウドコンピューティングの典型的な負荷は定常的だ。企業がECSを購入し、ウェブサイトやデータベースを稼働させると、トラフィックは比較的予測可能で、リソースは長期間占有される。クラウドプロバイダーのビジネスモデルも、リソース貸出を中心に設計され、コンピューティング、ストレージ、ネットワークの3つがビジネスの柱となっていた。 しかし、エージェントの作業モードは全く異なる。エージェントがタスクを実行する際、ミリ秒単位で数十回のモデル呼び出しを連続的に行い、タスク完了後はすぐに環境を破棄する。次に呼び出されるのは数分後かもしれないし、数秒後かもしれない。その負荷特性は不規則で突発的であり、短いライフサイクル内で瞬時に大量の負荷が発生し、使用後すぐに消えるのだ。 表面上、エージェントが呼び出すのはモデルだが、実際にはAIフルスタック体系全体が必要となる。コードを実行するためのサンドボックス環境、中間状態を保存するためのデータベース、外部ツールにアクセスするためのネットワークも不可欠だ。エージェントの1回のタスク実行は、コンピューティング、ストレージ、ネットワーク、モデル推論など、複数のリソースの協調的なスケジューリングを引き起こす。新旧の時代のクラウドコンピューティングでは、複雑さの度合いが桁違いなのだ。 劉偉光氏は、今年の春節後にローンチされたロブスター系のインテリジェントエージェント製品をめぐる興味深い現象を紹介した。従来は企業がクラウドリソースを開設するには、人間がコンソールにログインして手動で操作する必要があったが、現在ではエージェントがバックグラウンドで直接クラウドコンピューティングリソースを自動的にアクティブ化しているという。「エージェントは分単位でクラウドコンピューティングリソースのサービス開設を完了できる。これは、かつて私たち人間が日単位で行っていた作業かもしれない」と劉偉光氏は語った。 これは、クラウドの主要な利用対象が人間のエンジニアからエージェントへと移行しつつあることを如実に示す事例だ。

Agentic Cloudとは何か

エージェントが実際にクラウドを使えるようにするため、Alibaba Cloudはクラウド製品を3つの次元で改造した。

「スキル化」「MCP化」「CLI化」だ。各クラウド製品を、エージェントが関数を呼び出すように利用できる標準化された能力モジュールに変える取り組みである。

従来のクラウド製品のコンソールは人間に優しいが、エージェントには何の意味もない。エージェントに必要なのは、構造化された能力の記述と明確な呼び出しプロトコルなのだ。この体系はAlibaba Cloudによって「Agentic Cloud」と命名された。 ここ数年の大規模モデルの学習と推論にサービスを提供してきた「AI Native Cloud」との違いは明確だ。AI Native Cloudがモデルの生産と反復に重点を置き、弾力的で効率的なコンピューティングリソースのスケジューリングを提供するのに対し、Agentic Cloudはインテリジェントエージェントのランタイム向けに、サンドボックス、AIゲートウェイ、記憶管理、セキュリティ保護、オーケストレーションガバナンスなどの一連の能力を提供する点にある。 数年前、クラウドプロバイダーがAIを行う主な目的は、モデル企業にコンピューティングリソースを販売して学習と推論に使用させることだった。しかし今、Alibaba Cloudが行おうとしているのは、クラウド自体をエージェントが動作するオペレーティングシステムにすることだ。これは、クラウドビジネスの本質的な在り方を変える試みと言える。

自社チップで物理基盤を固める

Agentic Cloudがアーキテクチャレベルでの回答だとすれば、チップはその物理的基盤となる。

今回のサミットで、Alibaba Cloudは自社開発チップのロードマップを発表した。

半導体子会社のT-Headは、次世代の学習と推論の統合AIチップ「真武M890」を発表した。メモリ144GB、チップ間接続帯域幅800GB/sを備え、前世代の真武810Eの3倍の性能を持つとされる。同時に発表されたICN Switch 1.0接続チップは、128枚のAIチップを1台の超ノードサーバーに構成でき、P2P遅延は150ナノ秒未満だという。 T-Headは今後2年以内に、より強力な計算能力を持つ真武V900、真武J900の2世代のチップを順次リリースする予定だ。これは、Alibaba Cloudのチップ反復のペースがモデルの反復ペースと一致し、各世代のチップ性能の向上が、大規模モデルの学習と推論能力の飛躍に直接つながることを意味する。 真武シリーズのAIチップは累計56万枚を出荷し、電気通信、自動車、金融など20以上の業界の400社以上の顧客にサービスを提供している。さらに、Alibaba自社開発の倚天シリーズCPU、磐脈インテリジェントNIC、鎮岳ストレージコントローラーチップを加え、Alibabaのチップ版図は単一ポイントのブレークスルーから全面カバレッジへと移行した。コンピューティング力、ネットワーク力、ストレージ力の3つの次元にわたるデータセンターのチップマトリックスは、国内のクラウドプロバイダーの中でユニークな存在だ。 劉偉光氏は、チップ・クラウド・モデル・推論の一体化ロジックを繰り返し強調した。「今日、顧客に最終的に提示される結果は、歯車が噛み合った組み合わせ効果であり、モデル能力、チップ能力、クラウド能力という3つの事柄の完全で有機的な結合です」。

百錬推論プラットフォームが「生産車間」として機能する

チップとモデルの間で、百錬(Bailian)推論プラットフォームが「生産車間」として機能する。

Alibaba Cloudは百錬上に大規模なGPUリソースクラスターを構築し、エージェントシナリオに特化した技術スタックを通じて、推論側の特殊な課題に対応している。 その技術的な取り組みには、複数の重要な要素がある。プール化スケジューリングでGPUリソースを統一管理し、全体的な利用率を向上させる。コンテキストキャッシュにより、エージェントの多対話や長チェーンタスクにおける重複計算オーバーヘッドを排除する。スループット弾力的スケジューリングで、エージェントの同時リクエストのピークとトラフに対応し、トラフィック急増時にクラッシュせず、どん底の時期に無駄がないことを保証する。 さらに注目すべきはAgentic RLメカニズムだ。エージェントの実際の実行フィードバックに基づく強化学習により、モデルは実際のシナリオで使用されるほど良くなり、持続的な反復のループを形成する。 また、百錬にはセキュリティガバナンス能力が組み込まれている。エージェントが自律的に動作する文脈では、これは極めて重要だ。24時間休まずにタスクを実行するエージェントに、境界の制約がなければ、結果は制御不能になる。百錬のセキュリティメカニズムは、エージェントが常に事前設定された権限範囲内で行動することを保証する仕組みとなっている。

Qwen3.7-Maxが見せた35時間の自律実行

モデル部分を見ると、最新リリースのQwen3.7-Maxは、サードパーティ機関Arenaのグローバル大規模モデルブラインドテスト総合ランキングで、国産モデルとして第1位にランクインし、GPT、Claude、Geminiの最強モデルに迫っているとされる。

より説得力のあるのは、実際のケースだ。これまで接したことがない真武M890チップ上で、Qwen3.7-Maxはタスク説明書のみを頼りに、ゼロから自律的に35時間働き、生産レベルのAIコンピューティングカーネルの作成と最適化を独立して完了した。最終的な性能は公式バージョンの10倍に向上したという。人間の介入も、中間の指導もない。35時間でゼロから生産レベルへ。これは、モデルが「複雑なエンジニアリングタスクを自律的に完了する」能力を示す事例であり、動作するハードウェア基盤こそがAlibaba自社開発のチップだ。チップとモデルの協調進化が、このケースで具象化されたと言える。 直近3ヶ月でQwenのフラッグシップモデルは、3.5、3.6、3.7の3つのバージョンを連続してリリースしている。このペース自体が、Alibabaがモデルの進化を意図的に加速し、エージェント時代のモデル能力に対する指数関数的な成長需要に合わせようとしていることを示している。逆に言えば、モデルの反復速度は、最終的にはコンピューティング力の供給に制約される。ここでも、チップ・クラウド・モデルという一体化のロジックに行き着く。

Googleとの比較が示す戦略の独自性

Googleとの比較は、Alibaba Cloudの戦略の独自性を浮き彫りにする。

GoogleのTPUとGeminiモデルの深い結びつきは、独自の深層学習フレームワークにおいて最高のコストパフォーマンスを実現し、技術面でも資本市場でも高い評価を受けている。Alibabaが自社開発チップで自社開発モデルを実行し、ソフトウェアとハードウェアの深い協調を通じて、各チップの各コンピューティングユニットを極限まで活用するというアプローチは、Googleの路線と類似しつつも、クラウドビジネスそのものをエージェントのランタイムへと変革するという点で、より踏み込んだ取り組みだと言える。 AWSやMicrosoft Azureも同様に、エージェントの論理に基づいて自社のビジネスとインフラ基盤を再構築しているが、Alibaba Cloudのようにチップからモデルまでを自社で一貫して開発し、かつそれを一体化したパッケージとして提供しようとしているクラウドプロバイダーは、世界を見渡しても限られている。

「古い枠組み」を超える評価が必要

この1年間、Alibaba Cloudに対する外界の議論は、前例のない資本投入でAIインフラに大きく賭けたことに対する疑問が中心だった。

AI時代向けのクラウド基盤構築にこれほど多額の資金が必要なのか、AlibabaはAIの資本ストーリーで株価を吊り上げようとしているのでは、という声だ。 しかし、今回のサミットで示された全体像を踏まえれば、これらの疑問は「古い枠組み」でAlibaba Cloudを評価している可能性がある。市場シェアや成長率、AWSやAzureとの差といった従来の指標だけで測れない変化が起きているのだ。 エージェントがクラウドの主要な利用者になるという前提に立てば、クラウドインフラそのものの設計思想が変わる。エージェントの不規則で突発的な負荷特性に対応するためには、チップ、ネットワーク、ストレージ、推論基盤、セキュリティに至るまで、フルスタックでの再構築が必要になる。Alibaba Cloudが示したのは、その再構築を自社技術で一貫して実行しようとする意志と、そのための具体的なロードマップだ。 エージェント時代のクラウドがどのような姿になるのか、その答えはまだ完全には見えていない。しかし、Alibaba Cloudが描いた青写真は、クラウド業界の次の10年を規定する重要な一ページになる可能性を秘めている。

よくある質問

Alibaba Cloudの「Agentic Cloud」と従来のクラウドサービスは何が違うのですか?
従来のクラウドは人間のエンジニアがコンソールを操作して利用する前提で設計されていましたが、Agentic CloudはAIエージェントが直接クラウドリソースを呼び出せるように設計されています。具体的には、クラウド製品を「スキル化」「MCP化」「CLI化」し、エージェントが関数を呼び出すように利用できる標準化された能力モジュールに変換しています。エージェント向けのサンドボックス、AIゲートウェイ、記憶管理、セキュリティ保護などの機能も備えています。
Alibaba Cloudの自社開発チップ「真武」シリーズはどのような位置づけですか?
真武シリーズはAlibabaの半導体子会社T-Headが開発するAIチップで、学習と推論の両方に対応する統合チップです。最新の真武M890は前世代の3倍の性能を持ち、今後2年以内にさらに強力な真武V900、真武J900がリリースされる予定です。累計56万枚が出荷され、20以上の業界で利用されています。CPU、NIC、ストレージコントローラーチップと合わせて、データセンター全体をカバーするチップマトリックスを構築しています。
Qwen3.7-Maxの性能は他の大規模モデルと比較してどの程度ですか?
Qwen3.7-Maxは、サードパーティ機関Arenaのグローバル大規模モデルブラインドテスト総合ランキングで国産モデルとして第1位にランクインし、GPT、Claude、Gemini의最強モデルに迫る性能を持つとされています。また、自社チップ上で35時間の自律実行により生産レベルのAIコンピューティングカーネルをゼロから構築し、公式バージョンの10倍の性能を達成した実績もあります。
出典: 钛媒体

コメント

← トップへ戻る