Qualcomm、DRAM下に演算設定のAIアクセラレータ「HBC」
Qualcommがデータセンター向けAIアクセラレータの新アーキテクチャ「High-Bandwidth Compute(HBC)」を発表。DRAM層の下に演算ユニットを設定し、768GBのメモリ容量と133TB/sの実効帯域幅を実現すると主張する。
Qualcommがデータセンター向けAIインフラ分野での巻き返しに向け、新たなアーキテクチャを打ち出した。同社は2026年6月30日に開かれた投資家向け説明会で、DRAMの層下に演算ユニットを設定するニアメモリコンピューティング技術「High-Bandwidth Compute(HBC)」を発表した。The Registerが報じている。
この技術は、AI250シリーズのDragonflyラックシステムに搭載される予定で、従来NVIDIAやAMDが席巻するデータセンターAIアクセラレータ市場にQualcommが本格参入するための布石と位置づけられる。
HBCアーキテクチャの概要
HBCの核心は、DRAMのスタックの下にXPU(アクセラレータ用プロセッサ)の演算回路の一部を直接設定する点にある。これにより、SRAMのような低レイテンシ性能を維持しながら、HBM(High Bandwidth Memory)のような大容量メモリを実現するとQualcommは説明する。
同社のデータセンター担当エグゼクティブバイスプレジデント、Tony Pialis氏は投資家向け説明会で「SRAMの性能上の利点をすべて提供しつつ、HBMスタックが持つ密度とメモリ容量を実現する」と述べた。
このアーキテクチャは、一つの統合されたコンピュート・メモリモジュールを形成する。従来のGPUアーキテクチャでは演算チップとHBMが別々にパッケージされるが、HBCではメモリと演算が物理的に一体化されることで、データ転送のボトルネックである「メモリウォール」問題の緩和を狙う。
AI250が掲げる性能数値
Qualcommが公開した数値によれば、HBCを採用したAI250アクセラレータ1枚あたりのメモリ容量は768GB、実効メモリ帯域幅は133TB/sに達する。比較対象として、NVIDIAのGroq 3 LPUは500MBのSRAMと150TB/sの帯域幅を提供する。容量と帯域幅のトレードオフで、Qualcommは大容量メモリを重視した設計であることがわかる。
ただし、Qualcommの主張は「実効(effective)」という修飾語に依存している点に注意が必要だ。同社はAI200ベースのDragonflyシステムにおいても、56チップ全体で414TB/sの実効メモリ帯域幅を謳っている。The Registerの取材に対し、Qualcommはこの数値が「LPDDRインターフェースの純粋な物理帯域幅である」と説明したが、8800MT/sのLPDDR5xだけでこの帯域幅を達成するには6,720ビット幅のバスが必要となり、その実現方法については詳細を明らかにしていない。
AI250ではAI200比で18倍、さらに次世代のAI300では54倍の実効帯域幅が実現されるとする。これらの数値はHBCアーキテクチャに固有の帯域幅増幅効果によるものとQualcommは説明している。
データセンター戦略の転換点
Qualcommはスマートフォン向けSnapdragonプロセッサでNPUを搭載し、AI処理に長年取り組んできた。しかしデータセンター分野では、NVIDIAやAMD、さらにはCerebrasのようなスタートアップと比べても存在感が薄かった。今回のHBC発表は、同社がAIインフラ市場に本腰を入れる姿勢を示すものである。
2026年に出荷開始予定のAI200ベースのDragonflyシステムに続き、2027年にはAI250シリーズが投入される見通し。Qualcommは独自のニアメモリコンピューティング技術で、GPU中心の既存市場構造に風穴を開けようとしている。
ただし、HBCの真価は実際のワークロードでの性能と電力効率にかかっている。「実効帯域幅」という用語が示すように、クアルコムの主張は理論上のピーク値に基づく可能性が高い。システム全体としての実用的な推論性能や消費電力の実測値が公表されるまでは、市場の評価は保留されるだろう。
編集部の見解
短期的には、QualcommのHBC発表はNVIDIAとAMDが支配するデータセンターAIアクセラレータ市場に新たな選択肢をもたらす可能性がある。特に大規模言語モデル(LLM)の推論フェーズでは、大容量メモリが直接的なアドバンテージになる。しかし、2027年の製品投入までにNVIDIAがBlackwell後継アーキテクチャを投入している可能性が高く、競争環境は一段と厳しさを増すと見られる。QualcommがGPUベンダーと互角に戦うには、単なるメモリ容量だけでなく、ソフトウェアエコシステムと総所有コスト(TCO)の優位性を示す必要がある。現時点では「実効帯域幅」の定義が曖昧であり、独立したベンチマークによる検証が不可欠だ。編集部としては、Qualcommがサードパーティのテスト環境を早期に提供するかどうかが、このアーキテクチャの信頼性を測る最初の試金石になると考える。 長期的視点では、HBCのようなニアメモリコンピューティングのアプローチは、半導体プロセス微細化の限界が顕在化する中で、システム全体の性能を引き上げる現実的な解になり得る。
参考
よくある質問
- HBCアーキテクチャの最大の特徴は何か
- HBCはDRAMスタックの下にアクセラレータの演算回路の一部を設定するニアメモリコンピューティング方式を採用している。これによりSRAM並みの低レイテンシとHBM並みの大容量メモリを両立するとされる。
- AI250の実効帯域幅133TB/sはどの程度現実的なのか
- Qualcommは「LPDDRインターフェースの純粋な物理帯域幅」と説明するが、その帯域幅を達成するには極めて広いメモリバスが必要であり、詳細な実装方法は公開されていない。現時点では理論上の数値と見るのが妥当であり、実際のワークロードでの検証が求められる。
- 競合となるNVIDIAやAMDの製品とどう比較されるか
- NVIDIA Groq 3 LPUが500MB SRAMで150TB/sの帯域幅を提供するのに対し、AI250は768GBの大容量メモリと133TB/sの帯域幅を主張する。容量では優位だが、帯域幅ではGroqに劣る。ただしHBCは推論ワークロードでのメモリ容量不足を解消する点に強みがある。
コメント