Token工場半年で20倍成長、AI推論需要爆発の好循環
AI推論需要の爆発に伴い、中国スタートアップ無問芯穹(Infinigence AI)のToken工場ビジネスが半年で20倍以上に成長。チップとモデルの間を最適化する中立インフラモデルが好循環を生み出している。
AI産業の物語が訓練から推論へと大きく舵を切っている。2026年、全世界の企業における推論インフラへの設備投資は680億米ドルに達し、訓練インフラの450億米ドルを上回ると国際データ機関が予測する。推論市場が訓練市場を凌駕するこの転換点は、産業構造そのものを変えつつある。
虎嗅網の報道によれば、こうした需要爆発の只中で、中国のスタートアップである無問芯穹(ウーウェンシンチョン、Infinigence AI)が「Token工場」と呼ばれるビジネスモデルで急成長を遂げている。同社のAgentic MaaS(Model as a Service)事業におけるToken呼び出し量は、2025年12月から2026年4月までの間で20倍以上に拡大。その95%以上がエージェント(エージェント)からの需要だという。
推論需要が訓練を上回る転換点
これまでAI産業の主軸は訓練にあった。より多くのGPUを持つ者、より大規模なモデルを訓練できる者が市場を支配してきた。しかし2025年末以降、状況は一変した。AIが単なるチャットではなく、コードの記述、契約書の審査、プロジェクトの継続的なフォローアップといった複雑なタスクを実行するようになると、消費するToken数は従来の数十倍から数百倍に跳ね上がる。
無問芯穹のデータはこの変化を如実に示している。同社のプラットフォームで呼び出されるTokenのうち、95%以上がエージェントシーンから発生している。推論需要の爆発は、AI産業の価値の重心を下流へと押し下げ、これまでパイプラインに過ぎなかったインフラ層を「Token生産の中枢」へと変貌させている。
チップとモデルの間に立つ中立プレイヤー
無問芯穹のビジネスモデルは極めて特異だ。同社は汎用大規模言語モデル(LLM)を開発せず、自社チップも製造せず、消費者向けアプリケーションも提供しない。チップとモデルの間に立ち、供給が需要に追いつかない計算リソースをスケジューリング、マッチング、最適化し、より効率的にTokenへと変換する。言わば、AI産業チェーンにおけるToken生産のハブである。
共同創業者兼CEOの夏立雪氏は虎嗅網のインタビューで、「本当にAIで収益を上げている人々は、価格に怖気づくことは決してなく、ただ静かにコスト削減の方法を模索するだけだ」と語っている。同社は中立性を武器に、チップメーカー、モデル企業、アプリケーション企業といったさまざまな関係者を統合する立場を確立した。
好循環を生むバリューチェーン
無問芯穹は内部に「AI生産力=智能規模 × Token生産効率 × Token価値転換」という中核公式を持つ。現在、1兆パラメータ規模のLLMシーンにおいて、コストパフォーマンスを5〜10倍向上させることに成功している。
需要が多ければ多いほど、また多様であればあるほど、最適化可能なチップとモデルの組み合わせの余地が広がる。その結果、より安定した高コストパフォーマンスのTokenが生み出され、さらなる需要を呼び込む。この好循環(フライホイール)が回り始めている。
現在の課金モデルは、広告業界のCPM(インプレッション単価)に類似したToken単位の従量制である。技術最適化によって削減されたコストは直接粗利益に転換され、研究開発に再投資される。ユーザーは基盤となるハードウェアを意識する必要がなく、直感的な価値を享受できる。この構造が、Tokenの生産コストが下がり続けながら販売価格が上がり続けるという、一見矛盾した現象を説明している。
プリフィルとデコードの分離が拓く国産チップ
LLMの推論は、計算集約型のプリフィル(Prefill)段階と、メモリアクセス集約型のデコード(Decode)段階に二分される。この二つのタスクではチップに求められる要件がまったく異なる。
国産チップはすでに「使えるかどうか」という段階を超えている。特にプリフィルシーンは現在の国産チップの能力に適合し、実際の実装が進んでいる。虎嗅網の報道は、たとえ国産化という物語を排除しても、世界のAI計算リソースは供給不足状態にあると指摘する。無問芯穹の中核は計算リソース不足の解決そのものであり、事業成長のロジックは影響を受けないという。
Token価格低下が生む小規模AIネイティブ組織
夏立雪氏は、Tokenのコストは現在もなお1〜2桁(10〜100倍)の低下余地があると見込む。コストが低下すれば、10人から20人程度の小規模なAIネイティブ組織が大量に出現するだろう。こうした組織では人間とAIが深く協働し、生産効率は従来の同規模のチームを大幅に上回ると予測される。
デジタルトランスフォーメーション(DX)を完了した分野では、より早期にこうした組織が生まれる。AIは現在もなお需要が供給を上回る段階にあり、ゼロサムゲームにはほど遠い。産業チェーンの各主体は、価値を創造すれば利益を得ることができ、パラダイムシフトは新たな成長空間をもたらすにすぎない。
編集部の見解
短期的には、Token工場モデルの競争が激化する可能性がある。無問芯穹のような中立インフラプレイヤーが成功を示せば、同様のモデルを狙うスタートアップや、クラウド大手による囲い込みが加速する。今後3〜6カ月で、日本市場においても推論インフラの最適化を専門とする企業の出現や、既存クラウド事業者のToken課金体系の見直しが進むと見られる。 長期的視点では、このビジネスモデルが産業の分業構造をさらに進化させる可能性がある。チップ、モデル、インフラ、アプリケーションの各層が独立して最適化されることで、AI導入のハードルは大きく低下する。特にアジア圏では、コスト感度の高いエンジニアリング文化がToken工場の発展を後押しするだろう。1〜3年後には、Token単位でのリソース取引が一般化し、従来のGPUリース市場とは異なる流動性の高い市場が形成される可能性がある。 編集部としては、中立インフラプレイヤーの技術的バリアの実効性に注目している。チップとモデルの組み合わせ最適化は、一見するとソフトウェアエンジニアリングの問題だが、需要パターンの変化に応じてその価値は変動する。
参考
- 虎嗅网 — 2026-06-19T21:30:41.000Z公開
よくある質問
- Token工場とは何か
- AI推論において、チップとモデルの間に立って計算リソースをスケジューリング・最適化し、効率的にトークンへ変換するビジネスモデル。自社ではチップ開発もモデル開発も行わず、中立なインフラとして各プレイヤーを統合する。
- 無問芯穹(Infinigence AI)の成長が示す市場の変化は
- AI産業の価値が訓練から推論へ移行していることを示す。エージェントの普及によりToken消費量が爆発的に増加し、推論インフラへの投資が訓練を上回る時代が到来した。
- Tokenコストがさらに低下するとどうなるか
- 10〜20人規模の小規模AIネイティブ組織が大量に出現すると予測される。人間とAIの深い協働により従来のチームを大幅に上回る生産効率が実現し、産業構造そのものが変革される可能性がある。 ## 参考 - [半年20余倍增長,一個中国Token工厂的生意飛輪](https://www.huxiu.com/article/4867715.html?f=rss) — 2026-06-20公開(虎嗅網)
コメント