MAXモデル、AppleシリコンGPU対応 M5までの全世代サポート
Modular社がMAXフレームワークの最新リリースでAppleシリコンGPU対応を拡大。M1からM5までの全世代でテキスト生成LLMや画像生成モデルが動作可能に。
Modular社は2026年6月27日(現地時間)、同社が開発するAI/MLフレームワーク「MAX」がAppleシリコンGPUで動作するようになったと発表した。バージョン26.4以降のリリースにより、M1からM5までの全世代のAppleシリコンGPU上でテキスト生成LLM、視覚モデル、画像拡散モデルが実行可能となる。従来はMojo言語でのプログラミング対応や基本的なMAXグラフの実行に限られていたが、今回のアップデートで多くの実用的なモデルがネイティブに動作する環境が整った。
対応ハードウェアとパフォーマンス特性
MAXがサポートするGPUはM1からM5までのAppleシリコン全世代だ。ただし、世代間のアーキテクチャ差により、すべてのモデルが全世代で同等に動作するわけではない。Modular社のエンジニアチームは主にM3〜M5のシステムでテストを行っており、M1やM2の旧世代では検証不足の組み合わせが存在する。同社は問題が発生した場合、GitHubのIssueトラッカーに報告するようユーザーに求めている。
特にM5システムでは、専用の行列乗算演算を備えた新Neural Acceleratorが搭載されている点が重要だ。Modular社のPreston氏とFabio氏は、この演算ユニットをターゲットにしたカーネルの開発を進めており、内部テストでは高い実行速度を確認している。同社は現時点ではMLXや他のフレームワークとの直接的なベンチマーク比較を公開していないが、実用的な速度が達成されていると述べている。
利用開始と制約
MAXのAppleシリコンGPU対応を試すには、Modular社のリポジトリからMAXをセットアップし、コマンドライン経由でモデルを実行する。例えば、Qwen/Qwen3.5-0.8Bのような小型LLMであれば、以下のコマンドで直接テキスト生成が可能だ。
max generate --model-path=Qwen/Qwen3.5-0.8B --device-memory-utilization 0.5 --max-batch-size 1 --prompt "The sky is blue because"
同様に、サーバーとしてエンドポイントを公開する場合はmax serveコマンドを使用する。注目すべきは、メモリ制限用のフラグ--device-memory-utilizationと--max-batch-sizeの存在だ。AppleシリコンはCPUとGPUで共有メモリを利用するため、不必要なメモリ割り当てを防ぎ、システム全体の安定動作を保証する設計となっている。
システムに15GB以上の空きRAMがある場合、40億パラメータの画像生成モデル**FLUX.2 [klein]**もローカル実行可能だ。同社はsimple_offline_generationサンプルを用いた256×256ピクセルの画像生成や、Open Responsesエンドポイント経由のサーブ機能を提供している。
今後の最適化と開発ロードマップ
Modular社は現在もモデルカバレッジとパフォーマンスの改善を継続中である。ナイトリービルドではカーネルチューニングやモデル対応の進捗に伴い、一時的なパフォーマンス低下が発生する可能性があるとしている。特にM5以前の世代に対する最適化はまだ多くの領域が残っており、今後のアップデートで段階的に改善される見通しだ。
同社は「ナイトリービルドで最新の改善を追ってほしい」とコメントし、継続的な開発姿勢を示している。
編集部の見解
本件は、Appleシリコンを搭載したMacをAI/ML開発の実用的なプラットフォームとして位置づける上で、一つの節目と言える。M5のNeural Accelerator専用カーネルの存在は、Appleが進めるオンチップAI処理の方向性とModular社の技術戦略が合致した結果だ。短期的には、MacユーザーがクラウドGPUに依存せずにローカルでLLMや画像生成モデルを試せる環境が広がり、プロトタイピングの敷居が下がると評価できる。特にプライバシーを重視する企業では、ローカル推論の選択肢として注目されるだろう。 長期的視点に立てば、MLXやPyTorch MPSバックエンドとの競争が激化する可能性がある。Modular社はMojo言語との統合を強みとしており、グラフ最適化とハードウェア特化カーネルの組み合わせで差別化を図る戦略だ。ただし、AppleシリコンのGPUメモリ容量制限(現行最大192GB)は大規模モデルの実行には依然として壁となる。この制約をどう克服するかが、本格的なローカルAIワークステーションとしての普及を左右する。
参考
- MAX models can now run on Apple silicon GPUs - Modular Forum — 2026-06-27公開
よくある質問
- MAXとは何か
- Modular社が開発するAI/MLフレームワークで、同社のプログラミング言語Mojoと密接に連携する。グラフベースの実行モデルを持ち、複数のハードウェアバックエンドをサポートする。
- M5以前のAppleシリコンでも動作するか
- M1からM4までの旧世代でも動作可能だが、テストはM3〜M5中心で行われている。M1やM2では一部モデルで互換性の問題が発生する可能性があり、Modular社はIssue報告を求めている。
- MLXとの違いは何か
- MLXはAppleが主導する機械学習フレームワークで、Appleシリコン向けに最適化されている。MAXはMojo言語との統合やグラフ最適化に強みを持つが、現時点で両者の直接的なベンチマーク比較は公開されていない。
コメント