Modular社が開発するAI/MLフレームワークで、同社のプログラミング言語Mojoと密接に連携する。グラフベースの実行モデルを持ち、複数のハードウェアバックエンドをサポートする。

M5以前のAppleシリコンでも動作するか

M1からM4までの旧世代でも動作可能だが、テストはM3〜M5中心で行われている。M1やM2では一部モデルで互換性の問題が発生する可能性があり、Modular社はIssue報告を求めている。

MLXとの違いは何か

MLXはAppleが主導する機械学習フレームワークで、Appleシリコン向けに最適化されている。MAXはMojo言語との統合やグラフ最適化に強みを持つが、現時点で両者の直接的なベンチマーク比較は公開されていない。

開発

MAXモデル、AppleシリコンGPU対応 M5までの全世代サポート

Modular社がMAXフレームワークの最新リリースでAppleシリコンGPU対応を拡大。M1からM5までの全世代でテキスト生成LLMや画像生成モデルが動作可能に。

2026年6月28日 6分で読める SINGULISM 編集チームが確認・編集

Apple GPU AI 機械学習フレームワーク

MAXモデル、AppleシリコンGPU対応 M5までの全世代サポート — Photo by Adrian Regeci on Unsplash

Modular社は2026年6月27日（現地時間）、同社が開発するAI/MLフレームワーク「MAX」がAppleシリコンGPUで動作するようになったと発表した。バージョン26.4以降のリリースにより、M1からM5までの全世代のAppleシリコンGPU上でテキスト生成LLM、視覚モデル、画像拡散モデルが実行可能となる。従来はMojo言語でのプログラミング対応や基本的なMAXグラフの実行に限られていたが、今回のアップデートで多くの実用的なモデルがネイティブに動作する環境が整った。

対応ハードウェアとパフォーマンス特性

MAXがサポートするGPUはM1からM5までのAppleシリコン全世代だ。ただし、世代間のアーキテクチャ差により、すべてのモデルが全世代で同等に動作するわけではない。Modular社のエンジニアチームは主にM3〜M5のシステムでテストを行っており、M1やM2の旧世代では検証不足の組み合わせが存在する。同社は問題が発生した場合、GitHubのIssueトラッカーに報告するようユーザーに求めている。

特にM5システムでは、専用の行列乗算演算を備えた新Neural Acceleratorが搭載されている点が重要だ。Modular社のPreston氏とFabio氏は、この演算ユニットをターゲットにしたカーネルの開発を進めており、内部テストでは高い実行速度を確認している。同社は現時点ではMLXや他のフレームワークとの直接的なベンチマーク比較を公開していないが、実用的な速度が達成されていると述べている。

利用開始と制約

MAXのAppleシリコンGPU対応を試すには、Modular社のリポジトリからMAXをセットアップし、コマンドライン経由でモデルを実行する。例えば、Qwen/Qwen3.5-0.8Bのような小型LLMであれば、以下のコマンドで直接テキスト生成が可能だ。

max generate --model-path=Qwen/Qwen3.5-0.8B --device-memory-utilization 0.5 --max-batch-size 1 --prompt "The sky is blue because"

同様に、サーバーとしてエンドポイントを公開する場合はmax serveコマンドを使用する。注目すべきは、メモリ制限用のフラグ--device-memory-utilizationと--max-batch-sizeの存在だ。AppleシリコンはCPUとGPUで共有メモリを利用するため、不必要なメモリ割り当てを防ぎ、システム全体の安定動作を保証する設計となっている。

システムに15GB以上の空きRAMがある場合、40億パラメータの画像生成モデル**FLUX.2 [klein]**もローカル実行可能だ。同社はsimple_offline_generationサンプルを用いた256×256ピクセルの画像生成や、Open Responsesエンドポイント経由のサーブ機能を提供している。

今後の最適化と開発ロードマップ

Modular社は現在もモデルカバレッジとパフォーマンスの改善を継続中である。ナイトリービルドではカーネルチューニングやモデル対応の進捗に伴い、一時的なパフォーマンス低下が発生する可能性があるとしている。特にM5以前の世代に対する最適化はまだ多くの領域が残っており、今後のアップデートで段階的に改善される見通しだ。

同社は「ナイトリービルドで最新の改善を追ってほしい」とコメントし、継続的な開発姿勢を示している。

編集部の見解

本件は、Appleシリコンを搭載したMacをAI/ML開発の実用的なプラットフォームとして位置づける上で、一つの節目と言える。M5のNeural Accelerator専用カーネルの存在は、Appleが進めるオンチップAI処理の方向性とModular社の技術戦略が合致した結果だ。短期的には、MacユーザーがクラウドGPUに依存せずにローカルでLLMや画像生成モデルを試せる環境が広がり、プロトタイピングの敷居が下がると評価できる。特にプライバシーを重視する企業では、ローカル推論の選択肢として注目されるだろう。長期的視点に立てば、MLXやPyTorch MPSバックエンドとの競争が激化する可能性がある。Modular社はMojo言語との統合を強みとしており、グラフ最適化とハードウェア特化カーネルの組み合わせで差別化を図る戦略だ。ただし、AppleシリコンのGPUメモリ容量制限（現行最大192GB）は大規模モデルの実行には依然として壁となる。この制約をどう克服するかが、本格的なローカルAIワークステーションとしての普及を左右する。

参考

MAX models can now run on Apple silicon GPUs - Modular Forum — 2026-06-27公開

よくある質問

MAXとは何か: Modular社が開発するAI/MLフレームワークで、同社のプログラミング言語Mojoと密接に連携する。グラフベースの実行モデルを持ち、複数のハードウェアバックエンドをサポートする。
M5以前のAppleシリコンでも動作するか: M1からM4までの旧世代でも動作可能だが、テストはM3〜M5中心で行われている。M1やM2では一部モデルで互換性の問題が発生する可能性があり、Modular社はIssue報告を求めている。
MLXとの違いは何か: MLXはAppleが主導する機械学習フレームワークで、Appleシリコン向けに最適化されている。MAXはMojo言語との統合やグラフ最適化に強みを持つが、現時点で両者の直接的なベンチマーク比較は公開されていない。

出典: Lobsters

執筆 SINGULISM編集部

編集・確認山本健一郎

最終更新日: 2026年6月28日

本サイトでは、事実誤認や不正確な情報が見つかった場合、速やかに訂正記事を掲載します。訂正のご依頼はお問い合わせフォームよりご連絡ください。

← トップへ戻る