開発

コードベース記憶MCP、AIエージェント向け高速エンジン

コードベース全体をミリ秒でインデックスし、構造クエリを1ms未満で応答するAIエージェント向けツール「codebase-memory-mcp」が登場。Linuxカーネル(28M LOC)を3分で解析する。

7分で読める SINGULISM 編集チームが確認・編集

コードベース記憶MCP、AIエージェント向け高速エンジン
Photo by Mohamed Nohassi on Unsplash

AIコーディングエージェント向けに特化したコードインテリジェンスエンジン「codebase-memory-mcp」が注目を集めている。このツールはGitHub Trendingに浮上し、開発者コミュニティで急速に認知が広がっている。単一の静的バイナリとして提供され、リポジトリ全体をフルインデックスした上で、AIエージェントがコード構造に関する問い合わせを極めて高速に実行できるようにする。

従来手法を凌駕する速度

codebase-memory-mcpの最大の特徴は、そのインデックス速度にある。標準的なリポジトリをミリ秒単位でフルインデックスし、大規模なコードベースであるLinuxカーネル(約2800万行、7万5000ファイル)でも3分で完了する。構造クエリに対する応答は1ミリ秒未満だ。

このパフォーマンスは、RAM優先のパイプライン設計によって実現されている。LZ4圧縮、インメモリSQLite、Aho-Corasickパターンマッチングを組み合わせ、インデックス処理後にメモリを解放する仕組みを採用している。これにより、ファイル単位の探索(grepやreadの繰り返し)と比較して、構造クエリ5件あたりのトークン消費が約3400トークンと、従来の約41万2000トークンに比べて120分の1に削減される。

158言語対応とハイブリッド解析

コード解析の品質を支えるのが、tree-sitter AST解析とHybrid LSPセマンティック型解決の組み合わせだ。tree-sitterは158言語に対応し、すべての文法がバイナリ内にベンダリングされている。追加のインストール作業は不要で、環境に依存せずに動作する。

さらに、Python、TypeScript、JavaScript、JSX、TSX、PHP、C#、Go、C、C++、Java、Kotlin、Rustの13言語については、Hybrid LSPによるセマンティック型解決が行われる。これにより、関数、クラス、コールチェーン、HTTPルート、クロスサービスリンクからなる永続的な知識グラフが構築される。

14のMCPツールが提供する機能

codebase-memory-mcpはMCP(Model Context Protocol)を通じて14のツールをAIエージェントに提供する。検索、トレース、アーキテクチャ分析、影響分析、Cypherクエリ、デッドコード検出、クロスサービスHTTPリンク、ADR(Architecture Decision Record)管理など、多岐にわたる。

特に注目すべきは、インフラストラクチャ・アズ・コードの対応だ。Dockerfile、Kubernetesマニフェスト、Kustomizeオーバーレイをグラフノードとしてインデックスし、相互参照を保持する。K8sリソース種別のResourceノード、KustomizeオーバーレイのModuleノード、それらを結ぶIMPORTSエッジが自動生成される。これにより、アプリケーションコードだけでなく、インフラ構成も含めた横断的な解析が可能になる。

ゼロ依存、プラグアンドプレイ

ツールはmacOS(arm64/amd64)、Linux(arm64/amd64)、Windows(amd64)向けの単一静的バイナリとして提供される。Docker不要、ランタイム依存関係なし、APIキー不要だ。ダウンロード、実行、インストールという3ステップで利用を開始できる。

インストールコマンドは自動検出機能を持ち、Claude Code、Codex CLI、Gemini CLI、Zed、OpenCode、Antigravity、Aider、KiloCode、VS Code、OpenClaw、Kiroの11のエージェントに対応する。各エージェントのMCPエントリ、インストラクションファイル、プリツールフックを自動構成する。

セキュリティと透明性

開発元のDeusDataはセキュリティを最優先事項と位置づけている。すべての処理は100%ローカルで行われ、コードがユーザーのマシンを離れることはない。リリースバイナリは署名され、チェックサムが付与され、70以上のアンチウイルスエンジンによるスキャンが行われている。ソースコードは公開されており、監査を希望するユーザーは事前に確認できる。

ベンチマーク結果と研究背景

codebase-memory-mcpの設計とベンチマークは、プレプリント「Codebase-Memory: Tree-Sitter-Based Knowledge Graphs for LLM Code Exploration via MCP」(arXiv:2603.27277)として公開されている。31の実リポジトリを用いた評価では、回答品質83%、ファイル単位探索と比較してトークン消費が10分の1、ツール呼び出し回数が2.1分の1という結果を示している。

編集部の見解

短期的に見れば、codebase-memory-mcpはAIコーディングエージェントの実用性を大きく向上させる可能性がある。AIアシスタントがコードベース全体を理解するには従来大量のファイル読み込みが必要だったが、知識グラフによる構造化インデックスでそのコストが劇的に低下する。特に大規模モノレポを運用する組織には直接的なメリットがある。 長期的には、このアプローチがAIエージェントのコード理解能力を根本から変える可能性がある。ファイル単位の逐次探索からグラフベースの一発検索への移行は、ツール呼び出しの効率だけでなく、エージェントがコードベースを「理解する」方法そのものを変える。ただし、tree-sitterとLSPの組み合わせが静的解析に依存している点は限界であり、動的な振る舞いや実行時依存関係の把握には別の手法が必要になる。プロプライエタリなコードベースへの適用拡大や、CI/CDパイプラインへの統合が今後の普及の鍵を握る。 編集部としては、MCPを通じたAIエージェントと開発環境の統合が、このツールを皮切りに加速すると見る。

参考

よくある質問

codebase-memory-mcpはどのように動作するのか
リポジトリ全体をtree-sitter AST解析とHybrid LSPセマンティック型解決で解析し、関数やクラス、コールチェーンからなる知識グラフを構築する。このグラフに対してMCPツール経由でクエリを実行し、構造的なコード検索を高速に行う。すべてローカルで処理され、コードが外部に送信されることはない。
対応しているAIエージェントは何か
Claude Code、Codex CLI、Gemini CLI、Zed、OpenCode、Antigravity、Aider、KiloCode、VS Code、OpenClaw、Kiroの11のエージェントを自動検出して構成する。インストール実行時に各エージェントの設定を自動で書き換えるため、手動設定は不要。
セキュリティ上の懸念はあるか
すべての処理はローカルで完結し、コードが外部サーバーに送信されることはない。リリースバイナリは署名され、チェックサムが検証可能で、70以上のアンチウイルスエンジンでスキャン済み。ソースコードも公開されており、事前に監査することが推奨されている。 ## 参考 - [codebase-memory-mcp - GitHub](https://github.com/DeusData/codebase-memory-mcp) — 2026-06-18公開 - [Codebase-Memory: Tree-Sitter-Based Knowledge Graphs for LLM Code Exploration via MCP (arXiv)](https://arxiv.org/abs/2603.27277) — 研究プレプリント
出典: GitHub Trending

コメント

← トップへ戻る