AI

AI Berkshire公開、価値投資をAIエージェントで実装

GitHubで公開されたAI Berkshireは、Claude Codeを用いてウォーレン・バフェットら4人の価値投資手法をAIエージェントで再現。並列分析や反バイアス機構を実装し、実運用で年率66%超のリターンを達成したと報告されている。

8分で読める SINGULISM 編集チームが確認・編集

AI Berkshire公開、価値投資をAIエージェントで実装
Photo by Declan Sun on Unsplash

著名投資家ウォーレン・バフェットの「価格はあなたが支払うもの、価値はあなたが得るもの」という格言をAIで実装するプロジェクトが、GitHubで公開された。開発者xbtlinによる「AI Berkshire」は、バフェット、チャーリー・マンガー、段永平、李録という4人の価値投資の大家の手法を体系化し、Claude Code上で動作するAIエージェント群として提供するものだ。

このプロジェクトの特徴は、単なる投資分析プロンプトの集合体ではない点にある。複数のAIエージェントが並列して動作し、異なる投資哲学に基づく分析結果を統合することで、単一の大規模言語モデル(LLM)への直接的な質問では得られない深度を実現する。開発者は「一人の人間とClaudeが、一つの投資調査チームになる」と表現する。

実運用で年率66%超

AI Berkshireは理論研究に留まらず、実際の資金を用いた運用実績を公表している。2024年の年間リターンは+69.29%、2025年は執筆時点で+66.38%を記録した。同期間の主要株価指数と比較すると、2024年はS&P500を約46ポイント、2025年は約50ポイント上回るパフォーマンスを示している。

ただし、プロジェクトのREADMEには「過去の実績は将来の成果を保証するものではない」という免責事項が明記されており、投資判断の参考情報として位置づけられている。実際のスクリーンショットが証券口座の画面とともに公開されている点は、透明性を重視した設計思想の表れと言える。

単なるAI分析との差異

従来のLLMに投資分析を依頼した場合、多くのケースで「一方で…他方で…」という両論併記の回答が返ってくる。AI Berkshireが解決しようとするのは、この「決断できない分析」からの脱却だ。

第一の差異は、強制的な結論の出力にある。同フレームワークは「を通じて/不を通じて/グレーゾーン」の3段階評価を必須とし、具体的な価格帯と投資戦略を提示する。例えば「鏡テスト」と呼ばれるルールでは、投資対象のビジネスモデルを5文で説明できない場合は購入しないという厳格な基準が適用される。

第二に、4人の投資家の視点を対立させる設計が組み込まれている。分析対象企業に対して、4つの独立したエージェントがそれぞれの投資哲学に基づいて評価を行う。各エージェントの評価結果は自然と矛盾や緊張関係を生む。例えば、ある銘柄に対して「バフェット視点のエージェントは割安と判断する一方、李録視点のエージェントは長期の不確実性を理由に保留を推奨する」という状況が発生する。開発者は、このような多視点の衝突こそが投資判断における盲点を回避する鍵だと説明する。

反バイアス機構の組み込み

AI Berkshireの第三の特徴は、意思決定のバイアスを抑制する構造化されたメカニズムだ。LLMが持つ大きなリスクは、誤った情報をあたかも正しいかのように提示することにある。この問題に対処するため、同フレームワークは複数の防御機構を実装している。

  • 情報豊富度評価(A/B/C):単に情報量が多いことを確実性の高さと誤認することを防ぐ。データが限定的な場合は推計値に信頼度ラベルを付与する
  • マンガー式逆説的検証:投資対象が失敗するシナリオを強制的に列挙させるメカニズム
  • 即時拒否リスト:8つの合否判定基準を設定し、一つでも抵触すれば評価対象から除外する
  • 反コンセンサスチェック:市場の一般的な見解とは逆の視点からリスクを評価する
  • 留保原則:データが不十分な場合は「不明」と明記し、推測を事実のように語らない

これらの機構は、AIが思考のショートカットに陥ることを防ぐための実装上の工夫であり、単なるプロンプトエンジニアリングを超えた設計思想を示している。

金融データの精度管理

LLMは数値計算が不得意であることが広く知られている。特にPER(株価収益率)の計算誤差や通貨単位の混同(香港ドルと人民元など)は、投資判断に致命的な結果をもたらす可能性がある。

AI Berkshireはこの問題に対し、Pythonのdecimal.Decimal型を用いた厳密な数値計算を実装している。浮動小数点演算を避け、同一データを複数の独立した情報源でクロス検証するプロセスが組み込まれている。具体的には、株価と発行済株式数から時価総額を手計算で検証し、報告値との誤差が0.1%未満であることを確認する検証機能が提供される。

並列エージェントによる調査深度

最も特徴的な構造は、4つの独立したAIエージェントによる並列調査だ。各エージェントは担当領域(ビジネスモデル、財務評価、業界競争、リスクと経営)について、それぞれ独自にWeb検索とデータ検証を行い、独立した結論を導く。最終的にチームリーダー役のエージェントが統合レポートを作成する。

この方式の利点は、単一のLLMコンテキストウィンドウでは扱いきれない量の情報を処理できる点にある。4つのエージェントが並列動作することで、実質的に4倍の情報源と4倍の独立した視点が得られる。開発者はこれを「一人の人間が直接AIに質問するのと、4人のアナリストが独立して調査してから結果を持ち寄るのとの差」と表現する。

再現可能な分析プロセス

通常のLLMとの対話では、同じ質問をしても出力の質や形式が毎回異なる。AI Berkshireは、同じ入力に対して構造的に一貫した出力を保証する。これにより、複数企業の横断的な比較や、同一企業の経時変化の追跡が可能になる。

公開されたチェックリストの例では、7社が同一基準で評価されている。茅台酒(マオタイ)、騰訊控股(テンセント)は「を通じて」、NVIDIAと美団(メイトゥアン)は「条件付きを通じて」、Pinduoduo(ピンドゥオドゥオ)と泡泡瑪特(ポップマート)は「グレーゾーン」と判定されている。各銘柄には5段階評価(能力圏、ビジネスの質、経済的堀、経営陣、安全域)が付与され、統合スコアが算出されている。

編集部の見解

AI Berkshireの登場は、AIエージェントが専門知識の体系化と意思決定支援に活用される新たな方向性を示している。特に注目すべきは、単なる情報要約ではなく「判断を強制する」設計思想だ。従来のAI活用の多くが「人間の判断を補完する」という立場だったのに対し、本プロジェクトは「フレームワークが判断基準を持つ」という一歩踏み込んだ立場を取る。短期的には、金融業界におけるAIエージェントの実用性を証明する具体的事例として、類似のプロジェクトが増加する可能性がある。 長期的な視点では、投資判断という高度に主観的な領域に構造化されたAIの判断基準が導入されることの影響は大きい。ただし、2018年に公表された過去データを用いたバックテストと実際の運用成績が一致する保証はなく、市場環境の変化に対するフレームワークの頑健性は未知数だ。また、投資判断の自動化が進むことで、市場のボラティリティに新たなパターンが生まれる可能性も考慮すべきである。

参考

よくある質問

AI Berkshireはどのように使用するのか
GitHubリポジトリからコードを取得し、Claude Codeが動作する環境でセットアップする。投資分析対象の企業名を入力すると、4つのAIエージェントが並列で調査を開始し、最終的に統合レポートが生成される。使用にはClaude Codeへのアクセス権とPython実行環境が必要となる。
このプロジェクトは実際の投資に使えるのか
プロジェクトのREADMEでは免責事項として過去の実績が将来の成果を保証しないことが明記されている。構造化された分析フレームワークとしての価値は評価できるが、投資判断のすべてをAIに委ねることは推奨されない。あくまで意思決定の参考情報として位置づけるべきである。
従来のAI投資分析ツールとの違いは何か
最大の違いは単一のLLMに質問する方式ではなく、複数の独立したエージェントが並列で調査し、異なる投資哲学に基づく分析結果を統合する点にある。また、反バイアス機構や数値計算の厳密性チェックなど、投資判断に特化した品質管理プロセスが組み込まれている点も特徴的だ。 ## 参考 - [GitHub: xbtlin/ai-berkshire](https://github.com/xbtlin/ai-berkshire) — 2026-06-26公開
出典: GitHub Trending

コメント

← トップへ戻る