AI

リオ市の国産LLM疑惑、既存モデルのマージと判明 重量証拠で内部告発

リオデジャネイロ市が独自開発と公称する397BパラメータLLM「Rio-3.5-Open-397B」について、Nex-AGIが既存モデルの単純な重みマージであることを告発した。79%の確率で自ら「Nex」と名乗るという証拠も提示されている。

9分で読める SINGULISM 編集チームが確認・編集

リオ市の国産LLM疑惑、既存モデルのマージと判明 重量証拠で内部告発
Photo by Steve A Johnson on Unsplash

リオデジャネイロ市の公営IT企業IplanRIOが先日公開した大規模言語モデル「Rio-3.5-Open-397B」をめぐり、その出自に重大な疑義が生じている。AIスタートアップNex-AGIは2026年6月14日、自社のGitHub Issue上で、Rio-3.5がNex-AGIのモデル「Nex-N2-Pro」とAlibabaグループ傘下のQwenチームが開発した「Qwen3.5-397B-A17B」の重みを単純に要素ごとに合成したものにすぎないと告発した。

告発の経緯

IplanRIOはRio-3.5-Open-397Bを「独自にゼロから訓練した397Bパラメータモデル」として発表していた。市の技術局が関与した国産LLMプロジェクトとして注目を集めたが、Nex-AGIはこれを真っ向から否定する証拠を提示した。

Nex-AGIの主張によれば、Rio-3.5の重み行列は全ての60層とネットワークの全構成要素にわたり、Nex-N2-Proの約0.6倍とQwen3.5-397B-A17Bの約0.4倍の線形結合で説明できるという。この比率は数千標準偏差の精度で一致しており、偶然の一致や一般的なファインチューニングでは説明がつかないとされている。

自ら「Nex」と名乗るモデル

告発で特に衝撃的なのは、モデル自身が「自分は何か」を問われた際の応答だ。Nex-AGIは、Rio-3.5にハードコードされた「あなたはRioです」というシステムプロンプトを除去した上で、同モデルに自己紹介を求めた。その結果、79%の確率で「私はNex-AGIのNexです」と回答し、「私はRioです」と答えたケースは0%だったと報告されている。

告発者はさらに「Rio-3.5はNex-AGIの組織独自のバックストーリーを一字一句正確に暗唱する」とも指摘している。ファインチューニングによってモデルの振る舞いを変更することは可能だが、内部の重み行列が既存モデルの単純な加重平均であることは「ファインチューニングでは説明できない」と断じている。

この告発は、Nex-AGIのGitHubリポジトリ「Nex-N2」のIssue #4として公開された。公開から数時間で226ポイント、123件以上のコメントが寄せられ、Hacker Newsでもトップニュースとして話題を集めている。

技術的検証の詳細

Nex-AGIは証拠として、二つの独立した分析方法を提示している。

第一に、モデルの出力行動分析。上述のシステムプロンプト除去テストで、モデルの自己認識がNexに偏っていることを示した。これはモデルがRioとしての独自のアイデンティティを学習していない証左だとされる。

第二に、重みテンソルの統計的分析。Rio-3.5の全重みベクトルが、Nex-N2-ProとQwen3.5-397Bの線形補間(interpolation)として説明可能であることを示した。特定の比率からの逸脱は観測誤差の範囲内であり、何らかの追加訓練が行われた痕跡は見当たらないという。

Nex-AGIは「他のモデルのファインチューニングでは、このような単純な線形補間にはならない」と主張している。ファインチューニングでは特定のタスクに特化するための勾配更新が行われるため、重みの変化は層やチャネルごとに異なるパターンを示すのが一般的だ。全パラメータが均一な比率で混合されていることは、独自の訓練ではなく意図的なマージ処理が行われたことを強く示唆する。

オープンソースLLMの信頼性問題

この一件は、オープンソースLLMコミュニティにおけるモデルの出自と信頼性の問題を改めて浮き彫りにした。大規模言語モデルの開発には莫大な計算資源とデータセットが必要であり、自社でゼロから訓練したと主張する組織の発表を鵜呑みにできない現実がここにある。

IplanRIOは「ブラジルの公共機関が主導した国産モデル」という文脈でこのプロジェクトを位置づけていた。公共調達や政府系AIプロジェクトにおける透明性の欠如は、技術的な妥当性だけでなく、納税者の資金使途やガバナンスにも関わる問題だ。

類似の事例としては、2023年にスタンフォード大学が公開した「Alpaca」モデルがMetaのLLaMAをベースにしていたことが挙げられる。しかしAlpacaの場合は「LLaMAをファインチューニングしたもの」と明確に開示されており、今回のようにゼロからの訓練と偽って公開されたケースとは性質が異なる。

IplanRIOの対応

本稿執筆時点で、IplanRIOおよびリオデジャネイロ市からは公式なコメントは発表されていない。GitHub上のRio-3.5-Open-397Bのリポジトリは公開されたままの状態だが、Nex-AGIの告発を受けてコミュニティから多数の質問が寄せられている。

IplanRIOがこの告発に対してどのような説明を行うのか、あるいはモデルを撤回するのかが注目される。仮にNex-AGIの主張が正しければ、独自訓練を行ったとする市の発表は虚偽の情報を含むことになり、技術的信用だけでなく行政の信頼性にも影響を与える可能性がある。

モデル重みマージの技術的背景

大規模言語モデルの重みマージ(weight merging)自体は、モデル圧縮や複数モデルの知識統合の手法として研究が進められている。代表的な手法として、Model SoupsやTIES-Merging、DAREなどがあり、複数のファインチューニング済みモデルの重みを特定の比率で混合することで、タスク性能を向上させることができる。

しかし、これらの手法はあくまで追加訓練を前提とした技術であり、ゼロから訓練したモデルを偽装するために使われることは想定されていない。今回のケースでは、単純な加重平均で「独自モデル」が生成可能であることが示された点で、モデル公開時の検証プロセスについて業界全体が再考を迫られている。

編集部の見解

今回の告発は、オープンソースLLMエコシステムの健全性を維持するために極めて重要な事例だと評価できる。Nex-AGIが提示した二つの独立した証拠は、単なる疑惑ではなく統計的に確固たるものであり、IplanRIOが十分な説明を行わなければ、公共機関によるAIプロジェクトの信頼性に深刻な亀裂が生じるだろう。

短期的には、この一件が他の政府系・公営IT機関によるLLM公開のハードルを引き上げる可能性がある。自前で訓練していないモデルを「国産」と称するリスクが可視化されたことで、透明性の低いプロジェクトはコミュニティの厳格な監視に晒されることになる。

長期的な視点では、モデルの出自を検証するための技術的手法(重みテンソルの統計的分析やシステムプロンプト除去テスト)が標準的な監査プロセスとして確立される契機となるかもしれない。オープンソースLLMが社会インフラとしての役割を担うにつれ、その出自や訓練データの透明性を検証する仕組みが不可欠になる。

編集部としては、IplanRIOが公開しているモデルの重みやトレーニングログを第三者機関による検証に提供することを求める。技術コミュニティの信頼を回復するためには、単なる釈明ではなく具体的な証拠の開示が必要だ。また、この事例はAIの公共調達における技術的デューディリジェンス(買い手による適正評価)の重要性を強く示唆しており、行政機関が外部のAIモデルを導入・公開する際の基準策定が急務であると言えそうだ。

参考

よくある質問

Rio-3.5-Open-397Bは具体的に何が問題なのか
IplanRIOが「独自にゼロから訓練した国産モデル」として公開した一方で、Nex-AGIの分析により既存のNex-N2-ProとQwen3.5-397Bの重みを単純に0.6:0.4の比率で合成したものである可能性が高いことが明らかになった点。
Nex-AGIはどのようにしてこの合成を検証したのか
二つの独立した方法を用いている。一つはシステムプロンプトを除去した状態でモデルに自己紹介をさせた結果、79%の確率で「Nex」と名乗ったこと。もう一つは全60層の重みテンソルが0.6:0.4の線形補間で説明可能であることを統計的に確認したこと。
この告発がオープンソースLLMコミュニティに与える影響は何か
モデル公開時の出自検証の重要性が高まると考えられる。特に政府機関や公営企業が公開するモデルに対する透明性要求が強化され、重みテンソルの統計的分析や第三者監査が標準的なプロセスとして導入される可能性がある。
出典: Hacker News (Best)

コメント

← トップへ戻る