AI

浙大とTencent、AIに「演出家」の役割を担わせるロールプレイングフレームワークを発表

浙江大学とTencent YouTu Labが、AIが思考・動作・環境を連動させる没入型ロールプレイングフレームワーク「AdaMARP」を発表。4チャネルメッセージ形式とシーンマネージャーで、複雑な物語進行を実現する。

5分で読める SINGULISM 編集チームが確認・編集

浙大とTencent、AIに「演出家」の役割を担わせるロールプレイングフレームワークを発表
Photo by Fredrick Tendong on Unsplash

AIが「話す」だけでなく「考える」「動く」「環境を感知する」時代へ

浙江大学とTencent YouTu Labの研究チームが、汎用的な没入型ロールプレイングのための新たなフレームワーク「AdaMARP」を発表した。このフレームワークは、大規模言語モデル(LLM)を用いた従来のロールプレイングシステムが抱えていた「没入感の不足」と「静的なインタラクション構造」という2つの課題に、根本からアプローチするものだ。研究成果は、言語処理分野のトップカンファレンスであるACL 2026に採択されている。

従来のAIロールプレイングが抱える2つの限界

現在普及しているLLMベースのロールプレイングサービスは、ユーザーが設定したキャラクターとAIが会話を行う形式が主流だ。しかし、研究チームはその限界を指摘する。

第一に、環境情報が十分にモデル化されておらず、キャラクターが「空の部屋で独り言を言っている」ような状態になりがちな点だ。推理劇を例にとれば、事件現場のカーペットに残った蝋の痕や、証人の住居に置かれた未開封の手紙といった環境手がかりは、単なる装飾ではなく、物語の因果やプロットの転換点を推進する重要なシグナルとなる。従来のシステムでは、これらの環境信号がキャラクターの思考や行動と有機的に結びついていなかった。

第二に、シーンや登場人物が固定的で、物語が能動的に「進行」しない問題がある。ユーザーが特定のキャラクターと一問一答する形式では、複数の場所を巡って証拠を収集したり、新たな証人を動的に導入したりするような、複雑で開放的な物語の展開が難しい。

AdaMARPが提案する2つの革新:4チャネルメッセージとシーンマネージャー

AdaMARPは、これらの課題に「没入型メッセージ形式」と「適応的フレームワーク」という2つの柱で対応する。

1. Thought–Action–Environment–Speech:4チャネルメッセージ形式

AdaMARPの核心は、各インタラクションラウンドにおいて、思考(Thought)、動作(Action)、環境知覚(Environment)、発話(Speech)の4つのチャネルを交织させて情報を生成する点にある。例えば、シャーロック・ホームズが証人に質問する場面では、以下のような因果連鎖が形成される。

<ガス灯が揺らめき、証人は無意識に暖炉の時計を一瞥する> [彼は具体的な時間を回避している、あの時間帯には現場にいなかった](パイプで軽くテーブルを叩きながら)「事件当晚の8時から9時、あなたは一体どこにいましたか?」

環境手がかりが内心の推理を引き出し、圧力をかける動作を経て、追及の発話へと繋がる。これにより、キャラクターの応答に深みと現実味が生まれる。

2. 3エージェントと5種類のアクションを持つシーンマネージャー

もう一つの重要な要素が「シーンマネージャー」だ。これは物語全体の「演出」を統括する役割を担い、以下の5種類の離散的なアクションを通じて進行を制御する。

  • init_scene:シーンの初期化(例:ベーカー街221B)。
  • pick_speaker:次の台詞を誰が話すかを選択し、理由も付与する。
  • switch_scene:場所を切り替える(事件現場から証人のアパートへ)。
  • add_role:物語の途中から新しいキャラクターを導入する。
  • end:インタラクションを終了する。

このシーンマネージャーが、Actorモデル(キャラクターを演じるAI)とUserモデル(ユーザー側)を橋渡しし、「何時にシーンを切り替えるか」「何時に新たな証人を登場させるか」といった物語の大局的な進行を管理する。

実践例:シャーロック・ホームズの推理劇で動作を検証

研究チームは、シャーロック・ホームズの推理劇を題材にしたデモンストレーションでAdaMARPの有効性を示している。深夜の事件現場から始まり、ホームズが環境手がかり(蝋の痕)から推理を展開。シーンマネージャーの指示でワトソンが調査に向かい、舞台は大家の住居へと切り替わる。新たな証人(大家)が導入され、ホームズが尋問を開始する——という流れだ。各ステップでシーンマネージャーが発する「理由」付きのアクションが、一貫した物語の流れを保証している。

この研究は、AIとのインタラクションが単なるチャットから、環境と時間の経過を共有する「共演」へと進化する可能性を示唆している。今後、教育、エンターテインメント、心理療法など、さまざまな分野での応用が期待される。

よくある質問

AdaMARPは具体的にどのようなサービスに応用できるのでしょうか?
現段階では研究フレームワークですが、将来的には没入感の高いインタラクティブストーリー体験を提供するゲームや、歴史上の人物と対話する学習ツール、あるいは訓練用のシミュレーション環境などへの応用が考えられます。ユーザーが能動的に物語を進められる、新しいタイプのエンターテインメントや教育ソフトウェアの基盤となる可能性を秘めています。
既存のAIチャットボットとの最大の違いは何ですか?
最大の違いは、AIが「環境」を認識し、物語の「進行」を能動的に管理できる点にあります。従来のチャットボットは、ユーザーの入力に対する「返答」しか生成しませんでした。しかしAdaMARPでは、AIが周囲の手がかりを読み取り、シーンを切り替えたり、新たなキャラクターを登場させたりすることで、より複雑で予測不能なストーリー展開が可能になります。会話する相手ではなく、物語を共に創っていく「共演者」や「演出家」に近い役割を担えるのです。
出典: 量子位

コメント

← トップへ戻る