AI

元OpenAI最高技術責任者Mira Murati氏率いるThinking Machinesが「インタラクションモデル」を発表

Thinking Machinesが、オーディオやビデオをリアルタイムで処理し対話するAI技術「インタラクションモデル」を発表。人間とAIの協調のあり方を変えようとしている。

3分で読める SINGULISM 編集チームが確認・編集

元OpenAI最高技術責任者Mira Murati氏率いるThinking Machinesが「インタラクションモデル」を発表
Photo by Igor Omilaev on Unsplash

元OpenAI最高技術責任者(CTO)であるMira Murati氏が設立したAI企業Thinking Machinesが、新たなコンセプトとなる「インタラクションモデル」の開発を進めていることを発表した。

人間とAIの「自然な協調」を目指すインタラクションモデル

Thinking Machinesが提唱するインタラクションモデルの核心は、「人間同士が自然に協力するのと同じように、AIと協働できる」環境を実現することにある。現在の多くのAIモデルは、ユーザーがテキストを入力し終えるか、音声での発話を完了するまで待機し、処理を開始するという「シングルスレッド」の動作が主流だ。

Thinking Machinesは、この方式を「重要な議論をメールで行おうとする」ことに例え、コミュニケーションの帯域幅が限られていると指摘する。ユーザーの意図や判断が十分にモデルに伝わらない、あるいはモデルの作業プロセスがユーザーに理解されにくいという課題があるという。

これに対し、インタラクションモデルはオーディオ、ビデオ、テキストなどの情報を継続的に取り込み、リアルタイムで思考し、応答し、行動することを目指す。これにより、AIインターフェースが人間の側に歩み寄り、人間がAIに合わせて行動を変える必要がなくなると同社は説明している。

具体的なデモ例と今後の展開

Thinking Machinesは、この技術の可能性を示すいくつかのデモを公開している。例えば、物語の中で動物の名前が言及されたのを検知して即座に応答する、話されている言葉をリアルタイムで翻訳する、ユーザーが猫背になったことを検知して注意を促す、といった具体的な利用シーンが示された。

ただし、現時点で一般のユーザーがこのインタラクションモデルを試すことはできない。Thinking Machinesは「今後数ヶ月以内」に限定的な研究プレビューを公開し、「今年後半」にさらに幅広いリリースを行う計画だ。

設立から現在まで

Mira Murati氏は2025年2月にOpenAIを離れた後、Thinking Machinesを設立した。同社は設立以来、主要メンバーがMetaなど競合他社に移籍する、あるいはOpenAIに復帰するといった人材面での課題にも直面していると報じられている。新たな技術コンセプトの発表は、こうした状況の中での重要なマイルストーンとなるだろう。

インタラクションモデルが実用化されれば、音声アシスタント、リアルタイム翻訳、教育、健康管理など、さまざまな分野でのAI活用の形が変わる可能性を秘めている。

よくある質問

Thinking Machinesのインタラクションモデルとは、具体的に何が違うのですか?
最大の違いは「リアルタイム性」と「マルチモーダルな入力」です。従来のAIはユーザーの入力が完了するまで待機していましたが、インタラクションモデルは音声や映像を継続的に処理しながら対話できます。例えば、ユーザーが話している最中に話の内容を理解し、文脈に沿った応答を即座に返せるようになることを目指しています。
Thinking Machinesはいつサービスを公開しますか?
正式な一般公開の日程はまだ発表されていませんが、同社は2026年内に「今後数ヶ月以内」に限定的な研究プレビューを公開し、「今年後半」にさらに幅広いリリースを行う計画だと述べています。まずは研究者や開発者向けの限定的な提供から始まる見込みです。
Mira Murati氏はなぜOpenAIを離れたのですか?
提供された情報からは、Murati氏がOpenAIを離れた具体的な理由は明かされていません。彼女は2025年2月に退職し、まもなくThinking Machinesを設立しました。OpenAIを離れた後、独自のAI研究開発を進める道を選んだとみられています。
出典: The Verge

コメント

← トップへ戻る