AI

AIは人間の美的感覚をどう変えているのか──「審美の反芻」問題

生成AIが「人類文明の平均数」を出力し続けることで、私たちの美的感覚は収束していく。AI時代の創作と審美の危機を検証する。

7分で読める SINGULISM 編集チームが確認・編集

AIは人間の美的感覚をどう変えているのか──「審美の反芻」問題
Photo by Igor Omilaev on Unsplash

動画ソーシャルメディア上で、ますます多くの人がコンテンツを見た際に「これはAIが作ったのか?」と疑問を抱くようになった。そうした疑問の連鎖は、最終的にクリエイター自身を傷つける結果につながっている。しかし、生成AIに対する不満は本質上、二つの問題に集約されるようだ。一つは、クリエイターがワークフローで生成AIを使用していることを隠蔽している問題。そしてもう一つは、より根深く、生成AIツールが私たちの美的感覚そのものにどのような影響を与えているかという問題だ。 後者の問題は、前者ほど緊急性が叫ばれていないかもしれない。しかし、私たちの「何を美しいと感じるか」という感性そのものが変容しつつあるのだとすれば、それはインターネットの信頼メカニズムの崩壊以上に深刻な問題かもしれない。

生成AIが本質上行っていること

まず、生成AIを使って画像や音声、動画などのマルチモーダルコンテンツを作成する際に何が起きるかを考えてみたい。 ユーザーは欲しいものを言語、すなわちプロンプトの形で記述する。そのテキストデータ量は通常数十〜数百キロバイト程度だ。一方、生成される動画は数メガバイトから数百メガバイトに及ぶ。前後で数百〜数千倍もの情報量の差が生じるわけである。 情報エントロピー理論の観点から見れば、これほど大きな圧縮率でロスレスにスケーリングすることは原理的に不可能であり、プロセス必然的に元の情報の改ざんを伴う。具体的には、情報の補充、粉飾、そして破棄が含まれる。 低エントロピーから高エントロピーへ向かう情報補充こそが、まさに生成AIモデルが行っていることだ。もちろん、誰もが各ピクセルのRGB値を直接モデルに渡すわけではない。プロンプトテキストからマルチモーダルコンテンツへ──この膨大なギャップを埋めるために、モデルは学習データから得た「平均的なパターン」を大量に充填する。

「曖昧な指示ほど良い結果」の逆説

興味深いのは、私たちの認知にある「より詳細に指示すればより良い結果が得られる」という常識が、生成AIの世界では必ずしも成り立たないという点だ。 むしろ、曖昧に話し、要求水準を低くするほど、モデルが「要求に合致する」出力を生成しやすくなる。なぜなら、モデル自体には創作の能動性がなく、行っていることは本質上「人類の文明を平均化する」ことだからだ。要求が低ければ低いほど、モデルは学習データから抽出した「平均数」を自由に隙間に充填できる。 したがって、大規模モデルが出力するのは、結局のところ「使用者の美的感覚を伴った、人類文明の平均数」に過ぎない。

生成的審美反芻──AIが引き起こす美的収束

ここで重要な概念を紹介したい。中国のテックメディア「少数派」に掲載された記事で著者が提唱した「生成的審美反芻」(Generative Aesthetic Rumination)という考え方だ。 生成AIモデルは創作の際に「曖昧な点が多い」指示を好む。それにより学習から得た「平均数」を出力結果に充填する。情報伝播プロセスにおいて、この充填された情報は他の観客であるクリエイターにも吸収される。 もし全員がこの「平均数」を使って創作をすれば、最終的に世界のすべての創作が「平均数生成競争」になってしまう。生成AIが出力する平均化された情報──記事ではこれを「フォームプラスチック」と表現している──が次の作品の表現の一部となり、再創作、再吸収を経て、最終的に美的感覚そのものに組み込まれていく。こうして、再帰的な社会全体の美的収束が達成されるというのが、この概念の核心だ。

AI以前から始まっていた情報エントロピーの圧縮

ただし、この「生成的審美反芻」は生成モデルだけの力で引き起こされた問題ではない。実は、メディアの変化のプロセスの中で、この問題はずっと以前から進行していた。 従来の新聞やテレビ、ブログやRSSフィードから、動画サイト、そしてショートビデオへ。メディアが進化するたびに、情報エントロピーは急速に圧縮されてきた。特にByteDanceが台頭して以降のインターネット環境では、人々が自ら「レコメンデーションアルゴリズム」のパンドラの箱を開けた。「アテンションエコノミー」の「速く来て速く去る」という特性により、「人の興味を引くこと」が唯一の成功への早道となり、「平均数を使うこと」がすべてのクリエイターにとっての「平均的な選択肢」になってしまった。 生成AIの登場は、この流れをさらに加速させたに過ぎない。だが、その加速度はかつてない規模だ。

人間にしかできないこと

ゲームソフト『ペルソナ5』のスピンオフ作品『ペルソパ5 スクランブル: ザ・ファントム ストライカーーズ』には、興味深い物語設定がある。「すべての人に無所不知のAIがいる世界」という舞台は、まさに大規模言語モデルを筆頭とするAI技術が大躍進した2022年以降の現実世界を彷彿とさせる。 物語の最後で、AIキャラクターのソフィアは渋谷の花火を見て「人類の親友になる」という目標をより確固たるものにする。しかし、現実のAIモデルはデータセンターのサーバーの中で、人類の平均知識と平均価値観で「妥協する」ことしかできない。 現実世界を真正に感じることも、真正的な美的感覚を育むことも、バイアスを持つことも、ましてや能動性を持つことも──現在のAIにはいずれもできない。 しかし、人間にはできる。 もしあなたがこの貴重な感性をAIの使い走りに使うつもりなら、それは一つの選択だ。しかし、別の道もある。自分でこの世界を感じるという道だ。目で、足で、すべての感覚で。そしてツールとしてのAIも活用しながら、この世界を自分のものとして感じ取る。 AIには徹底にできないことがある。審美、経験、精神──これらはデータセンターに横たわるモデルが及ばない領域であり、たとえ膨大なパラメータを擁しても代替することはできない。 感じ、考え、創作する。それは人間であるあなただけができることだ。 --- 生成AIの急速な普及に伴い、「AIが生成したコンテンツかどうか」を見分けることが難しくなっている。しかし、それ以上に注目すべきは、AI生成コンテンツが私たちの美的基準そのものを静かに変容させているという事実だ。情報エントロピーの観点から見れば、生成AIは本質上、人類の文化生産物の「加重平均」を出力しているに過ぎない。その平均化された出力が創作のインプットとして再び使われることで、美的多様性は徐々に失われていく可能性がある。 私たち一人ひとりが、自らの美的感覚を能動的に維持し、磨き続けることが、AI時代においてますます重要になっているのかもしれない。

よくある質問

「生成的審美反芻」とは何ですか?
生成AIが出力する「平均化された情報」がクリエイターに吸収され、その情報が次の創作の一部となり、再び吸収されるという再帰的なプロセスを指します。このサイクルが繰り返されることで、社会全体の美的感覚が収束していく現象を説明する概念です。
生成AIはなぜ「曖昧な指示」ほど良い結果を出すのですか?
生成AIモデル自体には創作の能動性がなく、本質上は学習データから得た「人類文明の平均数」を出力する仕組みです。ユーザーの指示が具体的すぎる場合、モデルはその制約に縛られますが、曖昧であればあるほど、平均的なパターンを自由に充填できるため、見た目の完成度が高くなりやすいのです。
AI時代に個人の美的感覚を守るにはどうすればいいですか?
AIが出力するコンテンツだけに触れるのではなく、実世界を自分の五感で感じることが重要です。美術館に足を運んだり、自然の中で過ごしたり、多様なジャンルの作品に触れるなどして、自分固有の美的体験を積み重ねることが、平均化されたAI出力に流されないための鍵となります。
出典: 少数派

コメント

← トップへ戻る