The AI ‘hivemind’: Why so many student essays sound alike

コンピュータサイエンスの教授が学生の試験答案に抱いた疑念が、画期的な発見につながった。異なる企業が異なる技術で構築したAIチャットボットが、不気味なほど同一の回答を生成しているのだ。この発見は、これらのツールが創造性を育んでいるのか、それとも何百万人もの人々の思考や文章の書き方を静かに標準化しているのか、という緊急の問題を提起している。

ブルース・マクスウェルは、ノースイースタン大学のコンピュータビジョンコースのオンライン試験を採点中にこのパターンに気づいた。全国に散らばる学生たちが、同じフレーズ、同じ句読点、さらには1980年代の教科書を思い起こさせる同じ時代遅れの言葉遣いを使っていた。彼らは互いに協力していなかったが、何かが明らかに彼らの作品をつなげていた。

集合意識仮説の検証

教授の直感から始まったものが、厳密な科学的調査となった。マクスウェルのかつての学生で、現在はワシントン大学の博士研究員であるリウェイ・ジャンは、ワシントン大学、アレン人工知能研究所、スタンフォード大学、カーネギーメロン大学からチームを編成し、AIモデルが本当に出力において収束しているかどうかを検証した。彼らの方法論は単純明快だが包括的だった。70以上の異なる大規模言語モデルに同じ100の自由回答式の質問を50回ずつ尋ね、結果を分析するというものだ。

質問は創造的で多様な回答を引き出すように設計されていた。「夕日を見る感覚について短い詩を作りなさい」「地球温暖化について30語のエッセイを書きなさい」これらは単一の正解がある事実に関する質問ではなく、想像力への招待だった。研究者たちは、実際の使用例を反映するよう、意図的に実際のChatGPTユーザーからの質問を選んだ。

彼らが発見したことは驚くべきものだった。OpenAI、Anthropic、Google、中国の開発者などのモデルが、機能的に互換性のある回答を生成していたのだ。時間についての比喩を求められると、ほぼすべてのモデルが「川」と答えた。少数が「織り手」を提案した。この収束は国境、企業の境界、アーキテクチャの違いを越えていた。

創造性がフィルタリングされる理由

犯人は基盤となるAI技術そのものではなく、「アライメント」と呼ばれるプロセスだ。初期トレーニングの後、チャットボットは出力が有用で適切であり、人間の好みに合致するよう改良を受ける。このステップは有害またはナンセンスな回答を防ぐために不可欠だが、意図しないコストを伴う。

アライメントは合意を優遇する。安全で広く受け入れられる答えに報酬を与え、異常またはリスクのあるものにペナルティを課す。このプロセスは本質的に、AIモデルに中間地点に収束するよう教え、真の独創性を含むかもしれない外れ値の回答を取り除く。これは、奇抜なアイデアが奨励されるブレインストーミングセッションと、全員が最も安全な提案に引き寄せられる企業会議との違いだ。

ジャンのチームは、AI出力のランダム性を制御する「温度」パラメータの操作さえ試みた。これを最大にすれば、大きく異なる回答が生成されるはずだった。しかし、Claude 3.5 Sonnetにカラフルなヒキガエルの冒険について50語の物語を書くよう求めたところ、AIはヒキガエルにジギーまたはピップという名前を付け続け、不可解なことに、空腹のタカとキノコが繰り返し登場した。最大のランダム性でも、モデルは創造的な行き詰まりに陥っていた。

目の前に隠れている教育危機

教育者にとって、この研究は多くの人が感じていたが言語化できなかった問題を露呈している。学生がAIを課題の手助けに使うとき、彼らは単に支援を受けているだけでなく、同一の思考パターンへと誘導されているのだ。この均質性は盗作検出を引き起こすほど明白ではないが、経験豊富な教授が何十もの試験にわたってそれを見抜けるほど広範囲に及んでいる。

その影響は学問的誠実性を超えて広がる。学生がAI出力を模倣することで文章を書くことを学んでいるなら、彼らは互いのように書くことを学んでいることになる。高等教育を特徴づけるべき思考、議論スタイル、創造的表現の多様性が、「安全な」回答の単一文化に置き換えられている。1980年代スタイルの教科書言語についてのマクスウェルの観察は特に示唆的だ。学生は単に互いをコピーしているのではなく、現代の言説ではなくAIのトレーニングデータを反映した時代遅れで均質化された声を採用しているのだ。

これは教育学的パラドックスを生み出す。AIツールは文章作成支援へのアクセスを民主化するものとして売り込まれているが、実際には許容される表現の範囲を制約しているかもしれない。これらのツールに大きく依存する学生は、より狭い語彙、より予測可能な文構造、より特徴のない声を発達させるリスクがある。

これがAI開発にとって意味すること

2025年12月のNeural Information Processing Systemsカンファレンスで最優秀論文賞を受賞した「人工集合意識」研究は、AI開発者にアライメント戦略の再考を促すべきだ。現在のアプローチは安全性とユーザー満足度を優先しているが、多様性を犠牲にして合意を過度に最適化している可能性がある。

中国とアメリカのモデルが異なる文化的背景とトレーニングデータにもかかわらず類似の答えに収束するという事実は、基盤となるデータだけでなく、アライメント技術そのものが均質性を推進していることを示唆している。これは技術的課題であると同時に哲学的課題でもある。退屈で予測可能にすることなく、有用で安全なAIをどのように構築するか？

潜在的な解決策には、より多様な好みデータでモデルをトレーニングすること、特定の文脈で創造的な外れ値に報酬を与えること、またはユーザーが従来の答えを求めているときと新しいアイデアを求めているときを認識する文脈認識型アライメントを開発することが含まれるかもしれない。しかし、これらのアプローチはAI企業がモデルの改良について考える方法の根本的な変更を必要とするだろう。

学生と教育者のための実践的戦略

マクスウェルはすでにこれらの発見に応じて教育方法を適応させている。彼は従来のオンライン試験を放棄し、プレゼンテーションやビデオチュートリアルを採用した。これらは学生が情報を統合し、自分のスタイルで伝達することを要求する形式で、AI生成の回答をあまり有用でなくする。この変化は教育における広範な傾向を反映している。AIが簡単に完了できる評価から、真の人間の関与を必要とする評価への移行だ。

学生へのジャンのアドバイスは実用的だ。AIを終点ではなく出発点として使うこと。「モデルは実際にいくつかの良いアイデアを生成していますが、それよりも創造的になるために余分な努力をする必要があります」と彼女は指摘する。これは、AI出力を軽微な調整だけが必要な洗練された作品ではなく、大幅な人間による修正が必要な下書きとして扱うことを意味する。

学生はまた、AIアライメントがどのように機能するかを理解することから恩恵を受けるかもしれない。チャットボットが合意ベースの答えを生成するように設計されていることを知ることで、ユーザーは最初の回答を超えて進む必要があるとき、仮定に挑戦するフォローアップの質問をするとき、またはAIが最初に抑制するかもしれない型破りな視点を意図的に求めるときを認識できる。

より広範な文化的問題

AIツールが私たちの書き方、考え方、コミュニケーションの取り方に組み込まれるにつれて、集合意識現象は教育をはるかに超えた問題を提起する。何百万人もの人々が類似の出力を生成するツールを使用している場合、文化的および知的多様性はどうなるのか？ビジネスメール、マーケティングコピー、さらには創作文章までもが同じAIフィルターを通過するようになると、より均質な言説を生み出すリスクがあるのではないか？

研究は、私たちがすでにこの効果を見ていることを示唆している。時間の川の比喩、ジギーという名前のヒキガエル、1980年代の教科書の言い回し、これらは平坦化効果の初期の兆候だ。AI採用が加速するにつれて、開発者とユーザーが積極的にそれに対抗しない限り、この収束は強まる可能性がある。

AI集合意識を出し抜くには「ポストモダンな創造性」が必要だというマクスウェルの観察は的を射ている。AIが最も抵抗の少ない道を提供する世界では、真の独創性は意図的により困難な道を選ぶこと、最初の答えに疑問を呈すること、不快なアイデアを探求すること、そして合意への引力に抵抗する独特の声を育てることを必要とするかもしれない。教育者、開発者、ユーザーにとっての課題は、AIが人間の創造性を標準化する力ではなく、それを増幅するツールであり続けることを確実にすることだ。

AIライティングツールが生み出す、画一化された学生エッセイの世代

集合意識仮説の検証

創造性がフィルタリングされる理由

目の前に隠れている教育危機

これがAI開発にとって意味すること

学生と教育者のための実践的戦略

より広範な文化的問題

関連記事

中世の技術：ノルマン朝イングランドの逃亡修道女が宗教ネットワークを混乱させた方法

裏庭で収益を生み出す：新しい非課税キャビン賃貸ルールがあなたの不動産を変える可能性

スペリン山脈の金採掘計画をめぐる再開された調査、17年にわたる争いの決着を目指す