生成AIを子どもに使わせていいのか? 子育て中の言語学者が抱いた「違和感」の正体

写真はイメージです Photo:PIXTA
ChatGPTをはじめとする生成AIは、まるで人間が話しているかのような文章を出力する。その自然さから、「AIは言語を理解し始めている」と感じる人も少なくないだろう。しかし本当に、人間の言語と同一視してよいのだろうか?言語学者・川原繁人が、違和感の正体を考察する。※本稿は、言語学者の川原繁人『言語学者、生成AIを危ぶむ 子どもにとって毒か薬か』(朝日新聞出版)の一部を抜粋・編集したものです。
生成AIが使う「言語」は
人間の言語と似て非なるモノ
「生成AI」と「人間言語」の違いについて考えていきましょう。生成AIの特徴の一つとして「訓練データの量を増やせば増やすほど、精度があがる」という「べき乗則」が発見されています。例えば、ChatGPTで使われているGPTでは、新しいバージョンほど訓練データの量が多く、性能があがっています。
ChatGPTの開発に使われている訓練データの詳細は公表されていませんが、ChatGPTが公開される2年前にOpenAIが発表したGPT-3では約4000億トークンが使われており、GPT-4の訓練データは、具体的な量は未発表なものの、GPT-3の倍以上ではないかと推測されています。
これらが、どれだけ膨大な量なのかを実感するために、概算となりますが計算してみましょう。「トークン」という単位は、コンピューターが文章を理解しやすいように、単語や文字を小さく区切ったもので、言語における「単語」とは必ずしも一致しないのですが、あくまで概算ですし、結論は変わりませんから、本節では「トークン」=「単語」と簡略化します。
ここで、1秒に2単語読むと仮定すると、GPT-3やGPT-4の訓練データ量は、人間が24時間寝食を犠牲にして読み続けても、それぞれ約6300年、1万5000年以上かかる量です。1秒に4単語読めると仮定しても、この値は半分にしかなりませんから、やはり膨大な時間がかかることがわかります。
表1に、GPTのそれぞれのバージョンに使われたトークン数と、それを人間が読むのに必要な推定年数をまとめました。

同書より転載
これだけ莫大な量の訓練データを必要とするのが、今の生成AIなのです。もちろん、人間だって、読み聞かせや語りかけをたくさん受けるほど、言語能力が豊かになることは間違いありません。
ですが、赤ちゃんが基礎的な言語知識を獲得するプロセスは、たった数年で達成されるのです。そう考えると、生成AIが人間と同じ「言語」を扱っているように見えても、その背景にある学習の仕組みは、まったく別のものであると結論づけられます。
人間の子どもは、母語を獲得するのに4000億単語も必要としません。ですから私も妻も、生成AIの言葉を「それっぽく見えるけれど、根っこは別物」として捉えた方が、子どもの言語環境を考える上では健全ではないか、と感じています。
なぜ生成AIの言葉は
「それっぽく」聞こえるのか?
ひと言でまとめると、生成AIと人間言語は、その学習に使用するデータの「質」も「量」もまったく異なるのです。「じゃあ、なんで現在の生成AIは、まるで人間が話すかのように話せるの?」という疑問が飛んできそうです。ひと言で答えるとすると「なんでだかは、よくわからない」なのですが、もう少し詳しくお話ししましょう。
この疑問に対する答えについては、田口善弘先生による『知能とはなにか~ヒトとAIのあいだ』(2025年、講談社現代新書)の中で重要な洞察が展開されているので、興味がある方は、ぜひご一読をお勧めします。この本の趣旨を簡単に抽出しますと、
(1)人間の脳は、現実を脳内で再現することで理解している(=脳は現実世界のシミュレーターである)。
(2)そして、生成AIも現実を再現(シミュレート)するものである。
(3)ただし、人間の脳と生成AIでは、再現するために使っているシミュレーターのメカニズムが別ものである。
となります。(1)に関して補足すると、「人間の脳は、現実世界をそのままの姿で認識しているわけではない」という事実が重要です。田口先生はこの点を説明するために、「古典力学」と「量子力学」の対比を用いています。人間が世界を認識する際、その仕組みは、古典力学的な枠組みに基づいています。具体的に言うと、人間は「物が存在するか、しないか」という二分法で世界を捉えます。
「そんなの当たり前だろう」という声が聞こえてきそうですが、現代の量子力学の洞察によれば、物の存在は「確率的」にしか記述できないそうです。観測されるまでは、ある粒子が「ある場所に存在する/しない」という形ではなく、複数の可能性が重なり合った状態(重ね合わせ)にあるのです。
ところが、人間の脳はこのような量子力学的な世界をそのまま捉えることはできません。私たちの認識は、「確定的」な枠組みに縛られており、「確率的」な現実のあり方を直接的に把握することはできません。
つまり人間の脳には人間の脳なりの世界の理解の仕方があるのです。しかし、その「理解」は「現実そのもの」ではない、というのが重要な点です。量子力学的な世界をそのまま認識できる宇宙人がいたとして、その宇宙人が人間を観察したら、当惑するかもしれません。
人間とAIの「理解」は
似ているようで全然違う
この人間の脳の特徴は、言語の観点からも同じことが成り立ちます。例えば、日本語は子音のあとには、ほぼ必ず母音がきます。例えば、「た」は[t]と[a]のかたまりで、「ぬ」は[n]と[u]のかたまりです。日本語においては、母音があとに続かない子音は「ん」だけです。
そんな日本語母語話者は、子音が連続する[ebzo]という音が聞こえてくると、それを[ebuzo]と、二つの子音の間に母音[u]を勝手に補完して認識してしまいます。日本語母語話者の脳は、[ebzo]と[ebuzo]を区別できない、という実験結果すらあります。このように、人間の脳は「現実を自らが理解できる形でシミュレートしているもの」なのです。
人間の脳と同じように、生成AIもその内部で、何かしらの形で現実世界を再現しているようです。ただし、「人間と生成AIが同じ方法を用いて世界を認識している確率はとても低い」というのが田口先生の見解です。
同書の主張のまとめとなる部分を引用すると、「生成AIは現実と見まごう会話や映像を作りだすが、それは決して内部に同じ現実を実現しているということではなく、計算機で扱えるような、しかし、現実をかなり正確に再現できるシミュレーターを作成しているに過ぎないのである」と述べられています。
本書に関連して肝となるのは、生成AIは「人間のように文を理解し、発せられるようになった」わけではなく、なにか別のメカニズムによって、「文を理解し、発せられるように見えているだけ」ということでしょう。
生成AIは、人間のような知性を獲得しているわけではありません。私たちが打ち込んだ文の意味を「理解」しているわけでもありません。ただ、「こういう文章に対しては、こう返すべし」という「確率情報に基づいた応答」が極めて上手だということです。
生成AIの仕組みは
中身が見えない“魔法の箱”
では、生成AI技術は、「なぜ」そんな上手な応答を可能にさせたのでしょうか。田口先生も前掲書の中でくり返し明言していらっしゃいますし、その他の研究者からも聞かれることばですが、「なんで生成AIがこんなに上手く動くのかわからない」というのが現状における正直な答えのようです。
「上手く動いている理屈がわからない」ことから、生成AIは「ブラックボックス的」とも表現されます。私は生成AIの設計に直接関わっているわけではないので、現場の感触について証言はできないのですが、このような意見をよく耳にすることは確かです。
私の「生成AIの仕組みはブラックボックスだから怖い」という発言に、「でも、医療の現場でもブラックボックス的な薬ってあるよね」といった反論がなされることがあります。実際その通りで、例えば、全身麻酔薬は、その仕組みが完全に解明されているとは言い難いそうです。
なぜ意識が消失し、そしてどうして再び戻ってくるのか――神経科学の立場からも、まだ解明されていない部分があると聞きます。それでも医療現場で麻酔薬が安全に使われているのは、訓練を受けた専門家が、これまでの経験知に基づいて、対象者の状態をモニターし、用量や環境を厳密に管理した上で使用しているからです。
これに対して、生成AIの状況はかなり異なります。その出力のプロセスは極めて複雑で、しかも使用者のほとんどがその仕組みを理解していません。しかも、スマホやタブレットに搭載され、誰でも手軽に使えてしまうのです。
専門的な知識も訓練もなしに、子どもたちの発達に大きな影響を与える可能性のあるツールを、ブラックボックスのまま触れさせることの危うさは、やはり無視できないと思うのです。
「自然言語には似ているけど、やっぱり異なるもの」、そして、「その仕組みがブラックボックス的であること」に鑑みて、私は生成AIの出力を「ナニカ」と呼ぶことにしています。生成AIの出力が人間言語に似ていることは否定しません。
しかし、その背後にあるものは人間言語と別ものですし、その出力を生みだしているものが、なぜ現状のような結果を出しているのかは謎なのです。人間の言葉に似ているけれど、その正体がよくわからない『何か(ナニカ)』です。
正体不明の「ナニカ」を
子どもに使わせていいのか
そして、次に論じる懸念点は、賛否が分かれるかもしれませんが、「なんで上手く動いているかわからないナニカ」に子どもの発達を任せることは、果たして安全・安心か、ということです。例えば、住む家について考えてみましょう。建物は、どのような強度を持った構造であれば、どのような揺れに対応できるかを計算した上で、設計されています。

『言語学者、生成AIを危ぶむ 子どもにとって毒か薬か』 (川原繁人 朝日選書、朝日新聞出版)
そのためには、建物の構造とその耐震性を理解することが肝要です。「どんな仕組みで建っているかよくわかってないけど、何となく倒れないし、地震が来てもきっと大丈夫だと思う。仕組みはわからないけど」という家に住む勇気を持つ人はどれだけいるでしょうか。
その仕組みがわかっていないものは、何か問題が起こった時に、どこに原因があるかを追求し、それを解決するのが難しいという欠点があります。また、不意に予期していないような問題が起こる可能性も排除できません。
おしゃべりアプリに関連する具体例をあげれば、子どもが「怖い話」をリクエストしたとしましょう。現状の生成AIでは、学習データの中に含まれていた不適切なコンテンツが、どのような条件で出力されるかが予測できないため、おしゃべりアプリが子どもには不適切なレベルの残酷な話をしてしまう可能性があります。
しかし、ブラックボックスであるため、「なぜ」そのような不適切な話をしたのか原因がわからず、根本的な対策を立てることが困難なのです。