特定のアルファベットから連想される「色名」の連想のしやすさは、人間とAIで似ていることが実験で明らかになりました。
色の名前を一つ挙げてくださいと言われたとき、その答えの頻度は本や新聞などに使われている色名の頻度は一致しないそうです。そしてその理由は明らかになっていないません。
自然言語処理能力をもつAIは、膨大な量の自然言語の文章を学習しており、それと同時に世界についてのさまざまな情報をもっていると言えます。
では、連想する色名の頻度を人間とAIで比較したらどのようになるのでしょうか。
基礎生物学研究所の研究グループは、自然言語処理能力をもつAIの一つであるGPT-3を用いて、連想される色名に関するある実験を行いました。
これまでに、ある特定のアルファベット(a~x)から連想される色名についての研究が報告されています。ある文字を見たりしたときに特定の色の感覚が生じる「共感覚」をもつ人ともたない人とでは、アルファベットから連想される色名について共通する傾向があることがわかっています。
研究グループは、それと似たような実験を行いました。GPT-3のチャット機能の画面で、各アルファベットや数字に対してどのような色名を連想するかを問いました。
たとえば、「a」というアルファベットに対して連想する色名を答えてくださいと英語で質問して、それに対してGPT-3が答えた色名を収集しました。実験では、各アルファベットや数字に対して40から50回ずつ質問してそれぞれについての頻度を計算しています。
次に、その結果と先の研究で報告されている非共感覚者の結果を比べたところ、それぞれの色名の頻度はよく一致することが明らかになりました。
これらの色名の頻度にはどのような意味があるのでしょうか。
実は、これらの色名の頻度は、このAIが参照したであろう膨大な言語のデータベースに含まれる色名頻度とは大きく異なっています。
これはつまり、ただ単に学習した文章のデータベースに発生する頻度そのものを反映しただけではないことを示しています。
先に述べたように、「色の名前を一つ挙げてください」と人間に質問したとき、挙げやすい色名の偏りは本などに出現する頻度とは一致しません。
人間は獲得した情報を脳内で概念化しており、関連が深い概念同士は強くリンクされ、関連が浅い概念同士のリンクは弱くなり、巨大な概念のネットワークが形成されているといいます。
研究グループは、このネットワークそのものが世界についてもっている知識となり、世界を認識する際のベースとなっているとしています。
つまり、色名の連想のしやすさとは、単に文章などで収集された情報そのものではなく、このネットワークの構造に起因するものだという。
すなわち、今回の研究の結果は、AIにも人間と類似した概念のネットワークが獲得されていることを示唆しており、その結果として同じ色名の連想が生じていることになります。
“色名の連想しやすさの起源:人間とAIの比較” ~自然言語処理ができるAIの心理研究プラットホームへの応用~