第6章 どうして「人工」の「知能」ができるのか(その3)

ーさらに人間に近づくための「力」ー

{ブログの中のナビゲタ}第4章、第5章で検討したように、知能を形成するいくつかの「力」を使ってコンピュータが「人工」の「知能」を提供できることが理解されたと思います。この章で検討するのは、AIがさらに賢くなり、人間に近づくため持つことが必要となってくる「力」です。その「さらに人間に近づくための力」とは、理解力の残りと、認識力、創造力です。また、コンテンツとして知能を構成する「知識」についても、最後に簡単に触れることにします。
 なお、この章でも前章と同じ理由で、項目番号を11から始めます。

11.理解力(2)情報の意味の解釈

{ブログの中のナビゲタ}前章の最後の項目である「10.理解力(1)他人の気持ち」では、人の気持ちや立場がよくわかるという意味での「理解」について述べました。
 ここではその続きとして、「理解」に関するもう一つの意味である、意味をのみこむこと、すなわち入力された情報の意味を理解することについて考えていきます。

意味を理解するとは

 情報の意味を理解するにはどのようなことが必要であろうか。これはかなり複雑である。情報の形や入力方法は種々あるが、まず情報が目から入ってくる場合は画像認識が、耳から入ってくる場合は音声認識が必要である。
 入ってくる情報が写真とかグラフなどの場合は画像認識が必要なのは明らかであるが、実は文字も記号であり、ディスプレイに映し出されるような文章も画像の一種である。そのため文章を読んで理解するためにも、まずは画像認識が必要なのである。この画像認識は次項で述べる「認識力」の出番であるので、ここでは「認識力」で文字などが認識された後、その内容すなわちそれがもたらす情報の意味を理解することを考える。
 情報の意味を理解するということに関して考えるべき課題は多い。実は「意味を理解する」という言葉のニュアンスも微妙である。例えばAIの中には「首を横に振る」という言葉を別の同義語で置き換えることもでき、反意語も挙げられるし、もちろん外国語に翻訳もできるものもある。人の様子を映し出す映像を見て、どの人が「首を横に振っているか」という問いに答えることもでき、文章を作るときこの表現を使えるAIも存在しうるであろう。
 人間ならばこれくらいのことが全てできれば、その人はこの言葉の意味を十分理解していると見なされるであろうが、AIの場合はどうであろうか。「AIについても同じである。それだけできればこの言葉の意味を十分理解している」という意見もあるかも知れないが、「これをもって本当にAIが意味を理解しているとは思えない」と感じる人もいるかも知れない。そのように感じることは分かるような気もするが、「では何ができれば本当に理解したといえると思うか」とただしても、答えは難しいであろう。
 前章の最後で検討した「人の気持ちの理解」において、たとえ表面的ではあっても理解はしていると考えるか、親身になって理解していなければ理解したことにはならない、の違いがあると述べたが、このような「言葉の理解」についてはどうであろう。この場合でも、表面的な理解と深い理解の違いが存在する可能性がある。もしそのような違いが存在するとしたならば、上に示した「首を横に振る」という言葉の意味について列挙したような行動的あるいは、物理的現象として示せるものは表面的な理解であり、そのような理解だけではなく内面的な真意を捉えていることが深い理解と言えるというような見解になるのではないかと思う。
 この考え方もまた、先に紹介した「専門解説コラム:AIに関する唯物論と二元論」で取上げた心身問題に通ずるものがある。
 精神的な存在や活動も全て物質の所産であるとする考えである唯物論の立場から見ると、記憶、検索、計算といった時間・空間の中に形をもつ行動を指示するプログラムだけで精神的な存在や活動も実現できるはずで、上の例でしめしたようなことができればこの言葉の意味を十分理解している、という意見になると思われる。
 一方、宇宙の構成要素を精神(あるいは心)と物質との二つとする考える二元論的立場からすると、このようなプログラムだけで動くAIは表面的な理解しかできず、これらの行動を超越したものを持てるようにならない限り、AIには深い理解はできないと言うことになろう。

{ブログの中のナビゲタ}やや抽象的な方へ議論が進んでいくような気もしますね。このまま先に進めず、具体的な話に戻しましょう。
 ところで意味を解釈すべき情報としては、言語によって伝えられるものが圧倒的に多いといわれます。それは文字あるいは音声を介して文章によって情報がやりとりされることが多いからです。そこでここからは文章の理解ということにフォーカスを当てて考えていきましょう。

自然言語処理

 人間が普通に使う言語を、機械が取り扱えるようにする技術を自然言語処理というが、その方法は多種ある。文字変換を行う、翻訳をする、質問に回答する、などAIが人間の言語を取り扱う目的によって使う方法が異なる。
 AIが自然言語あるいは文章を理解できるようにするための技法はいろいろ研究されてきたが、長い間「AIが入力された情報の意味を解釈すること」ができるのは、限られた範囲になると言わざるを得ないと考えられていた。
 実際、「現在のAIは検索による膨大な知識はあっても文章の読解力が致命的にない、AIは意味を理解できない」と結論づけた壮大なプロジェクトがある。そのプロジェクトの名前は「ロボットは東大に入れるか」というもので、プロジェクトは既に数年前に打ち切られた。
 しかしながらその後、AIによる言語処理能力は格段に進歩し、特に最近は長足の進歩を成し遂げてきている。実際、文章読解が得意なAI言語モデルも登場して、読解能力のベンチマークテストで人間の平均レベルをはるかに上回る結果を出し、一部の人から「AIが読解力で人間を超えた」と評価されたこともある。
 でも、本当にAIが読解力で人間を超えたと言い切ることはできるのであろうか。

文の理解 

 文章を理解するためには何が必要かを考えると、まずはそこで用いられる言語に関する知識がなければならない。その言語の語彙とか文法である。しかしながらそれらを知っていても、文章すべてが理解できるというわけではない。
 文章を理解するためには、一つ一つの文(センテンス)の意味を正しく理解するというレベルと、センテンスを組み合わせた文章全体(ドキュメント)を理解するというレベルの二つの段階がある。
 まず一つ一つの文(センテンス)の意味を正しく理解することを考えていこう。このためにはさらに二つのレベルの理解が必要と考えられる。一つは書いてあることを理解することであり、もう一つは書いていないことを理解することである。これらは行(ぎょう)を読むことと、行間を読むことと言えるだろう。
 まずは書いてあることを理解するには、各単語の意味を正しく理解できなければならないのは当然であるが、文の構造を理解できないといけない。主語・述語・目的語といった基本構造のみでなく複文、箇条書き、等の構成を理解している必要がある。
 人間の場合は、母国語ならば学校で学習する点もあるが、多くは日常生活の中で数多く聞いたり話したりするうちに自然と覚えていく。それに対して外国語ならば、多くの場合は辞書と文法書等を使いながら学校で学ぶことによって理解力を高めていく。いずれにせよ数をこなして覚えていくと言えるだろう。
 一方、AIの場合は一般的には、膨大な数の例文を用意する、単語の組み合わせの頻度を利用する、文の構造分析をおこなう、キーワードを利用する、それらの組み合わせを用いるなどの方法がとられている。
 次に、書いていないことを理解することについて。一つ一つの文章の意味を正しく理解するためには、多くの場合、書いてないことを補完する必要がある。例えば「御曽崎は奥さんと、先日一緒に見た映画の話をした」という短い文章を考えてみよう。この文についてたくさんの解釈が生まれるとは思わない。「奥さん」は御曽崎の奥さん、「一緒」は、この二人が一緒、「話をした」は説明したのではなく、話題にあげたという意味であることは、日本語を十分知る人にとっては明らかである。
 しかしこれらは、元の文章に不完全さがあることを意味する。その不完全さを補完すると「御曽崎は彼の奥さんとの間で、先日自分達二人が一緒に見た映画のことを話題にとりあげた」等となる。我々はなんの意識もせず、このような補完をしながら、意味を正しく理解していく。
 文章を読むときは、上に示したような文の中で抜けている言葉を補うための知識のほかに、生活や世の中に関するさまざまな知識も使う。例えば「彼女はそば屋に入ろうとしたが、時計瓶に入って、店に入らずハンドバッグから携帯を取り出した。」という文があったとしよう。
 「時計が目に入って」というのは、物理的に時計を見て画像認識しただけではない。それが原因で店に入るのをやめて、携帯を取り出したのは何か理由があるはずである。時計をみて何かに気づいた、思い出した、心配になってきた、などを推測する。そういった推測ができなければ、これらの行為のあいだの関係が理解できないことになる。
 これはどちらかと言うと単純な例ではあるが、この種の推測は行間を読むことといえる。このような推測をおこなうためには、生活や世の中に関するさまざまな経験や知識が必要であり、それらを縦横無尽に引っ張り出してこなければいけない。
 ではAIはどのような方法で、行間を読み、文章を理解するために必要な常識を得るのであろうか。それはAIが使っている言語モデルによって異なるが、主なものとして次のような要素が上げられる。
 一番代表的なものは、大量のテキストデータを用いたトレーニングと言えよう。ここで用いる大規模データセットには、さまざまな種類、形式、内容のテキストが含まれており、そこから言語のパターンや文脈を学習し、同時に人間の常識や知識も獲得する。
 ほかにも、文の前後のコンテキストを利用して、単語やフレーズの意味を理解するだけでなく、文脈全体を考慮してその意味を解釈するようにしたものもある。あるいは、例えば、ニュース記事の読解で学んだ知識を使って、全く別の分野のテキストを理解するというように、既存の知識を新しいタスクに転用する技術を利用したモデルもある。
 これらに共通的に言えるのは、皆何らかの形で学習によって理解力を高めているということである。機械による学習は機械学習と呼ばれるが、この機械学習によってAIは常に進化し続け、より高度な理解力を持つようになる。
 この機械学習については次章で詳しく考えていくことにする。

文章全体を理解する

 ここまでに言及した、“書いていないことを補う必要がある、常識的な広い知識を必要とする場合が多い”などの課題を乗り越えて、一つ一つの文(センテンス)の意味を正しく理解ができると、その次の段階として、文章全体(ドキュメント)を把握するという別のプロセスが必要になってくる。
 文章全体といっても、1ページ程度の短い随筆から何部作にもなっている長い小説など、多種あるので一般論はむずかしいが、環境の変化、状況の流れ、因果関係、相関関係、人間関係、登場人物の心理、そういった諸々のことを把握しながら読み進めていく必要がある。
 例えば随筆ならば、そこに書かれている事象や意見は言うまでもなく、それらの間の論理の構造などを把握する必要もある。また物語ならば、ストーリーを正しく理解するのは言うまでもなく、そこに登場する人物などの心理の変化なども読み取る必要がある。もちろん一字一句を記憶する必要はないが、読み進んできた部分を何らかの形で記憶しておく必要がある。
 人間の場合は、文章を読みながら心象を描くことが多い。たとえば長い小説を読むような場合、人間は心象を描きながら、エピソード記憶を活用しているのかも知れない。エピソード記憶については、第4章 どうして「人工」の「知能」ができるのか(その1) 1.記憶力 の中の「エピソード記憶」参照のこと。
 文章は随筆、小説、解説、報告、学術論文等多種あるのですべてについてではないが、文章全体(ドキュメント)の構造とか流れを把握できるAIも開発されつつある。このようなAIはどのようにして長い文章を読みこなしていくのであろうか。
 これについてもいくつかの技法が研究されているが、長い文章をチャンク(小さなセクション)に分割し、各チャンク間の関係を考慮しながら処理をおこなう方法や、全体像と細部の両方を理解していけるよう、段落ごとや章ごとに理解を深めていく階層的なアプローチを取る方法などがある。その他、文章が進むにしたがって、書かれている内容を大きな関係図に描き、しかもそこに時系列的な変化も表現していくことや、内容にしたがってフローチャートや表を作っていくこと、起承転結や弁証法の正反合などの文章展開のパターンを記憶し、それに当てはめていくこと等が考えられる。
 このようにして、構造とか流れを把握できれば、文章全体(ドキュメント)を理解することができるようになる。しかしこれらをうまく適用できる場合は限られているし、まだ人間の理解力に匹敵するとは言えないのが現状である。
 しかしながら、ここでもAIが継続的に学習し、理解力を向上させている。新たなデータやフィードバックに基づいてモデルを更新し、より精度の高い理解を実現しようとしている。
 このように、AIにとって人間の言葉で入力された情報の意味を解釈することについては、かなり複雑な課題が存在する。先にも触れたように、「学習」については次章で詳しく考えていくことにするが、自然言語処理については技術的な側面を中心に、「第9章 AIの言語能力」でもう少し深く考えていくことにする。

12.認識力

 日常「そのように認識しています」とか「そのことは認識しています」のように使う「認識」とは、それぞれ「理解している」とか「知っている」と言った意味で使われている。ここでは理解することは「理解力」で、知っていることは「知識」の項で考えることにするので、ここでは多少狭義になるが、認識という言葉の中で、AIを論ずる上で特に重要な、画像や音声などの認識に焦点を当てて考えていくことにする。画像や音声のみでなく、AIによっては認識する対象が、味や食感であることもあるが、このようなAIについては、後に「感性の世界のAI」の中で考えていこう。
 このように絞り込むと、認識力とは外部から入ってくる情報を読み取る力と言える。例えば画像の場合、写真とか映像をみて、そこに写っているものが何か、どんな事象が起きているのかがわかる、あるいは特徴を掴むことができるといったことである。
 この認識力を働かせるためには、外部から入ってくる情報を内部で処理できる形にすることと、内容を解釈することの二つが必要である。このうち「外部から入ってくる情報を内部で処理できる形にすること」というのはピンと来ない人もいるかもしれないので、まずこれについて少し考えてみよう。

外部から入ってくる情報の処理

 外部から入ってくる情報は目で受け取る場合は光の形であり、耳で受け取る場合は音の形である。その他皮膚で受け取る熱さや冷たさ、痛さや気持ちよさ、舌で受け取る味などもある。しかし人間の場合、外部から入ってくる情報のうち、目が光の形で受け取る量が圧倒的に多い。
 光が目の中に入って、網膜の上に像が映し出されるが、目がその内容を解釈するのではない。それは脳が行う。目は言ってみればセンサーに過ぎない。しかも脳に送られるのは光ではない。目に入った光による情報は、脳で内容が解析できる形に変えなければいけない。脳はそれを解析することによって目の前に広がる事物を解釈することになる。
 例えばこのブログを読んでいる時、あたかも目の前のディスプレイに映し出されている文字列がそのまま光学的な映像として頭の中に入り込んでいるように思えるが、そうではない。光学的な映像として入ってくるのは網膜までで、その後は神経回路の中を電気信号として伝わって脳の中に入り、そこで信号処理がなされて初めて、目の前のディスプレイに映し出されている文字列なのだと認識される。
 AIの場合でも、カメラや読み取り装置(スキャナー)で読み取った画像を、コンピュータに送り、そこで解析できる形に変えなければいけない。コンピュータはそれを解析することによって読み込んだ事物を解釈することになる。

{ブログの中のナビゲタ}ここで簡単に説明した、網膜に光学的な映像として入ってくる像が、いかにして神経回路の中を電気信号として伝わって脳の中に入り、そこで信号処理がなされて内容が認識されるかについては、「第20章 人間の脳とAIのディープラーニングの仕組み」で詳しく見ていきます。

情報の理解

 次に、処理された信号から情報を読みるフェーズについて考えてみよう。人間が目を通して得る情報の場合、目に入った映像が脳の中で再度組み立てられた内容を理解するフェーズである。頭の中に描かれた画像から、何らかの情報を読み取ることである。
 何を読み取るかは目的によって異なり、「これは何であるか」「どんな特徴があるか」あるいは「何が書いてあるか」などが分かることがその例である。この「内容を解釈する」プロセスは、人間の場合は脳がモデルを作ることによって実行されていると考えられている。
 コンピュータの世界では、文字の自動読み取り、すなわち文字情報の理解については、AIと言われる前から、ある程度は実現されていた。いくつかの制約はあったものの、手書きの数字読み取り装置などがその例である。
 それに対して、写真なども含めたあらゆる種類の映像を理解できるようになるまでには、多少の時間がかかった。AIの開発の歴史の中では、写真に映っている動物が犬か猫かを識別することさえもスムーズにいかなかった時代もあるが、今ではAIの画像ならびに音声の認識力は非常に高くなってきている。人間に引けを取らないレベルまで達し、さらに人間の認識力を超えるものもあると言えよう。
 音声の認識力について言えば、第1章の中の「1.1 意外と身近にあるAI」で御曽崎が言っていたように、スマホで入力をするのに、音声認識機能を利用している人の中には、もうかなりの精度であることを実感している人も多いであろう。
 音声認識機能については、発せられた言葉を認識するだけではなく、音声を発した個人を識別する能力も高めたAIもある。これによって、自動で発言者を特定した上、会話内容を記録することができ、自動議事録作成ができるようにさえなってきた。
 画像認識についてはさらに長足の進歩が見られ、たとえば「AIが野生のチンパンジーの顔から自動的に個体識別する」というニュースがあった。チンパンジーの顔の識別など、専門的に観察している人でなければできないようなことを、AIは十分できるレベルに達しているということである。人間の顔認識によるセキュリティ監視についても、多くのものは顔全体の特徴を利用していた。そのため顔全体がセンサーに写る必要があったが、新型コロナウイルスによる疾病防止のため、広くマスク着用が求められるようになると、マスク着用のままでも認識できるものが出てきた。これも進歩の一例であろう。
 人間の顔認識といえば、「中国では国中に張りめぐらされた監視カメラで、何億もの人民の顔を認識して、その行動を常に監視している」というニュースを一度ならず目にしたが、それが真実であるならば、これは明らかに規模が大き過ぎて人間では対応できないレベルである。
 このように、ものを見分けることができるという点ではAIによる画像認識力は進んできて、人間の能力を遙かに上回るAIも実用化してきた。しかも認識力だけではなく、記憶力や検索力など他の力と組み合わせて、人間の能力を超える、各種の機能も実用化されてきている。先に挙げた中国の監視システムはこの一例であるが、大量に蓄積した画像を利用して医療診断を行うAIや、過去に生じた事象を示すたくさんのグラフを元に、経済予測や株価予測を行うAIなどもその例と言えよう。
 犬か猫かを識別することさえもスムーズにいかなかったAIが、今ではこれほど認識力を高めることができたのは、機械学習によるところが大である。例えば音声認識で紹介した自動議事録作成の場合、利用頻度を上げると個人の声や話し方のくせ、企業や業界特有の用語についてAIの学習が進み、音声認識の精度が高まる。このような学習については、その仕組みや原理も含めて、次章以降で考えていくことにする。

13.創造力

 創造力とはこれまでなかった新しいものや方法を考え出す力である。とは言っても、これまでになかった全く新しいことを、忽然として考案することだけではない。既存のモデルや観念から、新しいものが派生する場合も大いにある。むしろ後者である場合の方が多いようであるが、そのどちらで新しいことを考え出すことができたのか、本人すらも分からないこともある。
 普通なら組み合わせようなどとは考えない、一見関係のなさそうな項目同士を結合することによって、あるいはある分野の要素を別の異なる分野に応用することによって、創意に富んだ考えが生まれることが多い。これまでに考えられたことのないような新しい「よい関係」を見つけたり、新しい因果関係や類似性(アナロジー)を見いだすことなどによって、いろいろな創造、発見、発明がなされるわけである。このような具体的な項目や要素のみでなく、ある分野での考え方や概念、手法や道具立てなどを、異なる分野に適用することによって創造力を活かせる場合もある。

「目標状態」のない問題空間

 創造は「目標状態」のない問題空間を歩むことによってできる、と考えることもできる。試行錯誤やインスピレーションによって、「目標状態」のない問題空間を探索した結果首尾良くたどり着いた先が「目標状態」であり、これがすなわち「これまでになかった新しい物や方法」となるのである。
 「目標状態」がないと言うのは二つの可能性がある。一つは文字通どこに行き着くか見当がつかないような、五里霧中の環境であり、物理学における新しい方程式の発見といった類いの多くは、この例であろう。もう一つは「目標状態」があったことは確かだが、問題空間を歩んでいるあいだに、最初に考えていた「目標状態」とは異なる目標状態にたどりつく場合である。あるものを作りだそうとして、偶然あるいは間違えて目標としていたものとは異なるものができたというは、この例と言えよう。
 これまでに全くなかった新しいことを、独自に考案することは前者に相当し、既存のモデルや観念から、新しいものが派生する場合は後者に相当すると言える。

ビジネスにおける創造

 {ブログの中のナビゲタ}ここまで並べられてきた知能の力について、「なるほど」とか「そうなのか」と思いながら黙ってついてきた御曽崎でしたが、この「創造は『目標状態』のない問題空間を歩むことによってできる」という言葉に心を奪われました。どういうことでしょうか。

 御曽崎が勤務する経営企画室ではビジネス領域の拡大をもたらしそうなアイディアを育てて、事業の拡大に結びつけようとしている。社員から斬新なビジネスアイディアを出してもらい、面白そうなアイディアを温め、場合によっては発案者がリーダーになってプロジェクトとして立ち上げ、事業化の目処が立てば新規事業としてスタートさせるなどの仕組みが作られている。
 そのような企画が実を結びつき易くする支援も行なっている。定期的に社員を行ない、斬新なアイディアを生み易くするための考え方や習慣を教えているのである。斬新なアイディアを生み出すためのツールもいくつか教え、グループ演習による事例研究やワークショップも行っている。御曽崎自身、時折その講師を行っているが、適切なツールを用いることによって創造力が伸びる社員がかなりいると感じている。
 特に御曽崎にとって、この研修に期待することは、研修を受けている若い社員が新しい因果関係や類似性(アナロジー)を見いだすことにほかならないと思っていたが、それがどのようにして起こるのか釈然としないところがあった。
 それが「目標状態」のない問題空間を構築していく、という言葉でイメージが掴めてきたような気がした。研修時に研修生がいくつかのグループを作り、各グループ内で新しいアイディアを生み出そうと議論している姿が、あたかも問題空間の中を互いに協力しながら「目標状態」を作り上げていこうとしているように思えるようになったのだ。「そうだ、次の研修の際には、イントロのところでこの言葉を使うとよさそうだな。そうすることによって研修の目的を理解し易くなりだろう。」と、ご満悦のようだった。
 同時に御曽崎は新たな興味を持ち始めた。それは、この概念はAIに独創力を持たせようとするときにも使えるのではないかという興味である。とは言うものの、人間の場合はグループ演習を利用することができるが、AIにはその様なことはできそうもない。社内研修によって創造力を伸ばす効果が上がったとは思うが、AIはグループ演習などを実施するようには思えず、どうすればよいのかと頭をひねった。

{ブログの中のナビゲタ}ブラボー、御曽崎。御曽崎がやったように、このブログを読みながら、仕事をはじめ自分が日常おこなっていることと結びつけて考えを広めていったり、どうすればAIはそれができるのであろうと興味を持ったりすることは、読むことを一層面白くしていくでしょうし、読む価値も上げていきます。是非、皆さんもそうしてみてください。
 ところで、御曽崎が社員研修で教えている斬新なアイディアを生みやすくするためのツールとは一体どのようなものでしょうか。これらはAIとは関係ないようにも見えますが、御曽崎が思いついたように、この先AIの独創力を考えていくヒントにもなり得るので、「専門解説コラム:独創力を伸ばすツールの例」に載せておきます。

AIが発揮する創造力

 AIには創造力はないと言う専門家もいる。しかし、あながちそうは言えないと思われる面もある。
 人間にとって創造といっても全く新しいものを考えだしたり、作りだすことは希で、多くの場合既存の考えやものの影響を受けて創造が成される。金や銀でできている王冠の体積を量る方法を、全く何もないところから創造するのではなく、風呂に入った時に湯があふれ出るのをみて、それをヒントにそれまで考えられたことがない方法を考えつくといったのがそのような例の一つである。この場合は満タンの風呂に入るとお湯がこぼれ出るという事象が、複雑な形をした金属の体積を量る方法を新たに考え出したと言える。
 このように、既存の考えやものの影響を受けて創造が成されることに注目すると、AIは創造力がむしろ豊かとさえ言えそうである。AIは大量ののデータ、事象、項目、情報などの組み合わせを作ることは容易にできる。そのため、普通の人なら組み合わせようとは考えない、一見なんら関係のなさそうな項目や、異なる分野の要素や概念を結び合わせて、なにか新しいものを作り出すことは大いにありうる。離れた場所に記憶された情報を検索で引き出してくることもお手の物である。それによってたくさんの項目を組み合わせて関係づけることができる。
 人間にとっては考えただけで気が遠くなるような大量の組み合わせについて、愚直に検討して行くこともできる。また、もし人間がやるとしたならば、何百枚もの紙を貼り付けた巨大なキャンバスを用意して書いていかなければならないような、たくさんの項目間の関係を表わす図でも容易に描ける。これによって、例えば「風が吹けば桶屋が儲かる」のような、因果関係のある項目を連鎖的に組み合わせることによって新たな関係をいろいろ導き出せるであろう。
 しかし現実問題として「風が吹けば桶屋が儲かる」と言われて、それを信じる人はいない。それはあまりにも偶然的な要素が多いからである。ところがAIは、単に項目の組み合わせを作るだけでなく、過去に起きた多数の事例を統計的に分析することによって、各項目間の相関関係を求め、各項目間の関係の強弱などをつける(重みづける)ことが可能である。これによって「巨大な紙」に描かれた関係図から蓋然性の高い組み合わせを選ぶことができる。
 さらにAIはシミュレーションも得意である。シミュレーションによってどんな結果となるかをある程度予測することができる。ちょっと無意味な例ではあるが、どのくらいの強さの風が吹けば、どのくらい桶屋が儲かるか、といったシミュレーションさえできるであろう。
 AIはこのシミュレーションを数多く、あるいは大規模にこなすことができる。これによって新たに見出されたたくさんの「風が吹けば桶屋が儲かる」的な因果関係の中から、社会的インパクトが大きい関係や、求めていることを達成するための最も近道となるような組み合わせを示唆する関係などを見つけ出すことができる。
 このような蓋然性が高い関係や相関性の高い関係を新しく見つけることが、奇抜でありながらうまくいく確率の高いアイディアを創造すると言える。
 例えば、AIの利用によって「思わぬ薬の組み合わせが新しいコロナウイルスに効く可能性がある」「無限に近い(薬の)素材の組み合わせの中から、開発しようとしている新薬に結びつきそうなものを選び出す」「全く使われていなかったある特許を、従来目指していたのとは本質的に異なる分野に応用する」などの実例が報告されている。これらは、求めていることを達成するための最も近道となるような組み合わせを作り出していると言えよう。
 このほかにもAIの創造力を示す例はいくつもある。囲碁や将棋に特化したAIは既にトッププロ棋士を超える力を持っている。多くのプロ棋士が、それらが指す手が創造的だという評価をしている。そうなると既にAIは人間を上回る創造性を発揮している分野があると言える。
 なお、これらの関係性を作り出す組み合わせや、蓋然性や相関性の高い関係を選び出す統計的分析やシミュレーションは全てプログラムに従ってなされる。当然ながらそのプログラムがどれだけ秀逸なものかによって、AIの創造力に大きな差が生まれることになる。

{ブログの中のナビゲタ}ここに例として挙げた将棋をさすAIについては、少し詳しく「第10章 将棋界のAI」で取り上げています。よかったら覗いて見てください。

これを創造力と言えるのかという疑問

 このような例が沢山ある中でも、本当にAIが創造力を持つのか疑問視する人もいる。
 例えば、「ビジネスにおける創造」で紹介した、御曽崎が社員の創造力を養うために実施している社内訓練の内容を思い出してみよう。この訓練を受けて多くの社員が新しいアイディアを創造するようになったと御曽崎は思っている。それは各種のツールを学ぶことにスマート」に新しいアイディアを生む術を体得したからであろう。
 一方、現在のところAIはたくさんの組み合わせを作り、重み付けとシミュレーションを行うことによって、新しいアイディアを創造する、あるいは見つけることはできるが、「専門解説コラム:独創力を伸ばすツールの例」に示したような、自発的にマインドマップを描いたり、グループでブレインストーミングやメタホリカルシンキングをするような「スマート」な方法を期待するのは難しい。このような「ひらめき」とか「インスピレーション」と言われるような要素ではなく、愚直とも思えるような機械的な方法でアイディアを出すのを創造力と呼ぶのか、という疑問が生まれてくるのも理解できる。
 一体、AIはいずれ「ひらめき」とか「インスピレーション」を持つことができるようになるのであろうか。これを考えると、また先の「専門解説コラム:AIに関する唯物論と二元論」で取上げたに心身問題に帰着しそうである。
 多少繰り返し的になるが、簡単に言うと、もし心の諸活動を全て脳神経回路網の物理的な働きによって説明することができるならば、そしてもし、AIがこれらの全ての物理的な働きをシミュレートすることができれば、人間とAIによる「創造性」の本質的な違いはなくなることになる。そうなればAIは「ひらめき」とか「インスピレーション」を持つことができるということになる。ただしまだ現時点では、人間の脳神経回路網の物理的な働きは十分に解明されていないし、コンピュータ用のプログラムも人間の脳神経回路網の物理的な働きを全てシミュレートできるとは限らない。
 一方、もし心が身体の物理的な働きを超越した存在であるとしたならば、AIにはそのような存在はないと考えられるので、人間とAIによる「創造性」の本質は異なる部分があり、AIはそのような範囲での創造力は持たないことになる。
 しかしながら実用的な面から考えると、たとえ既存のモデルや観念から、新しいものが派生する場合に限られたとしても、独創的なアイディアが生み出されるのならば、やはりそれは創造力の賜と言えるとも考えられる。創造で重要なのは生み出された結果の新規性であると考えれば、AIには創造力があると言えよう。

{ブログの中のナビゲタ}AIによる創造力について、どう思われますか。「なんだかすっきりしないな」と感じる方もいるかもしれませんね。難しいところですね。この創造力については別の章で、特に創造力が求められると考えられる感性の世界においていくつかの実例を並べながら再度考えてみることにしましょう。

想像力

 {ブログの中のナビゲタ}創造力と発音が同じで、概念も似た力に想像力というのがありますね。多少蛇足的ではありますが、この想像力についても少し考えてみましょう。

 想像力は、視力や聴力で実際に見たり聞いたりせずに、心的な像、感覚や概念を作り出す能力である。想像力は人間が事物や現象を理解するのを助ける。
 例えば週末の夕飯の後に、「久しぶりに居間のカーテンを変えようじゃないか」となった時のことを考えてみよう。「色は何系がいいかな、模様はあった方がいいか無地のほうがいいか」など、周りの家具との調和や部屋のムードなどに考えを巡らすとき、わざわざその都度、大きな布や紙を窓に当てたりはしない。頭の中で黄色のカーテンがあったらどんな具合か、あるいは青い波の模様のあるカーテンではどうか、などをイメージしてどんなカーテンが部屋の雰囲気と合うかを検討することができる。
 あるいは十年くらい前に友人の家に遊びに行った時、とても印象的だったカーテンのことを思い出し、あのようなカーテンも良さそうだなと思うこともある。これは以前与えられた物のイメージが心の中で蘇るプロセスである。これらは全て想像力によって成される。想像力を使うことによって、対象が実際に目の前になくても、疑似的に見ているような効果を出すことができるのである。
 想像力は思考力の一部であると見なす人もいる。それは思考力の大きな二つのファクターである問題解決にも推論にも、想像力を必要とする場合が多いからである。しかしながら、想像力を働かせるのは、問題解決や推論を行うときだけではない。上のカーテンの例のように、計画を練ったり、予定を立てる時などでもこの想像力を使う。想像力によって心的な像を描くことができるので、それを利用するのである。
 その心的な像を描くときは、ほとんど場合それまでに得た知識や経てきた経験などを活用する。すなわち別の対象や別の機会で得た知識や経験などを、今取り組んでいることに当てはめていくのである。既に述べたように創造力にもそのような要素がある。
 さらに以前から持っていた知識や経験から、必要に応じて適切なものを引き出してくるのは記憶力、検索力によるものと考えられる。このように想像力は独立のものではなく、創造力、思考力、記憶力、検索力など複数の力が合成されたものと考えることができるだろう。

14.知識

 「第3章 知能とは何か」の最初に紹介したように、広辞苑では知能は「知識と才能」となっている。才能は道具とか器といったキャパシティのようなものであり、知識はコンテンツのようなものとも言える。これまで取り上げてきた「力」は全て前者に該当するので、もう一方の「知識」についても考えておく必要があるだろう。

形式知と暗黙知

 知識は入力された情報などが記憶力によって蓄積され、必要なときに検索力によって思い出され、利用されると考えることができる。これは人間の知能にも、人工の知能にも当てはまる仕組といえよう。
 この知識は、形式や伝達方法から、形式知と暗黙知に分けることができる。形式知は、明瞭に説明・表現できる知識で、文章・図表・数式などによって表されることが多い。誰にも認識が可能で、客観的にとらえることができる知識である。一方暗黙知は、経験知ともいわれるように、経験的に使っている知識だが簡単に言葉で説明できない知識のことである。ちょっとした力の加減、微妙な特徴の違いに関する知識などがその例である。
 人間は形式知と暗黙知の双方を記憶し、使っているのに対して、コンピュータは形式知だけを記憶できるし、また使っていると考えられることが多い。ところが暗黙知を持つことができ、実際にそれを活用していると考えられるタイプのAIも存在する。
 例えば、通関する荷物の中に違法薬物や偽ブランド品がないかを判断するAIがその一つである。覚醒剤、麻薬あるいは偽ブランド品等は輸入される荷物の中に隠すことなどで国内に持ち込まれる。これらは巧妙に隠されることが多く、X線画像からそれらを判別する知識は形式知になりにくい。すなわち誰もがそれらを判別できるようにするためのマニュアルを作るのは難しく、税関の担当者の暗黙知に頼ることになる。
 ところがこのAIは輸入品にかかわる膨大なX線画像データをもとに、薬物等が隠された疑いのある荷物を選ぶことができる。最終的にはそれらの選ばれた荷物を職員が開封し、薬物などが入っていないか調べる必要はあるが、それまでは暗黙知を備えた税関の担当者だけができたことを、膨大な画像データから得た知識を元に、AIが瞬時にして判定できることになる。しかもその知識はそのAIのみが持つもので、他に教えることが困難であるので暗黙知と言える。
 AIは複雑な処理を繰り返し行って何らかの結論を出すことが多い。上の例の場合は、検査対象となっている荷物のX線画像を膨大なX線画像データと比較して、薬物などの有無を推断することになる。そのような場合、一般にはなぜAIがその結論を出したのか人間には分からない。人間には推断結果だけが伝えられる。
 もちろんたとえ複雑な処理でも、処理方法はすべて人間がプログラムするので、プログラムが読める人には処理のプロセスは理解できる。したがって、処理の方法は形式知となっているといえる。またAIが推論をする、あるいは結論を出す手法も、やはりプログラムでそのアルゴリズムを教えるので、そこまでは形式知を利用しているといえる。
 ところがこれは処理や手法に関する一般的な方法のことであって、問題は個々の結論の出し方である。たとえば「多数の条件をすべて調べ、それらの条件がどのくらい満たされているかによって、判断を下す」という方法を考えてみよう。
 先ほどの薬物を見つけるAIの場合ならば、当該荷物のX線画像を、すでにもっている何百万個の輸入品にかかわるX線画像データと比較して、それぞれのデータとはどの程度類似性があるかを見極める。これら類似性のあるデータの組み合わせとそれぞれの類似性の大小関係によって、薬物の有無を判断しているわけである。その場合、このような方法論は理解できても、誰も個々の結論について、その判断根拠を理解できない。そのAIがもつ暗黙知によって判断がなされたと言える。
 暗黙知によって判断がなされるといっても、何らかの判断の基準はある。暗黙知であるということは、それが何であるかが誰にもわかるような形式になっていないということである。この暗黙知は、人間の場合は経験や勘で作られていくのに対して、AIでは学習によって形成され、さらなる学習によってさらに進化していくのだが、この「学習」については次章以降で考えることにする。
 ここでは知識について、人間もAIも共に、形式知と暗黙知の双方を記憶し、使うことができるということを理解するのにとどめておこう。

{ブログの中のナビゲタ}どうして「人工」の「知能」ができるのかという疑問について、三つの章にまたがって考えてきました。その中でこの章で取り上げた「さらに人間に近づくための力」は、一番課題が残されているエリアだと思います。それだけに今後のさらなる開発が期待されます。
 そこにおいては、人間とAIの類似点や相違点を考えていくことが大切だと思われます。これについてはサブグループ「人間との比較」の中で、いくつかの切り口から考えていきたいと思います。


投稿日

カテゴリー:

投稿者:

タグ:

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です