―数理理論や統計処理でできる「力」ー
{ブログの中のナビゲタ}本章で扱う「数理理論や統計処理でできる力」とは、第3章で並べた知能を構成する「力」の中の、思考力と理解力の一部です。
なお、最初にお断りしておきますが、「数理理論や統計処理でできる力」というサブタイトルから想像できるように、この章は統計に関する説明あるいは数学的説明が多い章です。あまりこれらに馴染みの無い方でも理解しやすいように、できるだけわかりやすく説明してあるつもりです。
しかしながら、どんなにやさしく説明してあると言われても、統計学などは肌にあわないという方は、章の中に「AIにおける統計の利用」という項がいくつかありますが、それらと専門的な説明をしている専門解説コラムは飛ばしてください。それでも、どうやらAIはよく統計手法を用いるようだということだけは理解しておいてください。
ただこれらも読んでいけば、たとえ十分に理解できないとしても、なるほどAIはそのような複雑なことをしているのでいろいろなことができるのだ、という感触を得るメリットはあると思います。
{もうひとつ、ブログの中のナビゲタ}章としては独立していますが、第4章から第6章までは、第3章で述べた「知能を構成する力」にリストした力に沿って順に考察していくので、章内の項目番号は連続したものを用います。従って本章では項目番号は4から始まります。
4.思考力(1)全体
{ブログの中のナビゲタ}パスカルの有名な言葉に「人間は考える葦である」とあるように、人間にとって考えることすなわち「思考」は知能活動のシンボル的な存在といえるでしょう。一方、それまではプログラムに従って機械的に計算をするだけであったコンピュータが、AIのおかげで考えるようになったのです。
「どうして機械であるAIが、考えることができるのか」を理解するために、思考力について整理することが必要であり、そのためこの「思考力」については、少し詳しく考えていきます。
思考とは考えや思いを巡らせ結論を導き出して、何かしら一定の状態に達しようとする活動であるといえる。もちろん、あれこれ思考したにも関わらず何も結論を得ることができなかったということも珍しくはないが、基本的に思考は何らかの結論を得るためにおこなう。
この思考で導き出す結論は「どうする」「どうなる」といった未来に関することと、「なぜ(そうなった)」「どのようにして(そうなった)」といった過去の出来事に関することといった具合に二つのグループに分けることもできるが、別の分け方もある。それは、一つは「何らかの目標があり、現状と目標との間に障害があった場合に、目標に達するための方法」で、いま一つは、「ある情報が与えられたとき、その情報に基づいて行われる何らかの予測や推測」である。前者が結論の場合は「問題解決」、後者が結論の場合は「推論」と言われている。人間とAIの比較をおこなう上では、この分類に沿っておこなうと検討し易いので、それぞれについて少し考えていこう。
{ブログの中のナビゲタ}「問題解決」と「推論」について考えていこうということですが、詳細に入る前に、まずはこの二つの用語の概念を把握することから始めましょう。
問題解決
問題解決とは解を発見して問題を解消することである。問題とは現在の状態と、目標とする状態との間にギャップがあり、それを埋める必要のある状況をいう。例えば、花子さんは買い物をするという目標がある。そのために、花子さんが店に入って欲しいものを買い物かごに入れるところまでやったとしたら、それが現在の状態である。その状態から買い物を完了させるまでのギャップを埋める活動が問題解決である。
問題解決の過程を明示するための「問題空間」という概念がある。問題空間とは、まず現在の状態である「初期状態」と、目標とする状態である「目標状態」が存在し、その間を結ぶ「道筋」と、その「道筋」に沿ってステップバイステップで変化していく途中の状態である「中間状態」からなる。
前の花子さんの例では、花子さんがお店でほしいものを集め終わった「初期状態」と、買い物を完了させる「目標状態」があり、その間のギャップを埋めるのが、レジに進み、そこでお金の清算をするという「道筋」である。その「道筋」に沿ってお金をだした状態などの「中間状態」がある。道筋にそって状態を変化させるためにはなんらかの「行為」が必要である。この問題の場合、それらの「行為」は、お金の計算、支払い、おつりの受け取りなどである。
「問題空間」についての御曽崎流解釈
空間というと自分の目の前に広がっているスペースとか、図鑑で見る宇宙空間といったようなものしか馴染みのない御曽崎は「問題空間」という言葉に違和感を持った。初めはどうして問題で空間なんかができるのだといぶかったが、問題を解決するための筋道、言ってみれば問題を解決するためのシナリオのようなものであるということで納得した。
そこで頭に浮かんだのが、子供の頃正月に楽しんだ「双六」である。「出発点」と「上がり」が目立つように表示してあり、上がりに行くまでの道筋が示されていると考えると、双六は問題空間と同じようなものだと思った。もちろん「出発点」が「初期状態」で、「上がり」が「目標状態」に相当する。さらに「ここでお菓子を食べる」とか「ここで一回休憩」といった表示のある「マス」が「中間状態」のようなものだ。そして双六では状態を変化させる「行為」は「サイコロをふるとか、出た目に従って駒を動かす」ということになる。これは双六が作り出す空間であるが、そこから問題空間のイメージを作り上げることができた。
推論
次に思考力の二番目のグループである推論に移ろう。推論とは、既に知っている事柄を元にして、未知の事柄について論じ、予想することと言える。もし、その結果に何らの責任を持たなくてよいならば、予測は簡単にできる。「当たるも八卦、当たらぬも八卦」でいくならば、サイコロをふって予想するのとあまり変わらない。推論で大切なのは、それがどの程度正確か、信用できるかということで、これはすなわち信頼度の高さである。
推論の信頼度を計るためには少なくとも次の三点について検討しておく必要がある。
- 推論の根拠として使おうとしている既に知っている事柄がどの程度正しいか。
- 既に知っている事柄が、予想する事柄に適切な情報を提供できるか、また両者の間に合理的な関係が存在するか。
- 既に知っている事柄から、未知の事柄を予想する方法が適切であるか。
なにやら難しいことを言っているようだが、これは例えば「前回こうなった時は、その後あのようになった。今回も同様なことになったので、ああなるであろう。」という推論に当てはめて考えれば、すぐに理解できるであろう。
この例では「前回こうなった時は、その後あのようになった。」が既に知っている事柄であり、まず(1)について考えてみよう。具体的には、それがたまたまのことだったのか、よくあることだったのか、あるいは普遍的な事実だったのかなどである。
次に、「今回も同様なことになった」は、既に知っている事柄と予想する事柄との関係を示し、(2)すなわちそこに合理的な関係が存在するかを考える必要がある。例えば、既に知っている事柄が、ここで予想する事柄と似たような条件や環境で起きたことなのか、あるいは二つの事柄の間には因果関係や相関関係があるかなどである。
最後に「ので、ああなるであろう」が未知の事柄を予想する方法であり、ここで(3)について考える必要がある。具体的には未知の事柄が既に知っている事柄から予測できるとする根拠はどこにあるのか、そこに合理性があるかなどである。
この議論は、どのような推論が常に正しい(真である)と言え、どのような推論は常には正しい(真である)とは言えないのかという問題に展開できる。この問題は帰納的推論と演繹的推論という用語で説明することができるが、それについては多少専門的な話になるので、「専門解説コラム:帰納的推論と演繹的推論」で考えることにする。
{ブログの中のナビゲタ}実はこの推論は、AI利用において非常に大きな役割を果たします。AIは結論を出すために、この推論をしばしば行います。その時どのような推論をしているかによって、AIの結論がどの程度信頼できるかが変わってきますが、ほとんどの場合、AIがどのような推論をおこなっているかは、利用者には開示されません。そのため、AIを正しく利用するためには、せめてAIがどのような推論をおこなう可能性があるかを理解しておくことが大切です。ここでは推論とは何か、そしてその推論の信頼度について簡単に紹介するに留めますが、AIによる推論については第6項で、実例も含め詳細を検討していきます。
アブダクション
{ブログの中のナビゲタ}推論の一つに「アブダクション」というカタカナ用語があります。しかしながら、この用語は多くの人にとって、あまり聞きなれないものでいささか嫌悪感を持つ方もいらっしゃるかもしれませんね。しかしこれは、既に起きたことについて、なぜそれが起きたかを考えることだと理解すれば、ややこしいことではありません。
アブダクションという一種の推論がある。これは、個別の事象を最も適切に説明しうる仮説を導き出すことである。日本語では仮説形成とか仮説的推論などと訳されているが、アブダクションというカタカナ表記をすることが多いので、ここでもこのカタカナ表記を使うことにする。
アブダクションは観察された事実の集合から出発し、それらの事実についての一番尤もらしい、ないしは最良の理由や説明を推論する。このアブダクションに対して、ここまでに考察してきた未知の事柄について予測する推論のことを「一般の推論」と呼ぶことにしよう。
「本日、日経平均が大幅に下がった」という事実に対して、そうなったのは為替、海外市場、政治問題、需給関係、重大なリスクの発覚などの中から、尤もらしい、ないしは最良の説明と考えられるものを選択する。これは既に知っている事実である結果に対して、それが生じた原因を導き出そうとしているので、アブダクションの例といえる。
アブダクションを問題空間で考えるならば、次のようになる。目標状態が明確で、しかもそれはすでに起きている。また初期状態も分かっている。通常、日経平均の上げ下げについてならば、それは昨日の日経平均の終値である。しかしながら、そこに至る道筋、すなわちなぜそうなった(大幅に下がった)のかは誰にも確定的にはわからない。その筋道を推測するのがアブダクションである。すなわち、アブダクションはすでに答えがわかっている問題に関する問題空間を埋めていくプロセスということができる。
このように解説すると、投資をしている方は、「なんだ、これまでいろいろなところでいろいろな専門家が、本日日経平均が上がったのは、あるいは下がったのは、このためであるといった口調で、断定的に説明しているのを見てきたが、これらは全てアブダクションで、尤もらしい推断をしているのに過ぎず、それが本当に正しい理由なのか誰にも分からないわけだ。後からならば何とでも言えるから、あまり意味がないな。」という具合に感じるかもしれない。
しかし、アブダクションをするのは単にその時の理由が知りたいからだけではない。このように問題空間を作り上げる経験を重ねていくことにより、因果関係、相関関係や傾向などを深く知ることができ、それによってこれから起こることに対して、より正確な予測ができるようになることが期待できることも忘れてはいけない。そしてこれは「一般の推論」の精度を上げていくことにも貢献する。
{ブログの中のナビゲタ}なんだかAIとはあまり関係のない話が出てくるな、と言う印象を持たれる方もいらっしゃるかも知れませんが、ここはAIと人間の知能について考えて行くための準備段階として、知能とは何かを整理しているのです。もうしばらくご辛抱ください。
{ちょっと寄り道}このように、思考力とはある「情報」を得て、そこから何らかの「結論」を導き出すために必要な力でありますが、それが常に合理的に働くとは限りません。
そのような例を、知人があるブログに載せているのを見つけました。よかったら、そこも覗いてみてください。
5.思考力(2) 問題解決
前項(第4項)の前半で、問題解決の過程を明示するために「問題空間」という概念があることを述べた。しかしながら、AIによる問題解決について考える場合、AIはこの問題空間というものをどのように使うのであろうか。一つの例として難病に対処するという問題解決のことを考えてみよう。
この場合はこの難病に罹るとこのような症状になるということが「初期状態」であると考えることができる。一方、「目標状態」はいくつかありうる。その症状を取り除くということは「目標状態」になりうるが、それが難しい場合は、症状の進行を遅くする、進行を止める、といったことを当面の「目標状態」として研究されるかもしれない。あるいは症状が出てしまうと治しようがないので、症状が出ないよう未然に防ぐということも「目標状態」になりうる。
どれが「目標状態」とされたにせよ、一度「目標状態」が決まれば、次にそこに向かうための「道筋」を考えることになる。新薬開発は一つの有力な問題解決の方法である。しかしこの例をとっても、道筋の候補はいくつもあろう。それぞれに対して適切な素材の組み合わせや加工などを見つけて行くことになる。このような前人未踏ともいうべき問題解決において、AIに目標や道筋を考え出すこと、すなわち新たな問題空間を作り出すことを期待するのは困難である。むしろAIに期待するのは、数ある素材や加工などのあらゆる可能性について、シミュレーションをおこなって適切と思われる行為や道筋を絞り込んでいくこと等にある。人間が問題解決のための空間を定義した後に、AIにプログラムすることによって、AIの活動が始まると言える。
一方、人間が抱える問題解決はこのような前人未踏のものだけに限らない。むしろその様な場合は少なく、過去において類似な問題が解決されていることが多い。この場合は、もしAIがすでにたくさんの問題や課題、それらを解決するための問題空間、そしてその問題空間に示された道筋の進め方などのモデルをデータベースに持っていれば、問題空間の概念を利用して解決することができる可能性がある。与えられた問題や課題を分析して、問題をあらかじめ揃えられたパターンにあてはめ、データベースの中からそのパターンに適切なモデルを選んで解決案を見つけてくることができるからである。
言うまでもなく、問題空間などを全く意識せずに問題解決できる場合もある。たとえば判例や、条文、契約書など、標準的なフォーマットが多い分野のことを考えてみよう。そこでは複雑な中間段階はないので問題空間など意識せずに、とにかく大量の事例をデータベースに蓄積し、新しい事象や課題に出てくる単語や単語の組み合わせなどで、データベースの中から同じ分野の適切な事例を検索し、それを新しい問題に適合するように単語などを適宜修正しながら完成させることができる。
これらに共通して言えることは、AIは記憶力に優れているためたくさんの事例などを用意することができ、検索力に優れているため探索できる範囲や量が大きく、さらに計算力に優れているため膨大なシミュレーションをすることができるという点である。このように、AIはいくつかの力を組み合わせて問題解決をすることができる。
良定義問題と不良定義問題
御曽崎は仕事の上で、AIによる問題解決に期待しているところがある。彼が扱う経営問題のほとんどは、どのような解決方法が一番良いのか、どのような解決方法ならば間違いなく解決に導いてくれるのか分からない。そのような状況の中で、「いくつか練リ上げた解決策の候補の中から、AIが一番良い方法だと言っている」だけでは、経営会議を通す十分な理由にはならないことは理解しているが、少なくとも安心材料は提供してくれると内心思っているのである。
この例からも読み取れるように、問題にはある方法を用いれば必ず問題空間の「目標状態」に到達するような問題と、たとえ適当な道筋を選んでも必ず目標を達成できる、あるいは目標に近づくことができるとは限らない問題がある。前者は良定義問題、後者は不良定義問題と言われることもある。
はじめのほうで例に上げた花子さんの買い物の問題の場合は、ある方法を用いれば必ず解に到達するので良定義問題と言える。しかし世の中にある問題は、このような問題ばかりではない。例えば「売上を伸ばさないといけない」とか「職場の雰囲気を改善したい」といったような問題は、ある方法を用いれば必ず解に到達するような問題ではなく、不良定義問題である。
不良定義問題は、仕事やビジネスにかかわる問題に限らない。「どうしたら戦争のない世界を築くことができるか」といった社会問題や「なんとか子供にこのことをわからせたい」といったような日常生活の問題など、我々が直面する問題はこのような問題のほうが多いとも言える。
このようにすれば必ず目標を達成できる、あるいは目標に近づくことができるという方法が必ず存在する保証がない問題であれば、AIが解を求めても状況は同じである。もともと絶対的な正解がない問題なのだから、AIが正しい解を見つけてくれると信じ込むのは誤解である。従って「AIが問題を解決します」とか「AIが解決策を提案します」といったようなうたい文句には要注意であるが、この種のセールストークにはだまされやすい。
理性的に考えれば、対象にしていることが良定義問題なのか不良定義問題なのかの区別は容易にできる場合でも、人は時としてそのことを忘れてしまう。今関心をもっている問題が、ある方法を用いれば必ず問題空間の「目標状態」に到達するような問題か否かを見極め、もしそうでないならば、御曽崎のようにAIが示した解決策であることは一つの支援材料である、という程度に受け止めるのが無難である。
6.思考力(3)推論
問題解決で説明したメカニズムを利用して、AIは推論も行うことができる。例えば、事例をたくさん記憶し、その中から適切な事例を検索して、それを利用して推論を行うことは可能である。ところで、第4項で説明したように、推論はただするだけではあまり価値がない。どの程度信頼できるかが重要であるが、それについてはどうであろうか。
画像による医療診断の例を取り上げて、推論について考えてみよう。例えば三人の癌患者のMRI(Magnetic Resonance Imaging:核磁気共鳴画像法)画像をみて、「これら三人の癌患者のMRI画像にはこういう特徴があった」という観察結果が出たとしよう。ここから何かしらの推論をすることが可能である。
推論とは、既に知っている事柄を元にして、未知の事柄について論じ、予想することであり、ここでは「三人の癌患者のMRI画像にはこういう特徴があった」ということが既に知っている事柄であり、それを元に「今後診る患者が癌だったら同じ特徴がみられるだろう」あるいは「今後診る患者に同じ特徴がみられたら癌を患っているであろう」といった推論が考えられる。だがもちろん、三つの例から出された推論は、常に正しい、すなわち真であるという保証は全くない。単なる偶然かもしれない。
前章で、推論の信頼度を計るためには少なくとも次の三点について考えておかねばならないであろうことを述べた。
(1)根拠として使おうとしている既に知っている事柄がどの程度正しいか。
(2)根拠として使おうとしている既に知っている事柄が、予想する事柄に適切な情報を提供できるか、すなわち両者の間に合理的な因果関係や相関関係があるか。
(3)根拠として使おうとしている既に知っている事柄から、未知の事柄を予想する方法が適切であるか。
これらのことを上の画像による医療診断の例をあてはめながら、考えてみよう。
まず(1)について。もしここで使うMRI画像の数を三から十へ、さらに百、千と増やしてみよう。それによっていつも「これらの癌患者にはこういう特徴があった」という同じ観察結果がでたとしても、それが常に正しいという保証はないが、その可能性は高くなる。このように、「根拠として使おうとしている既に知っている事柄」がたくさんのデータでサポートされれば、それが常に正しい可能性が高まってくる。
(2)については、現代医学ではMRI画像に写る特徴のいくつかは病気との関係が強いと考えられている。すなわち両者には強い因果関係があると考えられている。しかしながら、例えばもしその三人全員がヘビースモーカーであったり、あるいは大量の飲酒の習慣のある人であったならば、そこから導きだされた推論がそうでない人にも適応できるか否かわからない。ほかにも三人全員の職場環境が似ている、同じ持病がある、同じ人種であるといった場合も同様である。このようにMRI画像に写る特徴は、癌以外の要素からもたらされた可能性も否定できない。すなわち「既に知っている事柄が、予想する事柄との間に合理的な因果関係や相関関係があるか」を見極める必要がある。
(3)については、例えば同じ既に知っている事柄から未知の事柄を予想するのに、「今後診る患者にこういう特徴がみられたら癌であろう」という推論は適切であるように見えるが「今後診る患者にこういう特徴がみられなかったら癌ではない」と推論するのは適切ではないかも知れない。「逆は必ずしも真ならず」の問題である。
これらの推論の信頼度を計るための項目は何もAIだけのことではなく、人間についても言えることであるが、AIについては何が言えるだろうか。
(1)記憶容量や計算力に優れるAIにとっては、事例やデータが大量になることによって扱い切れなくなるということはほとんどない。例えば何十万、何百万のMRI画像でも扱うことができる。癌患者やそうでない人の画像を大量にAIに読み込ませることによって、既に知っている事柄を増やし、適切な情報を提供する確率を上げることができる。ただし一般には、事例やデータを入手し、AIに入力するのは人間の作業である。分野によっては、これは大量のAI人材が必要とされる要因の一つになる。
(2)人間には一見相関関係を考えにくいような組み合わせもふくめ、大量の事象の組み合わせを検討できる。例えばMRI画像の場合は、一枚一枚の画像から、それぞれたくさんの特徴と思われる項目をリストし、そのような項目のあらゆる組み合わせを検討することができる。このたくさんの事象の組み合わせの中から、統計的な方法により相関関係が強い組み合わせを選択することができる。このように客観的に相関関係が強い特徴の組み合わせを見出し、それらを利用することにより、推論の精度を高めることができる。
(3)現在のAIの多くは統計と学習を利用して推論する。それに対して人間は往々にして論理的推論を行う。後にでてくる「論理的推論」で示すように、人間は時として論理的推論において間違いを犯すことがあり、しかもその間違いが指摘されにくい場合などがある。その点、統計と学習を利用して推論するAIは、統計による間違いをおかすことはあっても、論理的間違いをおかすことはない。
{ブログの中のナビゲタ}ここで何回か「相関関係」という言葉がでてきました。この「相関関係」という言葉は日常生活でも使う言葉ですが、これが何を意味するか確認することは、今後AIがなぜ思考力をはじめ認識力、理解力等の知能を持つのかを理解する上で大切です。
例えば、相関関係と因果関係とは、同じことなのでしょうか、あるいは違うことなのでしょうか。もし違うとすれば、何が違うのでしょうか。
相関関係
例えば小学校の生徒一人一人の算数と理科の成績を比較した時、算数の成績がよい子は、理科の成績もよいことが多い、また算数の成績が低い子は、理科の成績も低いことが多いことが分かったとしよう。このような場合二つの変数のあいだに相関があると言える。
「二つの変数」とはここでは算数と理科の成績のことで、「相関がある」とは一方が高いと他方も高い(あるいは他方は低い)ということである。このような二つの変数のあいだに相関関係があるか否かは、「相関係数」というものを計算すれば客観的に判断できる。もし相関係数が高ければ相関関係が高いということであり、相関係数が低ければ相関関係も低いということになる。
もし、二つの変数の間でこの相関係数がかなり高くなっても、その二つの変数の間に因果関係があるとは限らない。ここからは二つの変数、あるいは事象の間に、同じ傾向が見られるということしか言えない。この例では、算数の成績がよい子は、理科の成績もよいことが多いとしか言えない。もし因果関係があれば、一方の事象が、他方の事象が起こる原因になっていると言える。例えば、算数をよく理解していると、理科の理解を助けことが多いといった具合である。
しかし同じ傾向があるということは、たとえそこに因果関係が見いだせなくても、何か共通な点があるだろうと想像できる。その共通な点は「共通因子」と言われる。例えば、この例では算数の成績が高い子も理科の成績が高い子も、「論理的思考能力」が高いという共通の点が見いだされる可能性がある。もしそうだとしたら、この「論理的思考能力」は算数と理科の成績についての共通因子であると言える。
{ブログの中のナビゲタ}ここまでに何回か「統計」という言葉もでてきました。全てのAIではないですが、多くのAIが統計的処理を行います。統計というと、高校等で入門的なことを学習した人は多いと思いますが、この統計学は結構奥の深い複雑な学問です。しかしながら、この統計的処理はAIが能力を持つ理由を理解する上で、非常に重要な要素です。この本では、AIによる統計的処理について、何回かに分けて紹介します。
多少専門的な話にならざるを得ないですが、特に専門性の高い部分は専門解説コラムとしますので、そこまで入り込むか否かは適宜判断してください。第一回目はタイトルにしめすように「因子分析」と呼ばれるものです。
AIにおける統計の利用(1)(因子分析)
一つ前の「相関関係」の項では、算数と理科の成績という二つの変数、あるいは事象のことを考えてきたが、世の中の事象のほとんどは二つだけでなく、多くの変数が関係し合っている。それだけにそれらの分析は複雑になる。複数の変数というのは、先の小学生の成績の科目間の関わりの例では、算数と理科のみではなく、国語、体育、音楽などの複数の科目の成績も対象に考えることである。
このような多くの変数の関係を求めるのに、いくつかの変数のあいだで結びつきの強いグループや、ほとんど相関のない変数を見つけだし、それを利用して分析する方法がある。例えば算数と国語と理科の成績は、一つが高いと他も高い場合が多ければ、この三科目は結びつきの強いグループと言える。このグループにはそれぞれの変数のあいだを強く結びつける「共通因子」があることになる。また、体育と音楽の成績にも同様なことが言えたとしたら、この二科目も結びつきの強いグループと言え、そこには別の「共通因子」があることになる。それに対して、算数と国語と理科の三科目の成績は体育と音楽の二科目の成績とはほとんど何も関係が見られないとしたら、これら五科目の間には「共通因子」がないことになる。
この共通因子の有無を見つけることによって複雑な事象を少ない数の原因によって説明したり、予測を立てることができる。共通因子には変数のあいだを強く結びつけるものもあれば、弱いものもある。いくつかの強い共通因子だけを取り上げて、これらによって多くの変数のあいだの関係を求めるのが因子分析である。
AIではこの因子分析は広く採用されており、推論でもよく利用されている。先ほど示した推論の信頼度を計るための三点のうち(2)と(3)、すなわち合理的な因果関係や相関関係の有無と、未知の事柄を予想する方法が適切であるかについて、因子分析を適用することによって確認することができる。
AIが因子分析をおこなうのは、上の例に挙げた科目の成績間の相関関係の有無を求めるといった単純な場合に限らない。例えば、MRI画像の場合、変数はMRI画像に写る脂肪、血管、腫瘍などの特徴、すなわちこれらの有無、位置、大きさ、形などである。このような特徴は人によってばらつきがある。一枚一枚のMRI画像から、それぞれたくさんの特徴と思われる項目をリストし、そのような項目を組み合わせて、この中から統計的な方法により相関関係が強い組み合わせを選択するわけであるが、単に二つ以上の特徴の間に相関関係があるか否かだけでなく、どこどこの部位にある腫瘍がある程度の大きさ以上になると、どこどこの部位の脂肪が厚くなる傾向が見られるが、腫瘍が小さいうちはそのような傾向はみられない、といったことを見いだすこともありうる。
このようなAIには「共通因子」を抽出する計算方法を含め、「因子分析」を行うためのプログラムが組み込まれている。実際「共通因子」に関して、どのような計算や処理が実行されるかについては、かなり専門的な内容になり、それだけでも一冊の本にできるような内容である。ここでは「専門解説コラム:共通因子の求め方」でその概要だけを説明することにする。
AIにおける統計の利用(2)(母数の推定)
{ブログの中のナビゲタ}AIにおける統計の利用の二つ目は「母数の推定」といわれる作業です。
前と同じ小学校生の科目ごとの成績の関係を調べる例で考えてみよう。調査は小学校生の各科目と他の科目の成績の一般的な関係を知ることが目的である。その際、地域差や学校差などを取り除くためには全国の小学生全員の成績について調べればよいのだが、それを実施するのは時間もコストも膨大になる。そのため例えば無作為に選んだ小学生100人についてこの調査をして、その結果から全国の小学生に関してどのような関係があるかを推測することが行われる。当然ながら誰がこの100人の中に入るかによって、各科目の成績の関係は変わってくる。小学校生の各科目と他の科目の成績の一般的な関係を知ることが目的であるならば、この100人の生徒だけについて知るのではなく、そこから全国の小学校生全員の各科目の成績について推定する必要がある。
この推定が「母数の推定」と呼ばれるものである。ここで母数というのは、母集団の平均値や標準偏差などのことである。母集団とは統計の対象となる事物の集団のことで、この例では、全国の小学校生全員の各科目間の成績の関係である。このような母集団と比べると少ない代表(これを標本とよぶ)の特徴に基づいて母数に関する推論を行うことは、統計的推論と呼ばれる。この統計的推論を高い精度で行うことによって、全国の小学生の科目間の成績に関する一般的な関係を把握することができる。
生徒の成績から容易に想像できるように、データはばらつきを持つ。しかしながらある程度の数の標本を集めると、データはある分布を持ってばらついていることがわかる。分布にはたくさんの種類(二項分布、正規分布、一様分布、ポアソン分布、超幾何分布、t分布、F分布など)があるが、どの分布に従うかはデータが現す事象などによる。
例えば、サイコロ一つを転がして出た目の数がデータならば、それは1から6の間での、均一な分布になるし、二つ転がして出た目の合計ならば、2から12までの、7を頂点とする二等辺三角形のような分布となる。しかしながら、どの分布でも、標本と母集団は同じ分布に従う。
母集団や標本がとるこれらの分布の統計的な特性は知られており、どの分布に従うかが分かれば、計算や表によって、平均値や標準偏差などの特性値を求めることができる。従ってAIはまずある程度の数の標本を集めて、その分布の平均値や標準偏差を求め、そこから母数の平均値や標準偏差を推定できる。それができれば、それに基づいてその後入力されるデータに関して、ある定められた範囲の中にあるものか、そこから外れたものか等を判断することができる。
推論における「母数の推定」の使われ方
推論の信頼度を計るための三点のうちの(1)、すなわち「根拠として使おうとしている既に知っている事柄がどの程度正しいか」について注目してみよう。変数がどのようにばらつくかを正確に知ることができれば、推論の精度を上げることができる。ここで利用される統計処理が「母数の推定」である。
MRI画像による医療診断の場合では、変数とはMRI画像に写る脂肪、血管、腫瘍などの特徴、すなわち有無、位置、大きさ、形などである。全ての腫瘍は癌ではないが、癌は腫瘍の一種である。腫瘍の中でどれが癌であるかを推測する方法はいくつかあるが、腫瘍の特徴をその推定根拠にする場合は多い。その特徴の一つが腫瘍の大きさである。
癌である場合とそうでない場合の腫瘍の大きさの分布がわかれば、腫瘍の大きさからそれが癌である確率を推測することができる。この場合、全ての人の腫瘍の大きさが母集団であり、その大きさの平均値、標準偏差などが母数となる。しかし、全ての人を対象とするのは非現実的なので、何人かの癌患者と癌でない人のデータから、この母数を推定することになる。
このとき腫瘍が大きいと癌である傾向は高まるものの、そうとも言えないケースもたくさんあるのか、腫瘍が大きいとほとんどの場合癌であるのかによって「腫瘍が大きいと癌である可能性が高い」という経験則が、どれほど正しいかが変わってくる。そして、その程度は母数を推定することによって、科学的に知ることができるのである。
7.思考力(4)アブダクション
一般の推論とアブダクションの異なるところは、一般の推論は未知の事柄について予測するのに対して、アブダクションはすでに起きている事象(結果)について理由や説明を推論するのである。隠れた因果関係を見つけるという意味で「因果推論」とも呼ばれる。
尤もらしい理由や説明を推論するためには、少なくとも以下の項目が必要と考えられる。既に述べた一般の推論の信頼度を上げるに必要な三項目に似るところもあるが、アブダクションでは結果が既に明確になっているので、多少異なってくる。
(1)関係する可能性のある項目、すなわち原因となりうる項目について豊富な知識を持っている。
(2)それらの項目間ならびに結果の間の関係図が描ける。例えば、それら項目間や結果との関係を線や矢印で結ぶことができる。
(3)上の関係図の線の太さ(重み付け)も把握でき、それによって蓋然性の高さを知ることができる。
これら三つの項目について、第三章で取り上げた「日経平均株価」の場合で示すと以下の様な例が考えられる。
(1)については、為替、海外市場、政治問題、需給関係、リスクの発覚、一つの上場大企業の大きな問題など、日経平均に大きな影響を与えうる要素に関する豊富な知識を持っている。
(2)については、前日のアメリカの株式市場の結果と当日の日経平均といった二つの項目間の関係、複数の主要通貨の為替相場と日経平均といった複数の項目との関係、社会問題の発生や沈静化、地政学的リスクの高まりや低下、中央銀行の政策、国際間の協調と失敗など複数の項目の間の相関関係などが描ける。
(3)については、例えば日本の大手金融機関の破綻の方が、前の晩のアメリカの株式市場の結果よりも、日経平均と結ばれる線が太くなる、すなわち影響が大きいなどを把握している。
AIは記憶容量が大きい上、外部記憶の検索力も優れ、関係する知識を豊富にもつことができる。しかも24時間働き続けることができるため、クラウドなどから最新の知識を容易に得ることができる。そのため(1)については高いレベルに達することができる。但し、最近ではフェークニュースといった、誤情報や偽りの情報も多く流布されており、それらを見抜くという課題も持ち上がってきている。
次に、過去に発表されている大量の事例を読み込み、それらに適切な処理を施すことにより、(2)と(3)もかなりのレベルで実現できると思われる。その処理としては例えば、実際に起きたたくさんの事例からキーワードを拾い上げ、複数の関係する項目間の相関関係を因子分析で求めて決める。重み付けに関するたくさんの方程式を作り、何通りもの解を求めて、母数の推定によって重み付けの平均値や標準偏差を求めて決める。あるいは複数の関係する項目のそれぞれの状況を把握し、後に述べる「条件付き確率」を求めることによって動的に決める、などが考えられる。さらに学習機能により、関係図に新しい要素を加えることも容易である。これらの理由により、AIは尤もらしい理由や説明を作成することが可能となる。
{ここは考えどころ}アブダクションを使って新しい発想をする
このアブダクションは時として科学が飛躍的に発展に大きく寄与すると言われています。代表例として海岸線の形などを見ながら、どうしてこんな形ができたのだろうと推測することから大陸移動説がひらめいたと言われます。あるいはもっとよく知られた、リンゴの実が落ちるのをみてニュートンが万有引力を発見したという逸話もあります。
このように地球儀を眺める、外の景色に目をやるなどといった日常生活の中で、ふとなぜだろうという素朴な疑問をもち、そこからアブダクションをおこなうことによって、世界的な発見や発明が起こるかも知れません。そんなことを常時頭の片隅に置いておくのも悪くないのではないでしょうか。
最近はアブダクションを利用するAIが増えてきているようです。AIに負けないように、一つ挑戦してみてはいかがでしょうか。
8.思考力(5)論理的な思考
{ブログの中のナビゲタ}ここまで前章で挙げた分類に沿ってAIの思考力について考えてきましたが、実はAIが「論理的な思考」ができるか否かは議論のあるところです。これについてはどのように考えればよいのでしょうか。まずは人間による「論理的な思考」について考えてみましょう。これがAIによる「論理的な思考」に関する理解の材料を提供すると思われます。
未知の事柄を予想する方法として、論理的推論は非常に有効な方法である。「AならばBになる、BならばCになる。これはAなので、Cになるであろう」といった推論が論理的推論の一例である。しかしながら、本章の思考力(3)推論 の項でも述べたように、人間は時として論理的思考において間違いを犯すことがあり、しかもその間違いが指摘されにくい場合などがある。まずは、そのような問題の例を一つ挙げてみよう。
ある企業が、一つのポストを公募したのに対して、A,B,Cの三人が応募して採用試験を受けた。この三人がこの試験をパスする確率は、学歴や職歴などから、それぞれ1/4,1/4,1/2であったとする。試験結果の発表の前夜、Aはこの社内の知り合いに、「BとCのうち試験に落ちる一人の名前を教えてくれないか」と頼んだ。社内の知り合いは、もう決済も済んでいるし、明朝の発表までになにか変わることはないし、まあいいかと「Bは採用されないよ」と教えた。さて、それを知ることによって、Aが合格する確率はいくらになるか。ただし、この社内の知り合いは、B,Cがともに落ちている場合は、1/2ずつの確率でBかCの名前を教えるものと仮定する。
この問題の答えはどうなるか?
まず。次のように考える人が何人かいるのではないか。即ち、「応募者三人のうち二人が採用されないのだから、B,Cのうちの少なくとも一人は必ず不採用になる。それがどちらかであることが明らかになったところで、Aが合格する確率は変わらない」と推論する。
あるいは、「今や合格する可能性があるのはAとCだけになり、かれらの事前確率は1:2だったので、Aが合格する確率は1/3になった」と推論する人も何人かいろのではなかろうか。
この二つとも一見論理的推論のように見えるが、じつは共に正しくない。そして「じつは共に正しくない」と言われて、「ああなるほど、ここが間違っている」と指摘できる人が何人ぐらいいるだろう。
この例を見てもわかるように、人間はいつも論理的な思考ができるわけではない。個人差も大きいし、また同じ個人でもできる時とできない時がある。また論理構造の思考で解析できる課題でも、その内容や事象によって論理的に考えることが容易であったり、難しかったりすることもある。また使われている論理展開に誤りがあった場合、それに気づく人もいるが、気づかぬ人もいる。このような差が生じるのはいくつかの要因がある。
まずは「論理構造」そのものを知っているか、十分にしかも正確に理解しているかが第一の要因である。考えている課題に「論理構造」をあてはめることができるかが第二の要因である。そして、本来「論理的な思考」は論理構造だけに注目して考えるべきことであるが、人間の脳の中では、既存の知識や経験で得た方法も適用して混ぜて考えてしまうことがあるのが第三の要因である。
これを先ほどの採用試験の問題にあてはめて考えてみよう。この問題は、事象Aが生じたという条件のもとで事象Bが生じる確率のことを論じたベイズの定理を使って解くことができる。このベイズの定理を知らない人にとっては、この問題は非常にむずかしい。
社内の知人はこのことを知らず、すなわち「論理構造」そのものを知らないために、「Bは採用されないよ」と教えたところで、何も変わらないだろうと考えたと思われる。また、ベイズの定理を学んだことがある読者でも、この話の中でこのベイズの定理を利用した「論理構造」をあてはめることができなかった人も多いと思われる。
さらに「今や合格する可能性があるのはAとCだけになり、かれらの事前確率は1:2だったので、Aが合格する確率は1/3になった」と推論した人は、既存の知識や経験で得た考え方を適用してしまったと言えるであろう。
ちなみに、この問題の解は、「Bは採用されないと知ってAが合格する確率は1/5になる」であり、実に「Bが採用されない」と知る前の合格確率である1/4よりも小さくなってしまうのである。
{ブログの中のナビゲタ}この解を聞いて「きっとそれはAが不当な方法で情報を得ようとして罰があたったのだ」などと心霊的(?)に考える方や、「いや、合格確率が下がることはありえない」と承服できない方など、いろいろいらっしゃるかもしれないですね。
なぜ、Aが合格する確率は1/5になるかは、少し複雑なので、本文では割愛しますが、どうしてこのような解になるのか気になる方は、後の「専門解説コラム:ベイズの定理による確率」をお読みください。数学的な説明がなされています。
人間の場合の説明が少し長くなってしまったが、AIのほうはどうであろうか。AIは「論理的な思考」ができないと言い切る専門家もいる。それに対して、「いやいや、論理的推論を解くプログラムを入れれば、AIは入力された問題の論理構造を抽出し、そこに論理推論ルールを適用して問題を解ける」という専門家もいる。
この後者の意見は、先に上げた人間の論理的思考に個人差がでる三つの要因と同じことを言っていると言える。すなわち、「論理的推論を解くプログラムを入れること」が、「論理構造そのものを知っていること」にあたる。次に、「入力された問題の論理構造を抽出すること」が、「考えている課題に論理構造をあてはめることができる」にあたる。最後に、「そこに論理推論ルール(のみ)を適用して問題を解くこと」が、「論理構造だけに注目して考えること」にあたる。
それでもAIについても、人間の個人差と同様、どの程度の「論理的推論を解くプログラム」ができるか、どの程度の「論理構造の抽出」ができるか、またどの程度「論理推論ルールを適用して問題を解ける」かなど、議論は尽きない。このような「できる、できない」の議論が生まれるのは、論理の体系がかなり複雑なことが大きな理由の一つであり、またAIの知能の限界の有無も別の理由である。これに関しては少々専門的な話になるので、「専門解説コラム:AIによる論理的推論の諸問題」で紹介することにする。しかし、どちらの立場を取っているかにかかわらず、「論理的に思考するAI」は次の大きな課題の一つであるということは、ほとんどのAI研究者が認めるところである。
{ブログの中のナビゲタ}そこで挙げられる課題のいくつかを「専門解説コラム:AIによる論理的推論の諸問題」に並べておきます。興味のある方はそちらもどうぞ見てください。
9.思考力(6)そもそも機械は思考できるか
{ブログの中のナビゲタ}AIは「論理的な思考」ができるかという議論の前に、そもそも統計的処理等によって結論を出すAIは本当に「思考している」と言えるのだろうか、と疑問を感じた人も中にはいらっしゃるのでは。
この疑問に対する答えの一つに「AIは考えるようになったのではなく、考えているように見えるようになっただけだ」と言う意見があります。ここまでいろいろ考えてきておきながら、今更のようですが、この「機械は思考できるか」という課題も長い間議論されてきて、未だにコンセンサスが得られていない課題なのです。
チューリングテスト(Turing test)と呼ばれる、ある機械が「人間的」か否かを判定するためのテストがある。これは人間の判定者が、一人の(別の)人間と一つの機械に対して通常の言語での会話を行う。人間も機械もそれぞれ隔離されており、共に人間らしく見えるように対応する。もし判定者が、機械と人間との確実な区別ができなかった場合、この機械は合格したことになる、というテストである。このテストの発案者であるチューリングの提案は、「機械は思考できるか」という問題を「我々が(考える存在として)できることを、機械はできるか」に換えることであった。
いくつかの機械は、このチューリングテストに合格した。その点からは、機械は思考できるということなる。一方、実際には人間の言葉を理解できない機械が、単に言葉を記号として処理しているだけでチューリングテストに合格した例がある。そこから、理解していないのならば、人間がやっているのと同じ意味で「思考」しているとはいえないという指摘もでてくる。したがって、チューリングテストは機械が思考できるということを証明するものではないという主張である。
このように考えていくと、AIに関する論理的推論にしても、思考にしても堂々巡りの体をなしてしているようにも見える。
この議論は思考力のみでなく、この後に出てくる創造力や理解力にも共通的に当てはまる課題である。これをさらに突き詰めようとすると、進む方向の一つが哲学の道となる。そこは、いささか専門的になるので、それは「専門解説コラム:AIに関する唯物論と二元論」で考えることにしよう。
チューリングテストに関する御曽崎の疑問と不安
ある晩、御曽崎が奥さんにこのチューリングテストの話をすると、思いもよらぬ返事が返ってきた。「あら、そのテスト、もしあなたが比較される人間だったら、多くの機械が合格しちゃうんじゃないの。」「えっ」と言って怪訝な顔をする御曽崎に向かって、奥さんは続けた。
「だって、あなたは私に機械的な説明をすることが多いし、行動も機械的だし。先日も窓ガラスを濡れ雑巾を使って掃除したとき、何も考えずに腕の高さの所から拭きだしたでしょう。一番上からやらないと、上からポタポタ水が落ちて、せっかく先に洗った下のガラスがまた汚れてしまうと、普通の人間ならば考えるでしょ。」
そう言われて御曽崎は反論するのを諦めたが、頭の中では奥さんの話で、チューリングテストに関する疑問と不安が浮かんだ。「自分が被験者となると、多くの機械がテストに合格してしまうか否かは別として、確かに誰が比較対象になるかによって、結果が異なることはあり得そうだな。それもさることながら、判定する人間がどのような人であるかによって、結果は大分異なるのではないか。結局は相対論や主観論になってしまうのではないだろうか。」
さらに「妻のような人間が判定者となったら、自分は機械寄りと見なされるだろうし、自分のような人間が判定者となったら、自分は最も人間らしいと見なされるだろう」などと取留めのないことを考えはじめた。もちろんこれ以上深傷を負わないように、奥さんにはそのことを言わなかったが。
10.理解力(1)他人の気持ち
{ブログの中のナビゲタ}思考力についてはいろいろ検討してきましたが、ここらで一旦きりあげて、次に理解力に移ることにしましょう。
広辞苑によると「理解」には大きく二つの意味があります。一つは、意味をのみこむこと、すなわち入力された情報の意味を解釈することです。もう一つは、人の気持ちや立場がよくわかることです。理解力についてもこの二つに分けて検討していきましょう。この章では二番目の「人の気持ちや立場がよくわかる」について考えてみましょう。
なお、一番目の「意味をのみこむ」については、次章で考えてみましょう。
人の心を読むのも統計次第。いささか味気ない表現だが、これは現在のAIが他人の気持ちを理解するメカニズムを的確に捉えていると思う。AIがどのようにして人の感情を理解できるのかを、既に実用化されている一つの例で考えていこう。一人暮らしの老人の話し相手になったり、健康状態を観察するコミュニケーションロボットに組み込まれるAIである。
このAIはコミュニケーションの相手が、喜怒哀楽などの感情によって顔つきや声の調子がどのように変わるかを観察して、たくさんのデータをそろえて心の状態と顔や声の特徴の関係を把握している。それができれば、相手の顔を見たり、声を聴いたとき、その把握された特徴と比較することによって、各時点の心の状態や感情をある程度知ることができる。画像認識や音声認識の技術を用いて、人の喜びや悲しみの状態等を判断するのである。認識技術は統計処理を用いるので、統計処理によって人の感情を理解するということになる。
さらに、平常心の時と違う特徴が観測されたならば、「何かうれしいことがあったのですか」とか「今日は悲しそうですね、どうしましたか」などと声をかけ、受ける返答によって、AIは自分の判断が正しかったか否か等を学習していくこともできる。これによって判断の精度があがり、例えば「いや、ちょっと寝不足なだけだよ」という返事をもらって、眠い時の顔と悲しい時の顔の区別がつくようになったり、あるいは眼からあふれる涙の量から感動の深さを知るようなこともできるかも知れない。
相手の喜怒哀楽等が判断できれば、それに応じて、AIがあらかじめ用意してある慰め、お褒め、同情等の言葉の中から適切なものを選んで発せば、ますます他人の感情を理解しているように見せることができる。
また、もう一つの例として、オンライン会議で発話者の表情や視線、姿勢などから、その感情を分析するAIがある。例えば、商談時に先方の様子を録画し、商談後にこのAIを使ってその録画データから、どの場面で顧客がどのような反応をしたのかを分析する。さらに、自動で文字起こししたデータも併せて確認することで、顧客の好反応を引き出した文句や言い回し等を学習することができる。ここでは対象としているのは、表情や視線、姿勢などであるが、感情を分析するのは同じく統計処理である。ここでも、人の心を読むのも統計次第と言える。
{ブログの中のナビゲタ}またここで、「統計的処理」という言葉がでてきました。ここではどのような処理をしているのか考えてみましょう。
AIにおける統計の利用(3)(最小二乗法)
二つの変数のそれぞれがとる値をx軸上、y軸上にとって該当する交点をとる。それを何回か繰り返して、いくつかの点をグラフ上にとっていくと、「ここらへんにかたまっている」とか「斜め横に広がっている」と言った具合に、グラフ上に何か見えてくることがある。
この章の「6.思考力(3)推論」で取上げた算数と理科の成績の場合のことを考えると、生徒一人一人の算数と理科の成績を二つの変数として、例えば算数の成績をx軸に、理科の成績をy軸にとって、各生徒のこの二つの科目の成績をプロットしていく。中には算数の成績が良いが、理科の成績は悪い、逆に算数の成績は悪いが、理科の成績は良い子もいるであろう。
しかしもし、算数の成績が良い子は、理科の成績も良いことが多い、また算数の成績が悪い子は、理科の成績も悪いという相関関係があれば、たくさんのプロットをとっていくと、プロットは右肩上がりのかたまりとなってくる。もし算数と理科の成績の間に逆相関があれば、すなわち一方の成績が良ければ、他方の成績が悪い生徒が多いという関係があれば、プロットは左肩上がりのかたまりとなるし、両者に相関関係がなければ、プロットは一面に散在することになる。
このように一般に、二種類のデータのセットを集めてグラフの上に点をとっていくことにより、点がある範囲に集中する組み合わせは相関の強いものであり、他方点がばらばらに散らばる組み合わせは相関の弱いものなど、を見つけることができる。
たとえこの二種類のデータセットに相関関係があったとしても、全てのデータがこの相関関係に従うわけではないので、プロットは一直線上に並ぶわけではない。しかしながら、二種類のデータセットの関係を一つの直線で近似できれば、一方のデータが入手できれば、他方のデータがいくつになるか推測し易くなる。
統計学ではこのプロットのかたまりを代表する直線のことを回帰(かいき)直線と呼び、最小二乗法という方法でこの回帰直線を合理的に求めることができる。最小二乗法とは理論値である回帰直線上の値と実測値のずれについて、ずれの大きさを二乗したものの和、すなわち二乗和を求めて、それが最小となるように回帰直線を決める方法である。この最小二乗法によって回帰直線を求め、それを利用する方法は多くのAIで使われている。
先ほど例に挙げたコミュニケーションロボットの場合では、たとえば喜びの度合いとその時の瞳の大きさをそれぞれx軸上とy軸上にとって該当する交点をプロットし、そのようなプロットを何点もとって、喜びの度合いとその時の瞳の大きさの相関関係を示す回帰直線を求める。それができれば、AIは老人の顔を見るたびに、その時の瞳の大きさによって、回帰直線を使って喜びの度合いの判断ができるようになると言った具合である。
AIにおけるn次元空間の利用
上で述べたコミュニケーションロボットが老人の喜怒哀楽を判断する際、瞳の大きさだけで判断するのでは非常に心もとない。もっといろいろな特徴を把握して判断することが望まれる。
例えば、喜怒哀楽などによって変わる可能性があるのは、瞳の大きさ以外に、目の大きさ、口元の大きさ、目じりの向き、眉間の大きさやしわ、頬のゆるみ、額に浮かび出る血管の影などの顔の特徴や、汗、涙、鼻汁といった分泌物、声の高低、大きさ、口調などいろいろ考えられる。
喜びの度合いをいつもx軸上にとり、y軸上にこれらの項目を順次とってそれらの相関を調べていくことも考えられるが、それでは特徴間の関係が把握できない。それを把握するためには、複数の軸を組み合わせるとよい。例えば口元の大きさをy軸上に、目の大きさをz軸上にとると、口元の大きさがいつもよりこの程度以上に大きくなり、かつ目がいつもよりこの程度以上に細くなった場合は、喜びの度合いがかなり高いと判断すると、信頼度が上がってくる。
この場合はx,y,zの三つの軸上で考察するので、三次元空間で考えていることになる。このような三次元空間でも、先の最小二乗法を適用することができる。すなわち三種類のデータセットを三次元空間の中にプロットしていく。ここでもプロットは一直線上に並ぶわけではないが、互いに相関があれば、ある程度の塊をつくってくる。そのような三種類のデータセットの関係を、三次元空間上の一つの直線(回帰直線)として見いだすことができる。それができれば、新たなyとzの二つのデータのセットが入手できれば、残りのxがいくつになるか求めることができ、その時点の喜びの度合いがどの程度か推測できる。
既に説明したように、最小二乗法とは理論値である回帰直線上の値と実測値のずれについて、ずれの大きさを二乗したものの和、すなわち二乗和を求めて、それが最小となるように回帰直線を決める方法なので、そのまま三次元空間でも使える。ここからさらに特徴の項目を増やしていくと、四次元、五次元となっていくが、考え方は同じで、最小二乗法を適用できる。
一般に多くの種類のデータ(変数)を同時に考察していくと、互いに相関関係のある種類の組み合わせもあるが、相関関係がない組み合わせも出てくる。この相関関係の有無は、前に説明した因子分析で見つけることができる。そのようにして見つけた相関関係があるn個の変数を同時に考察するためにはn次元空間で考えていく必要がある。
AIはこのn次元空間を利用することが多い。n個の軸に沿ってn種類の変数をとり、それぞれの値を示す点をとっていくのである。AIが扱うn次元空間は、各軸に特徴を表す変数をとることが多いため特徴空間と呼ばれることもある。なお、このn次元空間で回帰直線を求める際に、各変数の間の相関関係の大小によって重み付けをしていけば、一層正確な近似を求めていくことができる。
このように、AIではたくさんの特徴を抽出して、それらを統計的に分析して、最終的になにかを判断をすることが一般的である。それを人の心を読むことに応用したのが、「他人の気持ち」の理解力ということになる。
{ブログの中のナビゲタ}n次元空間の概念について、ご理解いただけたでしょうか。上の説明にもあるように、実はn次元空間の概念は多くの分野のAIで利用されているのです。例えば、今のAIは単語や文書をこのような多次元のベクトルで表現し、その相互の関係から言葉の正しい使い方などを推定しているのです。そのようなことについては、別の章で少し詳しく考えていくことにしましょう。
本当にAIは他人の気持ちを理解できるのか
{ブログの中のナビゲタ}「人の心を読むのも統計次第」となると、これで本当にAIは他人の気持ちが理解していると言えるのかという疑問が浮かんできませんか。これも単純に「できる」「できない」と判断しにくい疑問であり、賛否両論あります。
AIは他人の気持ちを理解できるのかという疑問に対して、「できる」と判断する一つの根拠としては、例えば先に挙げたコミュニケーションロボットのAIは、人間の感情を理解していると言えるではないかとするものである。さらにこれによって、一人住まいの老人の孤独感を減らしたり、何か大きな心の変化が認められた時に誰かに連絡するなどができるならば、十分ではないかと考えることもできる。
上で説明したように、AIの場合は統計的処理でこれを実行しているのだが、人間の場合はどうか。人間が他人の顔色や声の調子で相手の気持ちを理解する時は、経験知や暗黙知を使っていると考えられるが、これとてほぼ無意識のうちにおこなわれている一種の統計処理と見なすことができる。
もちろん、人間が他人の気持ちを理解するのはこのような外見の特徴よりも、会話によってなされることが多い。しかし、その会話による場合でも、AIもある程度は感情を読み取ることが可能である。例えば「どうしてよいか分からない」と言う言葉を低いトーンで繰り返すのを聴いて、相手は悲しいあるいは悩んでいるのではないかと判断するといった具合である。
一方、AIには人間の感情を理解できないと主張する意見の根拠についてはどうか。「AIは自分の感情を持つか。AIは全てのことを客観的、機械的に実行するもので、感情によって結果が左右されるようなことはない。いい意味でも悪い意味でも、AIは感情を持たない。もし本人が感情を持たないならば、他人の感情を理解できるはずがない。たとえ慰める、褒める等の言葉が出てきても、それは本当に他人の気持ちに寄り添って出た言葉ではない。」といったような論調である。
この「本人が感情を持たないならば、他人の感情を理解できるはずがない」という意見が常に真であるか否かは、少し考えて見る必要があるようにも思えるが、この論調も感覚的には理解できると言う人は多いのではなかろうか。
「他者が自分と同様の意識体験を持っていなければ、自分の気持ちは理解されるはずがない」というのも同様な意見である。ここで言っているのは意識体験であり、実体験でなくてもよいのだが、そもそもコンピュータには辛い、楽しい、悲しい、怒ったなどの意識もないのだから意識体験もあるはずがないということになる。
そのほか、人の気持ちや苦悩などをわかるためには、明示的な情報が十分にない中で、ある程度想像あるいは推測の要素を使わなければならない場合がある。確かに顔や声、それと本人が発した言葉だけでは、いつも人の感情が理解できるとは限らない。このような場合は言うまでもなく、「想像力」や「思考力」などと連携した活動となってくるが、現在のAIにはこれらが十分に備わっていないという指摘もある。
このように賛否両論がでる一つの理由は、「人の気持ちや感情がわかる」について、その深さによる違いからくるのではないかと思われる。たとえ表面的であっても理解をしているには違いないと考えるか、親身になって理解していなければ理解したことにはならない、の違いではないだろうかということである。
しかしそうなると、何をもって「親身になって理解して」いると言えるのかという課題がでてくる。このような判断は、意識の有無を判定するための経験的なテストしかないと言う意見もある。これは、チューリングテストに似ている考えであるが、先に述べたように、チューリングテストもその限界が議論されている。
{ブログの中のナビゲタ}ここら辺の議論になってくると、そろそろ数理理論や統計処理でできる「力」だけではなく、次章の「さらに人間に近づくための力」にも関係してくるようにも思えます。次章に進むことにしましょう。
コメントを残す