{ブログの中のナビゲタ}主に二つの理由から「俳句の世界のAI」を取り上げることにしました。
一つは最近身の回りに、俳句に興味を持つ人が増えてきたような気がするからです。いくつかの新聞や雑誌などに、ずいぶん長いこと俳句コーナーといったものがあるのを見ると、恒常的にそれなりの数のファンがいると思われるだけでなく、本文でも紹介する俳句を競うテレビ番組に刺激されて最近始めた人も多いように見受けられます。
でもそれだけでは、AIとの関わりを取り上げるに十分な理由はならないと思いますよね。そこでもう一つの理由です。俳句は原則17文字という非常に短い文字の羅列であるため、いろいろなことを試行したり、検討することが容易ではないかと考えたからです。組合わせを得意とするAIが果たせる役割なども考えやすいのではと思ったからです。
ここでお断りしておきますが、今「原則17文字」と書きましたが、ご存じのように俳句は必ずしも17文字でなければいけないわけではありません。ただ、いちいちそう断るのも面倒なので、ここでの検討は単に「17文字」ということで進めます。
1. 俳句の楽しみ
{ブログの中のナビゲタ}言うまでもなく、ここで考えようとするのは俳句そのものについてではありません。それでも、俳句の世界でのAIが果たしている、あるいは果たし得る役割を考えていく上で、多少俳句について分解してみると考えやすいと思うので、まずそこら辺から始めましょう。
俳句をたしなむ理由は人それぞれだと思うが、一般の人にとって俳句に関する楽しみは大きく二つに分けることができると思う。一つは自分で作ることで、もう一つは他人が詠んだものを鑑賞することである。
一つめの楽しみ、すなわち作る方は、二つの活動のフェーズに分かれると言えよう。一つめは何か事物に接して、あるいは頭に思い浮かべて、その時心に生まれる印象を知覚することで、もう一つはその印象を十七文字の言葉に変換することである。おいしいものを食べて 「ああ、ホッとする」と感じ、その感動を俳句で残そうとすると言った具合である。
同様に、二つめの楽しみ、すなわち鑑賞する方は、作者の持った印象、あるいはそれに近いものを知覚することと、他人の作品を批評するという二種類の活動に分かれると言うことができるのではなかろうか。紙面上の俳句をみて、「ああこの情景が頭に浮かぶな」と感じ、「実にうまく表現しているな」と評価するといった具合である。
もちろん、技法を学んだり経験を積むことにより力をつけていくという楽しみもある。しかしそれは、すなわち上達するあるいはするどく批評できるようになるといった、上で述べた二つの楽しみに結びついていくのだと思う。
そのような俳句の世界で、AIはどのような役割を果たしている、あるいは果たすようになるのであろうか。
2.俳句に関する御曽崎の楽観論と悲観論
「俳句の世界のAI」というタイトルで、御曽崎の頭にはまず楽観的と言うか、ある意味お目出度いような考えが浮かんだ。その考えは次のようなものである。
全く意味をなさないものも含めて、AIはとにもかくにも17字の50音のすべての組み合わせを作ることはできるではないか。そうすれば、その中には当然素晴らしい俳句と言えるものも含まれるので、AIは簡単に秀句を作れるではないかと考えたのである。
人間の場合は、何かに感動したり、思いを馳せることによって、いい俳句を作ろうとする。すなわち、句を詠もうとする動機を抱くことになる。それに対して、AIは17字の50音のすべての組み合わせで作ることができるとするならば、このような動機は必要なく、ただ機械的に作っていけばよいということになる。すなわち感情のないAIにも簡単に俳句を作ることができる。それでいて、作成された句の中には、読んだ人に「いいね」の印象を与えるものが存在しうる、という考えである。
同時に、彼の頭には、悲観論も浮かび上がった。もしこの楽観論が正しいとすると、AIはいとも簡単に秀作を作れることになる。したがって先にAIがそれらをすべて並べてしまったら、もう人間はそれらの二番煎じしかできないことになってしまうのではないか。もう俳句を作ることに意味がなくなってしまうのではないかという悲観論である。
3.俳句を俎上に載せてみる
{ブログの中のナビゲタ}御曽崎の頭に浮かんだこれらの楽観論も悲観論についてどう思いますか。一見至極理論的なことに思えますが、はたして現実的な話なのでしょうか。それを知るために、もう少し具体的に考えていきましょう。
楽観論にせよ悲観論にせよ、御曽崎が考えているようなことが実現するには、少なくとも四つのステップがいると思われる。
第一のステップは、言うまでもなく17字の50音のすべての組み合わせを作ることである。あいうえおの順で始めれば、「あああああ あああああああ あああああ」が第一号で、次は「あああああ あああああああ ああああい」となる。理屈の上では、AIでなくても人間も同じことができる。単にすべての組み合わせを作ればよいのだから、特別な知識や学習を必要としない。ただその様な作業は人間にはとても根気が続かないので無理である。一方、コンピュータならば淡々と単純な作業をやり続けることができるので、その点からは実行可能のようにも思われる。
第二のステップは、その中から少なくとも日本語として意味のない語句を含むものを除外することである。これだけでステップ1で作られる組み合わせの中から相当な数が捨てられそうである。言うまでもなく、上に挙げた二つの例はこの第二ステップを通過できない。
語句のうち、単語の方は歳時記も含めて何種類かの辞書や辞典を用意して、どれにも載っていない文字の組み合わせがでたらその時点で排除すればよいので、これはAIにはできそうである。
しかし句となるとやや複雑である。例えば「千本足の缶詰」とか「海より高いボール」といった句は、単語や文法に間違いはないが意味をなさない。例えば「ひなたぼこ 千本足の 缶詰や」といった句ができても、誰も見向きもしない。文法的な間違いとしては、例えば助詞の使い方が正しいかという基準などがあげられる。例えば「はえがてをする」はよいが「はえにてがする」という組み合わせは意味をなさないので除外することになる。この第二ステップは直感的には、AIよりも人間の方が得意のように思えるが、所詮人間がやるには組み合わせの量がハンパでない。
第三のステップは、残された17文字の中から秀作か愚策かは問わずに、とにかく俳句と認められるであろうものを抽出することである。第二ステップに必要なのは、語句として意味があるかが判断基準であるのに対して、この第三ステップに必要なのは、十七文字の詩として意味を持つかという判断基準といえよう。例えば「うつくしや はえがてをする としのくれ」という17文字はどうか。これは一茶の三つの俳句の五、七、五を適当に組み合わせたもので、全ての語句には日本語としての意味はある。しかしながら俳句全体としては意味をなさず、とても俳句としては受け容れがたい。
しかしなぜ俳句として意味をなさないのかを説明するのは簡単なことではないような気もする。形式的に「俳句と認められるもの」の判断基準の一つとして、「季語がある」といわれることが多いが、これは絶対にそうでなくてはならないという基準ではない。ちなみに「無季」派といわれる「季語があること」さえ否定する俳人もいる。ほかにも構成が五、七、五であることといったような好ましいとされる特徴もあるが、これらも絶対にそうでなくてはならないという基準ではない。実際にそれに従わない名句も沢山ある。
最後の第四ステップは、まあ俳句としての形は整っているし、全体として意味があるとみなされた17文字の組み合わせから、感性に訴えるもの、芸術性が高いもの、優秀な作品と考えられるものを選びだすことである。このための基準がどのようなものか明快に示すのも難しそうである。
芸能人などが作った俳句を、先生がコメントしたり、手なおししたりしながら作品を評価する、学習とエンターテインメントを併せ持つようなテレビ番組がある。この番組で先生が手直ししたものは、はじめに芸能人などが作成したもとの作品に比べて、俳句に関してズブの素人である御曽崎でも「なるほどよくなった」と感心することは多い。そこで先生が指摘することが、この基準を考えるための一つの参考となりそうである。
この番組を見て御曽崎が感じるのは、とにかく「どこかに工夫がなされていること」が秀句として認められる必須の条件であるようだ、ということである。その工夫とは、季語の使い方がよい、詠っている情景が浮かび易い、リズムがよい、掛詞(かけことば)になっている、サプライズがある、広がりがある、あるいは逆に絞り込まれていく、深みがある、余韻がある、切れがある、流れがある、韻を踏んでいる、語順がいい、散文調でない、17という限られた字数を有効に使っている、などいろいろある。もちろんこれらは御曽崎がこの番組を見ながら学んだり、印象をもった工夫の例であり、ほかにもあるだろう。
話を元に戻して、これら四つの全てのステップが完遂できれば、先に上げた御曽崎の楽観論と悲観論がともに実現することになるが、果たしてそれは現実的なことなのか、これらの各ステップについて、AIに関係する技術的あるいは数理的な考察をしてみよう。
時間的考察
上では第一ステップはAIにはできそうであると書いたが、はたして現実的な話であろうか。その17文字の組み合わせのデータ群はかなり大きいと思われるが、どれほど巨大なものなのであろうか。
5文字分の50音の組み合わせの数は50の5乗になる。これは約3億通りになる。最初の5文字だけでこの数になるが、これだけならば気が遠くなるほど大きな数ではないかもしれない。しかし、それに後ろの5文字の分を組み合わせると3億の3億倍となり、さらに中の7文字分を組み合わせると、1万×1兆×1兆よりも大きな数となる。カタカナや旧ひらがな使い、漢字など等を全く考慮しなくてもこの数である。
もちろんこの膨大な数の17文字の組み合わせを全て記憶する必要はない。順番に組み合わせを作っては、全てのステップをクリアしたものだけを記憶していけばよいのである。さらに一つでも辞書にない語が出た場合は、そこで第二ステップがクリアできないことを意味するので、その先の文字の組み合わせを一切考える必要がなくなる。例えば、最初に「ああああ」と、「あ」が4回並んだならば、もう日本語として意味のない語句がでてきたと判断し、その後に続く13文字の組み合わせを検討する必要がなくなる。(注:「あ」が3回連続しただけならば、「あああき(秋)の」とか「あああい(愛)に」など少なくとも第二ステップを通過できるものがあり得る。)
このようにして50音を組み合わせた17文字のうち、どれくらいの数が、次の第二ステップを通過するか想像しにくいが、仮に平均して1兆個の組み合わせのうち、たった1つが第二ステップを通過すると仮定してみよう。そうなると通過できる組み合わせの数は約1万×1兆となる。さらにそこまでのプロセスに要するAIの時間は無視できるほど小さいとしよう。
一方、第三ならびに第四ステップを満足するか否かの判断をするのは多少の時間を要すると思われるが、仮に1秒間に100の組み合わせについて判断できるとしよう。そうすると一年は約3千万秒なので、24時間働き続けて一年に約30億の組み合わせを検討できることになる。それでも第二ステップを通過した全ての組み合わせをこなすのに、300万年以上かかることになる。たとえ将来、現存するコンピュータの1万倍速いコンピュータが開発されたところで、300年かかることになる。この計算はいくつかの根拠のない仮定に基づいているため、結論の数字の信憑性は低いが、いずれにせよ相当な年月を要することは間違いない。
能力的考察
辞書、辞典、文法書などを記憶したAIは第二ステップを完遂することができるであろうか。語句のうちの語、すなわち単語については辞書や辞典でなんとかなりそうであるが、単語よりも大きな文字のかたまりである句の方はこれらに載っている知識だけでは、このステップを完遂することはできない。人間は通常、句に意味があるか否かを経験とか常識で判断する。AIがそれをできるようになるためには「学習」に頼らざるを得ないが、それがどこまでできるかの課題がある。この課題は第三ステップにも共通な課題であるが、この課題の一つの例を挙げてみよう。
コンピュータに自然言語を理解させることは、自然言語理解と呼ばれるが、この自然言語理解ができるようになるには、世界全体についての知識とそれを操作する能力が必要と考えられている。世界全体についての知識というと、何やら大げさのように思われるかもしれないが、例えばロボットに操作をさせる「ドアを開けなさい」というような単純化されたコマンドを理解するだけならばいざ知らず、新聞記事や詩を完全に理解しようとすると、これが必要になる。
先に挙げた一茶の俳句「はえがてをする」の例をとっても、「ハエは足がある生き物であるが、その前の部分はテ(手)と見なすことも可能である」、さらに何か人にお願いするときに「手を擦ることがある」といったような知識、あるいは判断力がないと理解できない。自然言語理解や、さらにその先の自然言語作成に係る技術も含めた自然言語処理技術ついては、最近大きな技術革新があったのも事実であるが、やはりこのような知識が必要な場合も多く、大きな課題が存在する。
{ブログの中のナビゲタ}自然言語処理技術はAIに関する一つの大きな技術分野であり、感性の受信・発信にも重要な役割を果たします。しかしながら、これらの技術の応用範囲は感性に限ったことではなく、きわめて一般的なものなので、これらについては別章で少し詳しく考えていくことにします。
判断基準の考察
先に計算したように、17字の50音のすべての組み合わせは天文学的な数になるので、たとえ第二ならびに第三ステップでたくさんの組み合わせを排除しても、残る組み合わせはまだ巨大な俳句の群と言える。そこから第四ステップである秀句を選び出すには、どのようなことをすればよいのであろうか。
理論的には、先に挙げた良い俳句にするための工夫の例に示したような項目について、一つ一つの候補に対して、それぞれの程度を数値化して合計点数を比較することによって、良い俳句を選び出すことができるかも知れない。
ところが御曽崎が挙げた工夫の例をもう一度あげてみると、「季語の使い方がよい、詠っている情景が浮かび易い、リズムがよい、掛詞(かけことば)になっている、サプライズがある、広がりがある、あるいは逆に絞り込まれていく、深みがある、余韻がある、切れがある、流れがある、韻を踏んでいる、語順がいい、散文調でない、17という限られた字数を有効に使っている」などで、多くは抽象的で、その程度を数量化するのは非常に難しい。
{ブログの中のナビゲタ}このようにいくらコンピュータでも17文字の組み合わせを全て作成し、四つのステップを経て、その中から良いものを抽出するという考えは、どのステップも現実的ではないようですね。
にもかかわらず、俳句大会にAIが作ったとされる作品が出展されたり、専門誌に作品が発表されることがあるようです。まだなかなか優秀作品までには至らないようですが、AIは一体どのようにしてこれらの作品を作り出しているのでしょうか。
4.AI俳句に取り組んでいる方々
いくつかの専門家グループが、AIによる俳句の制作にチャレンジしている。俳句に関する何らかの規範を見いだしながら生成していこうと試みていると言える。その多くは、先達から学ぼうというアプローチをとっている。
AIが俳句の世界で先達から学ぶ時に使えテキストマイニングテキストマイニングがある。テキストマイニングとは文字列を対象とした、一種のデータマイニングである。データマイニングとは「巨大なデータ群の中から、有用な情報を抽出すること」であり、それまで「未知」だったデータの特徴を発見することを目的とする。すなわちテキストマイニングとは、膨大な量の既存の文字列から、何かしらの特徴やルールのようなものを掘り起こすものと言えよう。
俳句におけるテキストマイニングの適用の一例として次のような方法が考えられる。古来名句といわれてきた俳句のみでなく、最近の俳句大会や専門誌において優秀作品と見なされたものなどをデータとして大量に読み込む。それらを単語や文節で区切り、出現の頻度や共出現の相関、出現傾向、時系列などを解析する。そうすることによって、それまで「未知」だったデータの特徴を発見できれば、その特徴を活用して、いい句を作れるようになる可能性があるという考えである。
例えば実際に開発されたあるシステムでは、3万8千の秀句と8千の季語、50万点以上の画像を読み込んで、これまでに大量の句を生成してきたそうだ。AIはまず、これら数万の秀句に多く登場する単語の並びを学習する。その上で「17文字で作る」「季語を入れる」といった俳句の標準的なルールに基づいて、言葉のつながりなどを考慮しながら単語を並べる。熟考する人間に対し、AIは1分で数百句を詠めるそうだ。画像もデータとして読み込むのは、画像が映し出している情景や事象と、単語の関係を特定することにより、読もうとしている情景や事象にマッチした句を創るためと思われる。
このようにして作り上げられた作品のいくつかは、少なくとも出展したり、発表できると判断されるレベルになっているそうだ。そうであるならば、この方法で少なくとも第三ステップ、すなわち「とにかく俳句と認められるであろうものを抽出すること」に相当するものはクリアできると言えるであろう。
しかしながら、残念ながら未だパットしたものは滅多にできない、すなわち先に考えた第四ステップに相当するレベルはなかなかクリアできないそうだ。第四ステップは、俳句としての形が整っているだけでなく、感性に訴えるもの、芸術性が高いもの、優秀な作品と考えられるものを選びだすことである。実際、AI俳句に取り組んでいる研究者の中では「作る方はある程度の研究成果が見られるが、その中からいいものを選ぶとなると別。ここは難しい」という意見も聞かれる。
第四ステップがクリアできないのは、前項で考察した「判断基準」の難しさが主要な要因ではないかと思われる。御曽崎が俳句の工夫の例にあげた項目を判断基準にするという考えもあるが、既に指摘したように、これらの多くは抽象的で、その程度を数量化するのは非常に難しい。
このように「感性に訴えるもの」を選びだすという作業は少なくとも今のAIには難しいようだが、試行錯誤は続く。テレビ番組や公開イベントに積極的に参加して俳句を詠み、その分野の先生方の助言をあおぎ、学習を重ねている。
一方俳句が秀句とみなされるために、この工夫の例にあげた項目が全て満たされる必要はなく、1つあるいは2,3満たされれば秀作と見なされる可能性がある。その点に目をつけ、1つの点のみに集中して研究しているチームもある。意外性のある言葉の組み合わせで効果を狙うのは俳句の一つの手法である。AIは意外性や組み合わせは得意なほうなので、このチームでは、俳句における意外性のある言葉の組み合わせを研究している。ここでも、現在のところ実力はまだおぼつかないそうだが、検討の対象範囲をかなり限定させることによって、その力が伸びていく可能性は否定できない。
{ブログの中のナビゲタ}17文字の俳句を作り出すことですら難題は多いようですね。一般に散文は俳句などの韻文に比べて制限が少ないが故に、AIにとって易しいのでしょうか、それともかえって難しいのでしょうか。
AIに文芸作品を書かせる研究をしているグループもあります。AIにうまい作文を書かせるためにはどのようなことをする必要があるのでしょうか。そんなことも気になりませんか。そこら辺については、別章で「散文の世界のAI」を取り上げて検討することにしましょう。
コメントを残す