朝顔の てのひらほどに ひろがりぬ

閑古鳥 朝顔なども 咲きにけり

上に並べた2つの俳句は、どちらか一方が小林一茶の句で、もう一方は人工知能「AI一茶くん」作の句だ。どちらがAIの作った句か、見抜けるだろうか。もし見抜けたなら、それはどんな違いがあったからだろうか。AIに俳句を作らせる研究は、私たちを取り巻く世界と言語のふしぎな関係を浮き彫りにする。

この2句のうちどちらか一方は小林一茶の句で、もう一方が人工知能「AI一茶くん」作の句だ。どちらがAIの作った句だろうか?

AI一茶くんは、AIを専門とする北海道大学の川村秀憲教授らが2017年に始めた研究プロジェクトだ。5・7・5の17音で季語を含んだ俳句を生成すると同時に、AI自身に優れた句を選ばせる方法の開発に取り組んでいる。実際の俳句の世界には、俳人たちが句を持ち寄り、互いの句を批評しあいながら最も良いものを選ぶ「句会」という催しがある。AI一茶くんの最終目標は「人間の俳人たちと共に、句会に参加できるようになることだ」と川村教授は話す。

AI一茶くんは、GPTと呼ぶ言語モデルを用いて俳句を作る。その仕組みは、簡単にいうと「言葉のサイコロ」だ。AI一茶くんは、ある単語の次にどんな単語が来やすいか、単語どうしの関係性をあらかじめウィキペディアやインターネット上の50万句の俳句などの学習データから把握している。こうした確率の情報を踏まえ、AI一茶くんの言葉のサイコロには確率の高い言葉ほど出やすい細工がしてある。このサイコロを振って、確からしいつながりのある言葉を紡ぐ。冒頭に紹介した2句のうち、1つ目の「朝顔の てのひらほどに ひろがりぬ」がAI一茶くんの作だ。朝顔の表現方法に独自性があるとして、この句は俳人からも高い評価を受けた。

AI一茶くんはこれまでに、1億を優に超える数の俳句を生み出している。それらは基本的にネット上で公開されており、誰でも閲覧することが可能だ(https://ai-issa.jp/)。そこには当然、できばえの良いものもあれば、そうではないものもある。たとえば「ヨモギ」を題材にすると、こんな句が表示される。

体内の水ひろびろと夏よもぎ(-27.840)

よもぎ野へ寝る児隠れを神かつぎ(-68.203)

かっこ内の数字は、生成文のできばえを言語モデルが自ら点数付けした「尤度(確からしさ)」の値だ。言語モデルは、サイコロを振って出た単語の出現確率を掛け合わせることでこの数値を算出する。AI一茶くんの場合、尤度は学習データの中にある俳句とどれだけ近いかという「俳句らしさ」の点数とみなせる。こうして比べてみると、尤度の高い句の方が確かにできばえが良さそうだ。

川村教授らは、こうしたAI一茶くんの俳句の「目利き力」を実際の俳人らと比べてみることにした。「文法的に正しいか?」や「意味が通るか?」などの項目について俳人に○×で200句の俳句を評価してもらい、AI一茶くんが同じように答えられるかを調べると、正答率は80%以上だった。さらに「句会で発表できるレベルの句か?」という設問でも俳人とAI一茶くんの評価は近く、正答率は75%程度。自動生成した数多の句の中から、AI一茶くんは句会にどの句を持っていくかをある程度自力で選べるのだ。

しかし「句会で点数を入れるか?」という設問になると、途端に正答率は当てずっぽうに近い約50%にまで下がってしまった。AI一茶くんは「俳句か否か」を判別することはできても、句会に参加して他の俳人らと句の良しあしを議論できるレベルにはまだ到達していない。

「言葉の意味が通るか否かは、たくさんの日本語と比較すれば判別できる」と川村教授は話す。しかし、意味が通るだけでは俳句とは呼べない。「それが俳句として価値を持つかどうかは、人の感性や経験と照らし合わせる必要があるのだろう」(川村教授)。

AIに俳句を作らせる研究のゴールは、単に人間を唸らせる名句を作ることではない。俳人たちの句会に参加するという目標は、人の感性や経験を理解できるAIの実現につながる。AIに俳句を作らせる研究は、俳句を作る人間の研究でもあるのだ。

(日経サイエンス編集部・出村政彬)

詳細は4月25日発売の日経サイエンス2024年6月号に掲載

  • 著者 : 日経サイエンス編集部
  • 発行 : 日経サイエンス
  • 価格 : 1,576円(税込み)
  • この書籍を購入する(ヘルプ): Amazon

    鄭重声明:本文の著作権は原作者に帰属します。記事の転載は情報の伝達のみを目的としており、投資の助言を構成するものではありません。もし侵害行為があれば、すぐにご連絡ください。修正または削除いたします。ありがとうございます。