AIの国語力、短文は得意でも長文の読み書きはまだまだ苦手
Siriなどの会話ボットに話しかけると、的確な返答に驚かされます。人工知能(AI)を駆使した会話やチャットシステムは日進月歩で精度が向上し、冗談交じりの器用な返答までこなすようになりました。その一方で、長文を読ませて内容を理解したり、原稿を作成させたりする能力はなかなか進歩していません。現在のAIは短文は強いものの、長文は弱いようです。
会話のような短文処理ならAIは得意
現在のAIを使った会話システムは目を見張るほど性能が向上しています。たとえば、「今日の天気を教えて」と会話口調で問いかけたときでも、AIは会話言葉を正確に理解します。
AIは短文の言語処理を得意としています。短文は主語、述語、目的語程度で構成されることが多く、構文解析やキーワードを抽出するのが比較的容易です。そのため、原文が送られてくると膨大な会話に関する情報を参照して、蓄積した学習データや構文パターンをもとに原文の意味を分析して、すばやく最適な返答を導き出すことができす。
会話は短文の場合が多く、AIを使った会話処理はチャットボットへの応用に力を発揮しているのです。
長文の読解や文章の作成になるとAIは苦手
短文が得意であるのに対して、長文となると現在のAIは力量を振るわないようです。
AIを使った言語処理は、長文読解力が得意ではありません。複数の短文で構成される文章から全体像を把握したり、主張を読み取ることは今のAIでは困難なのです。現在のAIは文章中から単語を拾い出して、関連する情報を力任せに参照しながら最適と思われる答えや判断を得ようとしています。つまり、人間が長文を読んで大局的に内容全体を理解するような処理をAIはしていないのです。
AIが長文読解力に弱い実状をおもむろに知らしめたのが、国立情報学研究所が中心となって開発した人工知能システム「東ロボくん」による大学入試問題解答の成績です。東ロボくんは、地歴のような知識の詰め込みがものを言う科目には得意な半面、国語や英語での読解力を必要とする長文問題には弱いことがわかったのです。不得意科目で得点を稼げず、東ロボくんは目標としている東大合格水準の入試解答能力に達するには、現在の研究では困難な状況です。
AIで東大合格断念 「東ロボくん」偏差値伸びず (日本経済新聞)
また、原稿を書く能力もAIはまだ未熟です。中部経済新聞社は創立70周年企画として、挨拶文をAIで書かせて紙面に掲載しました。
一読するとAIの原稿執筆力はあなどれないと思うかもしれません。しかし、この原稿は事前に人間がキーワードを入念に選定するといったお膳立てがしてあるのです。現在のAIでは、交流サイトなどネット上の情報から流行や関心事を探し出し、それらをつなぎ合わせて文章を作成することしかできません。そのため、文の前後で関連をもたず脈絡のない内容になったり、話の展開にメリハリがない無機質な文章の羅列になってしまうこともしばしばあります。
人が作った原稿は、最初に話のストーリーを作り、次に読み手にいかにわかりやすく筋道の通った主張を述べていくといった創意工夫を加えながら完成させていきます。しかし、AI単独で原稿の作成を試みても、現在のところ人と同等レベルの執筆を実現するには程遠いのです。
AIの国語力は発展途上
ロボットが流ちょうな会話をしたり、スマートフォンで話しかけると的確な応答をしたりなど、AIの会話力は人間並みに進歩しているように見受けられます。しかし、根幹となる国語力はまだまだ人の脳には及びません。長文を読み取って内容を理解するための言語処理手法を確立していくのが、AIの国語力を向上させる課題といえます。人並みの国語力をAIが持つにはまだ時間がかかりそうです。