2023-02-13

ChatGPTは図書館の敵か?

ChatGPTという質問応答型のAIサイトが話題になっている。たとえば、朝日新聞Web版には次のような記事が出ている。(https://digital.asahi.com/articles/ASR2B52W9R28UHBI024.html

>ChatGPTが変える検索 グーグルは守る闘い、日本「蚊帳の外」(松尾豊・東京大学教授 聞き手・真田嶺, 2023年2月13日 17時00分)

> 米新興企業「オープンAI」が開発した対話型の人工知能(AI)「ChatGPT(チャットGPT)」が世界で大きな話題となっています。ロイター通信は、金融大手UBSの分析として、昨年11月末に公開されてからわずか2カ月で、月間アクティブユーザーが1億人に達したと報じました。このユーザー数は、人気の動画投稿アプリ「TikTok(ティックトック)」でも9カ月かかったとされています。そもそもチャットGPTのどのような点が優れているのでしょうか。また、私たちの生活をどう変えうるのでしょうか。日本におけるAI研究の第一人者、松尾豊・東京大学教授に聞きました。

有料記事なので一部を引用するにとどめる。

> 「チャットGPTは大規模言語モデルといわれる、従来よりも非常に巨大なモデルを用いて学習しているため、従来のAIよりも多くのことを覚え、その覚えた知識を使って答える。そのため、特に自然言語の対話で従来とレベルの違う会話ができるようになっています。これまではほとんど対話になっていませんでしたし、長く対話を続けることが難しかったと思います。SiriやAmazonエコーと日常的に長い対話をしているという人はほとんどいなかったと思いますが、チャットGPTはあっという間に1億ユーザーを超え、調べ物など日常的に使って手放せない人がたくさんいる。何か疑問があるときに質問すると、とても便利ですよ」

> ――GPT―3は研究者の間でも、話題になりました。

> 「パラメーターの数が1750億と超巨大で、性能が非常に良かった。研究者かいわいでは公開された2020年から『すごい』と話題になっていましたね。今後、GPT―4も出ると思われ、またパラメーターが相当大きくなるとみられています。スケール則という法則が知られており、パラメーター数が大きくなると賢くなります。したがってGPT-4は、いまのGPT-3よりさらに賢いことが確実です」

また、弁護士ドットコムという法律サイトでは次のような興味深い実験が行われている。(https://www.bengo4.com/c_18/n_15648/?fbclid=IwAR2rbW0vwn9cj_9PHXKwlKZH9SfuBScSE5kTMcqJam8nxOveTj60W7mpJjA)

>ChatGPTは日本の司法試験に合格できるか 弁護士ドットコムが実験2023年02月13日 10時53分

>米国のベンチャー企業OpenAIが開発した対話型人工知能「ChatGPT」に注目が集まっています。共同通信の報道によると、米医療企業の研究チームが、ChatGPTに米国の医師国家試験を解かせてみたところ、正解率は52~75%で、合格ラインとされる60%前後に達しました。また、司法試験を解かせる米国の実験では、7科目全体の平均こそ人間に負けたものの、2科目では平均を上回る結果をみせています。では、ChatGPTに日本の司法試験を受けさせてみたらどうなるのか。弁護士ドットコムで実験をおこないました。

この実験では、令和4年司法試験の民法の択一試験の全37問についてChatGPTを使って回答させて、約3割の正答率という結果を導いたという。択一式の足切りが4割ということから合格ラインからかなり遠いが、択一式の回答を導くことができることがこのシステムがかなり「実用的」であることを示している。これがアメリカの司法試験だともっと正答率が高いらしいが、それはアメリカの場合には判例が公開されているのに対して、日本の判例で公開されているものの割合が低いことが理由のようである。それは当然で、このタイプのAIは用意されている文字列(知識ベース)の検索を高度に組み合わせて行うものであり、文字列に限界があれば、正解からは遠ざかることになる。

ここで、図書館のレファレンスサービスがChatGPTによってどのような影響を受けるのかについて考察してみよう。図書館員がオープンになっている知識ベースを使っていることは確かであり、もしそうしたネット情報だけで回答するならChatGPTで済んでしまうことになるからである。そこで次のような質問をしてみた。

>Q: 「日本の出版市場におけるアマゾンのシェアを知りたい」

この質問に対するChatGPTの回答は次のようなものだった。

>A:アマゾンは、日本の出版市場においても非常に大きなプレイヤーとなっています。しかし、具体的なシェア数に関しては正確なデータが公開されていないことが多いです。

>近年、日本でもデジタル書籍が人気となっており、アマゾンはこのセグメントでも強い地位を占めています。また、アマゾンのKindleストアを活用することで、多くの読者がデジタル書籍を手軽に購入・閲覧することができるというメリットもあります。

>一方で、出版業界ではアマゾンの大きな圧力に対して批判的な意見もあります。出版社や書店がアマゾンとの競争にあっているという声もあります。

>このような背景から、アマゾンが日本の出版市場で占めるシェアについては明確な数字はありませんが、非常に大きな影響力を持っていることは間違いありません。

以上は入力データも出力データもそのままである。質問に対する回答が自然な日本語であり、まったく違和感がないことに驚かされる。しかしながら回答については満足のいくものではなかった。これはアマゾンのシェアは業界レベルで共有されていても基本的には公開されていないからである。たとえば『出版物販売額の実態 2022』(日本出版販売, 2021.11)には、販売ルート別のシェアが掲載されているが、そこではインターネット販売のシェアは19.4%となっていて、それ以上のことは分からない。(https://news.yahoo.co.jp/byline/fuwaraizo/20221209-00327379)可能なのは、そのなかのかなりの部分がアマゾンが占めるのではないかと推測できる程度である。日販はより詳細なデータをもっていて、それ自体がビジネスデータとして個別に提供されるなり販売されるなりしているのかもしれない。

「日本の出版流通におけるインターネット販売のシェアを知りたい」とすれば簡単に回答が得られるはずと思ったが、やってみると「申し訳ございませんが、具体的な数字については私が持っていません。このような情報は常に変化しており、最新の情報は市場調査会社や業界専門家に問い合わせることが最善の方法かもしれません。」という回答だった。上記のデータがオープンになっていないからなのだろう。正直なものである。英語で同様の質問をしてみたが、結果は日本語の場合と同じだったし、アメリカのアマゾンのシェアについて聞いても同様だった。以上のことから、AI怖るに足らずということは言える。

公開された情報やデータを基にしているという意味では図書館員もAIも同じものに依存しているわけであって、それだけなら回答のスピードを考えれば勝負にならない。しかしながら、実はオープンになっていないデータは大量にある。図書館はそれらを収集提供することでそうしたデータへのアクセス手段をもちうるから、AIよりも有利な位置づけにある。また、視点を変えればChatGPTはGoogleとかWikipediaと同様のレファレンスツールの一つと考えることができる。これらはメタ・レファレンスツールと呼ぶべきもので、図書館(員)はこれらの信頼性を検証しながら、独自の評価とサービスの付加価値をつけることが可能である。

図書館員の強みは、AI的ツールを使って次の段階に進めるというところにある。逆に言えば、そうした評価や工夫ができなければChatGPTとは勝負にならないということにもなる。『朝日新聞』の記事に「「チャットGPT」で法律相談 弁護士ドットコム、今春開始へ」というのがあった。先ほどの実験をやった弁護士ドットコム(株)はこれまで蓄積した100万件以上の法律相談のやり取りをChatGPTに学ばせて、新たな無料法律相談サービスを今春に始める方針を明らかにしたというものである。ここは無料の法律相談DBの蓄積があり、これを活かそうということのようだが、これはこのビジネスが法律の問題で何らかの問題を抱えている人に対して最終的には専門の弁護士の紹介を目的としているから成立するものだろう。

同じ発想でレファレンス協同データベースに適用することができるように思われる。ここにはすでに15万件のレファレンス質問の蓄積がある。これをAIを挟んで以前より踏み込んだ質問と回答につなげ、それで足りない部分を図書館員がサポートするということになる。AIはここまで来ているのだから図書館は次の段階に進むことが必須なのである。

追記1(2023年2月14日)

その翌日、朝日新聞のWebにAIに強いプログラマー清水亮氏へのインタビューが追加された。ここで最後に次のようなことが語られた。

>――私たちはチャットGPTと、どう向き合っていくのが良いでしょうか。

>「残念ながら完璧とはほど遠いものですから、それを触って『こんなものか』と思ってほしくない。研究途上のものであるということは意識して向き合ってほしいです。まだまだAI研究の可能性はとても広い。チャットGPTが注目されたことで、これまで無関心だった人の中でもAIに急に興味を持った人が増えました。プレーヤーの絶対数が増えれば、新しいイノベーションは確実に生まれてくると思います。一番大事なのは、(人とAIをつなぐ)インターフェースがどうあるべきかを考えることだと思います」(聞き手・真田嶺)

AIについては過度な期待をもつべきではないことはいろんな人が言っていることである。Chat GHPはそれを如実に示す教材として我々の目の前に現れた。清水氏が発信している「なぜ人々は、ChatGPTという“トリック"に振り回されるのか? Google「Bard」参戦、チャットAI戦争の行方」も参照されたい。

追記2(2023年2月16日)

このブログはインターネットでオープンになっているから、ここで以上のように書いたことから、ChatGPTが日本におけるアマゾンのシェアのデータについての推測を行う可能性があるのかもしれない。しばらくその質問をやってみて、回答に反映されるのかどうかを見てみたい。(このページのアクセス数はもう少しで1000件になろうとしている。そのことも影響するのかもしれない。あるいは誰かがそれを見て同じ質問したり、別の回答を書き込んだりしているかもしれない。)

と、ここまで書いてから同じ質問をしたところ、

>Q: 日本の出版市場におけるアマゾンのシェアを知りたい

>A: 日本の出版市場におけるアマゾンのシェアは、年度やカテゴリーによって異なりますが、一般的には高いとされています。

>日本出版販売株式会社の調査によると、2019年の日本の書籍販売市場におけるアマゾンのシェアは約31%で、トップシェアの書店チェーンである紀伊國屋書店の約26%を上回っています。また、アマゾンは電子書籍市場でも強い地位を持っており、2019年には国内電子書籍市場におけるシェアは約60%でした。

>ただし、2020年には新型コロナウイルスの影響により、オンライン書店の需要が急増したことから、アマゾン以外のオンライン書店も成長しています。今後も市場の変化により、アマゾンのシェアがどのように変化するか注目されています。

と返してきた。3日前には何度やっても数値を返すことはなかったから、この間に何かの変化がある。この31%という数値だが、前の推測値よりかなり高い。理由は前のが「出版市場」であるのに対して「書籍販売市場」であるからだろう。日販の調査データとしているので同じものだろうが、ネット上にはアマゾンのシェアについての数字はなかったはずだ。誰かが教えたのかもしれないし、これが正しいかどうかわからない。しかしながら、何らかの「学習」をしているらしいことは確かである。





0 件のコメント:

コメントを投稿

新著『知の図書館情報学―ドキュメント・アーカイブ・レファレンスの本質』(11月1 日追加修正)

10月30日付けで表記の本が丸善出版から刊行されました。11月1日には店頭に並べられたようです。また, 丸善出版のページ や Amazon では一部のページの見本を見ることができます。Amazonではさらに,「はじめに」「目次」「第一章の途中まで」を読むことができます。 本書の目...