2024-10-25

ライブラリアンシップとは何か:生成AIと図書館(1)

 ノーベル物理学賞と化学賞がどちらも生成AIに関連したものであることから,またまたこの技術に注目が集まっている。ノーベル賞は2020年代になってから,科学分野の基礎理論よりも応用技術や社会的インパクトのある方法的発見に目が向けられるようになった。19世紀末に亡くなったアルフレッド・ノーベルの遺産で始まったノーベル賞が想定した学術的なジャンルという概念はとうに古びたものになり,理論と技術と社会との関係がかつて以上に相互的なものととらえられているのかもしれない。その意味で,今年のノーベル平和賞は日本原水爆被害者団体協議会(日本被団協)という国際的にはほとんど知られていなかった日本のNPO(この団体は法的性格を公表していないようだが,一般的意味での非営利組織としておく)が受賞し,経済学賞にトルコ出身でMITに所属するアセモグルを含めた社会経済学者3名が受賞したことを含めて,国際関係,経済,社会が新たな展開に入ったことを示す兆候に対して,アルフレッド・ノーベルの最初の理念に戻った観点から受賞者を選択したのではないかと思われる。

生成AIについてはこれが私たちの生活の深いところから影響を与えるものとなっていることは改めて言うまでもない。図書館情報学においても,これをどのように用いるのかについての議論はすでにいろいろ書かれたり,論じられたりしている。そこでは他の職業領域と同様に,図書館員はAIに取って代わられるのか,というのが中心的な問いになっている。ここでは,マーティン・フリッケ著(根本彰訳)『人工知能とライブラリアンシップ』を選んで日本語訳を作成した経験から何が言えるのかについて考えてみたい。

エミリー・ディキンソン風に表現したライブラリアンシップ

まず,ライブラリアンシップ(librarianship)という言葉そのものが耳馴染みがないと感じる人がいるだろうから,これから説明する。ライブラリアンが図書館員のことであることは想像がつくだろうが,ライブラリアンシップとは文字通り訳せば「図書館員魂」とでもなるような用語で,英語圏の図書館界では今でもよく使われる。かつて使われた図書館学(library science)も同じような意味があるが,そちらはもっと堅い感じである。ライブラリアンシップは図書館員がもつ知識とスキルの全体を指すややくだけた言葉である。これを使うのはベテランの図書館員が多いし,学術的には図書館情報学(library and information science)が使われる。また,情報学(information science)も同じ領域を指す用語という考え方をする人たちも多い。それは言うまでもなくこの領域が情報技術と切っても切れない関係があるからである。ライブラリアンシップを今でも使う図書館員が多いのは,情報技術に還元されない部分を強調したいからだろう。

本書302ページに示されている,「ライブラリアンシップをエミリー・ディキンソン風に表現する」というプロンプトに対して生成AIが作成した回答の訳をみてほしい。

「図書館員は,その静かな優雅さをもって,書かれた言葉の番人を務める。彼女は書架の間を歩き回り,知識の優しい守護者となる。彼女が本を取り出すたびに,彼女の目の前に新しい世界が広がる。彼女は真実の探求者であり,言語の愛好家であり,アイデアの守護者だ。彼女の手は,長年ページを繰ってきたためタコだらけだが,彼女の精神は壊れていない。彼女は秘密の番人であり,夢の提供者であり,学問の擁護者だ。図書館員は宝であり,知恵と驚異の稀有な宝石だ。」

 ここにはいくつもの興味深い表現が見られる。まず,ここで描かれたライブラリアンシップ像である。前半には,書かれた言葉の番人,知識の守護者,真実の探求者,言葉の愛好家,アイディアの守護者というような表現が並んでいる。よく見れば,どれも同じような概念を言葉を変えて言い換えたように見える。最後にある,秘密の番人,夢の提供者,学問の擁護者も同じだ。要するに,なかなか到達できない書き言葉の世界を扱っていることをこれだけの形容語で表現したということができる。図書館員が書き言葉の管理者であって,その書き言葉は,知識や真実,アイディア,秘密,夢,学問といったものを内包しているから,管理者はこれだけのものを提供できる。そして最後に「宝であり,知恵と驚異の稀有な宝石」という最大限の賛辞を送るわけだ。

そうした図書館員の役割の記述以外にここで表現されているものは,一つは「静かな優雅さ」という言葉である。そのあとに「彼女」とあるように,女性性と密接な関係をもつ。ディキンソンは,19世紀アメリカの女流詩人でピューリタンの上流階級の家に生まれ,早くから詩作に目覚めて,生涯,その修辞的な技巧と内向的でセンチメンタルな表現の詩作をすることで知られていた。(日本語版Wikipediaにかなり長い解説がある。)このあたりの表現はそれを反映しているのかもしれない。ただし,図書館員と女性性をつなげる考え方がフェミニズムの観点から批判されていることは確かだ。(参照:ディー・ギャリソン (田口瑛子訳)『文化の使徒 : 公共図書館・女性・アメリカ社会, 1876-1920年』日本図書館研究会, 1996)ここには,残されているテキストの文化的偏差が反映しているということも言える。

エミリー・ディキンソン肖像画

もう一つは「長年ページを繰ってきたためタコだらけだが,彼女の精神は壊れていない。」という表現だ。前半は図書館員の仕事から来るものなのだろう。後半の「精神は壊れていない」というのをどのように理解したらよいのだろうか。書物の世界に耽溺しすぎることで精神に変調を来すというのは西洋の知的世界では言われていたことは確かだ。作家のなかではヴァージニア・ウルフやカフカ,エドガー・アラン・ポーなどがそうした傾向のあった人と言われる。だから,ここでは図書館員は書物の世界に入ってはいるが,仕事としているので精神に変調を来すことはないという意味なのだろう。

作家の文体とは何かー大規模言語モデルの実験

ともかく,この文章はエミリー・ディキンソン風の文体によって西洋における図書館員というものの(ステレオタイプ的な)特性を言い表しているということができる。このような文体がどのようにして「生成」されるのかについて,詳細なところは公表されていないが,仕組みの大つかみなところはすでにいろいろと解説されている。生成AIの大規模言語モデルがどのように言葉を生成するのかについて,フリッケは本書で,大規模な書き言葉の集積があって,それらを処理単位(トークン)に分割したものを多次元的なベクトルとして数値化・データベース化し,類似度を計算することを繰り返してつくり上げられると述べる。その際に,テキストからの埋め込み(embedding)が行われ,ベクトルはトークンとトークンの関係を確率的に計算する学習を繰り返すことにより,「意味」が形成されるという。おそらくは「文体」もまたそうした確率的関係によって決定されるのだろう。

という説明だけでは理解しにくいので,フリッケに倣って,試しに,ChatGPTに対して,「図書館員の仕事を*風に表現してください」という質問をしてみたところ,次のような結果となった。*に入力したのは,1.与謝野晶子,2.川端康成,3.小松左京である。

1. 図書館員の仕事を与謝野晶子風に表現してください

ChatGPT:

図書館員の仕事は、まるで静かな庭に咲く花々を愛でるようなものです。書物の一冊一冊が、心の奥深くにひっそりと寄り添い、時に熱く、時に冷たく、さまざまな感情を呼び起こします。

訪れる人々は、何かを求めてこの場所に足を運び、その瞳には希望が宿ります。その瞬間、私は彼らの心を受け止め、彼らが探し求める物語へと導く役割を担います。本のページをめくる指先に触れると、まるで詩の一行が静かに流れ出すようで、私自身もその言葉に心を奪われていくのです。

図書館は、言葉が織りなす小宇宙。さまざまな人々の思いが交差し、共鳴しあう場所。私もまた、その中で一つの声として存在し、言葉の力を信じ、ひたむきにその使命を果たしていきます。

この静けさの中に、感動と喜びが満ち溢れ、心の奥に潜む情熱をかき立てられる。私の仕事は、書物を通じて生きる喜びを分かち合うこと。言葉の花を育てることで、訪れる人々の心を彩り続けたいのです。


2. 図書館員の仕事を川端康成風に表現してください

ChatGPT:

図書館員という職は、静寂の中に佇むひとりの旅人のようなものだ。書架に並ぶ本たちは、まるで長い旅路を経て、今ここに集まった思い出のように感じられる。それぞれのページには、遠い国の風景や、忘れられた人々の声が宿っている。

私はその本たちの案内人であり、訪れる人々に物語の扉を開く役目を果たす。彼らの目に浮かぶ期待や好奇心は、私の心にも温かな光を与える。薄暗い図書館の中、静かに本を手に取る音が響き、その瞬間に小さな宇宙が広がるのを感じる。

外の世界の喧騒は遠くに感じられ、ここでは時間がゆっくりと流れている。人々が本に触れることで、心の奥深くにある何かに触れ、過去と未来が交わる瞬間が生まれる。その瞬間に、私は自分自身もまた、書物の中の一ページになっていくのだ。

図書館はただの場所ではなく、思索と感動が交錯する聖域。そこにいることで、私は人間の営みの深さを感じ、また一歩、静かな旅へと誘われていく。


3. 図書館員の仕事を小松左京風に表現してください

ChatGPT:

図書館員の仕事は、まるで無限の宇宙を航海する宇宙飛行士のようなものだ。無数の書物は、銀河の星々のように、さまざまな物語や知識を秘めている。私はその星々の間を行き来し、訪れる人々に未知の世界を紹介する役割を担っている。

静かな書架の間を歩くと、時折、誰も知らない宇宙の秘密が耳をかすめるような気がする。ページをめくる音は、星の輝きが響く音楽のようで、心に不思議な感動を与える。私が手にする本の中には、異次元の思考や未来の予感が詰まっているのだ。

しかし、この空間は単なる情報の集積ではない。人々が訪れ、夢を語り、思索を重ねることで、ここは生きた場となる。図書館は、未来を探るための実験室でもあり、過去を解き明かすための考古学的な現場でもある。

私は、これらの知識の星々を繋ぎ、未来の探求者たちを導く道しるべとなる。やがて、彼らが持ち帰る知識や感動が、新たな宇宙を創造していくのだ。その瞬間こそが、図書館員としての私の存在意義であり、無限の可能性を感じる瞬間でもある。

どうだろうか。見事にそれぞれの作家の特徴を反映した文体で図書館員の仕事が表現されている。しかし,今,文体という言葉を使ったが先ほどの大規模言語モデルの説明に照らし合わせてみると,これを文体といってよいのか疑問も沸いてくる。要するに,それぞれの作家が使いそうな語を組み合わせて出力しているにすぎないのではないかと。

AIがしていることは,言葉と言葉がどのような関係で結びついているのかを確率計算によってつくりあげたベクトルデータベースに対して,プロンプト(質問)が与えられて,それによってつくられたベクトルデータとの一致度の高いものを再構成しているということである。この場合のプロンプトのデータは,「図書館員」,「仕事」,「作家*」である。推測できるのは,「作家*」が使用していたり,その人について書かれたりしたものの膨大なテキスト群があり,そのベクトルデータがつくられる。同様に,「図書館員」,「仕事」についてもデータがある。そして,それらが1つのプロンプトで表現されたときに,3つの言葉に共通する要素の多元的な言語空間が計算によって出力されて,それが文章として示される。

文章はいずれもステレオタイプと言えば言えないこともない。最初に「〜のようなものだ」で始まり,その「〜」にちなんだ経験が語られ,図書館員(あるいは私)がそこで何をしているのかの説明がある。そのときに,それぞれの作家が用いそうな語,表現が連続的に出てくるので,確かにその作家の文体だと思わせる効果がある。ともかく,短い文章ではあるが,文章の流れがしっかりしている。起承転結があるといってもよい。おそらく,ChatGPTは標準でこのような4段落の文体で流れをつくるように仕組まれているのだろう。

本当のところ,「文体」がこのような説明で可能なのかはよくは分からない。文体というのが特定作家が使う確率の高い用語の集合体にすぎないとすれば,ここまでの説明で足りるのかもしれない。しかし,与謝野晶子のものが,「ですます調」で,他の2つが「だである調」であるのは偶然ではないだろうし,単なる用語の集合体というだけではすまない,語と語のつながりに対する「深層的」結びつきがみられる。この「深層」こそがキーワードであり,そこでは思想も知識も文体もが「生成」される。それがたとえ計算に計算を重ねたものだとしても,「人工」「知能」に見えてしまうのだ。

作家の文体についての追加考察

文学における論理についてもう少し考察しておこう。たとえば,与謝野晶子と小松左京のように個性が違った作家の文体で図書館員の仕事を表現したときにどのような違いがあるのかを見てみよう。

まず,図書館員の仕事の特性。

[晶子]図書館員の仕事は、まるで静かな庭に咲く花々を愛でるようなものです。書物の一冊一冊が、心の奥深くにひっそりと寄り添い、時に熱く、時に冷たく、さまざまな感情を呼び起こします。

訪れる人々は、何かを求めてこの場所に足を運び、その瞳には希望が宿ります。その瞬間、私は彼らの心を受け止め、彼らが探し求める物語へと導く役割を担います。

[左京]図書館員の仕事は、まるで無限の宇宙を航海する宇宙飛行士のようなものだ。無数の書物は、銀河の星々のように、さまざまな物語や知識を秘めている。私はその星々の間を行き来し、訪れる人々に未知の世界を紹介する役割を担っている。

仕事の比喩においては,それぞれ,「花々を愛でる」と「宇宙を航海する」となっている。具体的に,晶子は「心の奥深くにひっそりと寄り添い...さまざまな感情を呼び起こ」す書物を求める人々の「心を受け止め,彼らが探し求める物語へと導く役割を担」うとしているのに対し,左京は書物が「さまざまな物語や知識を秘めている」から,図書館員はそれらの「間を行き来し,おとずれる人々に未知の世界を紹介する役割を担っている」としている。図書館員の仕事が,書物の世界に親しんだ上でそれを人々に媒介する役割をもつことでは共通している。これは康成の文体でも同様である。

次に扱うものが「花々」と「星々」,仕事の中身が「心を受け止め,彼らが探し求める物語へと導く」と「未知の世界を紹介する」というような違いに目を向けてみよう。花は書物がもつ感性的な側面,星は書物がもつ知的な側面を強調した表現であり,晶子は,感性的なものを物語世界へとつなげるとするし,左京は「知識の星々を繋ぎ、未来の探求者たちを導く道しるべとなる」とするような違いとなって現れる。これらは,それぞれが作家の個性を反映した論理的な表現であるだけでなく,図書館員の仕事の性格をうまく描いている。文学的な論理の表現の仕方が異なっているだけである。このことを文体と言っていたわけだ。

AIは図書館員のためのツールである

生成AIが日米の4人の作家の表現として示した図書館員の仕事あるいはライブラリアンシップは,書物に関わるという点で共通しているが,その関わり方にはそれぞれ特徴があっておもしろかった。それにしてもなぜこれが可能になるのかについては,今後ともいろんな領域で言及が進むだろう。ただしそういうものを研究というのは少し変な感じもする。生成AIの仕様や具体的なアルゴリズムは人間がつくったものであるからだ。確かに,将棋や囲碁のプロたちはAIを使って「研究」しているらしい。将棋や囲碁のような「論理」と「戦略」の組み合わせを研究するというのは分かる。しかしながら,人間がつくったものがブラックボックス化しているからといって,それを手探りで見ていくというのはおかしくはないだろうか。これが学術研究になるためには,これらをつくっている企業が率先して情報を開示する必要があるというのが,従来のこうしたもののとらえ方だった。

だが,これは人間がつくった法律とか政治の仕組みとかが研究対象になるのと同じなのかもしれない。個別には目的と方法や運用が言葉で表現できるようなものになっているが,それが相互に絡み合いながら複合化してきわめて複雑なシステムになっている。それを部分的に解明しようとするのが社会科学である。同様に,大規模言語モデルも,人間の手が入っているとしてもそれが複雑になり,かつ,(人手を介さない)自己学習を繰り返している。つまりすでに人知を超えたものになっている。また,法律や政治とまた違った意味で人や社会に影響を及ぼすものになっている。だから研究も必要になるのだろう。

AIにこんなこともできる,あんなこともできるということがよく言われるのだが,ここでもこのように示されると驚異であった。しかしながら,それが図書館員にとっての脅威にならないかというのが多くの関係者の不安でもある。そのことに対して,フリッケは本書で,このツールを使いこなすことが重要だと言うだけでなく,図書館員はもともと情報ストックの管理者であったのだから,AIとユーザーをつなぐことが託された位置付けになることを強調している。そのことについて,に書きたい。







0 件のコメント:

コメントを投稿

新著『知の図書館情報学―ドキュメント・アーカイブ・レファレンスの本質』(11月1 日追加修正)

10月30日付けで表記の本が丸善出版から刊行されました。11月1日には店頭に並べられたようです。また, 丸善出版のページ や Amazon では一部のページの見本を見ることができます。Amazonではさらに,「はじめに」「目次」「第一章の途中まで」を読むことができます。 本書の目...