2025-01-05

図書館情報学と生成AI——ネット社会30年とこれから

2025年になりました。昨年、2冊の単著(『図書館教育論』『知の図書館情報学』)を出したことでこれまでの総括を行い、次の課題を考えようとしているところです。情報技術において、生成AIが目下の最大の話題になっています。私も翻訳技術に使うAIのすごさに驚かされて、にわか勉強でこの技術が大きな可能性をもつことを実感しました。しかしそれだけでなく、この技術の限界を理解し、共生することの重要性も認識しました。

日本の経済状況を指すのに「失われた30年」という惹句がありました。コロナ明けのインフレ状況のなかではあまり聞かれなくなりましたが、私は日本の情報技術の「失われた30年」はまだまだ続くのではと思います。というのはインターネットが一般的になってからちょうど30年の節目の今年、日本でもICTのインフラが(ちぐはぐながらも)整ってきたように見えるなかで、急に立ち上がってきた生成AIの技術ですが、これが相変わらず米国を中心とする外国で開発されているからです。

インターネットからインテリジェントプラットフォームへ

情報技術は、もともと軍事技術だったインターネットが20世紀末に民生化されたことを契機に始まります。1995年にNSFNetが民間へ移管されたことをもってインターネット元年と呼ばれることがあります。冷戦体制終了後のこの頃に世界を自由につなぐ通信網が現れたことには大きな意味がありました。Windows95が発売された年でもあり、新しいネット社会への移行が始まります。


私は1990年代前半に図書館情報大学(現筑波大学図書館・知識情報学群)にいた頃に、見よう見まねでUNIXのコマンドでネット接続を行い、すでに学術世界においては図書館OPACの公開、データベースの公開、Gopherでの情報提供、メーリングリストでの情報共有などが行われていることを知り、新しいことが起こっていることを感じました。そのことをどこかで知った編集者の依頼で『入門インターネット』(日本能率協会編、1995)という本に「電子図書館としてのインターネット」という文章を書きました。この本の帯には「文系のためのインターネット解説書」とありましたが、技術屋ではなくふつうの人でもネットにアクセス可能というメッセージを伝えることができると同時に、電子図書館の可能性を考え始めたのもその頃でした。(とは言え、『電子図書館の神話』(勁草書房)という翻訳書を1996年に出して、文系的な備えもしようとしていました。)その後、ゼロ年代のインターネットは、メール、掲示板、WWW、ブラウザ、サーチエンジンといったものが中心で、基本的にはテキストベースでやりとりし、ネット上のコンテンツはオープンであることが前提でした。それがインターネットが電子図書館にもなりうるという言説を生み出す根拠にもなりえます。

このあたりまではネット状況に着いて行けたのですが、その後、2010年代にビジネスベースのSNSやマルチメディア・プラットフォームが席巻し始めたあたりから、全体状況を把握することが難しくなってきました。何よりもインターネットはオープンネスよりも、ビジネスや広告目的で顧客を取り込む商業的プラットフォームを提供する場となったことが、当初の予想と大きく異なるものでした。経済生活に関わる多くのものがネットベースに移行するようになりました。それには、スマートフォンやタブレット端末などのハードウェアの発展も大きく関わっています。

それでもここまでのインターネットは、ビジネスベースにせよ、公共サービスにせよ、オープンベースにせよ、取引、データ処理、情報データベースといったものの場がネット上にあって、どれを選択するのかについては、(サーチエンジンに頼る際のバイアスや広告的作用はあるにせよ)使い手に委ねられていることを前提にしていました。ところが、ブラウザとサーチエンジンに生成AIが組み合わされることで、ネットは単なる情報獲得手段にとどまらず、人工知能(AI)そのものになろうとしています。人は端末に何かの問いを投げかけることで、回答が得られます。そのうちに、問いのパタンを学習したAIは先んじて情報を提供することができるようになります。人が自らの行動の助言や指示を求めればそれも提供されることになります。実はサーチエンジンやSNSにはそれに似た機能はすでに組み込まれているわけですが、いっそう精緻に(あるいは巧妙に)装備されます。

生成AIにはバイアスやフェイク、誤りが含まれていることは明らかですが、使用する人の多くはそれに気づかず便利さを追求することで、このインテリジェントプラットフォームを受け入れる方向に進んでいます。人々が受け入れたものは、さまざまな価値をもともともっている方向に拡張させます。それにより、社会的には多様な価値が拡散されてその多元的な状況が支配することになります。リベラル的でコモンズ的な価値が主張される一方、力による解決を求める強権的な価値が主張されます。これらは多元的なベクトルを構成するので、ある主張はコモンズ的でありながら強権的な価値を支持することが十分にありえます。これらは以前から存在していたものですが、成立した価値は生成AIの自己学習原理によってさらにそれぞれのベクトルの方向にさらに拡張されます。生成AIと結びついたメディア環境は価値とは一線を画しますが、こらが多方面に拡大されることにより知らず知らずのうちに社会を大きく変貌させるのです。私はここ10年で進行している専制的な政治の強化や感染症に対する根拠のない対策、ウクライナ・中東における戦争、トランプ再選も含めた西欧諸国における保守的な政治状況はいずれもこの変貌の現れだと踏んでいます。

これらは、生成AIがもたらす一つの仮想的状況です。欧州連合(EU)は、この予想される未来が特定の企業がすべてのプラットフォームを独占することによって生じるとし、その歯止めとして、「デジタル市場法(DMA:Digital Markets Act)」と「デジタルサービス法(DSA:Digital Services Act)」を2022年、2023年に制定しました。DMAは「プラットフォーム市場における市場支配力の濫用防止や、公平で公正な競争の確保など」を規定し、DSAは「プラットフォーム市場における違法、不適切なコンテンツの排除や、適正なサービスの提供、透明性の確保など」を規定しています。こうした包括的な規制は寡占化されたプラットフォームの市場支配力を弱める働きをするでしょうが、先ほどの統合されたインテリジェントプラットフォームに対する真の意味での規制にはならないでしょう。

ひとつにはこの規制を強めれば、言論表現の自由という原理に抵触する可能性が出てくるからです。ここには、法的な規制とビジネスの自由、そして倫理的な歯止めとの間の複雑な関係があります。問題は従来の市場独占的な経済の問題ではなく、インテリジェントという、知に基づく政策判断や経営判断、そして社会行動にもたらす影響にあります。プラットフォームが独占されずに分散的であっても、過去の知のアーカイブに基づく生成AIの学習作用は結局のところ集合的に同じような作用をもたらします。

インテリジェント環境に対する図書館情報学の構え

生成AIについては話題になったこの2〜3年の間に多数の解説記事や本が出されています。詳しくはそうしたものを見てもらうことにして、ここでは大雑把に、大規模なテキストやドキュメントのデータの蓄積を多層的で多元的に分析したものにより、人の知能の働きをシミュレートさせることと言っておきます。データの蓄積と分析という点でテキストやドキュメントを再構成しているということができます。こうした点でドキュメントの蓄積と組織化を研究してきた図書館情報学との親和性があるわけです。

そのためにAIを理解するためには、図書館情報学で従来から知とはどのようなものと考えられてきたか、知識を利用するとはどういうことかを理解することが有効です。私はこの問いに対する自らの答えとして『知の図書館情報学』を執筆しました。これにより、西欧の図書館情報学理論的水準の一端を示すことができました。しかしながら、本書を書きながら、図書館情報学において日本ではほとんど未開拓だった領域があることに気づきました。こうして、これを皆で学ぶために、知識組織論研究会を呼びかけてオンラインですでに2回の会合をもちました。メーリングリストでは意見交換も活発に行われています。

生成AIは情報検索論の延長上に現れた技術ですが、あくまでも人間の行動の記録であるテキストやドキュメントを多元的に分析してシミュレートしているものであり、アーカイブとしての限界があることは明らかです。この限界を理解するには、人間の知的行動の原理を明らかにする必要があります。そうしたことは哲学や脳神経学、心理学、社会学などから幅広い検討が行われていることは周知の通りですが、図書館情報学ではもともとそれをサービスベースで支援する目的で検討されて来ました。情報資源組織論やレファレンスサービス論はそうしたものでしたが、国際知識組織論学会(ISKO)はこれを他の基礎理論を踏まえた議論を積み重ねて、IEKO(知識組織論事典)としてオープンにしています。この項目をひとつずつ読んでいくことによって西欧的な知識組織論の全体像を把握して、私たちの理解に役立てようというのです。

ここ1年ほどそうした取り組みをしてきて、現在の生成AIの状況に対抗しうる図書館情報学の理論の系譜を辿ることにしました。それは、人が知識を獲得する過程を図書館員が媒介する行為と、生成AIの仕組みとの違いがどこまで明らかになっているのかを知りたいと考えるからです。

20世紀の図書館情報学で理論的な議論を展開した人に、アメリカの哲学出身の図書館情報学者パトリック・ウィルソンがいます。彼の3冊の単著のうち昨年『知の典拠性と図書館』が出て、この1月末に『知の公共性と図書館』が出ます。(最初の著作Two kinds of power: an essay on bibliographical controlの翻訳は予定されていないようです。)ウィルソンの著作は必ずしも読みやすくはありませんが、その独特の哲学的レトリックにより、従来の図書館情報学が無視してきた知の領域の存在を明らかにしました。 それは個人の認識と公共的な知との関係および、知がいかにして公共性や典拠性を帯びるのかといった問題です。図書館情報学はドキュメントを扱いながらそれらが知の要素であり、図書館は知のエージェントであることについて無関心だったことを、彼は批判しました。

ビアウア・ヤアランはIEKOの編集長を務めている知識組織論の中心的人物の一人です。かれが書いた次の著作は、IEKOを読むための基礎理論として無視できません。

Birger Hjørland, Information Seeking and Subject Representation: An Activity–Theoretical Approach to Information Science. (Greenwood Pr. 1997)

(この本のエッセンスは次のインタビューで読むことができます。.)

ヤアランの著作は、ウィルソンの議論が図書館情報学を批判しながらそれを回収するための方法について具体的に提示していないと批判した上で、自らの認識論的=活動主義的議論を展開しています。また、彼は20世紀後半の図書館情報学が情報行動論を中心に展開したことに対して、それが心理主義に陥っているとして批判的です。この点で、アメリカの情報行動論の中心人物マーシャ・ベイツとのやりとりがあります。(JASIST, 59(5):842-844)

ヤアランは、知識組織論における「主題」の問題に焦点を当てます。図書館情報学ではドキュメントが扱う主題とは「分類表」や「件名標目表」から適切なものを選んで付与するものと理解されています。しかしながら、その分類表や件名標目表がどのような考え方でつくられているのかを考えてみると、一筋縄ではいかないことが分かります。また、私自身も自分の本の巻末索引をつくるのですが、そこでは著者名や固有名詞は扱いやすい反面、主題に該当する事項索引となると簡単ではありません。主題subjectは、哲学では「主体」「主観」と訳され、言語学では「主語」とされます。sub-は「下に」を意味する接頭語なのに、日本語だと「主」が付く転倒はどこから来るのか。これは欧米でも同様であり、ここに人間の認識についてのしっかりとした考察が必要であることが分かります。ヤアランはドキュメントの主題を表現するために西洋の哲学史を紐解き、合理主義、経験論、実証主義などの認識論や科学論を検討しながら、図書館情報学における主題表現の理論は可能であると述べます。彼はこの著作で主題概念について認識論的な基盤をつくったあとで、そうした議論をベースにして、21世紀になって彼が「ドメイン分析」と呼ぶようになる活動主義的な議論を展開します。本書はIEKOに至るための前提的議論をした著作ととらえることができます。

他方、前にブログに書いたマーティン・フリッケは『人工知能とライブラリアンシップ』を著し、図書館員はこの状況に対応できる職であることを述べています。なぜか。それは少なくとも欧米諸国では図書館がテキストを含むドキュメントの蓄積、利用に関わる社会的機関であり、図書館員のノウハウがライブラリアンシップと呼ばれるものだからです。フリッケは、AI技術に対して図書館員のできる役割として次の5つを挙げます。それは、「シナジスト(相乗効果の仕掛け人)」「セントリー(バイアスやパターナリズムの監視者)」「エデュケーター(市民にとっての情報リテラシーの教育者)」「マネージャー(AI技術と図書館技術を組み合わせる情報管理者)」「アストロノート(こうした状況を俯瞰できる宇宙飛行士)」です。

彼がこうした考えに至る際のライブラリアンシップとは何であるのか、その理論的考察はこの本には軽く触れられているだけで、それは前著に委ねられています。それが次の著作です。

Martin Frické, Logic and the Organization of Information. (Springer, 2012)

(本書を読んで刺戟されたAlan Gilchrist他の専門家数人が、書評に代わる短いエッセイJournal of Information Science誌に発表し、それらはオープン化されているのでご覧下さい。)

この本を要約するのもまた難しいのですが、基本的には知識組織論(彼は情報組織論と呼ぶ)を適切に要約した上で、言語の階層性と包含関係、そして意味的なネットワークの分析に論理学を適用して検索システムの論理の可能性と限界を明らかにしようとしているとひとまずまとめることができます。 現代の情報検索や知識の組織化は、論理学、数学、言語学という 3 つの分野の融合に基づいていますが、そこに健全なプラグマティズムが組み込まれることにより、形式論理だけに依存しない実際的な議論が構築されています。フリッケがその後の『人工知能とライブラリアンシップ』で図書館員という知識組織論の専門家が介入することでAIの限界を超えるというのは、こうした論理性とプラグマティズムのいずれもAIでは実現されないからです。(少し原理的なことに触れると、生成AIは、記号やデータ構造のシミュレーションを行うものであって、言語の意味や論理はまったく配慮し得ないし、また、プラグマティズムは人間の行為や目的を基準にする思想であってAI分析の基になる(過去の)データからは得られないことはすでに明らかにされています。)

おわりに

今挙げたヤアランとフリッケの著作については、今後、きちんと読み解いて日本の読者にも全容を明らかにしようと考えていますが、それには少し時間がかかりそうです。

冒頭で日本のネット社会の遅れという話しに触れました。『アーカイブの思想』を書いたりしたことで明らかになったと思われるのは、日本社会のドキュメント=アーカイブの仕組みは欧米社会のものとかなり異なっているということです。それは欧米出自の図書館情報学を研究してきたことから、これまでのコンピュータ関連の技術はすべて欧米社会がもつテキストアーカイブという知識組織論の伝統の上に成立してきたことを強く感じるからです。だから、図書館の制度化やデータのオープン化、ネット社会や知識組織化の仕組みのような情報技術の観点からは弱点として働いてきたと評価されてきました。とくに情報ビジネスでは完全に遅れをとりました。

しかしながら、生成AIがインテリジェントプラットフォームとして確立されると、そうした差はあまり気にしなくともよいのかもしれません。むしろ、日本的なアーカイブの仕組みはマルチモーダルなプラットフォームと相性がよく、こちら方面から新しいものが日本から生まれるかもしれないと考えることもあります。日本文化が西洋的なものと異なる出自をもつが故の可能性については、別の機会に書いてみたいと思います。


0 件のコメント:

コメントを投稿

図書館情報学と生成AI——ネット社会30年とこれから

2025年になりました。昨年、2冊の単著( 『図書館教育論』 、 『知の図書館情報学 』)を出したことでこれまでの総括を行い、次の課題を考えようとしているところです。情報技術において、生成AIが目下の最大の話題になっています。私も翻訳技術に使うAIのすごさに驚かされて、にわか勉強...