ページ

2025-03-31

小田芝桜倶楽部の活動

 5年くらい前から,つくば市小田の宝篋山登山口に近いところにある土地をお借りして,芝桜の育成をしている。毎年,3月末から4月にかけて芝桜がきれいに咲く。今年も3月31日現在,下の写真のように咲き出している。今年は暖かい日と寒い日が周期的に交互に来るだけでなく,最低気温が全体に低いので,花の付きが少し遅れているようだが,見頃はあと1〜2週間後になるだろうか。(「宝篋山麓まちあるきMAP」の真ん中あたり。)

3月31日


今朝は手伝ってくれている人たちといっしょに,雑草取りと若干の苗の植え付けを行った。

なおこれは2019年から2023年8月まで「小田地域まちづくり振興会」がつくば市の支援を受けて行ってきた芝桜育成プロジェクトを引き継いで行っている。昨年は,イノシシによる根の掘り起こしの害がひどかったために,つくば市鳥獣被害防止補助金を受けて,防護柵の整備を行った。さらに今年になって,いばらきコープ生活協同組合環境基金の補助もいただき,さらに花苗の植え付けを行っている。土地を貸して下さる方やボランティアの方々の支援でこれが可能になっている。感謝申し上げたい。

この後の開花状況の写真をアップしている。


4月5日



4月8日



2025-02-27

国立国会図書館の納本制度について

本日,国会図書館納本制度審議会の会合で「納本制度の課題ー発足77年後の変化を見ながら-」のお話しをさせていただいた。いずれ資料や議事録も公開されるのでそこでのやりとりはそちらをご覧いただきたい。この審議会に10年間参加しての思うこととこの場で十分にお話しできなかったことについても交えて,ここで納本制度について11項(+追加3項分)の事項を書いておきたい。(2月28日,3月1日, 3月2日一部改訂)

① 国立国会図書館(NDL)は立法府に所属するのだが,前身の帝国図書館・国立図書館は文部省の下にあったようにナショナルライブラリーの機能をもっていたことについて,図書館について学んだ人なら理解しているだろう。しかし,占領期に国会図書館となることで行政府からはずれて,立法府の機関となった。占領初期のGHQ/SCAP指導の下で,アメリカの連邦議会図書館の制度をそのまま導入したからである。しかし,これを現行の日本の法制度の上でどう考えるべきかについて,「国会法」や「国立国会図書館法」はともかく,「著作権法」と「視覚障害者等の読書環境の整備の推進に関する法律」の二つの法律の条文に,同館が14カ所で出てくることを根拠に,事実上,行政的な作用をもっていることについて指摘した。

② 関連で著作権法の下で,NDLには収集資料の即時デジタル化が認められている(著作権法第31条第6項)。2009年以降の著作権改正で,資料の滅失を防いだり,絶版等資料のデジタル送信するために同館資料のデジタル化を可能にしたことによる。これは著作権の制限のなかでもかなり強力な規定であり,同館が国策的にコンテンツデジタル化の拠点と位置付けられたことを意味している。ちなみにこれは,長尾真館長時代に進められたことであり,一方ではGoogle Books問題への対抗措置,他方では日本のICTにおいてコンテンツが弱体であったことへの対策でもあった。

③ 納本制度(法律用語では出版物の納入)は法成立当初の資料カテゴリー(24条に列挙されている「図書」「小冊子」「逐次刊行物」「地図」「楽譜」「蓄音機用レコード」等)が残されながら,9番目に突如「電子的方法、磁気的方法その他の人の知覚によつては認識することができない方法により文字、映像、音又はプログラムを記録した物」が加えられている。こうした広義の出版物のとらえ方を旧態依然ととらえるのか,紙を含んだパッケージ系をカバーしようとしているととらえるのか,難しいところである。また,映画フィルムについては納入免除になっていることをどう評価したらよいか(国立映画アーカイブは納入規定をもたない)。

④ 納本制度は以上の狭い意味の納本制度に加え,WARPによるインターネット資料(政府系,自治体系のネット上資料の自動採取)とネット上にあるオンライン資料(一定の要件を満たす図書と逐次刊行物に相当するもの)の取得も含めている。これらはどれも,対象資料の範囲が不明確であり,本当のところどれだけあるのかは誰も把握していない。とくにネット上のものは原理的に把捉不可能と言ってよいだろう。だから,納本制度の運用上,ある程度明確に対象を絞る必要がある。絞るときには,それぞれの制度の目的を参照しつつ,議論を深めることが肝要である。

⑤ 資料の「範囲」と「公開性」による位置付けという図(これはブログのここにある2番目の図とほぼ同じものである)を作成して,現在の納本資料がどこに位置付けられ,今後どちらに向かうべきかについて議論した。ここには,横軸に資料の発生に関わる範囲,縦軸に資料の公開性に関わるカテゴリーを図示してみた。この図は審議会委員にアピールしたようで,基本的な認識に役立ったという評価があった。ただし,この図は単なるモデル図であると同時に,パッケージ系が中心でネットワーク系をうまく表示できていない。

⑥ あとはネット上の文字系メディアは文化財かというあたりの問題がある。オンライン小説,オンラインコミックがある。ネット上の逐次刊行物相当のもの(たとえばオンラインジャーナリズム)は動的なコンテンツとなる。これらをうまくカバーする納入制度がつくれるのかどうか。さらに文字系を超えて,映像や音声メディアについては,この制度ではカバーできない。しかし文化財という問題を考慮すると,YouTubeのコンテンツもまた映像系資料と言える。

⑦ NDL法24条,24条の2(政府,自治体系の出版物),そしてインターネット資料の収集が情報公開制度やアーカイブズ制度と関わることを述べた。これについては,行政官庁や最高裁判所はNDLの「支部図書館」となっている図書館をもっていて,そことの連携も含めている。WARPで収集されるインターネット資料がこの目的に照らして有効なコレクションになっているのかの評価が必要である。

⑧ 結局のところ,NDLの蓄積したコンテンツは重要なナショナルな情報資源になっている。これは占領政策の一環でつくられたものだが,ネット時代になってその意味は明確になっている。NDLが政府のDX政策の一翼を担っているという認識をもつ必要がある。

⑨ 収集・蓄積・保存とその利用については分けて考える必要がある。すべてのものを網羅的に収集することとそれが(公開され,とくにネットを通じて)利用可能になることとは異なる。 蓄積・保存すれば利用可能というわけにはいかないさまざまな事情がある。著作権,人権上の問題,個人情報,「忘れられる権利」,フェイク等の真正性・信頼性問題,などがある。これらについては個別に対応しているところである。

⑩ 以上により,今後のNDLの資料の保存蓄積提供の方向について,まず資料が(a)納本制度による紙+パッケージ系資料の網羅的納入,(b)ネットワーク系資料(インターネット資料,オンライン資料)の義務的納入をベースとする。これらの現行の納本制度によるものに加えて,(c)NDL独自のデジタル化資源がある。これらがベースになるが,それら資料の定義および範囲については再考の余地がある。また,今後,オンライン資料が紙のものに置き換わっていくとすれば,現在,民間の有償オンライン資料リポジトリのものは納入を免除されていることについても再検討が必要になる。

⑪ これらに加えて(d)テキスト資源を考慮すべきである。現在,NDLデジタルコレクションから全文テキストが提供されている。NDLがデジタル化しさらにテキスト化したものの使い方はきわめて重要である。ここまで述べたNDLのデジタル化は基本的にはGoogle Booksのインパクトに対する国家的対策としてスタートした面が強い。で,現在,生成AIの原資としてのテキストが重要となっているが,NDLはきわめて良質のテキストを集約して保持している。これは,(GAFAMへの対抗としての)文化的なナショナルセキュリティの側面がある。つまりそれが一括して流出することがないような措置が必要である。

⑫ [追加1]ここまでネット上の文化資源を拡げるなら,結局,「デジタルアーカイブ」と呼ばれるもの全体が対象になるのかもしれない。『図書館情報学事典』の第7部門では「専門情報」として,ここに挙げたものの他に,映画,アート・ドキュメンテーション,地図・地理空間情報,音楽情報,演劇資料,放送番組などを取り上げた。ここにはデジタル化されたそうした様式のメディア・データ・情報が扱われている。他にも,医学,法,文学,政府,立法,公文書,文書・記録,社会調査データ,統計,スポーツ情報,演劇情報など個別領域の情報が扱われている。これらは,NDLとどのような関係になるのだろうか。

⑬ [追加2]NDL法25条および25条の4で言う「文化財の蓄積とその利用」という目的をどう考えるべきだろうか。25条ができた1950年代の状況では列挙された資料のなかでとくに図書と逐次刊行物という言葉で想定したのは,出版社および新聞社が刊行する図書,雑誌,新聞だった。これに学会や全国規模の専門職団体が出すものくらいが含まれていたと考えられる。だが,小冊子,地図,楽譜などのようなものも含まれており広く網をかけようとしたが,映画フィルムの納入を途中で放棄したように選択的にせざるを得なかった。25条の4が新設された2010年代はすでにネット社会であり,オンライン資料(その要件はPDFかE-PUBファイルというもの)は誰もが作成し発信できるようになっているから,範囲は遙かに拡がっている。何が文化財なのかについては,きちんとした議論をし,基準を明確にした上で提供を呼びかけることが必要だろう。でないと結局のところ,規定自体が有名無実化することになる。

⑭ [追加3]ネットワーク系の資料と納本制度の関係を考えるにあたってもう一点重要な点は,サーバーの位置である。グローバルな状況のなかで展開されているものが多いから,たとえ日本でつくられたコンテンツであっても,国外のサーバーに送られて,そこから世界中に送信されていることになる。たとえば,Googleのサーバー(これにYouTubeも含まれる)については,ここにデータセンターの情報があるようだが,これによると世界に38カ所ある。,国内だと千葉県印西市にあるが日本のコンテンツがここから発信されているとは限らない。こうしたコンテンツにNDLの納本制度を適用することはできないだろう。そもそも,納本制度がナショナルライブラリーによる国を単位とした制度であり,この状況についていけてない。対応できているのは,Internet ArchiveのWayback Machineだろうが,これも通常はプラットフォーマーのサイトのものは取って来れないし,非営利を標榜している運営体制でどれだけ安定した活動ができるのかは不透明である。(くわしくはWikipediaの英語版を参照。)今後,こういう民間団体とも協力関係をうまくつくっていく必要があるだろう。

以上。


2025-02-19

パトリック・ウィルソンの図書館情報哲学について

Facebookに次のように書きました。

パトリック・ウィルソン(齋藤泰則訳)『知の公共性と図書館』(丸善出版)が出て,訳者の齋藤さんから送っていただきました。

https://www.maruzen-publishing.co.jp/item/b306232.html

ウィルソンは20世紀後半のアメリカ図書館情報学において哲学的な言説を説いた数少ない人です。2000年代初頭に亡くなった頃から再評価が始まり,先に翻訳が出た『知の典拠性と図書館』とともに図書館の理論を語るときにこれらの著作を踏まえることは必須となっています。

20世紀の図書館(情報)学には,ピアス・バトラー⇒ジェシー・シェラ⇒パトリック・ウィルソン⇒ビアウア・ヤアランの系譜があったことは知る人ぞ知るというところです。


書いたのはいいのですが,日本の図書館関係者でも彼のことを知っている人はほんの数人しかいないのではないかと思い返し,少し彼のことについて書いてみたいと思います。まず,パトリック・ウィルソン (1927–2003)は,カリフォルニア大学バークレー校の図書館情報学大学院で長らく教授を務め,図書館情報学理論を深めた人です。 彼はここの修了生ですが,同大学図書館で主題専門図書館員としての仕事の旁ら,同大学大学院博士課程で分析哲学を研究し博士の学位をとります。他分野で博士号を取った人が図書館員養成の大学院の教員になる例は多くないのですが,彼はその教員となり,哲学的な視点からの図書館情報学の研究を継続したわけです。彼の伝記事項はここにあります。

なお,彼をパトリック・ウィルソンと書くことが多いのは,20世紀後半にこの分野で活躍した人に英国にT. D. ウィルソン(Thomas D. Wilson)がいたので,区別する意味があります。この人は情報探索行動やツールの実証的研究をした人です。

パトリック・ウィルソンの図書館哲学3部作は次のものです。

1. Wilson, Patrick (1968). Two Kinds of Power: An Essay on Bibliographical Control. University of California Press. p. 155. ISBN 978-0-520-03515-7.

2. Wilson, Patrick (1977). Public Knowledge, Private Ignorance: Toward a Library and Information Policy. Greenwood Publishing Group. 156p.  (齋藤泰則訳)『知の公共性と図書館』(丸善出版) 

3. Wilson, Patrick (1983). Second-Hand Knowledge: An Inquiry into Cognitive Authority. Greenwood Publishing Group. 210p. (齋藤泰則訳)『知の典拠性と図書館』(丸善出版)

(3の原著ももっていたはずなのですが,引っ越し他のごたごたで行方不明です。)

今回出たのは2の訳で,昨年9月に3の訳が出ました。最初の本については今のところ翻訳の予定はないと聞いています。しかし,これも含めて紹介しないと,ウィルソンの思想は明らかにできないでしょうね。これらが何について書いた本なのかを,学説史的なことは省いて乱暴にまとめておきます。

 

1 『2種類の力:書誌コントロール試論』(原著1968)

「書誌コントロール」という概念が20世紀半ばから使われてきましたが,それが何であるのかを明らかにしたということです。書誌コントロールは,資料を蓄積し組織化して提供する図書館を典型としたサービスが,書誌(資料を記述したもの)を中心として成立しているというものです。図書館の目録,レファレンスのための索引や抄録,各種のデータベースなどすべて,資料(図書館用語では書誌的単位)を記述し,そのリストに対して検索をかけることで必要な資料にたどりつくという仕組みになっています。つまり図書館サービスとはそうした資料組織法を中心として成立しているという考え方です。

20世紀半ばにこれを最初に主張したのは,当時シカゴ大学にいたジェシー・シェラとマーガレット・イーガンという人たちでした。20世紀後半に,書誌コントロールはすべてコンピュータデータベースで処理するようになり,図書館システムの発展とMARCや書誌ユーティリティの仕組み,オンラインデータベース,そしてインターネット以降はWebOPACやマルチDB検索サイトへのアクセスなどを通して,この仕組みは定着していきます。私たちが資料を使うときに,直接書店(出版流通の仕組みも書誌コントロールを踏まえています)や図書館に行ったり,WebのデータベースやWebOPACを使って資料があるかどうかを確認したりするのも,いずれもこの書誌コントロールの作用だということになります。

書店や図書館の書架を見てブランウジングする行為も書誌コントロールに該当するのですが,それは書架での資料の並び方や使う人がどれだけ資料について知っているのかによるものであり,人によってだいぶ異なる資料探索過程になります。図書館の側は資料を分類表に沿って分類して排架したり,目録規則に基づいて記述して検索できるようにしても,それをどのように理解して使用するか(多くの場合,あまり理解しないままに使っている)は利用者次第です。ウィルソンは書誌コントロールの一つ目は,分類,目録,索引,抄録のような図書館ツールや書誌データベースに基づく資料検索で,これを記述的コントロールと言っています。それに対して,情報や知識を求める人たちは記述的コントロールだけに頼ることは多くはなくて,もっと多様な探索をしているからその過程全体を書誌コントロールというべきであり,そのことを実効的コントロールと呼んでさまざまな思考実験を行います。実効的コントロールについての議論が第2,第3の本の起点となっています。

タイトルの「2種類の力」というのは書誌コントロールには記述的コントロールだけでなく,実効的コントールがあることを指し,この本は図書館関係者が図書館や書誌データベースの整備に力を入れているが,もっと全体的なプロセスを見て考察すべきことを説いたものです。

2『知の公共性と図書館』(原著1977, 邦訳2025)

副題に「公共的知識と個人的無知の対比」とあります。図書館には知を利用者に媒介する機関であるという前提があり,図書館が行う記述的な書誌コントロールは分類,目録,排架,レファレンスサービスなどを通じて蔵書に含まれる知を提供するものです。利用者の立場からすれば,知とは周りの人々,学校,大学,マスメディア,手持ちの本や雑誌などを通じて自ら獲得してきたものの集積であり,個人的なものというのが第一でしょう。では「公共的知識」とは何でしょうか。確かに図書館に蓄積された書物や雑誌には知が含まれているのでしょうが,それらは読んで理解しなければ知とはなりません。今なら「ググる」とか「生成AI」のチャットで聞けば簡単に知が獲得できるから,公共的な知識はネットやAIにあるという見方もできるかもしれません。これが書かれた当時はそんなものはなかったので,ウィルソンはブリタニカやアメリカーナといった百科事典を引き合いにだして,それが公共的知識の代替物としてどのようなポジションにあるのかも検討しています。

さらに,彼は「個人的無知private ignorance」という概念を持ち出します。知はあくまでも個人のものであるから,個人が意識を向け耳を傾けたり読み取ろうとしたり,調査しようとしたりしない限り得られないものです。とすれば,公共的知識が本来カバーすべきもののなかに,個人がもつべき知識が含まれる可能性があります。これが個人的無知です。公共的知識と個人的無知の間のギャップをどのように縮めていくのかは,本来教育の問題でもあるわけですが,同時に図書館の問題でもあるわけです。というのは,図書館は最大の公共的知識のインフラであったからです。また,書誌コントロールはこのギャップを埋めるための方法的概念と解釈することもできます。

書物や雑誌記事といった形をとった知識は一旦つくられればそれ自体はモノとして固定され動かないものですが,知識は人間の認識や行動,判断として現れる動的な存在です。本は読まれなければただのモノに過ぎないわけですが,書かれ誰かに読まれ,読んだ人がそれによって何らかの行動をすればそれは知識の作用ということになります。本が読まれたり読まれなかったりするのに影響を与える要因は何でしょうか。著者の名声,出版社の評判,雑誌や新聞に出た書評や広告,書店の店頭や図書館の新刊書棚での出会いなど多様なものがあるでしょう。誰しも買っただけでちょっと目を通したが通読していない本(積ん読本)をもっているでしょう。これは,何らかの出会いによって知ってそれを手元に置いておきたいと考えたから起こるものであり,その本,その著者との出会いが重要との考えから来ます。とくに図書館は蔵書が永久的に蓄積され,多様な書誌コントロールの手法が提供されていくならばそうした潜在的な出会いをつくりだす場と考えられます。

このように個人的無知と公共的知識を結びつける方法は多様にあることが示されます。本書は,個人と社会の知識基盤をつなぐための図書館の戦略的な位置づけについて考察した著作です。

3 『知の典拠性と図書館』(原著1983, 邦訳2024)

第3の著書の副題は「間接的知識の探究」となっています。この間接的知識というのは,自分が見聞きしたり経験したりして確信をもった知識(これが直接的知識です)とは異なり,誰かの請け売りだったり,マスメディアや書物,雑誌などで読んで得た知識です。間接的知識はその意味で今話題のフェイクや誤情報といったネット上で問題になることに関わります。この本の帯に「誰が言っていることが正しいのか」と大きくあり,「本書は今まさに,現代的な視野狭窄を修正する。「専門家が著す文献」への公平なアクセスを保証する図書館の重要性」について述べているとあります。つまり情報や知識の信頼性はどこから得られるのかということがテーマになります。

著者はここで「知の典拠性cognitive authority」という概念を持ち出します。書物や雑誌,新聞といった近代に成立したメディアは,それ自体に編集や校正・校閲というコンテンツの真正性を高めるためのプロセスを内包させています。(もちろん,それ自体を機能しない事例が増えていることも確かですが,それはさて措きます。)とくに,学術の制度化が進展すると,知のオリジナリティや質を確保するためのピアレビューが始まります。これは通常は査読と呼ばれるもので,複数の匿名の第三者が論文や著書を読み評価して一定の基準をクリアしたものを学術知として公表するものです。

知の公共性はこのように典拠性を保証することで保つことができるということです。ここで通常なら権威という訳語が与えられるauthorityを典拠としているのが訳者の工夫です。権威は政治学的な概念であり,典拠は人文学的な概念であり,少々ニュアンスが異なりますが,何らかの作用や影響力を皆で認めるプロセスを指します。とくにこの場合にメディアや知を媒介にしたものを問題にしているので,典拠性という訳語はしっくりくると思います。(典拠性については人文系で用いるカノンcanon(正典)という概念とも関係が深く,批判的に用いることも可能です)

まとめ

1のタイトルがTwo Kinds of Powerだったことを思い出す必要があります。20世紀半ばの時期が戦争や軍事力,原子力の在り方が大きな問題になっていたことを考えると,control とかpowerというとらえ方の源泉が分かると思います。また,その後の2著についても「知」や「典拠=権威」といったものが,書物や図書館の背後にあるものであり,きわめて政治力学的なとらえ方が特徴的だと言えるでしょう。

ウィルソンはもともと分析哲学から図書館情報学の領域に入って,他の研究者とは違って図書館やそこに関わる知の作用を冷静に観察して,以上のような考察をしました。哲学者が分かりやすく表現してもどうしても文章は堅くなり,あまり読みやすくなかったことも手伝い,英語圏においても彼の議論を本格的に論じることは行われてきませんでした。しかし,彼の議論については彼の卒業生の一人ハワード・D.・ホワイト(インディアナ大学名誉教授)が全体の論旨を紹介する論文を書いて全容が明らかになりつつあります。https://www.isko.org/cyclo/wilson

また私も『知の図書館情報学』(丸善出版)でウィルソンを四半世紀ぶりに論じましたので,もっと知りたい方はどうぞご覧下さい。

今,刊行されてからすでに40年以上過ぎている本が注目される理由は,まさにネット上の知の氾濫,サーチエンジンやSNSの害,生成AIと人間の知との関係などが露わになってきたことにあります。彼の古典的議論はそうしたそうした「機械の知」に対する「人間の知」の再構築を考える際のヒントが多数含まれています。

なお,余談ですが,ウィルソンの三部作はカントの三大批判書(『純粋理性批判』『実践理性批判』『判断力批判』)と相互の位置づけがちょっとだけ似ている気がします。1が認識論,2が実践論,3が1と2をつなぐための方法論的議論をしたものという意味です。ウィルソン本人の言が残されているわけではないのですが,物事に対して根源に迫ろうとすると思考パターンが似てくるのかもしれません。これは弁証法的な展開ということになるのでしょう。





2025-01-05

図書館情報学と生成AI——ネット社会30年とこれから

2025年になりました。昨年、2冊の単著(『図書館教育論』『知の図書館情報学』)を出したことでこれまでの総括を行い、次の課題を考えようとしているところです。情報技術において、生成AIが目下の最大の話題になっています。私も翻訳技術に使うAIのすごさに驚かされて、にわか勉強でこの技術が大きな可能性をもつことを実感しました。しかしそれだけでなく、この技術の限界を理解し、共生することの重要性も認識しました。

日本の経済状況を指すのに「失われた30年」という惹句がありました。コロナ明けのインフレ状況のなかではあまり聞かれなくなりましたが、私は日本の情報技術の「失われた30年」はまだまだ続くのではと思います。というのはインターネットが一般的になってからちょうど30年の節目の今年、日本でもICTのインフラが(ちぐはぐながらも)整ってきたように見えるなかで、急に立ち上がってきた生成AIの技術ですが、これが相変わらず米国を中心とする外国で開発されているからです。

インターネットからインテリジェントプラットフォームへ

情報技術は、もともと軍事技術だったインターネットが20世紀末に民生化されたことを契機に始まります。1995年にNSFNetが民間へ移管されたことをもってインターネット元年と呼ばれることがあります。冷戦体制終了後のこの頃に世界を自由につなぐ通信網が現れたことには大きな意味がありました。Windows95が発売された年でもあり、新しいネット社会への移行が始まります。


私は1990年代前半に図書館情報大学(現筑波大学図書館・知識情報学群)にいた頃に、見よう見まねでUNIXのコマンドでネット接続を行い、すでに学術世界においては図書館OPACの公開、データベースの公開、Gopherでの情報提供、メーリングリストでの情報共有などが行われていることを知り、新しいことが起こっていることを感じました。そのことをどこかで知った編集者の依頼で『入門インターネット』(日本能率協会編、1995)という本に「電子図書館としてのインターネット」という文章を書きました。この本の帯には「文系のためのインターネット解説書」とありましたが、技術屋ではなくふつうの人でもネットにアクセス可能というメッセージを伝えることができると同時に、電子図書館の可能性を考え始めたのもその頃でした。(とは言え、『電子図書館の神話』(勁草書房)という翻訳書を1996年に出して、文系的な備えもしようとしていました。)その後、ゼロ年代のインターネットは、メール、掲示板、WWW、ブラウザ、サーチエンジンといったものが中心で、基本的にはテキストベースでやりとりし、ネット上のコンテンツはオープンであることが前提でした。それがインターネットが電子図書館にもなりうるという言説を生み出す根拠にもなりえます。

このあたりまではネット状況に着いて行けたのですが、その後、2010年代にビジネスベースのSNSやマルチメディア・プラットフォームが席巻し始めたあたりから、全体状況を把握することが難しくなってきました。何よりもインターネットはオープンネスよりも、ビジネスや広告目的で顧客を取り込む商業的プラットフォームを提供する場となったことが、当初の予想と大きく異なるものでした。経済生活に関わる多くのものがネットベースに移行するようになりました。それには、スマートフォンやタブレット端末などのハードウェアの発展も大きく関わっています。

それでもここまでのインターネットは、ビジネスベースにせよ、公共サービスにせよ、オープンベースにせよ、取引、データ処理、情報データベースといったものの場がネット上にあって、どれを選択するのかについては、(サーチエンジンに頼る際のバイアスや広告的作用はあるにせよ)使い手に委ねられていることを前提にしていました。ところが、ブラウザとサーチエンジンに生成AIが組み合わされることで、ネットは単なる情報獲得手段にとどまらず、人工知能(AI)そのものになろうとしています。人は端末に何かの問いを投げかけることで、回答が得られます。そのうちに、問いのパタンを学習したAIは先んじて情報を提供することができるようになります。人が自らの行動の助言や指示を求めればそれも提供されることになります。実はサーチエンジンやSNSにはそれに似た機能はすでに組み込まれているわけですが、いっそう精緻に(あるいは巧妙に)装備されます。

生成AIにはバイアスやフェイク、誤りが含まれていることは明らかですが、使用する人の多くはそれに気づかず便利さを追求することで、このインテリジェントプラットフォームを受け入れる方向に進んでいます。人々が受け入れたものは、さまざまな価値をもともともっている方向に拡張させます。それにより、社会的には多様な価値が拡散されてその多元的な状況が支配することになります。リベラル的でコモンズ的な価値が主張される一方、力による解決を求める強権的な価値が主張されます。これらは多元的なベクトルを構成するので、ある主張はコモンズ的でありながら強権的な価値を支持することが十分にありえます。これらは以前から存在していたものですが、成立した価値は生成AIの自己学習原理によってさらにそれぞれのベクトルの方向にさらに拡張されます。生成AIと結びついたメディア環境は価値とは一線を画しますが、こらが多方面に拡大されることにより知らず知らずのうちに社会を大きく変貌させるのです。私はここ10年で進行している専制的な政治の強化や感染症に対する根拠のない対策、ウクライナ・中東における戦争、トランプ再選も含めた西欧諸国における保守的な政治状況はいずれもこの変貌の現れだと踏んでいます。

これらは、生成AIがもたらす一つの仮想的状況です。欧州連合(EU)は、この予想される未来が特定の企業がすべてのプラットフォームを独占することによって生じるとし、その歯止めとして、「デジタル市場法(DMA:Digital Markets Act)」と「デジタルサービス法(DSA:Digital Services Act)」を2022年、2023年に制定しました。DMAは「プラットフォーム市場における市場支配力の濫用防止や、公平で公正な競争の確保など」を規定し、DSAは「プラットフォーム市場における違法、不適切なコンテンツの排除や、適正なサービスの提供、透明性の確保など」を規定しています。こうした包括的な規制は寡占化されたプラットフォームの市場支配力を弱める働きをするでしょうが、先ほどの統合されたインテリジェントプラットフォームに対する真の意味での規制にはならないでしょう。

ひとつにはこの規制を強めれば、言論表現の自由という原理に抵触する可能性が出てくるからです。ここには、法的な規制とビジネスの自由、そして倫理的な歯止めとの間の複雑な関係があります。問題は従来の市場独占的な経済の問題ではなく、インテリジェントという、知に基づく政策判断や経営判断、そして社会行動にもたらす影響にあります。プラットフォームが独占されずに分散的であっても、過去の知のアーカイブに基づく生成AIの学習作用は結局のところ集合的に同じような作用をもたらします。

インテリジェント環境に対する図書館情報学の構え

生成AIについては話題になったこの2〜3年の間に多数の解説記事や本が出されています。詳しくはそうしたものを見てもらうことにして、ここでは大雑把に、大規模なテキストやドキュメントのデータの蓄積を多層的で多元的に分析したものにより、人の知能の働きをシミュレートさせることと言っておきます。データの蓄積と分析という点でテキストやドキュメントを再構成しているということができます。こうした点でドキュメントの蓄積と組織化を研究してきた図書館情報学との親和性があるわけです。

そのためにAIを理解するためには、図書館情報学で従来から知とはどのようなものと考えられてきたか、知識を利用するとはどういうことかを理解することが有効です。私はこの問いに対する自らの答えとして『知の図書館情報学』を執筆しました。これにより、西欧の図書館情報学理論的水準の一端を示すことができました。しかしながら、本書を書きながら、図書館情報学において日本ではほとんど未開拓だった領域があることに気づきました。こうして、これを皆で学ぶために、知識組織論研究会を呼びかけてオンラインですでに2回の会合をもちました。メーリングリストでは意見交換も活発に行われています。

生成AIは情報検索論の延長上に現れた技術ですが、あくまでも人間の行動の記録であるテキストやドキュメントを多元的に分析してシミュレートしているものであり、アーカイブとしての限界があることは明らかです。この限界を理解するには、人間の知的行動の原理を明らかにする必要があります。そうしたことは哲学や脳神経学、心理学、社会学などから幅広い検討が行われていることは周知の通りですが、図書館情報学ではもともとそれをサービスベースで支援する目的で検討されて来ました。情報資源組織論やレファレンスサービス論はそうしたものでしたが、国際知識組織論学会(ISKO)はこれを他の基礎理論を踏まえた議論を積み重ねて、IEKO(知識組織論事典)としてオープンにしています。この項目をひとつずつ読んでいくことによって西欧的な知識組織論の全体像を把握して、私たちの理解に役立てようというのです。

ここ1年ほどそうした取り組みをしてきて、現在の生成AIの状況に対抗しうる図書館情報学の理論の系譜を辿ることにしました。それは、人が知識を獲得する過程を図書館員が媒介する行為と、生成AIの仕組みとの違いがどこまで明らかになっているのかを知りたいと考えるからです。

20世紀の図書館情報学で理論的な議論を展開した人に、アメリカの哲学出身の図書館情報学者パトリック・ウィルソンがいます。彼の3冊の単著のうち昨年『知の典拠性と図書館』が出て、この1月末に『知の公共性と図書館』が出ます。(最初の著作Two kinds of power: an essay on bibliographical controlの翻訳は予定されていないようです。)ウィルソンの著作は必ずしも読みやすくはありませんが、その独特の哲学的レトリックにより、従来の図書館情報学が無視してきた知の領域の存在を明らかにしました。 それは個人の認識と公共的な知との関係および、知がいかにして公共性や典拠性を帯びるのかといった問題です。図書館情報学はドキュメントを扱いながらそれらが知の要素であり、図書館は知のエージェントであることについて無関心だったことを、彼は批判しました。

ビアウア・ヤアランはIEKOの編集長を務めている知識組織論の中心的人物の一人です。かれが書いた次の著作は、IEKOを読むための基礎理論として無視できません。

Birger Hjørland, Information Seeking and Subject Representation: An Activity–Theoretical Approach to Information Science. (Greenwood Pr. 1997)

(この本のエッセンスは次のインタビューで読むことができます。.)

ヤアランの著作は、ウィルソンの議論が図書館情報学を批判しながらそれを回収するための方法について具体的に提示していないと批判した上で、自らの認識論的=活動主義的議論を展開しています。また、彼は20世紀後半の図書館情報学が情報行動論を中心に展開したことに対して、それが心理主義に陥っているとして批判的です。この点で、アメリカの情報行動論の中心人物マーシャ・ベイツとのやりとりがあります。(JASIST, 59(5):842-844)

ヤアランは、知識組織論における「主題」の問題に焦点を当てます。図書館情報学ではドキュメントが扱う主題とは「分類表」や「件名標目表」から適切なものを選んで付与するものと理解されています。しかしながら、その分類表や件名標目表がどのような考え方でつくられているのかを考えてみると、一筋縄ではいかないことが分かります。また、私自身も自分の本の巻末索引をつくるのですが、そこでは著者名や固有名詞は扱いやすい反面、主題に該当する事項索引となると簡単ではありません。主題subjectは、哲学では「主体」「主観」と訳され、言語学では「主語」とされます。sub-は「下に」を意味する接頭語なのに、日本語だと「主」が付く転倒はどこから来るのか。これは欧米でも同様であり、ここに人間の認識についてのしっかりとした考察が必要であることが分かります。ヤアランはドキュメントの主題を表現するために西洋の哲学史を紐解き、合理主義、経験論、実証主義などの認識論や科学論を検討しながら、図書館情報学における主題表現の理論は可能であると述べます。彼はこの著作で主題概念について認識論的な基盤をつくったあとで、そうした議論をベースにして、21世紀になって彼が「ドメイン分析」と呼ぶようになる活動主義的な議論を展開します。本書はIEKOに至るための前提的議論をした著作ととらえることができます。

他方、前にブログに書いたマーティン・フリッケは『人工知能とライブラリアンシップ』を著し、図書館員はこの状況に対応できる職であることを述べています。なぜか。それは少なくとも欧米諸国では図書館がテキストを含むドキュメントの蓄積、利用に関わる社会的機関であり、図書館員のノウハウがライブラリアンシップと呼ばれるものだからです。フリッケは、AI技術に対して図書館員のできる役割として次の5つを挙げます。それは、「シナジスト(相乗効果の仕掛け人)」「セントリー(バイアスやパターナリズムの監視者)」「エデュケーター(市民にとっての情報リテラシーの教育者)」「マネージャー(AI技術と図書館技術を組み合わせる情報管理者)」「アストロノート(こうした状況を俯瞰できる宇宙飛行士)」です。

彼がこうした考えに至る際のライブラリアンシップとは何であるのか、その理論的考察はこの本には軽く触れられているだけで、それは前著に委ねられています。それが次の著作です。

Martin Frické, Logic and the Organization of Information. (Springer, 2012)

(本書を読んで刺戟されたAlan Gilchrist他の専門家数人が、書評に代わる短いエッセイJournal of Information Science誌に発表し、それらはオープン化されているのでご覧下さい。)

この本を要約するのもまた難しいのですが、基本的には知識組織論(彼は情報組織論と呼ぶ)を適切に要約した上で、言語の階層性と包含関係、そして意味的なネットワークの分析に論理学を適用して検索システムの論理の可能性と限界を明らかにしようとしているとひとまずまとめることができます。 現代の情報検索や知識の組織化は、論理学、数学、言語学という 3 つの分野の融合に基づいていますが、そこに健全なプラグマティズムが組み込まれることにより、形式論理だけに依存しない実際的な議論が構築されています。フリッケがその後の『人工知能とライブラリアンシップ』で図書館員という知識組織論の専門家が介入することでAIの限界を超えるというのは、こうした論理性とプラグマティズムのいずれもAIでは実現されないからです。(少し原理的なことに触れると、生成AIは、記号やデータ構造のシミュレーションを行うものであって、言語の意味や論理はまったく配慮し得ないし、また、プラグマティズムは人間の行為や目的を基準にする思想であってAI分析の基になる(過去の)データからは得られないことはすでに明らかにされています。)

おわりに

今挙げたヤアランとフリッケの著作については、今後、きちんと読み解いて日本の読者にも全容を明らかにしようと考えていますが、それには少し時間がかかりそうです。

冒頭で日本のネット社会の遅れという話しに触れました。『アーカイブの思想』を書いたりしたことで明らかになったと思われるのは、日本社会のドキュメント=アーカイブの仕組みは欧米社会のものとかなり異なっているということです。それは欧米出自の図書館情報学を研究してきたことから、これまでのコンピュータ関連の技術はすべて欧米社会がもつテキストアーカイブという知識組織論の伝統の上に成立してきたことを強く感じるからです。だから、図書館の制度化やデータのオープン化、ネット社会や知識組織化の仕組みのような情報技術の観点からは弱点として働いてきたと評価されてきました。とくに情報ビジネスでは完全に遅れをとりました。

しかしながら、生成AIがインテリジェントプラットフォームとして確立されると、そうした差はあまり気にしなくともよいのかもしれません。むしろ、日本的なアーカイブの仕組みはマルチモーダルなプラットフォームと相性がよく、こちら方面から新しいものが日本から生まれるかもしれないと考えることもあります。日本文化が西洋的なものと異なる出自をもつが故の可能性については、別の機会に書いてみたいと思います。