2024-10-20

『人工知能とライブラリアンシップ』の概要紹介

別ページで公開したマーティン・フリッケ『人工知能とライブラリアンシップ』の概要を紹介します。この本は,最新の生成AIの技術的知識を,きわめて高い水準を保ちながら分かりやすく解説し,それが図書館員の仕事とどのような関係になるのかを説明したものです。生成AIは大規模言語モデルを用いて,従来の情報検索や全文検索とは異なる知への新しいアプローチを提供していて話題を集めています。図書館員の仕事も文献の蓄積に対してアクセスすることを支援するものですから,この技術をうまく使うことで大きな力となるはずです。

しかしながら,そこには気をつけなければならない多数の問題があります。それを著者はていねいに記述していきます。全部で15章の本文に付録と用語集,文献一覧を含み,A4判で400ページ近くになる大著です。簡単に読みこなすことは難しいように思われるかもしれません。

全体としては,本文の1章から5章までは生成AIの技術的解説とその特性についての説明,6章から9章は生成AIがはらむ倫理的問題点とそれがライブラリアンシップとどのような関係になるのかの解説,そして10章から15章がライブラリアンシップにとって生成AIをどのように使いこなすべきなのかの話しです。とくに図書館関係の方は10章〜15章を先に目を通すと読みやすいかもしれません。お急ぎの方は,図書館員の役割を概説している10章と将来展望を述べている15章だけでも読むと,著者が図書館にどのような希望を込めているのかがわかります。



<目次>

第1章  知的背景
第2章  チャットボット
第3章  言語モデル
第4章  大規模言語モデル
第5章  大規模マルチモーダルモデル
第6章  評価と将来
第7章  バイアスと不公平
第8章  機械学習とライブラリアンシップにおけるバイアス
第9章  自然言語処理(NLP)はライブラリアンシップに何をもたらすだろうか?
第10章  図書館員にとってどんな機会になるか?
第11章  シナジストとしての図書館員
第12章  セントリーとしての図書館員
第13章  エデュケーターとしての図書館員
第14章  マネジャーとしての図書館員
第15章  アストロノートとしての図書館員


第1章 知的背景 

今起こっているAIについての技術的進展の最先端がどのようなものであり,そこで使われている技術の概要についての紹介。とくにライブラリアンシップにとって重要なテキストやそこへのアクセス問題(テキスト読み上げや機械翻訳,情報検索,アーカイブなど)と今の技術がどのような関係にあるのかについて記述している。また,AIの本質が機械学習にあること,そして,そこで学習のための「教師」がテキストによるトレーニングセットで構成されること,テキスト作成のためのOCR技術の重要性が解説される。教師あり,教師なしなどの組み合わせでトレーニングされ,さらに次の段階として自己教育が可能になる。これが,機械学習のポイントである。

第2章 チャットボット

コンピュータ画面でAIと対話しながら情報を得たり,何らかの指示を出したりするチャットボットの仕組みについての解説。こうしたシステムも初期のプログラム化されたエキスパートシステムから現在の深層学習に変わって大きく進化した。機械との対話が自然であるかどうかを見分けるためのチューリングテストにパスするようなものが現れている。深層学習による機械学習を理解するためには,テキストに現れていない意味(含意)を理解できるようにする必要があることが述べられる。

第3章 言語モデル

ここでは,言語学習がどのように行われるのかについての基本的な理論の解説を行っている。テキストを構成する文字の並びから次の文字を予想するために,確率的に言語のつながりを計算する手法である隠れマルコフモデルという考え方を導入する。シャノンは,英語の文字のシーケンスの確率に着目した。これによってサンプルデータからの学習の方法(ベイビーGPT)が示される。その方法が実際の大規模データで長期間をかけ,評価とフィードバックを含めて実行されてできたものがGPT等の大規模言語モデルである。学習の方法としてベクトルで表現した単語の「埋め込み」を行いそれを修正しながら学習していく。このようにして言語モデルから出力される文は知識や真実と乖離していることも多いが,それらに対して,教師あり学習の微調整や人間の評価者による強化学習によって知識や意味の要素を加えていくプロセスとしてInstructGPTがある。

第4章 大規模言語モデル

こうした言語モデルを大規模に高速に実行する方法について詳細に述べているのが,この章である。ここでは,効果的に言語を処理するために注目すべき語やシーケンスに重み付けをするためのアテンションや並列処理を可能にするトランスフォーマーといった最近開発された技術について解説される。さらに,大規模言語モデルの自己監督機能を使用してモデルを事前トレーニングし,次に微調整を施してモデルを下流のタスクに適したものにしていく過程を繰り返したものが基盤モデルと呼ばれる。基盤モデルはテキストだけでなく,音声,画像,映像などのマルチモーダルなドキュメントを同時に扱うことも可能になっている。こうして現れたのがGPT-3,GPT-3.5,GPT-4などの生成AIである。これらの多くはチャットボットのようなエージェント(質問応答形式)で提供されている。具体的な例として,本(AIと研究図書館のライブラリアンシップ)のアウトラインをつくっているプロセスを示している。こういうLLMの仕組みの解説から,問題点として,幻覚(ハルシネ—ション),フェイク,知財,プライバシー,チョムスキー理論との関係,サイバーセキュリティ,透明性の欠如,環境コスト,推論に弱いなどの問題点を指摘している。

第5章 大規模マルチモーダルモデル

画像や音声,映像を解析して対話的に応答できるLMMはLLMの一種と考えることができる。画像内のテキストや数値を読む,ただし,これを使う際には,マルチモーダルであることによるプライバシーやステレオタイプ,障害者への配慮などの安全面の配慮事項がありうる。LMMを使って説明したり,推論したりする例が多数紹介されている。ルネサンスの絵画を見ての美術史の解説,科学的知識と組み合わせての教育指導案,寿司の作り方の手順の写真から作成順序を推論,外的世界との関係ではロボットに買い物の指示をする事例など。これうして,現実世界とマルチモーダルな関係でつながる可能性が高まった。2024年になると,GPT-4 ターボ(OpenAI),Gemini(Google),Claude(Anthropic)など各社がLMMの拡張版を一斉に発表した。これによってできることはたくさんある。たとえば,スマホで撮影した画像からテキストを抽出すること,二つの画像の違いを見分けること,医療用画像の説明,画像の生成,画像の分類やラベル付け,情報検索の拡張といったものだ。

第6章 評価と将来

AI は主に信頼性とアラインメントの概念を使用して評価する。信頼性は一貫していることであり,アラインメントはモデルの予測や動作が,期待される,望ましい,または意図された結果とぴたりと一致することだ。LMM で何ができるかを理解する方法の 1 つは,一般的なベンチマークを見ることで,ここでは評価のためのツールとしてMT-Bench ,Chatbot Arena,A12 Reasoning Challenge,MMLU などがあり,それぞれの特徴が説明される。さらにコンピュータ コードの作成に特化したベンチマークとしていくつかを紹介している。「汎用人工知能(AGI)」を評価するための ARC-AGIベンチマークというものもある。最後に,カーツワイルの「シンギュラリティ」が起こるかどうかについて,アッシェンブレンナーが行った今後10年の予測記事の紹介があり,2027 年頃までに AGI が登場し,その1年後くらいにそれらを遙かに上回る人工超知能(ASI)が現れる可能性がある。これを最初に手に入れた者に決定的な軍事的および政治的優位性をもたらす可能性がある。AGIからASIへの飛躍の鍵は重み付けにあるので,セキュリティがきわめて重要である。

第7章 バイアスと不公平

ここからは,AIがもたらす倫理的問題について突っ込んだ議論がある。まず,機械学習におけるバイアスとは,事前に設定された変数間の重み付けのことであり,それ自体には倫理的社会的問題は存在しない。また予測バイアスという用語が使われるがそれは予測値と実質値との偏差という意味だ。明らかなバイアス表現は対応すれば排除できるが,自然言語に含まれるバイアスの多くはバイアスと気づかれないままに機械学習の基になっている。また,アルゴリズムは中立的用語でそれ自体にバイアスはない。バイアスをもたらすものがあるとすれば,ソフトウェアの仕様である。ただし,コンピュータの学習や予測は自己監督によることで非経験的であり,それはさらに深層学習で行われることによって「バイアス」が生じることは防げない。機械学習のバイアスに対して知識をもつことが必要で,ここでは分配的正義の意味での公平性について,住宅ローン審査のシステムにおける閾値の設定問題を挙げて論じる。また,ジェンダーバイアス除去,顔認識の拡がりにおけるパノプティコン状況の成立,図書館の蔵書分類問題などについて論じる。AIに含まれる誤報,スパム,フィッシング,法的および行政的プロセスの悪用,不正な学術論文執筆,バイアスなどについてそれが起こる理由を推測できることが大事だ。スマホを使うすべての人はプログラマーであり,図書館員は「情報リテラシー」の専門家である。

第8章  機械学習とライブラリアンシップにおけるバイアス

大規模言語処理に伴うバイアス問題をさらに分析する。とくに,どのようなシステムの動作が,誰に対して,なぜ有害であるか,これらの記述の根底にある規範的推論がどのように行われるのか。機械学習,バイアス,ライブラリアンシップに交差するところがあることを理解する。次に,検索エンジンの特性がバイアスを生み出す問題として,システムがもつステミング,オートコンプリートなどのキーワード修正機能があり,個々のユーザーの個々の検索機会によって作動の仕方が変わることが論じられる。ソーシャルメディアは1日24時間休みなく偽情報,誤情報,虚偽情報を大量に生み出しているが,これらは機械学習が翻訳や文章書き換えなどによってさらに強化しており,学習成果としてバイアスが紛れ込む。ライブラリアンシップの情報組織化において,「文献的根拠(literary warrant)」という概念が疑われて,かつてのツールのバイアスが問われるようになり,LCSH等のバイアスが問題になった。また,文献がネット上に無数にあるときに,「ユーザー的根拠」なのか「文化的根拠」なのかが問われるようになった。機械学習によってこれらの一部を技術的に解決することが可能である。分類という行為は二分する結果をもたらすことで責任を伴う。分類や件名標目,メタデータの選択はすべてある種の文化的行為であるが,どの文化的背景に基づくかの闘争があった。今,それが無秩序に拡がるLMMがツールとなったときに,図書館員が行ってきた議論や積み重ねてきた倫理的判断は役に立つはずである。

第9章 自然言語処理(NLP)はライブラリアンシップに何をもたらすだろうか?

自然言語処理についての技術的解説をすることによって,テキストをいじってLLMを構築する際にどのようなことが起こるのかを理解する。まず前処理を行って,テキストから余分なものを削除し分割したり正規化したりして,処理の最小単位であるトークン化する。その文字列から数値のベクトル (つまりリスト) を生成する。情報検索はクエリの文字列のベクトルとテキストの文字列のベクトルがどの程度類似しているかを評価して行う。類似するが異なる語でも埋め込まれたベクトルは類似性が高いことから検索が可能になる。単語だけでなく,チャンク(章,ページ,段落,文)でも同じことが可能である。また,検索だけでなく,テキストとテキストを対応させる処理(分類,レコメンド,トピックの抽出,固有名の処理)などでも同様であるから,図書館で行っている知的な処理(書架分類,書誌分類,統制語彙,索引法,自動索引,抄録,抜粋,キーフレーズ,キーワード,要約)のほとんどに適用可能である。これらについて一つ一つ解説している。ここで説明されたNLPの技術は,プログラマー (または図書館技術サービス部門) が大規模言語モデル (LLM) を使用し,公開アプリケーション プログラミング インターフェイス (API) を持つものを使用する適切なソフトウェアを作成することで利用可能である。

第10章 図書館員にとってどんな機会になるか?

エドワード・ファイゲンバウム (「エキスパート システムの父」) が,未来の図書館がAI を知識サーバーとして書物と書物が対話することを述べている。これはライブラリアンシップを考えるヒントになる。今,大量のボーンデジタルデータが生み出されビッグデータが問題になっているが,これらを扱えるのはLMMを使いこなすライブラリアンシップである。そのために,図書館員の役割を「シナジスト(相乗効果の仕掛け人)」「セントリー(監視者)」「エデュケーター(教育者)」「マネージャー(管理者)」「アストロノート(宇宙飛行士)」という5つのカテゴリーに分けて次章以降の各章で特性を検討する。ここでは頭出しで,たとえばシナジストは,AIはOCRや翻訳などによって情報アクセスを以前より容易にし知的自由を高める。スマホは情報へのアクセス機会をいっそう向上させる。ユーザーとリソースの仲介においても検索のレコメンドをしてくれる等々である。つまり,AIをライブラリアンシップにうまく組み込むことによって,AIの能力をライブラリアンシップの手法で向上させられるという役割である。セントリー(監視者)は,AIがもたらす進歩につきものの問題,とくに倫理的問題をチェックする役割である。エデュケーター(教育者)は,情報リテラシーやデータリテラシーへの対応である。マネージャーは図書館運営においてAIをうまく取り入れることである。アストロノート(宇宙飛行士)は,図書館が知識の宝庫であることでAIを駆使した知識の創造などに関わるということを言っている。

第11章 シナジストとしての図書館員

図書館における知的自由には,特権(自由権)と請求権的な側面がある。両方の意味での知的自由を保証しようとする。図書館員が多言語環境や古い活字本や手書きの本,オーディオ資料の文字変換,手話からテキストへの変換,翻訳等々を処理しなければならないときに,OCRや文字認識,音声認識,映像処理,翻訳のプログラムが何をしているのかを理解することが重要である。また,ユーザーとリソースをつなぐために知っておくべきことがある。たとえば検索エンジンのPageRankや機械学習が何をしているのか,商用情報検索システムがクエリとその応答とどう関係づけられているのか。個人情報と結びつけることで,レコメンドが可能になる。目録作成,分類,検索ツールについては,従来,ユーザーが仕組みを理解した上で使うという前提をやめて,機械学習がそのギャップを埋めてくれることを前提としたサービスに切り替える。そのために,機械学習のトレーニングにこうした分野の専門家がフィードバックを提供する。また,書誌作成,目録維持,引用・参照の分析,書評執筆,事典の編纂,チャットボットによるレファレンスサービス,パスファインダーなどにおいて,機械学習を用いたライブラリアンシップの向上が可能である。図書館が蓄積しているデータやノウハウがトレーニングデータの提供やキュレーションに貢献する。社会認識論に関わることとして,ファクトチェック,認知バイアスの軽減,真実主義のチェックなどに図書館員のノウハウは貢献する。

第12章 セントリーとしての図書館員

セントリーとは監視員という意味である。機械学習において,カスタマイズ,フィルター,レコメンドなどの機能は結果として検閲的に働くことがありうる。個人情報についても,パーソナライズのサービスが個人情報の目的外使用とバランスをとる必要がある。図書館員は知的自由を主張してきたが,アルゴリズムによるキュレーションを用いることで機械学習のバイアスやパターナリズムなどの意図せざる働きに対する歯止めになる可能性をもつ。それは,社会認識論的にも重要である。LLMがもたらす失業問題について,定型的な反復作業の自動化が進み,労働者はより複雑で価値の高い作業に取り組めるようになるというのが標準的な議論だが,失業がないという意味ではない。アセモグルは短期的には「そこそこの自動化」にとどまり,労働者の地位は下がるかもしれないが生産性の大きな向上にはつながらないと主張している。

第13章 エデュケーターとしての図書館員

情報消費者のためのAIリテラシーの中身は,アルゴリズムとその仕組み,AIツール(例えば第5章で述べたもの)とそれらが提供する情報についての批判的理解,バイアス,プライバシー,顔認識技術,研究ガイダンス,社会認識論といったものだ。研究ガイダンスとしては(図書館員は,機械学習ツールを使用してデータを分析する研究者を指導できる。これには,使用する適切なアルゴリズムに関するアドバイスの提供,結果の解釈の支援,研究が倫理的に実施されていることの確認などが含まれる。学習はよりパーソナライズされるようになり,個々の学生,講師,グループやクラスの学習データと分析が必要になり,図書館の利用データもその一部になる。大学図書館にAIラボをつくり,学生とインストラクターに新しいコンピューティング スキルを学ぶ機会を提供する事例が紹介される。個人情報の扱いは問題になる。研究面では,学術論文をフィルタリングし,評価し,発信するアルゴリズムが学術論文やジャーナルに取って代わりつつある。最後に,EUの「一般データ保護規則(GDPR)」22条では,プロファイリングを含む自動化された個人意思決定について,個人データを使用する際の注意の必要性と,下された個々の決定の説明の必要性を強調している。きわめて重要だ。特定の大企業がLMMをつくって世界中からデータを集めると様々な局面での意思決定に影響を及ぼす。説明可能な人工知能 (Explainable Artificial Intelligence: XAI) についての研究分野があるが,ブラックボックス化したAIの中身を見えるようにする努力が必要だ。

第14章 マネジャーとしての図書館員

図書館員の関わる情報マネジメントにおいて,過去の使用パターンと傾向を入力とし,需要とニーズを予測する予測分析や,ユーザーの個人データないし集団データによる行動分析,ユーザーが教育や学習の目的でどのようなリソースを使用し,どのように使用しているかに関するデータによるラーニング アナリティクスなどがある。これらをAIを用いて分析することで,エビデンスに基づくマネジメントが可能になる。こうしたことに対する忌避感やAIに対する恐れがあるようだ。しかしAI を,バイアス,誤用,差別のリスクと戦う積極的なプレーヤーとして受け入れる 図書館が情報マネジメントの分野で人工知能アプリケーションの実装に積極的な役割を果たせば,プログラマーがアルゴリズムに最適なデータを見つけるのを支援できる。

第15章: アストロノートとしての図書館員

ライブラリアンシップや情報キュレーション分野で,現代の機械学習が既存のものより際立った優位性を持つ可能性がある 3 つの分野は,データの視覚化,チャットボット,テキスト データ マイニングを含む情報発見だ。最後に,1986年のドン・スワンソン論文「未発見の公共知識」は,ライブラリアンシップが新しい創造的な領域を開拓する可能性を示した。それは,研究領域で未発見の2つの領域をつなぐためのデータマイニングの手法を提案するものであり,実際に,医学領域でその分野が開拓された。また,その手法は「文献に基づく発見Literature-Based Discovery」ないし「(テキストに基づく情報学Text Based Informatic」と呼ばれる。これは哲学者カール・ポパーの客観的知識論における「世界3」の開拓という意味合いもある。

付録A ライブラリアンシップの理論的背景
図書館情報学の知識組織論的な理論的背景について概説している。扱うのは,概念,分類,統制語彙,シソーラス,オントロジー,認識論などである。

付録B 大規模言語モデル(LLM) の操作
少し技術的な運用面に踏み込んで,Chat GPTなどのLLMと呼ばれるものの利用の仕方について解説している。

付録C 2つの重要な方法論的ポイント
主として統計学的な分析をするときの方法論的概念として,「偽陽性と偽陰性」と「 ベースレートの誤謬」について改めて詳しく解説している。

付録D 因果関係図
因果関係を→を用いて図示する手法についての解説である。

付録E ナレッジグラフ
人物,場所,物,日付などのオブジェクト間の関係をリンクで図示するナレッジグラフは情報発見のツールとして用いられる。

用語集
本文で出てきた重要な用語を解説している。

Bibliography
引用・参照されている文献一覧

0 件のコメント:

コメントを投稿

新著『知の図書館情報学―ドキュメント・アーカイブ・レファレンスの本質』(11月1 日追加修正)

10月30日付けで表記の本が丸善出版から刊行されました。11月1日には店頭に並べられたようです。また, 丸善出版のページ や Amazon では一部のページの見本を見ることができます。Amazonではさらに,「はじめに」「目次」「第一章の途中まで」を読むことができます。 本書の目...