索引と知識組織論
知識組織論研究会(KORG_J)では組織化の方法として,分類,書誌,索引などを取り上げている。ここに目録がないのは,通常,図書館目録は所蔵している資料の書誌であり,個別項目を排列する原理として分類があり,項目を分析する手法として語(メタデータ)を付与する索引があると理解するからである。
書誌と分類と索引は相互に排他的な概念ではない。たとえば,ある図書館の目録データベースがあるとすると,対象とする資料単位ごとに書誌データがつくられるからこれは書誌である。また,物理的な資料が排列されるために何らかの分類記号をつけるから,そこには分類の概念が存在する。たとえ,自動書庫において資料が物理的な位置は移動単位のボックスとそのなかの相対的な位置として識別されるとしても,そのID記号が(動的にしか決められない場合でも)分類記号ということになる。そして,目録データベースの書誌データにおいて,何を検索語とするかについて編成原理と検索原理から成る索引のシステムが存在する。これは通常は目録規則と呼ばれるものであるが,索引システムに包含されるものである。
知識組織論ではこのように従来の資料組織の考え方を相対化して,より大きな枠組みの下で考察しようとする。多くの人はすでにネット上のサーチエンジン,データベース,生成AIなどのツールをみずからの知識組織化のために使用しているからである。言うまでもないが,こうしたネット上のテクノロジーが現れる以前から,手作りの書誌や,新聞記事のクリッピングやその索引,パスファインダー,文献レビューなどがつくられていたし,百科事典や専門事典の編纂や専門領域のハンドブックや年鑑などで今でも行われている。これらは従来の図書館情報学では資料組織論やレファレンスサービス論のなかで検討されていたが,今では古くなった領域と見なされることも多い。後でも触れるが,日本索引家協会が20世紀末に解散したことはそれを象徴的に示している。
それは図書館情報学が医学や法学などの一部の領域を除いて知の専門領域に踏み込むことを忌避してきたことと関わる。多くの分野を対象にしたデータベースがつくらればそれで足りるという発想は知識組織論的に問題が多い。「神は細部に宿る」という箴言に倣えば「知は細部に宿る」というのが,ビアウア・ヤアランの思想である。そうしたgeneralismは今後の司書養成の本質と関わっている。それらは生成AIに駆逐されてしまうのではないかと。
巻末索引について
さて,ここでは書籍につけられた巻末索引がどのような索引システムであるのかについて考えてみたい。昔からよくある議論として,日本で出る専門書には巻末索引がついていないものが多いというのがある。以前よりも人文社会系の博士論文が出版される機会が増え,その意味で専門書が増えている状況があるなかで,索引がついている書籍は増えているという実感をもっている。だが,多くの思想書,専門書,大学の教科書には索引はついていない。ついていても人名索引,著者索引,作品(書名)索引しかついていない書籍は多い。これらは,固有名詞を抜き出せばよいから,比較的作成は容易である。問題は,事項索引と呼ばれる主題語の索引がつく例が多くないということである。
最近,経験したことを書いておこう。光文社という出版社は文芸書やコミックスなどの出版物も多いが,光文社古典文庫を出していたり,意外に硬派な専門書も出している。ここが2023年秋に『万物の黎明』と『索引〜の歴史』という2冊の翻訳書を出した。前者はグレーバーというたいへんおもしろい着眼点をもつ人類学者の遺稿で,西洋流の啓蒙主義的歴史観を根幹から批判したものとして世界的ベストセラーになった。後者はタイトル通りの地味な本だが,巻末に原著についていた索引を翻訳したものと,本文のテキストからAIが作成した索引と,日本で新たに作成した索引の3つがついていたのが面白かった(それについてはブログの2024-03-29を参照)。そのときに,『万物の黎明』に(原著には浩瀚な索引がついているのに)索引がついていないのはなぜかと編集部にメッセージを送った。あのように大部で,話題が太古から現在の古今東西の事例を検討するような類いの本は索引がなければ読めないと考えたからである。訳者はグレーバーの本の翻訳や紹介を積極的にしている人だから,索引についての見解もぜひ聞いてみたいと思った。だが,返事はなかった。
索引,とくに事項索引はつくるのが難しい。というよりも,これ自体が知識組織論の大きな問題である。目録とか新聞記事や雑誌記事の索引(抄録も含む)と巻末索引では何がどう違うのかといえば,まず,書誌や図書館目録,記事索引は対象がドキュメントという単位を明確にしているが,巻末索引は著作の部分を対象にするというだけで,部分の範囲は不確定で,その部分を広くとるか狭くとるか,部分をどのような言葉で表現するのかも一切は索引作成者に委ねられている。そして,事項索引を作成する作業自体が作成者がどのように対象ドキュメントを読み込み,それを解釈したのかを示すものである。そこが,全集や著作集の索引だと,特定個人の複数著作に対する索引であって,基本的には同じである。図書館目録や記事索引は対象がドキュメント単位であり,その対象の選定や処理方法が最初から標準化されているものとの違いである。書誌は編纂方針が作成者に委ねられているところは索引に近い。
巻末索引は多くの場合,担当編集者が作成するが,著者ないし訳者が作成する場合もある。いずれにしても,この作業は簡単ではないし,作成してもそれ自体が評価されることも多くないから省略されるのだろう。私はここに,日本人が書物に対して分析的に読むことを避ける考え方が表出していると思う。索引は書物を分析的あるいは批判的に読むときに必要なツールである。このことについては別の機会に書いてみたいが,今手元にある人文系の新刊翻訳書を何冊か取り出してみると,哲学書でもしっかりとした事項索引がついているものもあるが,原著にはあるのに訳書で省略しているもの少なくなかった。その必要性と作成のための労力やコストを比較して,つけなくともよいという判断が先に立つのだろう。
『知識組織論とはなにか』の索引
私が最近取り組んだビアウア・ヤアラン著『知識組織論とはなにかー図書館情報学の展開』という翻訳書で,索引にどのように取り組んだのかについて述べてみよう。この本は本ブログの他のところで何度か取り上げたのでここでは全体の内容について取り上げないが,ともかく先に述べた知識組織論の理論書である。知識組織論に索引の理論が含まれることは先に述べたとおりである。そして彼自身が自分で索引を作成しているから,この索引は彼の理論の応用例ということになる。また,それを翻訳という過程を経て他言語に置き換えたことで,この索引作成は彼の理論とその応用を日本の読者に向けてどのように表現するのかを問われるものとなる。本索引は,原著の索引を基にして,日本の読者に合わせて変更を加えたものである。原著には650項目ほどが掲載されているが,本訳書では370項目に絞ってある。副見出しがついている重要項目は,基本的に原著者がつけたものに若干の追加(「ヤアラン」項目の副見出しを含む)をした。本書で展開される主題理論の実践例として利用することができる。
まず,原著の2段組で10ページ分650項目の巻末索引というのは200ページ弱の書籍にしてはずいぶん多い。これは,著者が引用・参照した文献については原則的にすべて(例外はデンマーク語の文献の一部)著者名からの索引が取られているからである。参照文献だけでも19ページで400程度ある。通常は引用文献の著者名が索引の対象になることは多くはないが,著者は誰の論文を引用したのかが本書を読む際に重要な手がかりとなると考えているのだろう。ただ,翻訳でそれをすべて示す必要はないと考えてかなり絞った。
著者名とか図書館名や大学名などの固有名詞は全文検索で引っかかるので扱いやすいことは先に述べた。著者名については単に文献を参照しているだけでなく,当該著者が論じている内容が本文中に存在していることを基準にして絞り込むことができた。その場合に,著者名をカナ表記にするので,カナ表記のラストネームのみを索引語にした(フルネームは原綴りで示してある)。北欧の人のラストネームをカナ表記にすることに苦心したが,最近はそれを可能にするツールがネット上にいくつも存在するので何とかこなした。また,デンマーク人の名前の表記は『デンマーク語固有名詞 カナ表記小辞典』があって助けられた。(ただし,この辞典に合わせるのがいいのかどうかについて悩むところも少なくなかった。というのは,Hjørlandを「ヤアラン」とするのか「ヨーラン」とするのかは微妙なところなのだが,その違いでカナ表記だとかなりの位置の違いが生じてしまうからである。ヘボン式ローマ字のヘボンとオードリー・ヘップバーンのヘップバーンは同じHepburnだと言うと驚く人は多い。このことは原綴りの検索では問題にならないが,異文化間の「翻訳トランスレーション」問題がそこにある。)
ここで述べたいのは事項索引である。著者がその本でどのような用語を使って何を主張しているのか,使用する概念間の関係はどうなっているのか,同義語,類義語をどのように扱っているのか,といったあたりは最初に気をつけなければならないことである。さらに本書が哲学的な議論をしているところが多いので,概念をどのくらいの深さで論じているのかについても用語間の関係を理解する上で無視できない。なぜこれを強調するかというと,著者が索引を作成するときにそのあたりのことを意識しているからである。
原著の索引を基本的には「翻訳」する方針で作成した。これにより,著者の用語間の関係の理解を翻訳する際に行った作業とは別の文脈から再度行うことになる。言い換えると,テキストの直線的な流れの翻訳を行ったあとに索引を翻訳することは,著者が概念間の関係や議論の流れの関係を用語(索引語)で再度確認することである。これが逐語的な翻訳とはまた別の理解を要求する作業だった。具体的には,抽象的な用語を一語一語原著のページにもどって確認し,その対訳語で翻訳を検索する。固有名詞なら原ページにもどらなくともいいが,概念や哲学用語などの場合,どの語が対応しているのか分からない場合もあり,その対照作業はけっこうたいへんだった。これは1週間くらいかかりかなり疲弊した。
たとえば,サンプルページに「意味(meaning)」という索引語がある。この翻訳と原著を並べて表示すると次のようになる。
基本的に対応していることが分かるだろう。この作業を行うためには,まず原著と翻訳書ゲラのテキストファイルで「meaning」と「意味」を検索して,多数あるその用語のうち,ここに示されたページを見て,意味の対応関係がその通りになっていることを確認する必要がある。とくに複数ページにまたがる言葉の場合は最初と最後がどのページにあたるかを見極める必要がある。例にある副見出し「活動理論(in activity theory)」に対応するのは,原文ではp.80-81であるが,翻訳書ではp.99-101と3ページにまたがっている。
こうした作業を行うことで次のようなことが可能になった。
・ 用語の区別と統一 たとえば,information seekingとinformation searchはほぼ同義語として使用しているようだが,information retrievalは類義語ではあるがやはり機械検索を前提としているらしい。なので,前者は「情報探索」で統一し,後者は「情報検索」とする。
・ 用語構造の理解 用語を通じて著者の思想を理解するということで,たとえば,キーワードであるsubject representationは最初は「情報表現」としていた。しかしながら,expressionを使用することもあり,その違いがどこにあるのか最初は分からなかった。しかし区別しているらしいことに気づいたとき,representationは哲学や記号学で「再現前」あるいは「表象」とする用語であり,単なる(外に示すという意味での)表現ではなく,一度表現されたものが再度別の形で立ち現れるという意味であると理解した。それで最終的に「主題表象」という用語を使用した。
・著者の理解の深さを意識しながら用語を選ぶ これは,著者の主題についての考え方と密接な関係がある。先ほどの「主題表現」と「主題表象」もそうした例の一つであるが,これは,著者の思想に寄り添うか, 日本の読者を意識するかという問題でもある。日本の図書館情報学関係の読者を意識するだけなら,表現と表象の区別はそれほど大きな問題にならないだろう。しかしながら,これが一旦哲学や人文学一般の読者の存在を意識すると,それを区別した訳は必須となる。著者はプラグマティズムの立場から,主題は将来的な読者に向けて表象すべきことを主張する。とすると,本書が今の図書館情報学の読者だけでなく,将来的には人文学に通用するレベルで知識組織論を理解する手がかりとするものならば,ここではその区別をしなければならない。
このように索引の翻訳を理解し,それに基づいた作業をすることで,索引についての理解が深まった。たとえば,特定の重要語について,著者が強調したい部分のみの索引となっている。これは,本書では同じ概念が何度も何度も輻湊されて論じられるから繰り返しが多いが,著者はそういう場合にその文脈でもっとも強調したいところのみを索引項目としている。たとえば,「主題表象データ」という索引語は1カ所しか現れていない。この用語は第2章の標題にもあるように何度も使われているが,当該1カ所を見ればこの用語の内容,意義,著者の考えが示されているとということである。他にも,重要語の索引項目は多くはなかった。
場合によっては,当該用語が使われていなくとも,その概念にあてはまる記述があるときにはそのページを索引としている。たとえば,「能動的情報システム(proactive information systems)」は3カ所に索引参照がある。そのうち,「理想的には,情報システムは,利用者の情報ニーズに関して能動的に行動するべきであり」(p.188)とした部分と,「したがって,情報ニーズを経験的に研究する取り組みは,認識論的観点からの問題領域,および専門分野およびその下位分野と傾向の分析によって補完されるべきである。これが,情報システムがニーズに対応して能動的になれる唯一の方法である。」(p.211)の部分では,「能動的」の言葉が使われている。しかしながら,p.204には「能動的」という言葉は出てこない。おそらく索引者は次の部分を「能動的情報システム」としているのだろう。
情報ニーズの概念の最も中心的な部分は,上記のようにドキュメントの適合性基準に関わるが,それ以上のことも含まれる。情報ニーズの研究では,公式および非公式のコミュニケーション,科学会議,専門誌,図書館,データベースなど,情報源と情報チャネルの適合性がしばしば考慮される。私は,この概念の最も中心的な部分は情報に関する適合性基準であると主張するが,情報/ドキュメントへのアクセスを仲介するさまざまな情報チャネルに関する適合性基準も含めよう。情報ニーズの概念をこのように拡張することは望ましい。なぜなら,これは情報専門家にとって最も中心的なものの拡張になるからである。