2017-11-25

『情報リテラシーのための図書館ー日本の教育制度と図書館の改革』(続報)



『情報リテラシーのための図書館ー日本の教育制度と図書館の改革』(みすず書房)が刊行される。11月24日に見本刷りが出て、本日入手した。左はたぶんネットで最初に公開する表紙の写真である。



 12月1日発行となっていて、店頭には12月2日頃に並ぶ予定だ。すでにamazonでも予告されている。TRCの新刊急行ベルにも入っていると聞いた。


本書は私がこれまで出してきた図書館情報学本あるいは図書館本と共通のテーマを持ちながらも違っている点がいくつかある。

第1に、タイトルに情報リテラシーを掲げている点である。関係者には周知のように、日本で使われる情報リテラシーは国際的な用語としてのinformation literacyとかなり違っている。日本的な情報リテラシー理解は、ICTのシステム操作スキルを中心にとらえているのに対して、国際的な理解では情報コンテンツへのアクセスを中心にとらえるものである。この本は国際的な理解を積極的に採用し、それに基づいて情報リテラシーを論じている。国際的な理解はもともとACRLというアメリカの大学図書館関係団体での議論が中心だったものである。それ自体が現在揺れているところはあり、両者の理解は相互に近づいていてメディア情報リテラシーと呼ばれることもある。また、近年、市民リテラシーとか高次リテラシーなどと呼ばれるようになっているあたりの事情についても触れた。

第2に、情報コンテンツへのアクセスを教育改革の課題と関わらせて論じたことである。これは2020年の大学入試改革や学習指導要領改訂の課題と密接に関わっている。それは大きく言えば、学校教育における「知の解放」である。東アジア的な「習得型学習」「詰め込み教育」は学力向上あるいは学力保持の決め手と考えている人もまだいるが、文科省も含めてすでに舵は切られていて、新しいタイプの学習方法を取り入れそれを評価する方向に進み始めている。その際に、情報コンテンツを自在に使いこなす学習者の育成が重要なテーマとなる。こうした教育改革の課題自体を論じている。

第3に、実はこの教育改革が、戦後改革どころか明治維新に遡ってとらえるべき歴史的改革でもあることを論じている。本書の第4章では歴史的に遡り、江戸期の教育がきわめて自由奔放で効果的であったことを取り上げた。第5章では、それが明治以降の「上からの近代化」を国是としたことで、教育の目的も方法も限定され、情報コンテンツへのアクセスが著しく制限されたことを述べている。図書館の整備よりも学校教育が優先されてきたことを批判的にとらえる視点を強調している。

第4に、図書館改革については職員問題を中心に論じている。戦後改革において図書館の位置づけが中途半端だったことにより、司書も司書教諭も専門職としてきわめて不完全なままに大学での養成が行われてきた。さらに、近年、学校司書という新しい資格が加わることになった。教育改革における「知の解放」の決め手が情報リテラシーにあるとしたら、それを推進できる専門的なライブラリアンの存在は欠かせない。そのことを6章、7章で論じた。


以上のことをご理解いただくために本書の本文の一部をここに示すことにしたい。
お見せするのは、次の項目からなる「本文見本」である。
「はじめに」
「目次」
「引用/参照文献一覧」
「索引」

根本彰『情報リテラシーのための図書館ー日本の教育制度と図書館の改革』(みすず書房 2017年12月刊)

どうぞ手にとってご覧いただければ幸いである。




2017-10-27

「書籍のナショナルアーカイブ」の研究会報告

昨晩、表記の研究会を三田キャンパスで開催した。著作権法の第一人者松田政行弁護士をお呼びして、最近の著作権法と著作物の利用の問題について伺った。

================================

慶應義塾大学文学研究科・三田図書館・情報学会共催 公開研究会

「書籍のナショナルアーカイブについて考える」

日時:20171026日(木)午後630分〜830分(開場:午後6時10分)
場所:慶應義塾大学三田キャンパス 南校舎 475教室
参加:無料。事前申込み制

開催の趣旨:
 2016年に、Google Books裁判がGoogle社側の勝訴をもって終了した。英語書籍の電子化とそれに対する検索サービス提供が米国著作権法におけるフェアユースの範囲にあることが法的に認定され、同社は今後とも電子書籍流通の重要な担い手であり続けることになった。他方、この間にわが国では「長尾構想」を基に著作権法を改正し、国立国会図書館に著作物のデジタルコレクションをつくることによって、その一部をインターネット公開したり全国の図書館に送信可能にしたりするための制度的基盤がつくられている。
 これらの事態がもつ意味、そして今後の書籍流通あるいは図書館の在り方に与える影響について、『Google Books裁判資料の分析とその評価:ナショナルアーカイブはどう創られるか』(商事法務, 2016)の著者である松田政行弁護士をお招きして一緒に考えてみたい。

  <プログラム>
司会:松本直樹(慶應義塾大学文学部准教授)

630分〜650分 講師紹介と最近の状況についてのまとめ
 根本 彰(慶應義塾大学文学部教授)

650分〜750分 講演「電子書籍流通のための情報基盤書籍のナショナルアーカイブをめぐって」松田政行氏(弁護士、森・濱田松本法律事務所シニアカウンセル)

750分〜830分 議論 
================================


この間の経緯、背景、考え方についてはまた報告する機会をつくるつもりだが、これを開催するきっかけは、松田政行編著・増田雅史著『Google Books裁判資料の分析とその評価:ナショナルアーカイブはどう創られるか』(商事法務, 2016)という本をたまたま手にとったことにある。この本の重要性については、『日本図書館情報学会誌』のvol.63, no.3(Sep 2017)に書評として掲載してもらったのでそちらを参照されたい。

要約すると、2005年のGoogle Books裁判以降の動きを追うことによって、Googleのビジネス戦略とそれがアメリカの連邦レベルの司法によって修正されながらも認定される過程を描いている。またそれが「書籍のナショナルアーカイブ」をつくることにあたると述べている。そして、Google一社が英語圏の書籍アーカイブを手中に納めているのに対して、日本国政府は(いつの間にか)国立国会図書館がこれをつくることを可能にする著作権法改正を行ったという。

昨夜のお話しは、その後の動きについて触れる場面もあって、今、これがリアルタイムで動いていることを肌で感じるものだった。ヒントとしては、一つは内閣府知的財産戦略推進事務局が「デジタル・アーカイブジャパン推進委員会」で検討している「デジタルアーカイブに関する取り組みについて」という報告にある。国の機関が実施しているデジタルアーカイブのプロジェクトに対して、横断的に検索をかける「ジャパンサーチ」という検索の窓口を国立国会図書館が中心になって立ち上げることが想定されている。

もう一つは、アメリカ著作権法の重要な要素としてフェアユースと言う考え方があるが、それを日本でも導入しようというもので、「権利制限規定の柔軟性」と呼ばれて現在準備中ということである。詳しくは、文化審議会著作権分科会につくられた作業部会の報告書「著作権法における権利制限規定の柔軟性が及ぼす効果と影響等について」に出ている。もしこれが実現すると、日本でもデジタル化とそれに対する検索データベースの作成が許諾なしで可能になり、Google Booksと類似のサービスが民間事業者によって実施されることもありうるということだ。

これら二つの動きは密接にリンクしている。私も、この問題に首を突っ込んでいろいろ調べてみて、最初の長尾構想(国立国会図書館がデジタル化を行い、図書館や民間の「電子出版物流通センター」がデジタルデータの提供や流通を担う分担方式)とは少し異なったかたちで国が動き始めていることに気づくようになった。しかし、10年前、Google Book Searchのときにはあんなに大騒ぎしたのに、今回は表面下で人知れず進んでいる。こうした事情の全体像を理解することがたいへんなことはあるが、もう一つはさまざまな利権がからんでいるためにマスメディアが報道を控えているのだろう。彼らも利害関係者であるからだ。

ともかく、以上のことをここに書いておくことで今後の考察のスタートとしよう。これは、これまで紙ベースで動いていたものが、デジタルネットワークに移行するという大きな転換点に私たちが今いることを示している。そして、一方でGoogle一社で書籍のデジタルアーカイブを運用することの危険性を意識するべきであるが、他方、日本でも、これが誰の手でどのようにつくられるのかということについて私たちは関心を持ち続ける必要がある。

2017-10-22

「図書館での文庫本の貸出」について

10月13日の全国図書館大会第21分科会「出版と図書館」については、当事者でもあるので発言しておきたい。

このとき、みすず書房持谷寿夫氏、文藝春秋松井清人氏、岩波書店岡本厚氏とともに登壇した。資料としては、http://jla-conf.info/103th_tokyo/index.php/subcommittee/section21のページに原稿があるのでご覧いただきたい。この資料は、大会の前にここにアップされており、前日12日の朝日新聞東京版の朝刊社会面(日経が夕刊)にこれを紹介する記事が出た。朝日の記事は「文庫本「図書館貸し出し中止を」 文芸春秋社長が要請へ」というものである。これをきっかけにして、マスメディアでの取材の事前申込みがあったといい、行ってみるとNHKとTBSのカメラが入り、他に数社の新聞社から記者が来ているのが分かった。

当日のNHK総合の午後7時と11時のニュースで放映され、TBSニュースでも放映された。新聞も、東京新聞、読売新聞、毎日新聞で記事になっているのを確認している。このなかでは、NHKが、この分科会の紹介だけでなくて、図書館での取材も行った上でニュースとして報道したのが目に付いた。いずれの報道も松井氏の発言を中心に、出版不況で本の売れ行きが落ちているなかで、文芸書出版社が文庫本の提供制限を図書館員に説いたという論調だった。

このとき私は基本的に出版界と図書館界とをつなげ両立を模索する方向の発言が求められていると考えそのように述べた。このときは、「遅延的文化作用」という言葉を使って、図書館は出版社の市場を奪うような書籍の提供の仕方はしていないはずだと強調した。

ただ、そのことからすると松井氏の発言は意外な側面をもっていたことも事実だ。文芸書を出す出版社にとって、文庫本は初期の単行書を十分に売り切った後に出す廉価版であり、あまり採算は問題にしていないと考えていたのに、それが重要な収益源だというからだ。図書館の遅延的作用が出版社の販売戦略とぶつかっているように見えるわけで、従来とは構図が変化してきている。それだけ、出版は追い詰められているのだろう。また、それに寄り掛かって文庫本をたくさん提供している図書館があるとすれば、それはそれで危機を共有していることになる。

松井氏の発言のなかで印象的だったのは、「本を借りるのではなく買う習慣をもってほしい」と繰り返していた点である。私はこれで、彼の真意が理解できた。もともと日本人にとっては本は買うものであったから、買うのではなく借りる人が増えているとすれば、図書館が借りる習慣をつくりだしたからだ。だから、私が出版界と図書館界の協調をと発言した部分について、彼は出版流通における公と私の境を少し前のものに戻して、借りると買うとの境界の見直しに協力してほしいと具体的にコメントしたのだ。これは、出版社の経済行為としての出版活動なしで図書館の資料提供は成り立たないから、まず出版社の経営の安定に協力してほしいということだ。これはこれでそこにいた人たちに訴える力はあったと思う。その場でアンケート調査が行われたがそこでは、松井氏に反発する発言はあまりなかったようだ。

けれども、ちょっと意地の悪い見方をすると、今回の件はニュースがどのように構築されるのかを知るのによい体験だった。そもそも、分科会の前日に朝日と日経がリーク的な報道をしている。そして、多くのメディアが入り、報道をした。松井氏は開口一番、前日あった新聞報道は自分の本意とすることを伝えていないと発言した。しかしながら、実際の話はやはり文庫本を図書館では積極的に提供するのを控えてほしいという内容だった。ただし、朝日の報道では「貸出中止」とあったが、そのときの発言はそこまで踏み込んだ強い要請ではなかったと思う。

マスメディア(ここには当然出版社も新聞社も含まれる)によって「出版社 vs. 図書館」という構図がつくられて耳目を集めた。私には、2年前の新潮社社長佐藤隆信氏の「貸出猶予」の発言と同様に、松井氏が集まった図書館員を相手にあえて悪ぶってみせることによって、多数のメディアを呼び寄せ、文芸書出版の危機とそれを救うための手立てを世間に訴えたように見えた。図書館大会の場はその出汁に使われているのだ。

SNSでは松井氏の発言に対する批判が強いようだが、それは物事の表面だけをみた判断だ。それだけ出版界は追い込まれていてなりふり構っていられない部分があるのだ。真の問題は、特定ジャンルの出版社の危機というより書籍文化全体の危機がある点だろう。読み手が減っているのは、少子高齢化が大きな原因である。活字世代がそのまま歳をとっていて、文庫本の買い手もその図書館での借り手も中高年層が中心である。彼らの一部が借りることをやめて買うことにしたところで、それほど大きな影響はないだろう。だが問題なのは、次の世代の読み手が十分に育つことを妨げている状況がある点である。読書推進を唱えても読むのはせいぜい小学生までで、それ以上の世代に読む習慣が必ずしもできていないことが最大の問題ではないのか。今の中高年の後の世代が買い手であると同時に借り手でもある読者に育つのかどうかが問われている。

分科会では、児童書出版と図書館の関係が一つのよきモデルだと発言しておいた。図書館では児童書を複本で提供するのは当たり前のように行われているが、そのことを出版社や児童作家が批判したりすることはない。図書館が読者を育成し本の買い手を生み出し、それが次の世代の読者に引き継がれている。だが、児童書が売れ借りられ、読まれても、それがそのまま継続して大人の書籍の読み手になるまで導くものになっているのかといえばなってはいないことが問題なのである。

ともかく今回の分科会への参加は私にとって、出版と図書館の関係を考えるだけでなく、メディアの在り方を考えるのにもよい機会になった。だが、図書館という領域がこのように注目され取り上げられる存在になったのだということも事実であった。そのことについてもまた考えてみたい。



『情報リテラシーのための図書館ー教育制度と図書館の改革』

現在、表記の書籍を出版する準備中で11月下旬に出版予定です。
図書館大会の分科会でも配布させていただきました。


小田の能舞台


これまで小田のことを書く機会があまりなかったが、今回はNPO法人華の幹(はなのき)であった能舞台のイベントについて書くことにしたい。ここは、主催者である飯塚洋子さんが、人が住まなくなった古民家をボランティアの人たちの力を結集して再生し、地域の活性化の拠点として活動している場所だ。これまでも何度かお邪魔したことがあるのだが、9月30日の晩、年に1度のイベントとしてここ4年間行われている本物の能公演を見に行った。

能の鑑賞は中学生のとき以来だと思う。広い庭にござを敷いて、そこに座って能舞台を見る。幸い天気はよく暖かい夕べなのだが、徐々に冷えてくるので途中の休憩のときに上着を取りに帰ったくらいだ。ボランティアによる手作りだという能の舞台を初めて見たが立派なものだった。会場はざっとの見積もりで200人以上は集めていてなかなかの盛況だった。

第1部はここで開催されている月に1度の能教室参加者の成果を見せるものだった。小さな女の子がかわいい通る声で謡いをしていて写真を撮る人が多かった。(第1部だけは撮影可)腹の底から声を出すトレーニングは確かに身体によさそうだし、本当に声が出るようになれば気持ちよかろう。

次にプロの芸だが、5歳の頃からやっているという現役の大学1年生の三味線弾きが素晴らしいパフォーマンスを見せてくれた。その後は、観世流の高梨良一さんが仕手を務める舞台だ。声が朗々として通るのはさすがだったし、能役者が腰を落として地面に垂直と水平に動く様をじっくり堪能させてもらった。メインイベントは橋弁慶というお題で、例の牛若丸と弁慶の話しだ。ただ都を荒らすのが弁慶でなく牛若丸になっている。高梨さんの説明によると、それはじっとしていられない子役に動きを与えるためだという。牛若を演じたのが能教室に通って4年目の中学生だそうで、しっかりと舞っていた。

他にも衣裳を着せるところを見せて、伝統芸能をじっくり理解してもらおうという工夫がいろいろとあって楽しかった。司会はプロの人だと思うがなかなか上手で、話しがくどくなっている高梨氏から話しをうまく引き出そうとしていた。ただ、橋弁慶のストーリーを司会者がながながと語るところは余計なように思われた。よく知られている話しだから、あのような長い語りは聞いていていらいらするし、能を純粋に鑑賞するのの邪魔になるようにも聞こえた。

それにしても、4時間の長時間の舞台をたくさんのお年寄りがじっと飽きずに鑑賞しているのには驚かされた。高梨氏の話ぶりもそうだったが、年をとると時間がゆっくり流れていて、あまりいらいらしなくなるのかもしれない。小田は、もともと中世には地方豪族の小田氏の居城があったところで、今、その城跡が再現されつつあるところだ。そういう場所で開催される能舞台であったが、そこで流れる時間に同期できない私はまったく修行ができていないと反省させられた。

2017-09-02

磐梯山の思い出・立体地図の楽しみ

小学校の夏休みの思い出の一つに裏磐梯でのキャンプがある。福島県いわき市(1966年までは平市)で小学校時代を送ったが、夏になると中学校教師をしていた父が指導していたブラスバンド部の夏合宿に家族を連れて行ってくれた。キャンプ場は決まって同じ県内の裏磐梯桧原湖に面した岬バンガローであった。今はもうないが、この夏に裏磐梯に車で行ったら行き先案内の目印にこのキャンプ場の名前が残されていて、懐かしい気がした。

裏磐梯は会津磐梯山の北側に当たり、磐梯高原とも呼ばれている。久しぶりに訪れたら、高原型リゾートとして大手の資本も入り開発されていたが、ところどこに昔の面影が残っていて興味深かった。なによりも自然の景観はそのままで嬉しかった。たとえば、五色沼という沼がある。蔵王の五色沼は一つの沼で時間帯や見る角度によって色が変わるのでこう呼ばれるが、ここの五色沼は複数の連続した沼がそれぞれに微妙に色を変えて並んでいる。小一時間のハイキングコースだが、緑の木々のあいだに緑や青の水面が見えて気持ちのよい散歩道になっている。これは昔とまったく変わらない。

五色沼の一つ瑠璃沼(写真)
青沼(写真)

ここにある湖沼群は、1888年(明治21年)に磐梯山の噴火があり、その際に川が堰き止められてできたものだ。写真の後ろに山が見えるが、雲に隠れてよく見えない右側の峰が大磐梯で左側は櫛ヶ峰と呼ばれる。実はこの峰の間に小磐梯(こばんだい)という峰があったのだが、それが水蒸気爆発と呼ばれる噴火をきっかけにして山崩れを起こして、麓では多数の死者が出る大災害となった。山体がなくなる噴火は珍しく、当時、国内はもとより世界的に報じられたことは、北原糸子『磐梯山噴火:災異から災害の科学へ』に詳しく紹介されている。

残された噴火口付近には、赤い色をした岩の間に銅沼(あかぬま)と呼ばれる酸化鉄を含む赤い水が溜まり、まわりにところどころ噴気が出ていて不気味な感じだった。ところが、その水が流れて込む五色沼は青系統の色となっている。不思議なのだが、土に含まれている鉄分は赤みをもつが、アルミニウムや珪素が化合した成分は青色をもたらすそうだ。これらの色は山体に含まれている金属成分によって表現され、普通なら別の化学反応を起こして目立たないものが、爆発によってそのまま地表面に出てきたことによりもたらされたものであるらしい。

子どもの頃から、磐梯山が表側からみると会津富士などと呼ばれ優美な形をしているのに、その裏側のキャンプ場からみる磐梯山の山体が二つの峰から成り、その間に噴火口があることに何となく不思議な感じをもっていた。

猪苗代湖上空から見た磐梯山(写真)

しかしながら、最近、3Dの地図表現が可能になったことで、表と裏の見え方の違いが直感的にわかるだけでなく地形図と対比できるようになってきた。次の図は、国土地理院がネットで提供している地形図で、磐梯山の山頂付近を切り取って示している。磐梯山(大磐梯)と櫛ヶ峰が並んでいることが分かるだろう。また、南側にはもう一つ赤埴山(あかはにやま)というピークがあることも分かる。今は磐梯山はこれら3つのピークから成り立っている。+の記号があるあたりに小磐梯があったと思われ、この付近で爆発があって山体ごと崩れて爆裂火口ができている様が分かる。「中ノ湯」と書かれた右手に沼があるが、これが銅沼である。

これを今は3Dで表示できるようになっている。まず、次が北側から見たところである。ほぼ五色沼付近から見た景観と一致している。大磐梯と櫛ヶ峰が並んでいる。私が見慣れた景観だ。
 
 それに対して同じ地図を反対の猪苗代湖側から3Dで表現したのが次の図である。上の猪苗代湖上空から見た磐梯山の写真とほぼ同じ角度から見たものに相当する。真上からの地形図と比較しながらよく見ると3つのピークがあることが分かる。一番高いのが左側の大磐梯であり真ん中が赤埴山、そして右が櫛ヶ峰である。標高は赤埴山が一番低いはずだが、手前にあり下から見上げる角度になるので櫛ヶ峰より高く見えるのだ。また、裏から見るとピークが二つに分かれるが、表からは大磐梯が中心で他の二つのピークははっきりしないことも分かる。3Dで見ると遠近法と山の重なりで見え方が違ってくることが分かるのだ。


同じ地形図からこのように立体的に地形を見せることができる。地図の表現技術はすごいものになっている。昔、山好き、地図好き少年だった頃の思い出に耽りながら新しいものの可能性を感じた。

今はつくばにある国土地理院が常時、全国の測量データや航空写真によるデータを集めながら、それを表現する情報技術を駆使して提供してくれている。私たちはそれをネット上で気軽に利用できるようになっている。ありがたい。

いずれ国土地理院に付設された地図と測量の科学館についても書くことにしたい。

<参考> 

北原糸子『磐梯山噴火:災異から災害の科学へ』吉川弘文館 1998

<追記>
小磐梯がどのように見えたかについての記事をネット上で探して、次のものを見つけた。2番目の米地文夫氏の論文が求めているものだった。この論文のなかで、大塚専一「磐梯山噴火調査報告」(1890)に掲載された図が小磐梯の山容を示していることが紹介されているので、ここに再掲しておく。このうち左から2番目のピークが小磐梯である。こうしたものに基づき米地氏は噴火前の磐梯山の模型までつくっている。



米地文夫『磐梯山爆発』 (シリーズ日本の歴史災害) 古今書院 2006

米地文夫「絵画資料の分析による小磐梯山山頂の旧形と1888年噴火経過の再検討」
東北地理 Vol.41(1989)PP.133~147
https://www.jstage.jst.go.jp/article/tga1948/41/3/41_3_133/_pdf

ブラタモリ 2016年7月16日放送 会津磐梯山は宝の山?

磐梯山噴火と小磐梯推測図 livedoor blog

2017-08-15

日本で刊行された書籍のGoogle Books対応について

 8月2日にアマゾンに、ヴァイディアナサン『グーグル化の見えざる代償:ウェブ・知識・書籍・記憶の変容』(インプレス, 2012)という本の簡単な評を書いた。それは、次のものである。

=========================
Googleは、短期的な情報やデータをやりとりするメディアとしてはきわめてすぐれているが、米国社会が長期的に蓄積してきた出版や大学、図書館のような知識の制度を企業ベースの論理で扱うことによりそれらを破壊する可能性があるという。Googleブックス裁判のありようによっては、Googleは「知」の世界をコントロール可能であり、できて20年に満たない企業にそんな覇権をとらせることは危険だという主張である。

実際に、2016年4月の連邦最高裁の決定でGoogleの勝利が確定した。本書が今品切れになっているのは裁判途中の議論を前提にしているせいなのかもしれない。だが、その事実さえ何らかの力が働いているのではないかと思われるくらい、迫真性をもった記述になっている。

========================= 

Google Books裁判は全世界が固唾をのんで見守っていたものだが、結局、Google側の勝利で終わった。アメリカの連邦著作権法が前提とするフェアユースの考え方は、著作物の自由な流通が最終的には著作権者の権利保障につながることを前提にしている。情報流通のインフラ整備は、図書館での閲覧・貸出や複写物提供などと同様にフェアユースの範囲にあるものであり、Google Booksもまた著作者の許諾なしに複製して全文検索可能にすることは著作物の流通につながることを裁判所で認定した。

ただインフラ開発は鉄道がそうであり、鉄鋼業がそうであり、石油掘削がそうであったように、常に資本の独占という問題と関わっている。まして、情報や知識を流通させる仕組みが単一の企業によってコントロールされる状況をつくるのでよいのか、というのが本書のテーマであった。

この問題については、さまざまな角度から検討することができる。評でも触れたように、この本の原書は2011年に出ていて、その後に裁判が確定したから、本書で警告されていることは実際に起こっている可能性がある。また日本への影響は別に検討しなければならない。

ここでは、日本で刊行された書籍に対して、Google Booksがどのような影響をもっているのかについて書いておきたい。訴訟の過程で和解案が提示されたが、そのなかでは当初すべての書籍が対象だったのが、英語圏の4カ国で刊行されたものに絞られることになったために、日本で刊行された書籍はその対象になっていない。その後、この和解案は連邦地裁で棄却されたことにより、和解不成立になった。とはいえ、2011年の新和解案以降は、Googleは米国、英国、カナダ、オーストラリアで刊行されたものを対象としたビジネスモデルを選択したために、日本で刊行されたものは基本的に対象になっていない。

しかしながらそれで安心することはできない。というのは、当初は全世界の書籍を検索対象にするプロジェクトとして開始され、その時点では日本で刊行された書籍も対象になっていたからである。その当時テキスト化されて検索可能になった書籍は今でもGoogle Booksで利用可能になっている。

それを筆者が関わった書籍で見ておこう。まず、私の名前で検索すると筆者が関わった本が8冊登録されていることがわかる。
いずれも日本の出版社から出た本であり、一番古いものは1998年で新しいものは2015年である。だが、私が関わった出版物はほかにもあるから、なぜこれらのものだけが登録されているのかはわからない。

そのなかで全文が検索可能になっているものが2冊ある。「スニペット表示」という表記がある『文献世界の構造』と『情報基盤としての図書館』である。2009年までは全世界対象だったわけだから、これらのなかでは『続・情報基盤としての図書館』も全文検索の対象になっていてもよさそうなものだが、そうなっていないようだ。

このなかで 『文献世界の構造:書誌コントロール論序説』という本をみておく。この本は1998年に勁草書房から刊行された。まず次のカバー付き表紙の画像と書誌事項が表示される。白く光っているのはこの本がもともとビニールカバー付きだったことを示しているのだが、だから図書館の蔵書とは思えず、どこか別のところで撮影されたものらしい。

下のほうに、詳しい書誌事項が表示されている。
これでわかるのは、2010年6月にデジタル化され、「書籍の提供元」がカリフォルニア大学だということである。このプロジェクトに全米の主要な大学図書館が関わっていたことが公表されている。カリフォルニア大学はキャンパスが複数あるので、そのなかのどこの蔵書なのかはこれだけではわからない。

肝心の全文テキストだが、「スニペット表示」であり、一部しか見えない。見るための手がかりとしては「目次」と「多く使われている語句」がある


目次はごく一部にすぎないし、ここからリンクが貼られているわけでもなく、あまり役にたたない。多く使われている語句は出現頻度等の解析をおこなって重要度の高いものはフォントの大きさが変えられている。このなかで、「書誌コントロール」の用語をクリックしてみる。


となる。これも、この用語の使われている例の一部にすぎず、その前後の文章が表示されているというものだ。文脈付きで重要な用語が検索可能であるのは、当該の書籍がどのような内容なのかを知るのには役に立つ。だから、これらは本書のテキスト提供するためのものではなくて、あくまでも例示にすぎない。

以上のことから確認できるのは、Google Books裁判の途中の段階(おそらくは新和解案が出されてGoogle自体の方針が確定された時期)まで、米国の大学図書館の協力が得られた日本語の書籍の一部がスキャンされ、さらにテキスト変換されたということだ。私の当該書がその対象になっている。また、一連の作業によっておそらくは全文がテキスト化されたらしいこと、また、そこから索引化(キーワードの切り出し)が行われたことが分かる。

テキスト変換の精度はある程度高いとは言えるが、細かいところではミスが見られる。句読点や引用符、大文字・小文字の使い分け、小文字の読み取りなどに問題があるようだ。とくに、この本で扱っている書誌コントロール論で重要な貢献をしたJesse H. Sheraという人の名前は、本書では[シェラ」と表記しているが、この名前で検索できない。なぜかと思っていろいろとやってみると「シエラ」と表示されていた。これは単純な変換ミスであるが、日本語OCR技術はこのレベルなのだろう。

そもそも、アルファベットと数字を中心とする記号しかない言語圏のものと、漢字を使用している言語圏のものとでは読み取りの条件がまったく違う。その意味で、簡体字に切り替えた中国も、全面ハングル使用に切り替えた韓国も、日本語の複雑な文字使用環境と比べればだいぶ異なる。

それから、索引については、「多く使われている語句」を見ればわかるように、重要な用語についての切り出しは一定程度成功しているように見えるのだが、他方、文節の語尾やつなぎの言葉、日常用語などでかなり冗長な切り出しが行われていることも確かなようだ。これもワード単位で空白が入る言語とそうでない言語では条件が違っている。

もちろん、シソーラスのような語彙統制の仕組みは使われていない。 そもそもGoogle Booksのプロジェクト自体が日本の出版物には必ずしも適用しにくい面をもっているわけである。


 Googleがしているのは、図書館と協定して書籍を借り出し、これをスキャナーで画像化し、それをテキスト化ソフトにかけて全文をとりだして、索引化してデータベースに蓄積することである。Googleはネット上にある情報をすべて索引化して検索システムで提供しているのだが、これに加えて紙の書籍をデジタル化して同じようにネット上で検索することができるようにしたというのは、日本語の本についてもある程度あてはまるようなのだ。これが著作権法違反だとして訴訟になったのだが、Googleがこの作業をする際に図書館が協力していた。このことは記憶しておいてよい。

この本がこのように全文検索の対象になっていることについて、著者としてどう考えるかということであるが、なかなか複雑な心境である。すでに出てから20年近くになる本だし、本文中のキーワードで検索が可能になれば、今まで以上に読者が増える可能性があると喜んでもよいのかもしれない。しかし、このような不完全な技術のままで全文検索が可能だといわれても困る。自分が書いたものの全文が解析の対象になっているということそのものが、何となく頭の中を探られいじられている感じがするのも否定しがたい。

この本がここにあることについて、Googleに置かないように連絡したらスニペット表示をしないようにはできるだろう。著作権をもつ著者にできるのはこのように表示しないように要求すること(オプトアウトという)だけである。公開された書籍を加工して作成したこのような全文テキストとその索引ファイルについて、削除することを要求する権利はないとされている。

先ほどのインフラについての資本の独占という問題だが、これについて個人情報と結びついたビッグデータの問題点について議論が行われている。だが、それに加えて、書籍に含まれる「知」の独占的なコントロールもまたもう一つの問題だろう。書籍のテキスト化と索引化について、著作者の著作権および人格権との関係でさまざまな操作が可能になる。それらが相互にリンクされたときに、単に知の便利なツールができるのか、それとも、それが一人歩きする「世界頭脳」(H. G. ウェルズ)ができるのか。

*なお、この問題はこの秋に何度か取り上げる予定にしています。
 


 









なぜこの本を翻訳したのか:生成AIと図書館(2)

 マーティン・フリッケ著『人工知能とライブラリアンシップ』を1ヶ月で翻訳した。できた訳稿は全部で40万字,大判で400ページ近くある大きな本になった。かつてなら1年くらいかけないとできないようなものが短期間でできたのは,AIの力を借りたことが大きい。翻訳ソフトの能力が各段にアップ...