2024-12-03

知のオープン化と NDLの役割(1)ーオープンサイエンスのための図書館

 本年の図書館総合展の企画の一つで,「オープンサイエンスを社会につなぐために―国立国会図書館の取組を踏まえて」(11月6日午後1時〜2時半)に参加したときのことを書いておこう。公式のものは別に出るが,十分に時間がなくてお話しできなかったことも含めて,ここでは私自身がこれにどう取り組み,そう発言したのか,さらにそれをどう考えているのかについて書いておこう。

使用したスライドはhttps://www.ndl.go.jp/jp/event/events/forum03-1.pdfとしてオープン化されている。

また,講演自体はすでにYouTubeで映像が公開されている。そこにもスクリプトもついているが,ここではそれとは少し変えて,作成したスライドに改めてキャプションをつけるという方法で書くことにしたい。したがって,スライド,映像(すでにYoutubeにて公開済み),講演要約(いずれ『国立国会図書館月報』に掲載予定)に加えて4番目のテキストになる。


知のオープン化の事例


講演タイトル


ここ数年,図書館情報学において「知」ないし「知識」をどのように位置付けているのかに関心をもってきた。よく,図書館は知というコンテンツ(内容)を含んだコンテナ(容れ物)である書物(あるいは資料)を収集蓄積した「知の宝庫」であるという言い方がされる。ところが,資料がデジタル化,ネットワーク化された場合,コンテンツとコンテナの区別は曖昧になる。そればかりか,電子図書館はどこにいてもアクセス可能である。となると,すべての書物,あるいは資料がデジタル化,ネットワーク化された電子図書館が出現するのが理想ということになる。知のオープン化に向けての歩みが進んでいるように見える。

しかしながら現実には,そのように進んでいるわけでない。それにはいくつかの理由がある。それが実現するためには,①著作権の壁や②デジタル化やネットワーク化のための費用負担,③実現するための高い技術開発が主たるハードルである。それ以外にも,こうしたシステムができたからといってそれが「知の宝庫」と言えるかというもっと原理的な問題にも答えなければならないが,ここではそれは措いておく。ともかく,ここでは日本では国立国会図書館(以下NDLとする)がそれに果敢に取り組んでいる唯一の機関であることについて述べておくことにする。




最初に,今取り組んでいる二つのプロジェクトがいずれも知のオープン化の動きと密接な関係をもっていることについて触れた。一つはこのスライドにある「知識組織論研究会(KO研)」である。これは,年に4回,オンライン会議ツールで議論する場を提供するものだが,そこでは,ヨーロッパ中心に展開されている同名の学会(ISKO)が提供しているオープンドキュメントの「知識組織論事典(IEKO)」を読解することで進めようとしている。この動きについては,本ブログの別項目で触れているので参照されたい。

事典編集そのものが知識組織化の重要な営為であることは言うまでもない。現在もオープンで自由参加の百科事典Wikipediaが多くの人たちにとって重要な情報源になっている。専門事典でよく知られたオープンドキュメントとしては,1995年からスタンフォード大学を拠点に開設されている哲学百科事典のStanford Encyclopedia of Philosophyがある。Wikipediaがコンテンツ作成もオープンになっているのと比べるとこちらは,編集委員会による厳密な編集方針の下に執筆編集が行われているところが異なる。Wikipediaに「インターネット百科事典」という項目があり,そこにはネット上にオープンになったものを含めて多くの百科事典,専門事典が紹介されている。英語版Wikipediaにはさらに多くのものが紹介されている。

KO研は伝統的な図書館情報学や知識組織論の理論や手法を学ぼうとするが,同時に,こうしたオープン化の動きにも目を向けようとしている。同じくオープンドキュメントの考え方が示されているものとして次のものがある。



これについても,本ブログで紹介している。アリゾナ大学名誉教授のマーティン・フリッケ氏の著作Artificial Intelligence and Librarianship: A Note for Teaching, 2nd ed.の日本語訳である。いずれもCC BY 4.0というライセンスの下でオープン化している。これは,本書の制作に関わるクレジット表記を残しておけば,これを複製したり,改変したり,再配布したりすることは自由ということを意味する。

原著者がなぜこのようなライセンスを選んだのか詳しいことは分からないが,筆者も含めてすでに第一線からリタイアする年齢になったときには,今後の斯界の発展に貢献できればよいという心理になることは理解できる。そう言えば,先ほどのIEKOの編集責任者であるコペンハーゲン大学のビアウア・ヤアラン氏はLIS,IS,KOの分野で多数の論文を書いている人だが,一冊の単著も公刊していない。この人のまとまった著作を読みたいという気がするが,今のところはそうした論文から選んで読むほかない。だが,彼がIEKOの編集を行い,そこに多数の新しい概説的な項目を書いているのを見ると,これらを読むことで彼の考え方を理解することができるのではないかと思われる。つまりこの人も知のオープン化を積極的に進めようとしているのである。

ユネスコのオープンサイエンスとは何か


さて,以上が序論的な内容でここから本論に入る。


オープンドキュメントという言葉を使ってきたが,全体のテーマはオープンサイエンスとなっている。またオープンアクセス(OA)やオープンデータなど類似の言葉がある。学術情報の世界でオープン化を問題にする議論の中心は電子ジャーナルのアクセスをめぐるものであり,特定の出版者や学会が寡占的に世界の学術論文流通を支配する状況が生じていることに対して,その対策としてゴールドOAやグリーンOAといった手法が提案されてきた。グリーンOAは著者自らがエンバーゴ期間後にオープン化するものであるのに対し,ゴールドOAは最初からオープン化された雑誌に登録料を払って投稿するものである。出版費用を誰がどのように負担するのかが問題になる。グリーンOAは雑誌の購読者が払うのに対して,ゴールドOAは著者が払うものである。その裏返しで,「ハゲタカジャーナル (predatory journal) 」などと呼ばれるメディアが出現し,オープンアクセスジャーナルを標榜しながら,査読レベルを下げて高額な掲載料を取る状況もある。

図書館にとっては,毎年の講読料がどんどん高額になることで,契約できずその結果アクセスできない雑誌が増えるという問題があり,紙のものならどんどん蓄積されるのにサブスクリプションの雑誌が利用できなくなる問題もある。そして知の世界が特定の出版者が所有するメディアの比重が大きくなる寡占化の問題をどのように考えるかが問われる。近代につくられた学術知の配布流通過程に異変が起きている。図書館は知の世界が良き知の獲得をめぐる競争原理によって支えられることを前提に成り立ち,それを支える学術情報流通システムの存在を前提として成立してきた。しかしながら,この状況はその延長に現れながら似て非なるるものであり,経済原理が学術知の評価システムを捻れさせている。

このことは図書館の立ち位置をも大きく変える可能性がある。これまで,知の質の保証に関わるものを挙げると,まず著者がいて,著者が所属する機関,所属して査読誌を出している学会があり,ときには学術論文を出している出版社があり,関連して,その知を媒介して外部に報知するジャーナリズムあった。さらには,知的生産物のメディアに識別子(ISBN,ISSN,DOI)を付与する機関や知の保存機関(図書館,文書館,博物館)の役割も重要だった。このうち,図書館はかつてから学術の世界を上流として,上から流し込まれる情報を下流の利用者に流すための仕組みにとどまらない機能をもってきた。選書や資料保存による蔵書構築,OPAC等による資料組織化,利用者の要望による調査方法の提示(レファレンスサービス)により,ダムのように水量調節をおこなってきた。この調節機能は,紙メディアがデジタルメディアに変貌するときに,図書館まで行かなければアクセスできなかったものが,どこからでもオンラインアクセスできれば各段に使い勝手が上がるから,単なる量的な調節に関わらない質的な影響を与えることになる。ここにAIが入るとさらに変化することになるが,その点はここでは論じない。

NDLは大規模な蔵書のデジタル化だけでなく,その深いレベルのメタデータ付与,全文テキスト検索機能を提供し,またWARPでのインターネット資料の収集,電子書籍や電子雑誌の収集(オンライン資料納入制度)を実施中である。これらは,知のアクセスに大きな影響を与えつつある。
 
図書館が大きくオープンサイエンスの動きに対して何が可能なのかを考察しておこう。最初に,ユネスコが2021年11月23日第41回ユネスコ総会採択で採択した「オープンサイエンスに関する勧告」(文部科学省訳)での議論を見ておこう。たとえば,その冒頭の部分で「オープンサイエンスは、科学コミュニティの間における科学的知識の共有の促進を助長するのみならず、伝統的に過小評価されてきた又は除外されてきた集団(女性、少数民族、先住民の学者、相対的に不利な国及び言語資源の乏しい国出身の学者等)の学問的な知識の吸収及び交流を促進し、並びに各国及び地域の間の科学の発展、基盤及び能力についてのアクセスの不平等を減らすことに貢献すべきであることを認め」とある部分は,図書館の課題と密接に関わる。つまり,これまでのサイエンスが科学コミュニティというマジョリティを中心に展開してきたことに対するアンチテーゼが主張されている。

これはユネスコという国際機関の特性上自然なことだろうが,ビッグサイエンスが主流の学術からするとオルタナティブな考え方ということになる。学術情報流通の考え方は,主要なジャーナルによって重要な情報が流通するから効率的な流通を目的とすることになる。ところが一旦ジャーナルによる流通が最善のものではないかもしれないという仮定の下にこれを見直すことが必要という立場に立てばそのあたりが変わってくる。次のオープンサイエンス知識の定義を見てみよう。

まずここには,知識の実体が「科学的出版物、研究データ、メタデータ、オープン教育資源、ソフトウェア並びにソース・コード及びハードウェア」とされてように,通常の学術論文よりもかなり広い範囲のものが含まれている。また,黄色でマーキングしたように,「開かれたアクセス」「パブリック・ドメイン」「オープンライセンス」,「無償」といった条件の下に,「全ての関係者(居所、国籍、人種、年齢、ジェンダー、収入、社会経済的事情、職業段階、学問分野、言語、宗教、障害、民族若しくは移住資格又は他の理由のいかんを問わない。)」に対して「直ちに又は可能な限り速やかに提供」することを挙げている。これはすべての人がサイエンスの担い手であることを宣言するものである。

図書館が知の生産者と知の利用者のあいだに立つ存在であるとされるが,すでにここには,知の流通においては生産者と利用者の区別は曖昧であり,生産者は利用者であるし,利用者は即生産者に転ずることが想定されている。そうした媒介的作用をもつ図書館のなかでも,NDLは特別な存在である。次にそれを見ておこう。



知のオープン化と NDLの役割(2)ーナショナルライブラリーの今後

NDLは(デジタル)コンテンツの専門機関

現行の国立国会図書館法(NDL法)の納本制度に関わる条項は次のスライドのとおりである。まず,古くからある納本制度は,同法の24条(国の機関),24条の2(地方公共団体の機関),25条(それ以外の者)によって当該の機関や者は,24条1項に列挙されている「出版物」を発行したら納入する義務がある。見てのとおり,図書から始まって多様な種類の資料が出版物として掲げられている。映画フィルムや蓄音機用レコードなどのオールドメディアがここに含まれている。第8号までは1948年にこの法律ができたときから対象になっていたものであり,第9号はいわゆるパッケージ系の電子出版物の納入規定で2000年から付け加わった。それに対して,同法25条の3により,国の機関および地方公共団体の機関のインターネット資料の収集が可能になっている。インターネット資料とはインターネットで公衆に利用可能な文字,音声,映像,プログラムとされている。通常は自動的な収集ソフトウェアによって取得される。民間のネットワーク系電子出版物(オンライン資料)も収集が可能になっている。

NDLが資料を閲覧に供したり,デジタル化して送信したりするには,著作権を制限する必要があるので,著作権法との関係も深い。とくに,インターネット資料やオンライン資料の収集はここ15年ほどのことであるが,これらを実施するためにはNDL法だけでなく,著作権法の改正も伴っていたので,その当たりについて見ておきたい。(法律の条項は現行のもの)

・2009年(平成21年)著作権法改正ーNDLでの資料の滅失を防いだり,絶版資料のデジタル送信するために資料のデジタル化を可能にした(著作権法31条6項)

・2009年(平成21年) NDL法,著作権法改正ーNDLが国,地方公共団体,独立行政法人等の提供するインターネット資料の収集を可能にした(NDL法25条の3,著作権法43条ほか)

・2012年(平成24年)著作権法改正ーNDL21年改正で認められたデジタル化された資料の一部を図書館に対して公衆送信を可能にした。(著作権法31条7項)

・2021年(令和3年)著作権法改正ー国立国会図書館による絶版資料等の登録利用者への送信(31条8項〜同条11項)

これらの措置は,国のデジタルトランスフォーメーション政策の一環にも位置付けられていたことが重要である。アメリカの著作権法においては,フェアユース(一定の条件の下で権利者の許諾なしに著作物使用が可能になるという考え方)の存在を前提にしていたことで,ICTの技術開発がしやすかったとされる。日本でも,「権利制限の一般規定(日本版フェアユース規定))が検討され,2018年(平成30年)著作権法改正により新設された法30条の4が導入され,47条の4,47条の5が新設された。この動きについてはブログで紹介している。(2022-12-08「Google Booksと同じような検索ツールは誰でもつくれる」)2021年法改正はこうした動きを受けてのものである。個人的には,2009年の31条6項がもっとも印象深い。NDLが入手した資料をすべてデジタル化することを可能とする規定だからである。

さて,こうした動きをどのように評価すべきだろうか。著作権を一部制限してデジタル化やデジタル資料の公衆送信を行うことはどのようにオープンサイエンスに近づくのだろうか。利用をパブリック・ドメインにおいたり,オープンライセンスを付与して利用しやすくすることは著作者や研究者などの発信者の役割であるのに対して,図書館は仲介者として,開かれたアクセスや直ちに又は可能な限り速やかに提供とか無償であることに貢献する。










かつては,こうした仲介者の役割はそれほど注目されなかったが,状況は大きく変化している。これは今まで述べたもの以外にも,デジタルアーカイブを横につなぐハブとなるJapan Searchの開発や先進的な知識工学的技術開発を行っているNDLラボなどの活動がある。国のデジタル化戦略に組み込まれていることは,たとえば,首相官邸に置かれた知的財産戦略本部が毎年出している『知的財産推進計画2024』では,NDLについて,「国立国会図書館は立法府に属する機関であるが、デジタルアーカイブに関する施策は国全体として取り組むものであり、同館は重要な役割を担っていることから、便宜上、本計画に関連する同館の事業について担当欄に記載するものである。」(p.64)と注記を入れて,何度も言及している。

この点で,NDLは(デジタル)コンテンツ保存・管理・発信のナショナルな専門機関としての役割を担う代表的な機関となっていることは明らかである。著作権を制限することで,知のオープン化に向けての仕掛けをすることに、国全体の合意が得られているのである。

別の観点から見ておくと,その陣容の大きさということがある。この点は図書館関係者はあまり口にしないが,スライドの<参考>にあるように,常勤職員の数が900人弱というのは,国内の大規模図書館のなかでもひときわ大きな存在である。このリストで横浜市や大阪市,東京大学は多数の地域館や部局図書館(室)を合わせての数である。また,文部科学省が外局や所轄機関を合わせて2000人程度の職員数であり,その半分くらいの規模があると考えてよい。こういう陣容の組織に,新しい時代のナショナルライブラリーの形を示してもらいたいと思うのは自然なことではないだろうか。










NDLのカバー範囲

次にオープンサイエンス知識の管理という図書館が貢献できる領域で,NDLがどのように位置付けられるのかについて見ておこう。次の図は縦軸にメディアのオープンネスの段階を4つに分け,横軸にはメディア発生の場と拡がりを4つに分けて示したものである。オープンネスは外部に対する公開の度合いであり,「クローズド」「グレイ」「パブリッシュ」「オープン」の4段階で示した。メディア発生の場と拡がりは,「プライベート」「コミュニティ・アソシエーション」「ナショナル」「インターナショナル」の4つである。これで,4×4=16のマトリックスができることになる。たとえば,「プライベート」なドキュメントとして,作家の書簡,日記,メモなどがあるが,通常は「クローズド」の形でつくられている。これが,何らかのかたちで「発見」され,研究対象になったりすれば「グレイ」の状態に置かれる。そして,それが公開すべきとなったときに,編集されたのちに著作集とか全集という形で「パブリッシュ」される。さらに,これがデジタル化されて「オープン」になる状態がある。「コミュニティ・アソシエーション」は中間段階の組織がもつドキュメントであり,「ナショナル」は国および国レベルでのドキュメントであり,「インターナショナル」は国を超えたレベルでのドキュメントでいずれも「クローズド」から「オープン」になる段階がある。











国立国会図書館の伝統的な守備範囲を見ると,本来納本制度は日本国内の「出版物」を対象としていたから,プライベートなものは除かれるとしても,国内出版のものはすべて含まれるはずである。その出版物の定義も映画フィルムやレコード盤,電子的・磁気的な記録物も含んだかなり広義のものだったが,ここでは主として文字を用いて知識を記録した「図書」「小冊子」「逐次刊行物」を考える。この図で網掛けで示したところは従来の納本制度がカバー範囲として想定してきた部分であり,「ナショナル」なレベルでの「パブリッシュ」されたものを中心としてきた。

なお,この図は大雑把なものしか示していない。「プライベート」なものでも「パブリッシュ」されれば納本対象になるはずだがそれらはここでは除かれている。これにインターネット資料やオンライン資料を含めて,現在の守備範囲は次のように示せるだろう。










納本資料の中心である「ナショナル」×「パブリッシュ」の部分(オレンジ色)に加えて,グレーの部分は本来想定されているところかもしれない。「パブリッシュ」については「プライベート」から「インターナショナル」まで全部をカバーするはずである。薄緑色のインターネット資料は「コミュニティ・アソシエーション」の「グレイ」から「オープン」まで拡げてカバーすることができるし,青色のオンライン資料も「コミュニティ・アソシエーション」のカバーを拡げてくれる。

ここで「商業オンラインジャーナル」(青色)について,とくに外国のジャーナルは日本の法制度の適用外とされるからNDLではうまく対応できない。また「運動系資料」(黒)としているものは,「プライベート」や「コミュニティ・アソシエーション」の「クローズド」や「グレイ」のものを含むが,これらも一部を除くと対応できていない。










網羅と質の保証の両立は可能か?

以上のものを基にして,オープンサイエンス時代のNDLの資料保存と提供体制について考えてみたい。

コンテンツの定義の見直し(国図法 24条の納本資料の範囲,グローバルに拡がる「出版地」,サブスク・コンテンツの保存)ー納本制度を見直しするかどうかは別として,法の24条,24条の2,25条が対象としている「資料」の種別や範囲が現状に合っていないことについて検討すべきではないだろうか。オンライン資料やインターネット資料の「出版地」がサーバーが置かれた場所でよいのかどうか。また,サブスクリプション契約のコンテンツの扱いについてはどうか。
グレイな領域(地域資料,サブカル関係,運動系資料…)ーこれまでの図書館経営は学術資料を前提としてきたが,オープンサイエンスの理念の下にシティズン・サイエンスを考えると市民が直接生産したり,やりとりしたりするコンテンツの扱いが重要になる。これまでも地域資料やサブカル系資料,運動系資料は入手しにくくNDLは十分に対応してこなかったが,そのままでよいのか。
クローズドな領域の受け皿(憲政資料室ほかの特別コレクションの拡大...)ーNDLの憲政資料室はクローズドな政治家の資料の受け皿として重要だった。国立公文書館他のアーカイブズ機関との関係をどのように考えるか。
ネット上の無数のコンテンツの扱い(ブログ,オンライン文芸,オンラインジャーナリズム,写真,動画,ゲーム,データベース)ー出版物やオンライン資料の定義は実は曖昧であり,ネット上にさまざまなコンテンツがある。これらの一部はかつてなら紙の出版物として発行されたものがネット上に置きかわったものである(オンラインジャーナリズムなど)。動画やゲームのなかには十分な科学的根拠をもったコンテンツとして位置付けられるべきものも含まれる。
動的に変化するコンテンツの保存問題(WARPの拡張,米Internet Archiveの苦闘)ーオンライン資料やインターネット資料は固定されたコンテンツにならず,常に変化する可能性がある。これは,「版」の概念とも「逐次刊行物」の概念で扱いきれないところがある。インターネット資料の検索システムをどのように考えるか。アメリカのInternet Archiveはフェアユースの範囲でコンテンツの公開を行っていたが,著作権者からの訴訟に悩まされている。NDLは法的な武装をしながらここまでやってきたわけだが,今後は著作権者や著作者との軋轢が生じる可能性もある。

ナショナルライブラリーは国民国家成立とともにつくられたが,その第一の目的は,国家にある知的所産を収集保存しそれを一望の下におくことで,知識の流通をはかることにあったと考えられる。ただし,それは書物などの紙メディアが知の流通と保存のためのメディアとして重要であると考えられたからである。NDLの成立の理念もそこにあるが,21世紀になってその前提は揺らいでいる。そもそも,納本制度で規定された資料のカテゴリーは古めかしく,それらを網羅的に集める意義は薄らぎつつある。とは言え,ネット上のものについてどのように網をかけて収集することができるのかについても不明の点が多い。




知のオープン化と NDLの役割(1)ーオープンサイエンスのための図書館

 本年の図書館総合展の企画の一つで, 「オープンサイエンスを社会につなぐために―国立国会図書館の取組を踏まえて」 (11月6日午後1時〜2時半)に参加したときのことを書いておこう。公式のものは別に出るが,十分に時間がなくてお話しできなかったことも含めて,ここでは私自身がこれにどう...