2020.8.11

デジタル化能力5%弱?!国会図書館デジタル化実現へ大きく前進!(上編)

写真)国立国会図書館でのデジタル化スキャンの様子

参議院会館の道路を挟んで向かいにある国立国会図書館。普段はあまり注目されない施設ですが、日本国内で出版されたすべての出版物を保存する、日本で唯一の図書館です。私も立法調査業務で毎日のように利用していますが、一般の方の来館者数も年間79万人(東京本館だけで57万人/1日平均2071人)にものぼります。

しかし、そんな国のもっとも重要な施設の一つでもある「国会図書館のデジタル化能力が、毎年納本される書籍等のうち5%弱しかない(年間納本件数43万点中、デジタル化処理能力は約2万点)」という驚愕の事実を知りました。かつ、現在国会図書館の蔵書は約4418万点、1968年以前の発刊書籍等1240万点のうち、デジタル化されているのは、244万点でデジタル化率は20%しかないというのです。

コロナ禍においてデジタル化・オンライン化のニーズが高まっているにもかかわらず、国会図書館のデジタル化が進んでいない、本文検索もできない、といった課題は大きな問題であり、早急に解決すべきことです。

私は、必要な書籍が広く電子化され、特に研究・教育目的で活用しやすい形で書籍データを提供できていること、国会図書館内では、納品されている書籍は全て全文検索を行うことができ、必要な情報を素早く取出すことが出来るようにすることが、今の時代の国会図書館のあるべき姿だと思います。

この驚愕の事実を知ってから2ヶ月、秘書の坂井をプロジェクトリーダーとして国会図書館の担当者から複数回ヒアリングを重ね、デジタル化の現状と、なぜこれだけ進まないのかという課題を洗い出してきました。そして、実際に国会図書館に足を運び、デジタル化の現場も見てきました。

写真)国会図書館での打ち合わせの様子

○ヒアリングのしたデジタル化の課題

 冒頭でも触れましたが、現在国会図書館の蔵書は約4418万点、1968年以前の発刊書籍等1240万点のうち、デジタル化されているのは、244万点でデジタル化率は20%しかありません。デジタル化は古い年度から実施されていますが、現状の予算2.3億円での年間処理件数は約2万点しかないそうです。年間の納本件数43万点(図書17万点、雑誌26万点)と比較してもかなり少ない数字です。つまり、納本される本の5%弱の電子化処理能力しか保有していないということです。

提供)国立国会図書館

また、全文検索のためのOCRもなされていないなど、デジタルアーカイブとその活用のための基盤整備が充分に行われているとは言い難い状況です。そして、2000年までに刊行された既存の出版物をすべてデジタル化するためには207億円の予算が追加で必要だということを明確にしました。207億円で2000年までの刊行物がすべてデジタル化できるのであれば、決して高くない金額だと思います。そして、2000年以降の刊行物すべてをデジタル化するには約700億円かかるという見積もりもはっきりしました。

まだ、水面下で動いている状況なのでお伝えできないことが多いのですが、国立国会図書館のデジタル化とその予算やあいまいな『絶版』の定義の明確化のために、私が事務局長を務める自民党の「デジタル社会に対応した知財活用小委員会」で取り上げました。国会図書館デジタル化問題は、私以外に取り上げている議員はほとんどおらず、私がいなければ前進しなかったという自負があります。まだ、途中経過という状況の報告ではありますが、しっかりと結果を出し、正式に皆さんにお伝えしたいと思います。

次回のブログでは、国会図書館の視察レポートを掲載予定です。