知の共有化

読者です 読者をやめる 読者になる 読者になる

知の共有化

Digital Transformation時代に対応した文化資産のデジタルアーカイブシステムの構築、知識インフラの構築、利用環境の高度化により、知識の一層の利活用の促進を目指す。

「未来の図書館を作るとは」を改めて読んでみて

「未来の図書館を作るとは」を改めて読んでみて、今の人工知能の技術でどこまで実用化できそうか考察してみたい。まずは現状認識まで。

 

 1994年に刊行された長尾元国立国会図書館長の著書「電子図書館 」(岩波文庫)(2010年新装版)では、「既存の図書や資料をデジタル化すればそれで電子図書館が実現するかといえばそうではない。あるべき姿はデジタル化された情報を縦横に使いこなし、まったく新しい知的空間を創造するための図書館である。」と述べられている。また、2012年、国立国会図書館(NDL)を退官されるときに執筆された「未来の図書館を作るには」では人工知能を活用した図書館サービスや図書館員の仕事の変革の具体的イメージが示唆されていた。

 

 さらに、2015年1月の同志社大学図書館司書課程講演会「見たことのない図書館を考える」で「夢の図書館を目指して-20年後の知識システム-」と題した講演の中でも、人間頭脳の知識構造に近づく電子図書館として、関連情報のリンクによる知識の構造化、様々な観点からの連想検索、情報探索から事実検索などを改めて示された。

 

NDLは、「電子図書館サービス構想」の実現形として、知識インフラとしての利活用を目指した「国立国会図書館デジタルコレクション」、「国立国会図書館サーチ」等のサービスの提供により、NDLを含めて様々な機関のデジタルコンテンツを一元的に「検索」し「利活用」できる道筋は付いた。

しかし、「未来の図書館を作るには」で言われている「デジタル化された情報を縦横に使いこなせる」して、「関連情報のリンクによる知識の構造化、様々な観点からの連想検索、情報探索から事実検索」ができる状態には遠く及ばない。

 

「未来の図書館を作るには」が発行された2012年初めは、まだ第3次AIブームの前であり、当時はまだまだ「未来」の話しとして、「夢の方向性」的な認識だった。

人工知能の技術は、第2次AIブームでの専門家が人手によりタグ付けして知識として作り上げてきたエキスパートシステムから、第3次AIブームとして、人間の頭脳の原理を模した汎用の仕組みに大量のデータを投入し、自動的に内容を認識し特徴を認知して知識として学んでいくディープラーニング等の手法により、AIが実用化レベルとしてブレークスルーし、様々な分野で一気に利用が進んできた。

ディープラーニングが普及した背景は、基礎となる学問分野・情報科学の進展はもとより、ビッグデータとして大量のデータが発生・オープンデータとして流通し、手軽に利用可能になり、コンピュータの性能が飛躍的に向上したことによる。

 

 図書館が中核となって進めてきた、「電子図書館」、「文化資源のナショナルアーカイブ」では、信頼性の高い膨大な文化情報資源がアーカイブとして蓄積され、検索のために全文テキストや画像等の情報が利活用できつつある。

実用化段階に来ている人工知能による認識・認知の仕組みと、その仕組みにより学習された知識が、今まで電子図書館の発展系として目指してきた「文化資源のナショナルアーカイブ」の「知識創造基盤」の中で想定された、事実情報である「本文テキスト」が「知識データベース」に、「書誌情報」や分類用辞書である「辞書・シソーラス・典拠情報」が「教師データ」として、人工知能に投入され学習することにより、「実用レベルの知識インフラ」としての実装が想定できる。また、人工知能が組み込まれたロボット、IoT機器が付与された資料や職員の移動情報がビッグデータとしてリアルタイムに収集されて、様々な測定データと合わせてサービスや業務の効率化や改善に活用されていけるようになる。

 

「未来の図書館を作るには」で記述されている仕組みを、今後5年程度の図書館として、どのような人工知能の機能を実装していくか、そのような仕組みを作るために、従来からの情報システム関連の職員は、どんな知識・スキルが必要か、また人工知能を活用した業務・サービスを提供するために、職員は業務をどのように行っていくのかを、個別に整理してみたい。ただ、ここで整理するのは、現状のいわゆる「弱い人工知能」の仕組みを活用して2020年には実現可能なレベルであり、2040年頃にいわゆる「強い人工知能」が人間を越える段階(シンギュラリティ)と言われるレベルを想定したものではない。

 

以下、「未来の図書館を作るとは」(長尾真著)の内容の抜粋及び要約であり、個別に実現方法を検討してみたい。

 

  • AI等の活用で現時点でも現実味が帯びてきたこと
    • 図書・資料は部品に解体され、それぞれが種々の観点からリンク付けされた巨大なネットワーク構造が作られるようにする      
    • 自然言語処理
        • 自然言語による質問要求を受け付けて、取り出したものがその要求に対応するものであるかどうかを自然言語処理技術によって調べ、できるだけ質問要求に近いものだけを選択するといった技術を確立することが必要
    • 書誌検索のような単純、単一の検索でなく、種々の検索のモードを提供することである
    • 種々のあいまいさを許すあいまい検索の工夫
    • 電子図書館になって取り出す単位が書籍の単位ではなく、書籍の中の章や節、パラグラフ、あるいはこんな内容が書かれている部分のみ、といった時に従来のシステムは全く役に立たない。
    • 自動的な形で適切な知識の所在にまでナビゲートしてゆくシステムが開発されつつある
    • 個人によって違った知識の構造の部分については、その人の力によって種々の検索方式を試み、自分の必要とする情報をとり出して中立的な知識の構造に付加してゆくことが出来ねばならないし、またそれによって自分に合った知識の構造を作りあげてゆくことができるだろう。
    • その本のどこに書かれているかを探すというのではなく、自分の欲しい情報そのものが出てくることになる。

 

  • 人工知能電子図書館
    • 自動的な形で適切な知識の所在にまでナビゲートしてゆくシステムが開発されつつある
    • 人間の持っている知識は頭脳の中にあり、種々の知識が何らかの関係性によってつながれていて、連想的に関係する知識が取りだされている
    • 図書館においてもぼう大な書物の中に存在する知識が関連性をもって書物という単位を超えてつなげられ、それが取り出されることが大切であろう。
    • 本のある部分に存在する単語や概念を集め、それらに近い単語や概念が存在する部分を他の本について網羅的に調べる
    • 関連する知識を人間頭脳の中のネットワークのようにつないで、利用者の要求に応じて提示できるような形の電子図書館の内容の組織化が望まれているのである。
    • 情報検索というよりは事実検索に近づいてゆく。
    • その本のどこに書かれているかを探すというのではなく、自分の欲しい情報そのものが出てくることになる。
    • ある社会において一定の教育を受けた人達の場合にはほぼ共通した知識の体系、構造というものがある
    • 電子図書館における図書・資料は部品に解体され、それぞれが種々の観点からリンク付けされた巨大なネットワーク構造が作られるようにする。これは1つの社会で共有する中立的な知識構造、知識システムである。
    • 個人によって違った知識の構造の部分については、その人の力によって種々の検索方式を試み、自分の必要とする情報をとり出して中立的な知識の構造に付加してゆくことが出来ねばならないし、またそれによって自分に合った知識の構造を作りあげてゆくことができるだろう。
    • 個人の電子図書館が出来るし、その人の頭脳の知識の構造が反映されたものが作られてゆく
    • 現実世界の本や情報の大切さ以上にヴァーチュアルな世界における情報処理と表現力の可能性にもっと大きな関心を持つべき時代に来ていると言えるのではないだろうか。
    • 「分かる」ことへの道程
        • 理想の電子図書館では、知識や情報が与えられるごとに、それが単なる増加知識として記憶されるのでなく、他の既存の知識との間での因果関係がチェックされ、新しい因果関係のリンクが付けられてゆくという形で発展してゆくべきである。
        • 個人の頭脳内容を反映した個人電子図書館が発展してゆくことになれば、いろいろと楽しく、心を豊かにしてくれるだろうし、新しい未知のことに対する挑戦という勇気もわいてくることは間違いないだろう。
        • 未来の自分の頭脳をヴァーチュアル世界に作ることであるともいえる。魅力的で挑戦的なことではないだろうか。