AIを活用した知の共有化の進展への期待 【要約】【2017年5月23日】
【2017年】AIを活用した知の共有化の進展への期待 【要約】 - Docs.com
1 はじめに |
1.1 |
1.1.1 |
1.1.1.1 図書館サービスの将来方向として、出版物に限らず様々な情報機関が保有する文化情報資源を一元的に利活用できるようにして、新たな知識を創造する「知識インフラ」としての方向性を検討してきた |
1.1.1.2 その方向性の実現に、メタデータの集約による単なる統合検索が可能な「知識インフラ」でなく、情報資源そのもの(画像データ、本文フルテキスト等)をビッグデータとして活用して、人工知能により知識化し、ファクトを取り出せる基盤としての「真の知識インフラ」の構築の実現を見通せる時代になった |
1.1.1.3 「電子図書館」は、「真の知識インフラ」として、「情報の集合体としてのアーカイブ」に留まらず、「人工知能により知識化」され、利用者に対して「電子図書館」を「脳の外部記憶」として利用を可能にする実用化システムの構築も実現可能なところまで到達しつつある。 |
1.1.1.4 そのような時代に、図書館を含めた文化情報資源の保有機関は、どんな業務・サービスに人工知能を活用すべきか、そのためにどんな知識とスキルを持つべきかを考察する |
2 すでにデジタルトランスフォーメーション(デジタル変革)は始まっている |
2.1 【参照】IT人材白書2017【2017年4月IPA】 |
2.2 今は、IoT、ビッグデータ、ロボット、AI等の技術革新による、第4次産業革命の入り口にいる |
2.3 あらゆるものがインターネットに接続するIoTの広がり、あらゆる情報がビッグデータとして活用され、AI技術により、様々な分野で定型的な業務はもとより、人海戦術では不可能だった業務まで、AI技術を適用したサービス、ロボットの適用が始まっている |
2.4 既存のビジネスや業務に新技術を取り入れるだけでなく、ビジネスモデルを変え、経済活用のみならず、個人の生活や社会構造まで影響が及ぶ |
2.5 デジタルフォーメーション(デジタル変革)とは、あらゆる情報がデジタル化され、IT技術によって、社会や産業、企業、人のあり方や働き方が変わっていくこと |
2.6 第4次産業革命が進むにつれて、発展するビジネスと縮小するビジネスが明確になっていく |
2.7 時代環境が大きく変わる時、それにそぐわないビジネスは淘汰されていく |
2.7.1 匠の技的な高度な伝統的技能を要する作業や、旧来の延長線で仕組みの高度化、洗練により、生き残れるビジネスもあるが、現状維持のビジネスの多くは、相対的に意義を失う可能性が高い |
2.8 IoT、ビッグデータ、ロボット、AI等の技術を、クラウドコンピューティングやモバイル環境で活用できるようになったことは、少ない投資で事業を立ち上げることが可能であり、中小企業、ベンチャー企業や個人の活躍のまたとないチャンスである |
2.9 組織として、 |
2.9.1 時代の潮流を捉えて、組織が社会の変化の中で、時代に適合して発展できる道を探り、ビジョンをはっきり示すことが重要であり、それは経営者の責務 |
2.9.2 「デジタル子ランスフォーメーション」を実現するには、ビジネスとデジタルのスキルを併せ持った人材の育成と獲得をしていく必要がある |
2.10 個人として、 |
2.10.1 自らも「デジタルトランスフォーメーション」の流れの中にあることの意識 |
2.10.2 求められるのは、周囲を巻き込みながら改革を進める能力やビジネスとデジタルを結び付けて全体をデザインする能力を持った人材になること |
2.10.3 目の前の業務だけにとらわれることなく、広く視野を持って進むべき道を探り、学ぶ。勉強会やコミュニティなど、学びの場は周囲にある。自己研さんによって能力を高めれば高めただけ、社会をリードしていく人材になっていく |
3 本格的な人工知能の実用化を迎えて |
3.1 電子図書館は、図書館界、出版界におけるデジタルフォーメーションである |
3.2 今まで |
3.2.1 「電子図書館サービス構想」の実現形としての「デジタルコレクション」、「NDLサーチ」、「リサーチナビ」 |
3.2.2 電子図書館サービスの発展形としての「知識インフラ構想」 |
3.2.3 「知識インフラ構想」の実現形を目指して分野を特定した「東日本大震災アーカイブ」 |
3.2.4 「東日本大震災アーカイブ」の発展形として分野を文化情報資源まで拡大した「文化資源のナショナルアーカイブ」 |
3.3 今後 |
3.3.1 デジタルトランスフォーメーション時代の知識インフラの構築 |
3.4 人工知能の進展 |
3.4.1 ビッグデータをディープラーニングにより学習できるようになったことにより、第3次人工知能ブームが起き、様々な分野で実用化が進んできた |
3.4.2 人間の頭脳が成長しなければ、今の技術の延長線で、コンピュータが人間の頭脳を上回るシンギュラリティ(技術的特異点)が2044年までに起きると言われている |
3.4.2.1 突然変異的な技術が生み出された場合、もっと早く訪れる可能性もある |
3.5 「未来の図書館を作るには」【長尾先生】の抜粋 |
3.5.1 「電子図書館」、「未来の図書館を作るには」の再認識 |
3.5.2 「電子図書館 」岩波文庫, 1994年, 長尾真 |
3.5.2.1 第2次人工知能ブームの終盤、第3次人工知能ブームへの助走段階 |
3.5.2.2 既存の図書や資料をデジタル化すればそれで電子図書館が実現するかといえばそうではない。あるべき姿はデジタル化された情報を縦横に使いこなし、まったく新しい知的空間を創造するための図書館である。そのために何が必要かを説く本書の構想は挑戦的かつ刺激的な未来の設計図だ。 |
3.5.3 「未来の図書館を作るとは」が刊行された2012年からの技術の進展 |
3.5.3.1 「未来の図書館を作るには」が発行された2012年初めは、まだ第3次人工知能ブームの前で、人工知能がブレークスルーしていなかった。 |
3.5.3.2 「未来」の話しとして、人工知能を活用したシステムにより、図書館サービスや図書館員の仕事の変革が示唆されていたが、ディープラーニングの実用化により、今まさに実現可能になっていると思う |
3.5.3.3 しかし、2012年以降のディープラーニングに代表される人工知能の進展、資料のデジタル化、デジタルコンテンツのオープンデータ化、LOD化の加速化により、「未来」とされてきた相当な範囲の仕組みで、今後5年程度でできることが多くなってきたように思える |
3.5.4 人工知能と図書館 |
3.5.4.1 人間の持っている知識は頭脳の中にあり、種々の知識が何らかの関係性によってつながれていて、連想的に関係する知識が取りだされている【長尾先生】 |
3.5.4.2 図書館においてもぼう大な書物の中に存在する知識が関連性をもって書物という単位を超えてつなげられ、それが取り出されることが大切であろう。【長尾先生】 |
3.5.4.3 本のある部分に存在する単語や概念を集め、それらに近い単語や概念が存在する部分を他の本について網羅的に調べる【長尾先生】 |
3.5.4.4 関連する知識を人間頭脳の中のネットワークのようにつないで、利用者の要求に応じて提示できるような形の電子図書館の内容の組織化が望まれているのである。【長尾先生】 |
3.5.4.5 電子図書館における図書・資料は部品に解体され、それぞれが種々の観点からリンク付けされた巨大なネットワーク構造が作られるようにする。これは1つの社会で共有する中立的な知識構造、知識システムである。【長尾先生】 |
3.5.4.6 個人によって違った知識の構造の部分については、その人の力によって種々の検索方式を試み、自分の必要とする情報をとり出して中立的な知識の構造に付加してゆくことが出来ねばならないし、またそれによって自分に合った知識の構造を作りあげてゆくことができるだろう。【長尾先生】 |
3.5.4.7 現実世界の本や情報の大切さ以上にヴァーチュアルな世界における情報処理と表現力の可能性にもっと大きな関心を持つべき時代に来ていると言えるのではないだろうか。【長尾先生】 |
3.6 図書館関連が保有しているビッグデータとしての知的情報資源 |
3.6.1 従来から図書館員の知識・ノウハウにより統制され形式知化してきた情報 |
3.6.1.1 情報に関する情報⇒メタデータ |
3.6.1.2 書誌情報 |
3.6.1.3 情報を見つけ出すための情報⇒ナレッジデータベース |
3.6.1.4 レファレンス情報(参考情報) |
3.6.1.5 Q&A |
3.6.1.6 調べ方案内情報 |
3.6.1.7 情報資源⇒デジタルアーカイブ |
3.6.2 今後ビッグデータとして活用が可能になっている情報 |
3.6.2.1 デジタルアーカイブ内で保有している情報で、オープンデータ化されていない情報も含めて、バックヤードで検索・分析に活用できる本文フルテキスト |
3.6.2.1.1 著作権者の許諾なしに書籍の全文を電子データ化し、検索のために人工知能などを活用した新サービスが認められる方向 |
3.6.2.1.2 図書館等から一定期間公開しない有償オンライン資料、東日本大震災アーカイブ等も検索のためには活用できる? |
3.6.3 今後活用を期待したい情報 |
3.6.3.1 図書館が保有するオープンデータ化された情報の内容(コンテンツ) |
3.6.3.1.1 図書館の世界でのデジタルアーカイブ |
3.6.3.2 図書館の枠を越えたナショナルアーカイブ内の情報(コンテンツ) |
3.6.3.2.1 図書館界外が保有する情報 |
3.6.3.2.2 図書館界が保有する情報 |
3.6.3.3 図書館員が持つノウハウ等の暗黙知 |
3.6.3.3.1 レファレンス業務過程情報を形式知化 |
3.6.3.4 図書館情報システムから収集する情報 |
3.6.3.4.1 匿名化した加工情報 |
3.6.3.4.1.1 利用実績情報(統計化されてない情報) |
3.6.3.5 各種センサー等のIoT機器から収集する情報 |
3.6.3.5.1 利用行動履歴 |
3.6.3.5.2 利用した情報の移動履歴 |
3.6.3.5.3 研究データ |
4 文化情報資源のナショナルアーカイブの方向性は |
4.1 ビッグデータとしての知の共有化、人工知能が適用された知識インフラの構築 |
4.2 今後 |
4.2.1 世の中ではWeb2.0時代と言われた時代、図書館界ではOpac2.0と称するサービスで、いわゆる人工知能とまでは言えないかもしれないが、人工知能を指向した組織化、あいまい検索等の実現を目指してきた |
4.2.2 既にインターネット上に広範な情報が公開されているが、公開が遅れている文化機関、公的機関が保有している情報もオープンデータ化が進みつつあり、ビッグデータとして利活用できるように方向に向かっている |
4.2.3 また、今後の著作権法の改正により、著作者の許諾なく、著作物の本文そのもの活用して、人工知能等により高度な検索、分析に活用できるようになる |
4.2.4 このような時代に、従来の業務やサービスは、人工知能が組み込まれたシステムやロボットに支援されてサービスが省力化され、さらに今まで不可能だった新たなサービスが生まれようとしている |
4.3 文化情報資源のナショナルアーカイブの方向性 |
4.3.1 知識インフラ |
4.3.1.1 知識インフラ構築における最も大切な概念は、情報を集め、これを知識化し活用することによって新しい情報・知識を創出し、知識インフラに加えるという形で循環的にこのシステムを強化・拡大してゆくことによって社会・経済に貢献することである。【長尾先生】 |
4.3.1.2 知識が種々の観点から組織化、構造化されて利用しやすい形で蓄積されて利用に供される【長尾先生】 |
4.3.1.3 |
4.3.2 ナショナルアーカイブは |
4.3.2.1 図書館は、書物等の情報資源を収集・保存し提供する場であるとともに、それらを使って関心のある人が集まって議論し新しい知識を創造する場【長尾先生】 |
4.3.2.2 日本としてのナショナルアーカイブは、日本中に存在する知識情報が有機的に結合され、日本中の人が自由に使える日本の「知識インフラ」【長尾先生】 |
4.3.2.3 世界中の知識情報が有機的に結合したものが、「インターナショナルアーカイブ」 |
4.3.3 今、ディープラーニングが実用化になった時代に、ナショナルアーカイブはどのような方向へ進んでいくか |
4.3.4 図書館での従来から形式知化してきた情報を、信頼性の高い情報として、人工知能の教師用データとして分析し、人工知能として学習した知識として蓄積 |
4.3.4.1 書誌、辞書、典拠(シソーラス)類 |
4.3.5 著作物のイメージ画像、フルテキストを人工知能の学習データとして分析し知識として蓄積 |
4.3.5.1 画像、全文フルテキスト(OCR化も含む)、目次、索引、あらすじ、書評、、、 |
4.3.6 長尾先生が提唱した「電子図書館」が、「人工知能を備えた知識インフラ」となる |
4.3.6.1 文化情報資源としてのナショナルアーカイブがビッグデータとして利用可能になり、人工知能の学習データとして信頼性の高い知識が飛躍的に豊富になり、より精度の高い情報を提供できるようになる |
4.4 ナショナルアーカイブの各基盤の概念 |
4.4.1 |
4.4.2 我が国の多様な文化を知識として保存・継承する役割、様々な分野の専門家が参加し、新たな文化を知識として創造していくための社会的な基盤としての役割、それらの知識を利用目的に応じて発信する役割、そして、これらの仕組みを統括し運用していく役割が考えられ、文化的資産を館種毎に集約している拠点と、新たな知識を創造し発信するしている拠点等が分担して構築・運用していくことが必要 |
4.4.3 恒久的保存基盤(あらゆる情報の恒久的保存) |
4.4.3.1 恒久保存と利活用のための共通プラットフォーム |
4.4.3.2 1つの機関にすべてを集約するのではなく、各分野のアーカイブを集約する拠点が中核となって分散アーカイブを構築 |
4.4.3.3 あたかも1つのアーカイブとして見えるように |
4.4.3.4 個々の情報同士を意味的に関連付け |
4.4.3.5 検索で情報を取り出すだけでなく、取り出された情報から芋づる式に関連する情報を取り出せるように |
4.4.3.6 情報の網羅性・完全性が重要 |
4.4.4 知識創造基盤(新たな知識創造活動の場) |
4.4.4.1 キュレーター、ライブラリアン等の支援のもとで、それぞれの分野の専門家のみならず、広く国民も含めて、情報に付加価値を付けたり、他の分野の情報と関連付けて、二次的著作物を創造する場 |
4.4.4.2 知識創造支援機能 |
4.4.4.2.1 情報全体の基本情報としてのメタデータを付与する活動、記事、章節項、文節等の単位で組織化・構造化する活動、情報間を意味的に関連付けるための基本情報として、用語辞書、典拠、シソーラス辞書等を作成する活動 |
4.4.4.2.2 辞書類作成 |
4.4.4.2.2.1 コーパス |
4.4.4.2.2.1.1 人工知能の支援により省力化が進むと思われる |
4.4.4.2.2.2 件名典拠、シソーラス |
4.4.4.2.2.2.1 本文フルテキストも人工知能への入力データとして特徴量を抽出することにより、書誌データのみならず、本文テキストから標目を抽出しすることが可能 |
4.4.4.2.2.2.2 また、コーパスを利用することにより、同義語、上位語、下位語、関連語、分類記号の関係づけをすることも可能ではないか |
4.4.4.2.2.3 固有名典拠 |
4.4.4.2.2.3.1 既に刊行されている書籍の著者に関して、人工知能を利用して、著作名、著者、出版年、NDC分類等の特徴量を抽出・分析することにより、著者の自動同定の精度は相当向上すると思われる |
4.4.4.2.2.3.2 人工知能により、省力化、自動化ができることにより、書籍だけでなく雑誌記事等も含めて、固有名典拠の自動作成が可能になる |
4.4.4.2.2.4 NDC分類 |
4.4.4.2.2.4.1 件名典拠をベースにした分類の番号体系は、人間の判断によるところが大きいので、容易に人工知能化することは困難か? |
4.4.4.2.2.4.2 分類を番号体系でなく意味的なシソーラス体系として維持し、改訂していく作業は、人工知能により体系を整理することは可能。また番号体系の版毎の対比表の維持も可能ではないか |
4.4.4.2.2.4.3 ただ、配架のための分類という考え方、資料検索のための分類体系は、全文検索を含めて様々なレベルでの検索が容易になってくる状況において、役割を問い直す必要があるのではないか |
4.4.4.2.2.5 情報を関連付けるための情報 |
4.4.4.2.2.5.1 共通語彙 |
4.4.4.2.2.5.1.1 分野を超えた情報交換を行うには、個々の単語について、表記・意味・データ構造を統一し、互いに意味が通じるようにすることが必要。人工知能の知識として蓄積する場合、共通語彙になっていることが学習の効率を高められる。 |
4.4.4.2.2.5.2 情報と情報を結びつけるための情報 |
4.4.4.2.2.5.2.1 コーパス |
4.4.4.2.2.5.2.1.1 国立国語研究所で構築したコーパス |
4.4.4.2.2.5.2.2 オントロジー |
4.4.4.2.2.5.2.3 用語辞書 |
4.4.4.2.2.5.2.3.1 DBPedia等 |
4.4.4.2.2.5.2.4 分野別辞書 |
4.4.4.2.2.5.2.4.1 大漢和辞書等 |
4.4.4.2.2.5.2.5 分野別シソーラス |
4.4.4.2.2.5.2.5.1 JSTシソーラスmap等 |
4.4.4.2.2.5.2.6 個別情報の永続的識別子(Linked Data化) |
4.4.4.2.3 組織化 |
4.4.4.2.3.1 情報に関する情報の組織化(書誌作成) |
4.4.4.2.3.1.1 新しい著作物に対するNDC分類、件名などは、既存の書誌、典拠を教師データとして、人工知能により自動付与。専門家は、人工知能による精度に応じてチェック、補正することが役割になるのではないか。 |
4.4.4.2.3.1.2 雑誌記事に関しても、記事を著作単位とした書誌作成が人工知能により省力化して付与が可能になる |
4.4.4.2.3.2 情報の組織化 |
4.4.4.2.3.2.1 図書・資料は部品に解体され、それぞれが種々の観点からリンク付けされた巨大なネットワーク構造が作られるようにする【長尾先生】 |
4.4.4.2.3.2.1.1 |
4.4.4.2.3.2.1.2 |
4.4.4.2.3.2.1.3 目次情報を付けたり、本の表紙の画像や数行の簡単な要旨を付ける |
4.4.4.2.3.2.2 動画・静止画・音声は、画像認識機能により自動タグ付け |
4.4.4.2.3.2.2.1 従来の書誌情報の考え方をマルチメディア情報に対応できるように拡張かつ詳細化するとともに、対象資料に関係する様々な種類の情報にリンクをはり、それらの情報をたどってゆけるようにする【長尾先生】 |
4.4.4.2.3.2.3 全文テキストを利用することにより、新たに時間軸、空間軸に沿った知識の関連付け等の組織化も可能ではないか |
4.4.4.2.3.2.4 レファレンス事例、司書の知識・ノウハウを、信頼性の高い情報を、人工知能の教師用データとして特徴量を自動抽出し、情報を知識化して人工知能の知識データベースとして蓄積 |
4.4.4.3 知識創造活動 |
4.4.4.3.1 恒久的保存基盤に格納された網羅的な情報を活用して新たな知識を創作する活動 |
4.4.4.3.2 歴史的な文化財や現代文化を映像化、画像化、テキスト化する活動、構造化された情報に解題情報等を付与する活動、情報間を意味的に関連付ける活動、テーマを設定してデジタルギャラリを構築する活動等 |
4.4.4.3.3 既存の知識から自分の必要とする部分を切り出して、新たな発想の著作を創造し、新たな知識とする【長尾先生】 |
4.4.4.3.4 新たな知識創造の場としての図書館 |
4.4.4.3.4.1 施設としての実空間、インターネットを利用した仮想空間はシームレスに |
4.4.4.3.4.2 情報を媒介して専門家と専門家を繋ぐ |
4.4.4.3.4.2.1 様々な組織が持つ情報が関連付けられて、それぞれの組織を中心に活動していた人が繋がっていく |
4.4.4.3.4.3 専門家を媒介して辞書と辞書を繋ぐ |
4.4.4.3.4.3.1 様々な分野の人たちが繋がって、情報に関する情報が蓄積され、それによって様々な各種辞書が関連付けられていく |
4.4.4.3.4.4 読者と読者を繋ぐ場としての図書館 |
4.4.4.3.4.4.1 議論の場の提供という図書館機能【長尾先生】 |
4.4.4.3.4.4.2 解決したいという人達と研究者、そして図書館司書のグループが種々の角度から資料をもとに議論【長尾先生】 |
4.4.4.3.4.4.3 考え方の違う人達が知識を共有し、その違いを議論を通じて明らかにすると共に、新しい知識・思想を作り出してゆく場【長尾先生】 |
4.4.4.3.4.5 出版社、著者と読者をつなぐ場としての図書館 |
4.4.4.3.4.5.1 図書館が司書による相談サービス、あるいは自動的な案内サービスをする場合でも、自分の電子書棚を作りたいという人の多くは図書館から借りるのではなく出版社のデータベースの方に行き、書物を購入することになるわけで、図書館は出版社と読者を結合する接続業者のようになってゆく【長尾先生】 |
4.4.4.3.5 知識創造のための問合わせに対して、ファクトデータを提供する |
4.4.4.3.5.1 レファレンスサービス |
4.4.4.3.5.1.1 司書の世話にならなくてもある程度のレファレンスサービスが受けられるように【長尾先生】 |
4.4.4.3.5.1.2 自然言語による質問要求を受け付けて、取り出したものがその要求に対応するものであるかどうかを自然言語処理技術によって調べ、できるだけ質問要求に近いものだけを選択する【長尾先生】 |
4.4.4.3.5.1.3 利用者からの問い合わせに対して、人工知能を利用して、必要とする内容に最もマッチングする資料名、所在場所へナビゲーション。オープンデータに関しては、記述された内容の記載部分を列挙。さらに答えとしての事実まで提示が可能になる |
4.4.4.3.5.1.4 自然言語処理により、音声での自然言語の問いに対して、知識インフラを知識とした人工知能が、解の候補を抽出し、それを音声での自然言語で回答することが可能になる |
4.4.4.3.5.2 事実に基づいた報告書 |
4.4.4.3.5.2.1 依頼または予測調査に対して人工知能により文献内容検索により、最もマッチングする資料名、資材場所を探し出し、オープンデータに関しては、記述された内容を洗い出し、内容要約して報告書の原案を作成 |
4.4.4.3.6 知識創出システムの構築 |
4.4.4.3.6.1 人と人工知能の協調による創造的な課題解決 |
4.4.4.3.6.1.1 人工知能の助けを借りて新サービスの構想を練り開発する |
4.4.4.3.6.2 人とシステムの得意な作業が連携 |
4.4.5 知識利活用基盤(情報発信) |
4.4.5.1 恒久的保存基盤に格納された一次情報、コンテンツ創造基盤で創出された二次的情報を有機的に組み合わせて、利用できるようにする |
4.4.5.2 見るだけのアーカイブ」から「使い、創り、繋がり、伝えるアーカイブ」として、広く国民による新たな知識の創造、新産業の創出、地域活性化、防災・減災、教育活用、教養・娯楽、観光、国際文化交流等、様々な利用者毎の目的に応じて、恒久的保存基盤に格納された一次情報、コンテンツ創造基盤で創出された二次的情報を有機的に組み合わせて、利用できるようにする |
4.4.5.3 網羅的な情報から、利用目的に応じてあらかじめ適切に絞り込み、利用者の属性、スキル、利用場所に応じて、様々な画面インターフェースを用意して、利用者が必要とする情報、参考となる関連する情報を容易に得られるようにする |
4.4.5.4 知識検索機能 |
4.4.5.4.1 電子図書館になって取り出す単位が書籍の単位ではなく、書籍の中の章や節、パラグラフ、あるいはこんな内容が書かれている部分のみ【長尾先生】 |
4.4.5.4.2 自動的な形で適切な知識の所在にまでナビゲートしてゆくシステム【長尾先生】 |
4.4.5.4.2.1 その本のどこに書かれているかを探すというのではなく、自分の欲しい情報そのものが出てくることになる。【長尾先生】 |
4.4.5.4.3 書誌検索のような単純、単一の検索でなく、種々の検索のモードを提供する【長尾先生】 |
4.4.5.4.3.1 種々のあいまいさを許すあいまい検索の工夫【長尾先生】 |
4.4.5.5 自分の知識の外部記憶装置(自分用の電子図書館【長尾先生】) |
4.4.5.5.1 個人によって違った知識の構造の部分については、その人の力によって種々の検索方式を試み、自分の必要とする情報をとり出して中立的な知識の構造に付加してゆくことが出来ねばならないし、またそれによって自分に合った知識の構造を作りあげてゆく【長尾先生】 |
4.4.5.5.2 自分の書棚を電子的に作れば、自分の連想に基づいて自分の本や本の部分部分をリンク付けして自分の知識の構造に合った自分図書館を作って楽しむことができる【長尾先生】 |
5 次世代の図書館サービスの業務と、業務に従事する人材の資質とスキルは? |
5.1 人工知能と人間の能力と役割(一般論) |
5.1.1 人工知能が果たす役割・機能 |
5.1.1.1 不足している労働力を補完する |
5.1.1.2 既存の労働力を省力化する |
5.1.1.3 既存の業務効率・生産性を高める |
5.1.1.4 既存の業務の提供する価値(品質や顧客満足度など)を高める |
5.1.1.5 これまでに存在しなかった新しい価値をもった業務を創出する |
5.1.1.6 既存の業務に取組む意欲や満足度を高める |
5.1.1.7 新しい業務に取組む意欲や満足度を高める |
5.1.1.8 その他 |
5.1.2 人工知能(AI)の活用が一般化する時代における重要な能力 |
5.1.2.1 情報収集能力や課題解決能力、論理的思考などの業務遂行能力 |
5.1.2.2 チャレンジ精神や主体性、行動力、洞察力などの人間的資質 |
5.1.2.3 企画発想力や創造性 |
5.1.2.4 語学力や理解力、表現力などの基礎的素養 |
5.1.2.5 コミュニケーション能力やコーチングなどの対人関係能力 |
5.1.2.6 |
5.1.2.6.1 (総務省「ICTの進化が雇用と働き方に及ぼす影響に関する調査研究」) |
5.1.2.7 ルーティンワーク、マニュアル化された仕事は、アルバイト、非常勤、外部委託、そして人工知能に置き換わる |
5.1.3 ビジネスプロセスにおける業務とシステムの役割分担の見直し |
5.1.3.1 AIの実用段階に達した今、今まで人が担ってきた部分の作業も、精密化すると一部が人工知能を活用したほうが効率的なことが多々ある |
5.2 図書館員の役割と資質 |
5.2.1 Librarian, cataloguers, reference librarian, Embedded librarian |
5.2.1.1 人工知能により自動出力された内容の評価、補正 |
5.2.1.1.1 選書 |
5.2.1.1.2 関連付けに必要な典拠類の構築 |
5.2.1.1.3 情報に関する基本情報付け(メタデータ付与) |
5.2.1.1.4 情報に関する付加価値情報付け |
5.2.1.1.5 情報間の関連付け |
5.2.1.1.6 分類・主題情報の付与 |
5.2.1.1.7 人工知能を活用したレファレンス |
5.2.1.2 集いの場(intellectual commons)の運営 |
5.2.1.2.1 研究グループの中に図書館的業務のできる人を置くことが必要。embedded librarian(研究協力図書館員)と呼ぶようになって来た。【長尾先生】 |
5.2.2 情報化推進部門 |
5.2.2.1 【グーグルに学ぶディープラーニング(日経ビッグデータ)】 |
5.2.2.2 l .ビジネスの旗振り役2 ディ-プラ一二ングの技術者、データサイ工ンテイスト3. モデルを組み込んだシステムを作る工ンジ二ア4. ビジネスと工ンジ二ア、データサイ工ンテイストの橋渡し役 |
5.2.2.3 .ビジネスの旗振り役 |
5.2.2.3.1 CIO |
5.2.2.3.2 CDO |
5.2.2.4 データサイエンティスト |
5.2.2.4.1 技術 |
5.2.2.4.2 ビジネス |
5.2.2.4.3 分析 |
5.2.2.4.4 コミュニケーション能力 |
5.2.2.4.5 主流のプログラミング言語でプロトタイプを開発でき、数学、統計学、確率論、コンピュータサイエンスの確かな素養のある人材 |
5.2.2.4.6 かつ、ビジネス課題への感覚が鋭く顧客に共感できること |
5.2.2.5 ビジネスと工ンジ二ア、データサイ工ンテイストの橋渡し役 |
5.2.2.5.1 4の橋渡し役が既存の組織にはない、一方で重要な役割を果たす人。工ンジ二アと人工知能の技術を理解しながらビジネスとつないでいく人 |
5.3 図書館サービスの構築・運用に従事する人に必要な知識とスキルは? |
5.3.1 一気に人工知能に置き換わらなくても、少なくとも職員から、アルバイト、非常勤、外部委託へとシフトしていくものが多い。その中で図書館職員としての仕事を見極める必要がある |
5.3.2 一般的な情報化推進部門 |
5.3.2.1 網羅的なスキル構成 |
5.3.2.1.1 メソドロジ |
5.3.2.1.1.1 ITビジネス活動の様々な局面で発揮される手法、方法などで、発揮される対象領域が広く、汎用性、応用性が高いスキルカテゴリ |
5.3.2.1.2 テクノロジ |
5.3.2.1.2.1 ITビジネス活動の様々な局面で発揮されるIT関連技法などで、対象領域が特定されるものが多いスキルカテゴリ |
5.3.2.1.3 関連業務知識 |
5.3.2.1.3.1 ITビジネス活動の様々な局面で活用される、メソドロジ、テクノロジ以外の関連業務知識。業務固有のスキル。 |
5.3.2.1.4 ITヒューマンスキル |
5.3.2.1.4.1 企業・組織が IT に関するタスクを実行する際に必要となるスキル。人工知能が実用化される状況において、人間として特に重要なスキル。 |
5.3.2.1.4.2 実行力・実践力 |
5.3.2.1.4.2.1 俯瞰力・深耕力・革新力・継続力 |
5.3.2.1.4.2.2 効果を上げるために、実行・実践環境や状況を適切に捉える力 |
5.3.2.1.4.2.3 効果的継続の実行と新しい取り組みや新領域へ挑戦する力 |
5.3.2.1.4.3 創造力 |
5.3.2.1.4.3.1 問題発見力・問題分析力・仮説設定力・論理思考力・概念化力 |
5.3.2.1.4.3.2 状況を認知して問題を発見し、見極め、解決案を策定する「価値の創造・問題解決」を着実に遂行する力 |
5.3.2.1.4.3.3 複雑な状況や問題に対して、論理的思考により概念の形成、判断の構築、命題設定を行う力 |
5.3.2.1.4.4 コミュニケーション力 |
5.3.2.1.4.4.1 自分の考えを伝える力・相手の考え方を理解する力・共感を呼ぶ力 |
5.3.2.1.4.4.2 情報の獲得や更なる情報の要求や内容の確認、他者への情報提供、他者に影響を与えたり、協働への引導する力 |
5.3.2.2 一般的なシステム構築のタスク |
5.3.2.2.1 戦略 |
5.3.2.2.1.1 事業戦略把握・策定支援 |
5.3.2.2.1.1.1 要求(構想)の確認 |
5.3.2.2.1.1.2 新ビジネスモデルへの提言 |
5.3.2.2.1.1.3 事業戦略の実現シナリオへの提言 |
5.3.2.2.1.2 IT製品・サービス戦略策定 |
5.3.2.2.1.2.1 市場動向の調査・分析・予測 |
5.3.2.2.1.2.2 IT製品・サービス戦略の策定 |
5.3.2.2.2 企画 |
5.3.2.2.2.1 IT戦略策定・実行推進 |
5.3.2.2.2.1.1 基本方針の策定 |
5.3.2.2.2.1.2 IT化計画の策定 |
5.3.2.2.2.1.3 IT戦略実行マネジメント |
5.3.2.2.2.2 システム企画立案 |
5.3.2.2.2.2.1 システム化構想の立案 |
5.3.2.2.2.2.2 システム化計画の策定 |
5.3.2.2.2.2.3 業務・システム要件定義 |
5.3.2.2.2.2.4 ITサービス要件定義 |
5.3.2.2.2.2.5 情報セキュリティ要件定義 |
5.3.2.2.3 開発 |
5.3.2.2.3.1 システム要件定義・方式設計 |
5.3.2.2.3.2 運用設計 |
5.3.2.2.3.3 移行設計 |
5.3.2.2.3.4 基盤システム構築 |
5.3.2.2.3.5 アプリケーションシステム開発 |
5.3.2.2.3.6 ソフトウェア製品開発 |
5.3.2.2.3.7 Webサイト開発 |
5.3.2.2.3.8 システムテスト |
5.3.2.2.3.9 移行・導入 |
5.3.2.2.3.10 ソフトウェア保守 |
5.3.2.2.3.11 ハードウェア・ソフトウェア製品導入 |
5.3.2.2.3.12 ファシリティ設計・構築 |
5.3.2.2.3.13 プロジェクトマネジメント |
5.3.2.2.4 利活用 |
5.3.2.2.4.1 サービスデスク |
5.3.2.2.4.2 IT運用コントロール |
5.3.2.2.4.3 システム運用管理 |
5.3.2.2.4.4 Webサイト運用管理 |
5.3.2.2.4.5 ファシリティ運用管理 |
5.3.2.2.4.6 サービスマネジメント |
5.3.2.2.5 評価・改善 |
5.3.2.2.5.1 システム評価・改善 |
5.3.2.2.5.2 IT戦略評価・改善 |
5.3.2.2.5.3 IT製品・サービス戦略評価・改善 |
5.3.2.2.5.4 事業戦略評価・改善支援 |
5.3.2.2.5.5 システム監査 |
5.3.2.2.5.6 資産管理・評価 |
5.3.2.2.6 管理・統制 |
5.3.2.2.6.1 システム監査 |
5.3.2.2.6.2 資産管理・評価 |
5.3.2.2.6.3 事業継続マネジメント |
5.3.2.2.6.4 情報セキュリティマネジメント |
5.3.2.2.6.5 品質マネジメント |
5.3.2.2.6.6 契約管理 |
5.3.2.2.6.7 コンプライアンス |
5.3.2.2.6.8 人的資源管理 |
5.3.2.2.7 推進・支援 |
5.3.2.2.7.1 マーケティング・セールス |
5.3.2.2.7.2 再利用 |
5.3.2.2.7.2.1 再利用資産管理 |
5.3.2.2.7.2.1.1 再利用資産管理の準備 |
5.3.2.2.7.2.1.1.1 ソフトウェア開発プロセスの標準化手法 |
5.3.2.2.7.2.1.1.2 ソフトウェアエンジニアリングの標準化手法 |
5.3.2.2.7.2.1.1.3 論理思考力 |
5.3.2.2.7.2.1.1.4 概念化力 |
5.3.2.2.7.2.1.1.5 自分の考えを伝える力 |
5.3.2.2.7.2.1.2 再利用資産の保管と管理 |
5.3.2.2.7.2.1.2.1 ソフトウェア開発プロセスの標準化手法 |
5.3.2.2.7.2.1.2.2 ソフトウェアエンジニアリングの標準化手法 |
5.3.2.2.7.2.1.2.3 論理思考力 |
5.3.2.2.7.2.1.2.4 継続力 |
5.3.2.2.7.2.1.2.5 共感を呼ぶ力 |
5.3.2.2.7.2.2 再利用施策管理 |
5.3.2.2.7.2.2.1 再利用施策の計画 |
5.3.2.2.7.2.2.1.1 ソフトウェア開発プロセスの標準化手法 |
5.3.2.2.7.2.2.1.2 ソフトウェアエンジニアリングの標準化手法 |
5.3.2.2.7.2.2.1.3 問題分析力 |
5.3.2.2.7.2.2.1.4 仮説設定力 |
5.3.2.2.7.2.2.1.5 概念化力 |
5.3.2.2.7.2.2.1.6 共感を呼ぶ力 |
5.3.2.2.7.2.2.2 再利用施策の実施 |
5.3.2.2.7.2.2.2.1 ソフトウェア開発プロセスの標準化手法 |
5.3.2.2.7.2.2.2.2 ソフトウェアエンジニアリングの標準化手法 |
5.3.2.2.7.2.2.2.3 問題分析力 |
5.3.2.2.7.2.2.2.4 仮説設定力 |
5.3.2.2.7.2.2.2.5 革新力 |
5.3.2.2.7.3 調達・委託 |
5.3.2.2.7.4 標準の策定・維持・管理 |
5.3.2.2.7.5 新ビジネス・新技術の調査・分析と技術支援 |
5.3.2.2.8 業務 |
5.3.2.2.8.1 ビジネス目標の決定 |
5.3.2.2.8.2 状況の評価 |
5.3.2.2.8.3 目標の決定とプロジェクト計画の策定 |
5.3.2.2.8.4 データの理解 |
5.3.2.2.8.5 データマイニングのためのデータの準備 |
5.3.2.2.8.6 モデリング |
5.3.2.2.8.6.1 モデリング手法の選択 |
5.3.2.2.8.6.2 テスト設計 |
5.3.2.2.8.6.3 モデルの構築 |
5.3.2.2.8.6.4 モデルの評価 |
5.3.2.2.8.7 評価 |
5.3.2.2.8.8 結果とモデルの展開 |
5.3.2.2.8.9 ビジネスでの活用と評価 |
5.3.2.2.8.9.1 ビジネスでの活用 |
5.3.2.2.8.9.2 ビジネス成果の確認 |
5.3.2.2.9 |
5.3.2.3 業務タスクとスキル・知識の蓄積のスキーム |
5.3.2.3.1 |
5.3.2.4 iコンピテンシ・ディクショナリを活用した業務の遂行とスキル・知識の選択的習得方法 |
5.3.2.4.1 |
5.3.3 今後の図書館サービスの実現のためのタスクと必要なスキル |
5.3.3.1 文化資源の収集・保存・修復・公開のスキル |
5.3.3.1.1 図書館が扱う情報資産は、文献だけではない。 |
5.3.3.2 専門分野に関する知見(文化・芸術・学術) |
5.3.3.3 文化資源を取り扱うための知識・技能 |
5.3.3.3.1 保存・修復技術 |
5.3.3.3.2 文化資源に価値を見出し、情報として記述するカタロガーとしての知識・技能 |
5.3.3.3.3 文化資源の価値を顕在化させて共有するための企画・発信するキュレーターとしての知識・技能 |
5.3.3.3.4 文化資源と人々をつなぎ、新たな価値を創出するコーディネータ、エンベデッドライブラリアンとしての知識・技能 |
5.3.3.3.5 文化資源を扱う活動の使命を明らかにし、その達成に向け経営資源を配分し、事業を統括するマネージャーとしての知識・技能 |
5.3.3.4 デジタル技術を活用したアーカイブ化のための知見 |
5.3.3.4.1 文化資源を取り扱う様々な局面でITを活用し、文化資源をデジタル化し情報メディアに乗せていく技術を有する |
5.3.3.4.2 著作権をはじめとする知的財産権、肖像権、契約など各種法律分野に関する知識を有する |
5.3.3.5 文化資源を情報として収集・組織化・保存し、公開することを実現するシステムの開発・運用管理の知識・技能 |
5.3.3.5.1 効率的・効果的なシステム開発を行うシステムエンジニア |
5.3.3.5.2 基礎となる学問分野の知識 |
5.3.3.5.2.1 A:自然言語分野 |
5.3.3.5.2.2 B:音声・音楽分野 |
5.3.3.5.2.3 C:画像・映像分野 |
5.3.3.5.2.4 D:コンピュータ・ソフトウェア、情報通信 |
5.3.3.5.2.5 E:知識工学、人工知能 |
5.3.3.5.2.6 F:図書館学、図書館情報学 |
5.3.3.5.3 文化資源の保有機関にも、先進技術の研究開発および実用化を目指す研究者 |
6 データサイエンス領域のスキル標準「ITSS+」の適用【要約】 |
6.1 位置付け |
6.1.1 iコンピテンシ・ディクショナリの補足として活用 |
6.1.2 従来のiコンピテンシ・ディクショナリでは、まだに辞書化が十分でない領域 |
6.1.3 知識インフラの構築は、ビッグデータや人工知能の活用が必須であり、典型的なデータサイエンス領域として位置づけられる |
6.2 スキルカテゴリ |
6.2.1 ビジネス |
6.2.1.1 課題背景を理解した上で、ビジネス課題を整理し、解決する。 |
6.2.2 データサイエンス |
6.2.2.1 情報処理、人工知能、統計学などの情報科学系の知恵を理解し、活用する。 |
6.2.3 データエンジニアリング |
6.2.3.1 データサイエンスを意味のある形に使えるようにし、実装、運用する。 |
6.3 タスク構造 |
6.3.1 |
6.4 タスク |
6.4.1 分析プロジェクトの立ち上げと組み込み後の業務設計 |
6.4.1.1 前提条件の明確化 |
6.4.1.2 目標の明確化 |
6.4.1.3 推進体制設計 |
6.4.1.4 計画の承認 |
6.4.1.5 環境整備 |
6.4.1.6 組み込み後の業務設計 |
6.4.2 データの作成と収集 |
6.4.2.1 データ分析設計 |
6.4.2.2 データ収集 |
6.4.3 構造化データ加工 |
6.4.3.1 データ加工 |
6.4.3.2 データ利用環境の構築 |
6.4.4 解析用データ準備 |
6.4.4.1 入力変数データと目的変数データの作成 |
6.4.4.2 データの準備 |
6.4.5 データ解析 |
6.4.5.1 データ集計、抽出 |
6.4.5.2 性質・関係性の把握 |
6.4.5.3 検定 |
6.4.5.4 予測・判別 |
6.4.5.5 グルーピング |
6.4.5.6 最適化 |
6.4.5.7 シミュレーション |
6.4.6 データ可視化 |
6.4.6.1 可視化の企画とデータ収集 |
6.4.6.2 2軸チャート化 |
6.4.6.3 多次元の可視化 |
6.4.6.4 関係性の可視化 |
6.4.6.5 地図上の可視化 |
6.4.6.6 挙動・軌跡の可視化 |
6.4.6.7 ダイナミックな可視化 |
6.4.6.8 リアルタイム可視化 |
6.4.7 非構造化データ処理 |
6.4.7.1 方針検討 |
6.4.7.2 言語処理 |
6.4.7.2.1 (データ収集) |
6.4.7.2.2 (辞書構築) |
6.4.7.2.3 (構造解析) |
6.4.7.2.4 (特徴量変換) |
6.4.7.2.5 (教師あり分析) |
6.4.7.2.6 (教師なし分析) |
6.4.7.2.7 (情報検索) |
6.4.7.2.8 (文書生成) |
6.4.7.3 画像処理 |
6.4.7.3.1 (類似画像推定) |
6.4.7.3.2 (画像認識) |
6.4.7.3.3 (画像復元) |
6.4.7.4 音声/音楽処理 |
6.4.7.4.1 (本人認証や話者識別) |
6.4.7.4.2 (感情分析) |
6.4.7.4.3 (テキスト化) |
6.4.7.4.4 (音楽分析) |
6.4.8 評価 |
6.4.8.1 モデル評価 |
6.4.8.2 分析評価 |
6.4.9 業務への組み込みと評価 |
6.4.9.1 業務への組み込み |
6.4.9.1.1 業務で活用するためのソリューション開発を行う(小規模な表計算ソフトでのツール開発や大規模ビッグデータシステムへの組み込みなど) |
6.4.9.2 組み込み結果の評価 |
6.4.9.3 データ分析結果活用による業務改善 |
6.4.9.3.1 データ分析結果を活用して、業務上の問題点や課題を明らかにする |
6.4.9.3.2 明らかになった業務上の問題点や課題に対する対応策を検討する |
6.4.9.3.3 検討された対応策について、業務への反映と改善を図る |
6.4.9.4 ビジネス上の効果の把握とさらなる改善 |
6.4.9.4.1 ステークホルダーからの意見や要望を収集し、さらなる改善に活かす |
6.5 詳細は、データサイエンス領域のスキル標準「ITSS+」の適用【別シート】参照 |
7 次世代サービス構築及び提供に当たって留意してほしいこと |
7.1 効率化、人はより創造的な業務へ |
7.1.1 答えが1つでアルゴリズムが明確な業務は、システム化が容易⇒人工知能化が容易 |
7.1.2 情報システムは、図書館員の仕事を効率化・高度化させるもの。そのシステムの開発には図書館員の力が必要。図書館員もITの知識が必要⇒システムライブラリアン |
7.2 保守的な組織にありがちな前例主義・横並び主義からの脱却 |
7.2.1 自分が利用者だったらどうなっていてほしいか |
7.2.2 「民間はできるが公的機関だからできない」ということはない |
7.2.3 組織規則、内規は、変えられる |
7.3 与えられた権限には、実施の責任と義務を負っている |
7.3.1 使命を果たすために与えられた権限には「実施の責任と義務がある」 |
7.3.2 できる範囲をコツコツとではなく、できる部分は責任を持って実施 |
7.3.3 できない部分は、他にどのようにしてもらいたいかも、責任を持って提示 |
7.4 サービス提供者は利用者以上のITスキルを持つ |
7.4.1 技術に進展は早い。若い利用者のIT利用技術は高い。 |
7.4.2 レガシーサービスの利用者のITリテラシーと高めることも、サービス提供者の役割 |
7.4.3 来館者のスキルが高くないのは、対応するサービス提供者のITスキルが高くないことも要因 |
7.5 One of themの組織としての役割を考える。Give&Takeの協力関係を想定する |
7.5.1 国全体がなすべき施策の中で、個別の事業の進め方を考える |
7.5.2 自分でできないことは、どのようにしてもらいたいかを提示(メリットも示す) |
7.5.3 個別案件の利害調整でなく、出版文化の発展に向けて、ビジネスモデル全体での役割調整 |
7.5.4 創造力を持ってサービスの設計・構築・提供を考える |
7.6 外部の動き(特に商用サービス)を知る組織外の情報を組織内へ |
7.6.1 他の図書館、出版界、他の業種、業態の人との交流の場への参画、主催も積極的に |
7.7 今後10年を見据える |
7.7.1 世の中の動向を想定する。⇒自分の将来を見る |
7.7.2 今の延長で可能な範囲での実施でなく、今後10年の人工知能技術の進展、その時点の社会のニーズを見据え、国全体で何をする必要があるかを考える |
7.7.2.1 その時、情報提供機関の役割は?サービス提供者の役割は? |
8 まとめ |
8.1 |
8.1.1 |
8.1.1.1 文化情報資源を中核とした「知識インフラの構築と利活用」のサービスの方向性を見極めて、提供する機関の1つとしての図書館情報サービスの構築と提供を考えていくことが重要と考える |
8.1.1.2 2040年代には、人工知能が意志や感情を持って人間を超える「シンギュラリティ―時代」が来ると言われて、また10年後にはどんな新しい技術が確立しているかわからないが、現時点での人工知能の実用化レベルでも、社会は大きく変革する。 その社会の中での図書館サービスは、従来の延長線上での業務を行っていては、有益なサービスを提供する機関としての存立が危ぶまれる |
8.1.1.3 人工知能により、人の仕事が奪われるのではなく、より人間らしい仕事にシフトしていく。 仕事が奪われるとしたら、むしろ、人工知能を活用した省力化と新しいサービスに取り組まなかったために事業を継続できなくなる機関・組織であろう。 |