「オープンサイエンス」の拡大がイノベーションの促進につながる–NIIが目指す先
今回は「「オープンサイエンス」の拡大がイノベーションの促進につながる–NIIが目指す先」についてご紹介します。
関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
国立情報学研究所(NII)は7月28日、都内で記者懇談会を開催した。4月1日付で所長に就任した黒橋禎夫氏が、NIIの方向性と生成AIのインパクトについて講演した。
NIIは、情報学に関する総合研究と学術情報の流通のための先端的な基盤を開発する国立研究開発法人。NIIの取り組みについて黒橋氏は「情報学は社会と非常に近いものであり、使われる技術であるため、『研究』とそれから(研究したものを)実際に使う『事業』の両輪で進めている」と話す。
研究では、数理情報や量子コンピューティング、人工知能/機械学習(AI/ML)などを研究する「情報学プリンシプル研究系」、ネットワーク・計算機アーキテクチャーやソフトウェア工学などを研究する「アーキテクチャ科学研究系」、テキスト・自然言語処理(NLP)やコンピューターグラフィックスなどを研究する「コンテンツ科学研究系」、学術情報や図書館情報学などを研究する「情報社会相関研究系」の4つの研究系がある。
事業では、学術情報ネットワーク「SINET6」を基盤に、セキュア蓄積環境、人材育成基盤、研究データ基盤「NII RDC(Research Data Cloud)」を提供し、日本の学術研究活動を支えている。同氏は、「オープンサイエンスに対応する形で、研究データ基盤に新しい機能を拡張する」と説明。
5月に仙台市で開催された「G7科学技術大臣会合」において焦点となった「オープンサイエンスの拡大の推進」を取り上げ、さまざまな社会課題の解決には複数の分野の協力が必要であり、オープンサイエンスによってイノベーションの促進や知識へのアクセスの民主化に貢献できるとし、NIIでも同様にオープンサイエンスの拡大に注力するという。
NII RDCは、研究データのライフサイクルに即した3つの基盤「管理基盤(GakuNin RDM)」「公開基盤(JAIRO Cloud)」「検索基盤(CiNii Research)」から構成されている。GakuNin RDM(Research Data Management)は、研究者が研究データや関連資料を管理・共有するための研究データ管理サービス。2023年5月現在、各大学や研究所など67機関で利用されているという。
JAIRO Cloudは、研究成果を収集・保存・発信する機関リポジトリーのクラウドサービスとして提供しており、2023年4月末時点で737機関が同サービスを活用している。CiNii Researchは、海外の研究データ公開基盤や分野別リポジトリーと連携した日本最大規模の学術情報検索サービス。これら3つの基盤により、研究データの管理・保存と公開・蓄積、そして検索・利用が実現できる。
NIIでは、文部科学省が進める「AI等の活用を推進する研究データエコシステム構築事業」を理化学研究所、東京大学、名古屋大学、大阪大学と共に受託し、NII RDCを中心に基盤の機能高度化やガイドラインの作成など、幅広く取り組んでいる。同事業は、デジタル技術とデータ活用による研究活動の変革を促進するため、「ユースケースの形成、普及」「データ共有・利活用の促進」「研究デジタルインフラ等の効果的活用」を一体的に進めることを目的にしている。
2022年度から開始した同事業を促進するため、NIIはNII RDCの3つの基盤を「データガバナンス機能」「キュレーション機能」「秘匿解析機能」「人材育成基盤」「セキュア蓄積環境」「データプロビナンス機能」「コード付帯機能」――の7つの側面で高度化し、2027年までに全てを実現するとしている。
今後のビジョンについて黒橋氏は、「各事業を高度化したりユーザーを増やしたりすることが非常に重要だと思う。加えて、やはり研究と事業がさらに密接に関係していけるのではないかと考えている。情報学は人や社会が使って改善していく面があるので、この間の距離を縮めていきたい」と話した。
また、NIIは2022年12月に日本学術会議の「未来の学術振興構想」の策定に向けた「学術の中長期研究戦略」に提案。NII RDCの拡充に加えて、専門家レベルのテキスト読解能力と推論能力を備えたAI基盤モデルにより、NII RDCで集まったデータをAIが学習することで、さまざまな分野を解釈して学術分野の垣根を越えた「知識基盤」を構築する。この基盤により、「新たな知の創造」や「1つの学問分野では解決できない複合的な社会課題の解決」を支援していくという。
データ基盤から知識基盤へ
黒橋氏は次に生成AIについて言及。生成AIの課題として「自然言語処理の研究者も何が起こっているか分かっていない」ことを挙げた。大規模言語モデル(LLM)の高機能性や汎用(はんよう)性、事実と異なる回答を出力するハルシネーションの原理解明が必要だという。
原理解明を進める上では、「LLMの研究開発が一部の組織の寡占状態であることは健全とは言えない」と指摘。完全にオープンで商用利用できるモデルを継続的に構築し、LLMの原理解明や多分野展開などの研究開発を進めることが重要だと訴えた。
この課題に対して、NIIではLLM勉強会を定期的に開催。産学の自然言語処理および計算機システムの研究者約200人が参加しており、オープンかつ日本語に強いLLMを構築し、LLMの原理解明に取り組むとしている。
LLM勉強会で作成されたモデルやデータ、ツール、技術資料などの成果物は議論の過程・失敗を含めて全て公開する予定だという。