2024年のノーベル賞のうち、物理学賞と化学賞が機械学習の研究に授けられたことは、科学における人工知能(AI)の存在感の高まりを強く印象づけた。実際、科学へのAI活用は急速に進んでいる。その1つが、実験で得られた数値や画像などをAIに学ばせる「基盤モデル」の開発だ。理化学研究所は、一生分のマウスの行動記録などの大量の実験データを用い、コンピュータ内で複雑な自然現象を再現する基盤モデルの開発を始めている。(文中敬称略)
「基盤モデル」という言葉は21年にスタンフォード大学のボッマサーニ(Rishi Bommasani)らが提唱した。大量の言葉を学んだ大規模言語モデルと同じように、数値や画像、音声など様々な種類のデータを学習させたAIが基盤モデルだ。同大には現在「基盤モデル研究センター」が設置されている。他にも、米アルゴンヌ研究所を中心に、生命科学や物質科学、気候変動に至るまで幅広い科学分野で使える大規模な基盤モデルを構築する国際プロジェクトが進行中だ。
日本でも、理化学研究所が24年4月に「科学研究基盤モデル開発プログラム」を立ち上げた。プロジェクトを率いる泰地真弘人プログラムディレクターは「近年になって、機械学習を用いて複雑な対象を理解する手法が一気に強力になった」と指摘する。
たとえば物理の運動方程式で星の動きを計算するのは可能でも、体の中で起こる小さな分子の変化が全身レベルの病気に至るまでの過程を細かくシミュレーションするのは難しい。それは、計算量があまりに多かったり、そもそも数式が存在しなかったりするためだ。しかし機械学習なら、数式がなくてもデータから予測ができる。それはつまり、コンピュータで扱える科学の領域が広がることを意味する。
泰地らの基盤モデル開発の特徴は、AIを作るだけでなく、AIに学習させる高品質の実験データの取得を同時に進めている点にある。たとえば生命科学の基盤モデルを構築するため、現在泰地らは「個体レベル」と「細胞レベル」の2種類のデータセットの取得を計画している。
前者は、具体的には動物行動に関するデータセットだ。マウスが生まれてから死ぬまで、一生の間の映像や音声による行動記録と、遺伝子の発現状況のデータを取り続ける。同じ現象を複数の方法で観測することで、データ間の関係性を基盤モデルに学習させる。さらに、健常なマウスと、人間で起こる様々な病気を再現したヒト疾患モデルマウスの双方で実験データの取得を行う予定だ。マウスにおいてDNAやたんぱく質の変化と病気の関係性を網羅的に学習した基盤モデルは、人間の医学研究に役立つ。
後者の細胞レベルでは、iPS細胞など約100種類の細胞について、5000種類の薬物にどう反応するかを調べる。目指すのは、外部からの刺激に細胞がどう応答するかを網羅的に学んだ基盤モデルだ。泰地らは生命科学の他に、材料科学や創薬の基盤モデル開発も進める。「25年度の末までに試験版の基盤モデルを幾つかリリースする」のが目標だ。
泰地は「最終的にやりたいのは、複雑な自然現象をコンピュータで再現する『デジタルツイン』を基盤モデル上に作ること」だと話す。こうした考え方は、24年のノーベル化学賞を受賞した英グーグル・ディープマインドのデミス・ハサビスも示している。
基盤モデルは、研究のあり方自体を今後大きく変えそうだ。たとえば、現在はデータベースや個々の論文で提供される実験結果の知識共有が、基盤モデルを介して行われるようになるかもしれない。直接論文などを検索するのではなく、基盤モデルと対話して先行研究で得られた知見にアクセスするやり方だ。
こうした変化は創薬や材料開発などの研究を効率化するだろう。その反面、「研究を行う楽しみが人間から損なわれてしまう可能性もある」と泰地は話す。ただ、科学研究へのAIの応用は米国や中国を筆頭に、すでに世界中で加速している。「現代は人間活動全体がAIで大きく変化しようとしている時期だ」と泰地はいう。「そこに居合わせた自分が科学者としてどう貢献できるか考えながら、このプロジェクトに取り組んでいる」
(日経サイエンス編集部 出村政彬)
詳細は12月25日発売の日経サイエンス2025年2月号に掲載
この書籍を購入する(ヘルプ): Amazon
【関連記事】
- ・1本の巻物が呼ぶ波乱 江戸の天才数学者、関孝和の実像
- ・自然に分裂する人工細胞 偶然が産んだ生命の「OS」
- ・津波石が語る過去の巨大地震 「想定外」を伝える痕跡
鄭重声明:本文の著作権は原作者に帰属します。記事の転載は情報の伝達のみを目的としており、投資の助言を構成するものではありません。もし侵害行為があれば、すぐにご連絡ください。修正または削除いたします。ありがとうございます。