革新的基盤モデルで期待高まる医療AI の今後

イノベーションを加速させる世界初の取り組みとは

  • Facebookでシェアする
  • Medical Tribune公式X Xでシェアする
  • Lineでシェアする
感染症ビジョナリーズ 感染症ビジョナリーズ

研究の背景:基盤モデルとはAIにおける「万能な多機能ナイフ」である

 皆さんもChatGPTをご存じだろう。この大規模言語モデル(LLM)は、人工知能(AI)技術のパラダイムシフトを象徴する機械学習システムである。ChatGPTのようなモデルは、特定のタスクのために設計された従来のAIモデルとは異なり基盤モデル(Foundation Model;FM)と呼ばれる、より汎用的なカテゴリに属する。

 従来のタスク特化型モデル(Task Specific Model;TSM)は、特定の疾患名だけを完璧に知っている専門医のようなものである。専門分野外の領域(例:放射線画像 vs. 眼科画像)については全く知識を持たず、訓練された範囲外のデータには対応できない。それに対して、FMとは膨大な量の広範なデータを用いてタスク非依存的な方法で事前学習され、多岐にわたる下流タスクに対応可能な汎用AIモデルのことである。

 事前学習とは、ラベルなしの広範なデータセットを用いて、モデルが一般的なパターンや知識を獲得する初期段階の学習であり、まさに人類の知識を詰め込んだ「百科事典の熟読」といえる。特定のクイズ(タスク)の答えを暗記するのではなく、膨大な情報(未ラベルデータ)から、世界(データ)の一般的な構造と意味を理解する基礎教育機関である。

 TSMが特定の疾患診断(パンを切る)に特化した単一のナイフだったのに対し、知識を詰め込んだFMはいわばAI界の「万能な多機能ナイフ」である。一度この汎用的な基盤が構築されると、モデルは指示文(プロンプト)や追加の微調整(ファインチューニング)のための最小限のラベル付きデータしか必要とせず、ゼロショット学習や少数ショット学習で高い性能を発揮できる。

 FMは研ぎ澄まされた刃(基礎知識)を持つため、わずかな教師データを用い少し調整するだけで、画像分類、セグメンテーション、報告書作成など、あらゆるタスクに対応できるのである。このように、FMはTSMと比較して、適応性、堅牢性、効率性が著しく向上している。

 FMの構築は、主に大規模データにプラスして、技術的な進歩、すなわちニューラルネットワークアーキテクチャの進歩(特にTransformer)、自己教師あり学習(Self-Supervised Learning;SSL)やコントラスト学習などの学習アプローチ、および計算能力の相乗効果によって急速に進展した。以下にFMとTSMの違いをまとめておく(表1)。

表1.FMとTSMの比較

 他方、医療AI分野の状況はどうなっているのか?今回は、私も著者に名前を連ねる「世界初となる真にグローバルな医療FMの構築」に関する書簡について触れながら解説する(Nat Med 2025年9月8日オンライン版)。

柳 靖雄(やなぎ やすお)

医療法人社団祥正会お花茶屋眼科手術外来院長、横浜市立大学視覚再生外科学客員教授、デューク・シンガポール国立大学医学部Adjunct Professor

東京大学医学部を卒業(1995年、MD)し、同大学大学院で医学博士号を取得(2001年、PhD)。基礎医学に強固な学術的バックグラウンドを持ち、200本以上の科学論文を執筆、国内外で10以上の賞を受賞。東京大学医学部眼科学教室講師(2012~15年)、デューク・シンガポール国立大学医学部准教授(2016~20年)、旭川医科大学眼科学教室教授(2018~20年)を歴任し、現在は横浜市立大学視覚再生外科学客員教授(2020年~)およびデューク・シンガポール国立大学医学部Adjunct Professor(2020年~)として国際共同研究に積極的に関与している。専門は黄斑疾患で、新規治療薬に関する特許を多数出願。スタンフォード大学とエルゼビア社が2024年に発表した「世界のトップ2%の科学者リスト」に選出された。DeepEyeVisionの取締役としてAI技術の開発に携わり、国際誌「TVST」や「Scientific Reports」の編集者としても日本のプレゼンス向上に貢献。都内のクリニックでは質の高い診療を提供し、地域医療にも尽力。現在、医療経済研究、創薬、国際共同臨床研究など多岐にわたる分野で積極的に活動している。

柳 靖雄
  • Facebookでシェアする
  • Medical Tribune公式X Xでシェアする
  • Lineでシェアする