生成AI

最終更新日:2025/06/30
ヒューマノーム研究所は、約3億パラメータを持つ世界最大級のシングルセル遺伝子発現モデル「CellScribe」を開発しました。これにより、多種多様な医療品開発と疾患の克服を目指します。
このニュースのポイント
株式会社ヒューマノーム研究所は、約9億細胞のデータを用い、3億パラメータを持つ世界最大級のシングルセル遺伝子発現量基盤モデル「CellScribe(セルスクライブ)」を開発しました。
新薬の研究開発には、通常10年以上と1000億円以上の投資が必要であり、特に新しいタイプの医薬品や治療手段の開発では過去に類似実験例が無いことが多く、薬剤候補による生体へ影響予測が難しいという課題がありました。
この課題に対し、細胞ひとつひとつの遺伝子活動(発現)を詳細に捉えるシングルセル解析技術が近年目覚ましい進捗を遂げていますが、得られるデータは膨大かつ複雑なため、効率的に解析する新たな基盤が求められていました。
今回開発された「CellScribe」は、先行研究であるscFoundationのアーキテクチャをベースに拡張した3億パラメータのモデルとして開発されており、シングルセル解析から得られた遺伝子発現データを効率的かつ高精度に解析できます。
利用者の実験データとモデルを組み合わせることで、そのデータが持つ特徴や傾向などを予測できます。また、細胞間の関係性や多様性を俯瞰する「地図」として機能し、創薬データの解析を支援。これまで見過ごされていた創薬ターゲット候補や新たな作用経路の発見を可能にし、研究開発の時間短縮と効率化に貢献します。
また、データセットの準備にあたり約9億細胞分の遺伝子発現量データをCellxGeneなど4つの公開データベースから集め、高品質な約3億細胞のデータセットを構築しました。多様な細胞種や状態における遺伝子発現プロファイルを大規模モデルで学習したことで、未知のデータに対する高い汎化性能の獲得と顕著な性能向上を見込んでいます。
「CellScribe」は、遺伝子発現量基盤モデルの予測誤差の指標として用いられる平均二乗誤差において0.295を記録し、比較対象となる非対称エンコーダ・デコーダ型の最先端モデル「scFoundation」と比べて予測誤差を約7.8%改善、世界最高性能を達成しました。
ヒューマノーム研究所は「製薬企業やアカデミアとの連携を強化し、実際の創薬研究や疾患メカニズム解明に取り組み、生命科学分野でのAI活用の推進と、新薬開発のコスト削減を図ります」とコメントしています。
出典:PR TIMES
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら