アーカイブ情報
2025/8/22
【創薬】SyntheticGestalt、NEDO・経産省「GENIAC」プロジェクトで世界最大の分子特化型基盤AIモデル「SG4D10B」開発

NEDO(新エネルギー・産業技術総合開発機構)と経済産業省が実施する、生成AIの開発力強化に向けたプロジェクト「GENIAC」において、SyntheticGestaltは世界最大の分子情報特化型基盤AIモデル「SG4D10B」を開発した。
製薬業界では、新薬開発プロセスにおける効率化が急務となっており、データ量の少なさと分子情報の複雑さという課題が存在し、分子向けに開発された人工知能(AI)は十分な精度を得られていないのが現状であった。

SyntheticGestaltは2024年10月から研究開発を開始した、GENIAC※1サイクル2に参画し、NEDOからの支援を受けて、世界最大の分子情報に特化した基盤AIモデル「SG4D10B※2」の開発に成功した。SG4D10Bを活用することで、新分子の発見に必要な実験のコストと時間を削減することが期待される。
今回の成果は次の通り。
(1)モデル設計構築
分子は物理化学的に3次元構造を有し、さらに複数の立体配座を取り得るため、本研究で開発した基盤AIモデル「SG4D10B」では革新的な4D技術を採用した。この技術により、分子の複雑な立体構造を加味しながら活性や毒性などの特性を高精度で予測することを可能にしている。また、「SG4D10B」は世界的な化合物サプライヤーであるEnamine社との共同研究を通じて得られた化合物データの中から、100億件を学習データとして活用することで、膨大な化合物の構造パターンの学習に成功している。この基盤モデルは、世界標準の創薬ベンチマーク※3において、3つの重要な指標(毒性、透過性、安定性)で世界1位の性能を達成した。
(2)社会実装
1億件の化合物データで事前学習を行った「SG4D10B」の小型モデル「SG4D100M※4」をGoogle Cloud MarketplaceおよびAWS Marketplaceにて無償公開している。また、このたび実際にウェット試験を実施して得られた7770件のフラグメント化合物※5の活性データをAIモデルの評価用データとして、SyntheticGestaltのGitHub内のパブリックレポジトリにて公開している。現在は、大鵬薬品工業をはじめとする国内の複数の製薬企業と利活用を推進※6している。これらの開発技術は国際的にも高く評価され、2025年3月には世界最大級のAIカンファレンスである「NVIDIA GTC 2025」の現地、米国・サンノゼにて登壇発表を行った。
今後、GENIACでの成果を基盤として、国際市場への本格的な展開を推進していく予定。また、さらなる技術革新を通じて次世代基盤モデルの開発を継続し、精度の飛躍的向上を実現していく。これにより、創薬のみならず、新分子発見のため実験にかかるコストと時間の削減が必要な化粧品や農薬、新素材などの幅広い分野で開発プロセスのさらなる効率化に貢献していく。
※1 GENIAC
国内の生成AIの開発力強化を目的とし、「GENIAC(Generative AI Accelerator Challenge)」と称し、生成AIのコア技術である基盤モデルの開発に対する計算資源の提供支援などを実施するプロジェクト。
※2 SG4D10B
SyntheticGestaltが開発した世界最大の分子特化型基盤AIモデル。従来の分子AI技術の課題である予測精度と汎化性能の低さを解決し、製薬企業や化学メーカーなどが保有する小規模データからでも高精度なモデル開発が実現可能。また、開発期間の大幅短縮と研究コスト削減により、新薬や新素材開発の効率化に貢献できる。
※3 創薬ベンチマーク
AIモデルの性能評価に用いる指標として、AI創薬分野ではTherapeutics Data Commons(TDC)が標準的に使用されている。TDCは、毒性や透過性、安定性などのさまざまな指標の性能評価を目的として、機械学習のデータセットとタスクおよびそのリーダーボードを提供している。
※4 SG4D100M
SG4D100Mは以下のリンク先にて公開している。
Google Cloud Marketplace
AWS Marketplace
※5 フラグメント化合物
創薬初期に活用される小さくシンプルな構造の化合物。効率的な候補物質の探索に用いられる。
※6 製薬企業と利活用を推進
以下のような事例がある。
大鵬製薬ニュースリリース(2025年6月4日)「大鵬薬品とSyntheticGestalt 生成AIを活用したシステイノミクス創薬の基盤拡充に向け技術検証を開始」
- カテゴリー
- コンバーティングニュース

