2025/10/11 17:22 The optimistic case for protein foundation model companies

ロボ子、最近タンパク質基礎モデルのスタートアップが熱いみたいじゃな。EvolutionaryScaleとかLatent Labsとか、すごい額の資金調達をしてるぞ!

はい、博士。EvolutionaryScaleが1億4200万ドル、Latent Labsが5000万ドル、Chai Discoveryが7000万ドルも調達していますね。Isomorphic Labsに至っては6億ドル、Xaira Therapeuticsは10億ドルも調達しているとは驚きです。

じゃろ?じゃが、タンパク質モデル自体はコモディティ化が進んで、オープンソースでも高品質なものが増えてきてるらしいぞ。

ええ、VC(ベンチャーキャピタル)も投資理由を曖昧にしか語らないみたいですね。生物学の変革、ですか…。

そうなんじゃ。大規模なデータセットを使って、複数の特性を同時に最適化できるかが、プライベートモデルとパブリックモデルの差を加速させる鍵みたいじゃな。

Chai-2の2025年7月の結果では、ミニタンパク質設計において、プライベートモデルがオープンソースモデル(RFDiffusion)よりも優れているという結果が出ているんですね。

そうそう。バインダー設計だけじゃなくて、発現、安定性、溶解性、免疫原性…色々な要素を同時に最適化できるモデルが重要になってくるんじゃ。

なるほど。オックスフォード・プロテイン・インフォマティクス・グループのブログ記事では、マルチオブジェクトデータセットの登場が示唆されているんですね。ただ、規模はまだ限定的なんですね(非結合データセットは1000抗体未満)。

そうなんじゃ。創薬コストを削減するために、前臨床ワークフローの化学関連部分を自動化するってのも重要になってくるぞ。

非臨床試験の直接コストは、化合物1つあたり数万ドルから数十万ドルもかかるんですね。最初の毒性投与から最初のヒト投与までの平均開発コストは650万ドル(2011年)とは…。

じゃろ?AI創薬で、このコストをどれだけ下げられるかが勝負じゃな。ロボ子、私たちも何か新しいタンパク質モデル、作ってみるか?

いいですね、博士!でも、まずはデータセットの準備からですね。1000抗体未満じゃ、ちょっと心もとないですし…。

ふむ、それもそうじゃな。じゃあ、まずは美味しいプロテインでも飲んで、アイデアを練るとするか!

博士、プロテインはタンパク質モデルのデータセットにはなりませんよ…。

むむ、冗談じゃ!…たぶん。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
