AI分子设计能有多猛?Insilico一口气生成1亿候选化合物,围剿炎症靶点NLRP3!
作者:微信文章Insilico一口气生成1亿候选化合物
围剿炎症靶点NLRP3!
BioTender | AI4Chem
在药物设计的世界里,想从浩如烟海的化学空间中找到一个能靶向疾病的好分子,难度堪比在银河中找一颗合适的星球。而Insilico Medicine最新发布的一篇论文,展示了他们如何用AI一口气生成超过1亿个候选小分子,精准围猎复杂的炎症靶点——NLRP3。这篇文章,值得每一个关注AI制药的人认真读一读。
点击查看原文Molecular LEGION.pdf
为什么要探索“化学空间”?
我们常说“药物筛选”,其实是在一个被称为化学空间(chemical space)的虚拟宇宙中寻找分子。这个空间的理论规模高达10⁶⁰,是我们目前合成药物数量的亿万倍。而传统药物设计方法,只覆盖了极小一部分,很多可能有效的分子我们根本没见过。
The topology of chemical space.
NLRP3:一个“难搞但高价值”的靶点
NLRP3 是一种参与炎症反应的蛋白,被认为是治疗自身免疫疾病的关键靶点之一。虽然各大药企都在盯它,但目前还没有任何一个NLRP3小分子药物上市。难点在于它结构复杂、选择性差、机制难控——用传统方法设计,太难了。
The chemotypes of co-crystallized NLRP3 inhibitors.
LEGION:AI分子设计的“军团系统”
为此,Insilico Medicine 搭建了一个命名霸气的 AI 工作流——LEGION,全称:
Latent Enumeration, Generation, Integration, Optimization, Navigation
(潜在枚举、生成、整合、优化与导航)
简单说,LEGION 是一个专为“大规模生成新分子”而生的 AI 军团。它不是简单用模型生几个分子,而是围绕 NLRP3 这个靶点,完成了一整套 AI 设计—筛选—优化—验证的闭环。
LEGION workflow
LEGION 的三步走战略
Scaffold Seeding:找支架
用 AI 挖掘了 34,000 多个化学支架(分子的核心骨架)
来源包括:
AI 生成模型(MolGrow、GenGramm)
AI 智能筛库(从ChEMBL、PubChem等15M分子中智能挑选)
Scaffold seeding for NLRP3 potential ligands
Enumeration:生成大军
利用上述支架进行组合生成,爆炸式扩展:
生成式化学生成:6.5百万分子
组合爆炸式生成:约 1.1亿个分子
都是符合基础可合成性、结构规则的“靠谱分子”
Combinatorial expansion of trivalent scaffolds to bivalent ones.
Extrapolation:验证命中率
从生成的分子中随机抽样做三维建模打分
命中率:
AI生成分子中有 58.8% 能绑定NLRP3
组合爆炸分子中有 8–26% 能绑定
结果展示:可视化的化学空间覆盖
作者还用 GTM可视化技术 展示了 AI 筛选 vs AI生成的分布:
两者覆盖的区域几乎互补
合起来几乎覆盖了 NLRP3 相关的关键化学空间
结论:筛选 + 生成是双保险
Classification GTM landscape demonstrating the distribution of chemical structures obtained from AI Screening (class 0, black color) and Generation (class 1, dark red color)
LEGION 有什么用?
早期药物发现加速器:快速生成新颖且合理的候选分子
“伞式专利”战略支持:自动生成海量变体用于IP布局
靶点探索“放大镜”:AI可识别未知结构与已有药物间的潜在联系
局限也有:
如果缺少蛋白结构或SAR信息,系统效果会下降
组合爆炸虽然快,但命中率低于生成式化学
当前平台并非完全开源,仅限 Chemistry42 内部使用
BioTender
LEGION 是目前最完整的大规模AI分子设计系统之一,首次展示了如何围绕一个复杂蛋白靶点,生成并筛选亿级分子,并取得显著命中率。
如果你也在研究 AI4Bio、AI4Chem、AI4Protein、蛋白互作预测、抗体设计、药物筛选,欢迎扫码添加小编,加入交流群👇一起追踪最新进展!
页:
[1]