将化学空间转变成可编程计算对象,浙大侯廷军、谢昌谕团队等提出SpaceGFN

专属客服号

微信订阅号
大数据治理
全面提升数据价值
赋能业务提质增效
将 ScienceAI 设为星标
第一时间掌握
新鲜的 AI for Science 资讯


编辑丨coisini
治疗分子的探索,已从天然产物的经验性发现,演进至理性、从头分子设计的时代。生成式人工智能已成为一股变革性力量,将范式从枚举库的被动筛选,转向化学空间的主动探索。
然而,一个根本性局限依然存在:当前大多数模型将化学空间视为一个固定的、从精选数据库中隐式学习得到的分布。它们在一个由数据定义的流形内运作,未能显式控制化学空间自身的结构组织。
基于此,来自浙江大学药学院的侯廷军和谢昌谕团队等提出一个将空间定义与空间探索解耦的框架 ——SpaceGFN,从而将分子宇宙从静态约束转变为可控变量。研究团队认为:分子设计的下一前沿在于将化学空间提升至一个可编程的计算对象。
通过将可编程的、由反应定义的化学空间与生成流网络(GFlowNets)相结合,SpaceGFN 能够构建并自适应地遍历为特定治疗假说量身定制的结构化宇宙。

论文地址:https://arxiv.org/abs/2603.00614
SpaceGFN
为应对药物开发中苗头化合物发现与先导化合物优化的差异化需求,该研究设计了 SpaceGFN 的两种模式 —— 发现模式与编辑模式。

发现模式(Discovery mode)通过两种不同策略展示了空间级编程的深远影响。
首先,该研究构建了一个拟天然产物空间,系统性地组装出重现天然产物结构复杂性的分子架构 —— 这是许多计算库中仍探索稀少的化学空间区域。

更重要的是,该研究引入了一个受进化启发的进化空间,该空间由内源性代谢物和酶催化转化构建而成。进化空间并非仅依赖 post hoc ADMET 筛选,而是将进化生化原理作为结构先验,嵌入到生成过程中。通过利用生命系统历史上处理过的分子基序,这一先验在保持药理多样性的同时,引导了预测代谢与毒理学分布向统计上更有利的方向偏移。

在编辑模式(Editing mode)下,SpaceGFN 通过应用由可执行合成转化组成的精选分子编辑工具包,实现了与反应一致的先导化合物优化。这使得对现有化合物进行局部的、考虑合成可行性的修饰成为可能,而非进行不受限制的图结构突变。针对 96 个药物靶点,SpaceGFN 在合成约束下实现了稳健的优化性能,同时保持了结构多样性。

通过将可编程的化学宇宙构建、基于流的探索以及反应级编辑统一于一体,SpaceGFN 建立了一个用于审慎设计与导航治疗性化学空间的计算框架,架起了连接生成式人工智能、合成方法学与生物学设计原理的桥梁。
局限性与未来方向
该研究在 96 个不同的药物靶点上对 SpaceGFN 进行了验证。结果表明,在明确的合成约束条件下,SpaceGFN 在实现稳健优化性能的同时,大幅拓展了分子拓扑结构的多样性。

需要注意的是,该研究中所有验证均为计算性的,这些结果反映的是计算机内的性能指标,而非经验性的药代动力学结果。
此外,可编程空间的表现力受限于用于构建它的反应规则和构建块。然而,研究团队认为这也是一种优势:SpaceGFN 并非试图取代人类专业知识,而是为药物化学家提供一种媒介,将他们的领域特定直觉形式化为可执行的结构先验。
展望未来,可编程化学空间设计可能受益于适应性优化循环,其中实验反馈会重塑底层空间定义。从这个意义上说,SpaceGFN 为闭环范式提供了计算支架,其中化学宇宙设计与实验验证共同演化。
人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。

