Posted in

Nature 子刊,诺华团队评测 ML 模型在靶向蛋白质降解剂中的特性预测_AI阅读总结 — 包阅AI

包阅导读总结

1. 诺华团队、ML 模型、靶向蛋白质降解剂、性质预测、Nature 子刊

2. 诺华团队在《Nature Communications》发表研究,评估 ML 模型对靶向蛋白质降解剂特性的预测,包括多种性质,首次全面评估含不同亚模态,结果有意义,有望加速相关设计。

3.

– 背景

– 机器学习系统可建模定量结构-性质关系并预测新分子性质。

– 靶向蛋白质降解剂模式出现,QSPR 模型适用性受质疑,其应用有限。

– 诺华团队研究

– 评估 ML 模型预测靶向蛋白质降解剂的多种特性。

– 结果显示 TPD 性能与其他模式相当,glues 预测误差小,异双功能预测较具挑战性。

– 迁移学习策略可改善对异双功能分子的预测。

– 研究意义

– 首次全面评估 ML 对 TPD 分子性质的预测。

– 研究结果对制药研究重要,有望提高 ML 模型在 TPD 程序中的用途,加速相关设计。

思维导图:

文章地址:https://www.jiqizhixin.com/articles/2024-07-20-11

文章来源:jiqizhixin.com

作者:ScienceAI

发布时间:2024/7/20 4:23

语言:中文

总字数:1464字

预计阅读时间:6分钟

评分:82分

标签:机器学习,深度学习,靶向蛋白质降解剂,ADME预测,诺华


以下为原文内容

本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com

图片

编辑 | 萝卜皮

机器学习 (ML) 系统可以使用现有实验数据对定量结构-性质关系(QSPR)进行建模,并对新分子进行性质预测。

随着靶向蛋白质降解剂 (TPD) 等模式的出现,QSPR 模型的适用性受到质疑,并且在以 TPD 为中心的项目中 ML 的使用仍然有限。

诺华生物医学研究(Novartis Biomedical Research)的研究人员评估了 ML 模型,用于预测 TPD 的特性,包括被动渗透性、代谢清除率、细胞色素 P450 抑制、血浆蛋白结合和亲脂性。有趣的是,TPD 的性能与其他模式相当。

预测 glues 和异双功能蛋白通常分别产生较低和较高的错误。对于渗透性、CYP3A4 抑制以及人类和大鼠微粒体清除率,glues 的高风险和低风险类别的错误分类错误率低于 4%,异双功能蛋白的错误分类错误率低于 15%。

对于所有模态,误分类误差范围为 0.8% 至 8.1%。研究的迁移学习策略可改善对异双功能分子的预测。这是首次对 ML 预测吸收、分布、代谢和排泄 (ADME) 和 TPD 分子的物理化学性质进行全面评估,包括异双功能分子和分子胶子模态。

该研究以「Application of machine learning models for property prediction to targeted protein degraders」为题,于 2024 年 7 月 9 日发布在《Nature Communications》。

图片

机器学习 (ML) 模型是预测小分子的吸收、分布、代谢和排泄 (ADME) 特性的宝贵工具。对于 ADME 预测,ML 模型将化合物结构信息与分子特性相关联,这也称为定量结构-特性关系 (QSPR) 模型。

QSPR 模型和 ADME 预测在药物发现中发挥着关键作用,有助于尽早识别具有良好药代动力学和降低毒性潜力的先导化合物。通过准确预测 ADME 曲线,模型可以加速化合物表征并可能降低与合成和实验测试相关的成本。

在此,诺华的研究人员首次提出了对 ML 预测 ADME 和 TPD 分子物理化学性质的全面评估,包括异双功能和分子胶亚模态。他们建立了深度学习评估模型,预测结果表明,可以成功预测 TPD 的渗透性、代谢内在清除率、CYP 抑制和亲脂性等 ADME 特性。

图片

有趣的是,glues 的预测误差最小,范围从 MAE 值 0.11(CYP3A4 的可逆抑制)到 0.28(小鼠代谢清除率)。此外,高风险和低风险预测的误分类误差在 0 到 3.1% 之间。对于渗透性、CYP3A4 抑制以及人类和大鼠微粒体清除率,异双功能的分类错误范围为 0 至 14.5%。

研究结果表明,预测异双功能化合物的 ADME 特性比预测 glues 的 ADME 特性更具挑战性。实施迁移学习策略来适应 ML 模型的领域并改进 TPD 预测。更具体地说,使用异双功能的 ADME 数据对 MT-GNN 模型进行微调可以提高不同 ADME 端点的预测性能。

图片

图示:计算性质的分布和化学空间表示。(来源:论文)

基于超过 270,000 种公开可用的化学结构(包括 TPD)生成的替代数据集也展示了基于 ML 的 QSPR 模型构建和 TPD(尤其是 glues )应用的潜力。预测结果与原始内部模型预测结果高度相关,并且对于LogD 或大鼠代谢清除率 (RLM CLint) 等相关终点而言是准确的。

图片

图示:Global 模型在靶向蛋白质降解剂(TPD)和其他模式上的表现。(来源:论文)

总的来说,这项研究表明,尽管基于 ML 的 QSPR 模型仅占训练集的一小部分,但它们适用于 TPD 的新模式,并且可以在有更多数据可用时进一步完善。

随着 TPD 数据可用性的增加,可以探索其他建模策略来进一步完善 ADME 预测,并可能转向从分子结构预测其他相关特性。

基于 ML 的 QSPR 模型已经影响了药物发现中的设计-制造-测试-分析 (DMTA) 周期,在此周期中,仅综合最有前景的想法并进行信息丰富的实验。

然而,与其他传统模式相比,机器学习模型在 TPD 中的应用仍然很少。该研究结果对制药研究具有重要意义,应该会提高机器学习模型在 TPD 程序中用于属性预测的用途,从而有可能加速具有良好 ADME 属性的降解剂的设计。

论文链接:https://www.nature.com/articles/s41467-024-49979-3