总结

  • 然而,现有方法的准确性仍需提高。 另一方面,大多数深度学习方法只关注非共价(非键合)结合分子系统的预测,而忽略了在药物开发领域越来越受到关注的共价结合的情况。 为了处理如此复杂的问题,研究人员分别对蛋白质和药物分子使用了不同的表示。 具体来说,通过使用非键合蛋白质-配体相互作用的数据集训练模型来构建初始框架。 对于广泛使用的数据集 Davis,该团队提供了一个手动校正的 Davis 数据库。 为了优化性能,还在 CovalentInDB 数据库中的较小共价相互作用数据集上对该模型进行了微调。 结果表明,与单独使用 BindingDB 数据相比有了显著改进,预测非共价结合亲和力平均提高了 7.6%,预测共价结合亲和力平均提高了 62.9%。 该研究以「TEFDTA: a transformer encoder and fingerprint representation combined prediction method for bonded and nblog.byteway.neton-bonded drug–target affinities」为题,于 2023 年 12 月 23 日发布在《Bioinformatics》。 在药物研发领Ligthing News域,预测药物与靶点相互作用/亲和力(DTI/DTA)是不可或缺的组成部分。 在早期阶段,研究人员通过实验确定这些相互作用,这既耗时又昂贵。 随着计算机技术的进步,研究人员开始利用计算机来预测药物与靶点的相互作用,并使用对接程序(例如 GLIDE、Molegro Virtual Docker)模拟药物与靶点的结合姿势。 TEFDTA 从两个现有模型 DeepDTA 和 TransformerCPI 中汲取灵感。 DeepDTA 提供了一种使用 1D-CNN(一维卷积神经网络)从序列中提取特征的方法。 该模型侧重于从序列信息中提取局部模式特征,以方便特征提取。 虽然循环神经网络(RNN)也可以处理一维输入并执行特征提取,但它们存在某些局限性。 另一方面,CNN 在有效捕获全局特征方面存在局限性。 RNN 尽管能够通过网络传播处理整个序列,但会遇到随着时间的推移而忘记信息的问题。 TransformerCPI 证明 Transformer 可以有效解决 CNN 和 RNN 模型中存在的问题。 鉴于此,该团队利用 Transformer 作为特征提取器来提取复杂的分子序列。 为了评估 TEFDTA 的性能,研究人员在 Davis、KIBA 和 BindingDB 数据集上进行了实验,并将结果与其他结合亲和力预测模型(即 DeepDTA 和 DeepCDA)进行了比较。 结果证实了 TEFDTA 在结合亲和力预测方面的性能。 此外,通过对数据库 CovalentInDB 中键合蛋白-配体相互作用的数据集进行微调,进一步优化了该模型。 结果表明,微调过程显著提高了模型对共价结合亲和力的预测准确性,强调了专门训练的重要性。 图示:六种常见弹头微调前后的共价结合亲和力预测比较。 总之,TEFDTA 结合了指纹变换和 Transformer 编码器模块,为准确预测药物-靶标相互作用提供了一种改进的方法。 虽然该模型可以成功捕获分子序列的微小变化对亲和力的影响,但它对蛋白质片段的突变(包括单个或几个氨基酸变化)并不敏感。 对于虚拟筛选任务,当突变发生时检测亲和力的可观察变化非常有价值。 未来,该团队还将尝试使用大型语言模型来提取蛋白质表示。 此外,目前对共价结合亲和力的预测需要先验了解配体和靶标对的共价键类型,这可能限制了广泛和正确的应用,特别是对于非化学家来说不友好。 这些方向值得在未来的研究工作中进一步探索。

阅读时间

  • 14 分钟, 共 2613 字

分类

  • 上海科技大学, Molegro Virtual Docker, Davis, 数据集, CovalentIn

评价和解读

  • 这篇文章是对当前感兴趣的主题进行全面而引人入胜的探讨。

Related suggestion: 最新消息: 金盘科技变压器出海加速 原材料波动毛利率承压

总结2023年,受益于新能源发展、海外市场拓展,变压器出海相关公司收入递增明显。 2024年金盘科技还能维持高增长吗? 干式变压器出海高景气 金盘科技于1997年成立blog.byteway.net于海口保税区,传统主营产品为干式变压器等电力电Ligthing…

作者 Steve Jobs

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注