plDDT怎么计算？常见公式有哪些？

plDDT（predicted local Distance-Dependent Threading score）是AlphaFold中用于评估蛋白质结构预测可靠性的局部置信度评分，取值范围为0-100。其计算基于模型对残基间距离分布的预测一致性，分数越高表示该区域结构越可信。常见公式包括：通过softmax输出的距离概率分布计算交叉熵或标准差，再经线性变换映射到0-100区间。另一种形式为：plDDT = 100 × (1 − σ/σ_max)，其中σ为预测距离分布的标准差。实际应用中需注意多结构域蛋白中柔性区域plDDT偏低的问题。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

爱宝妈 2025-09-22 12:10

关注

一、plDDT基础概念解析

plDDT（predicted local Distance-Dependent Threading score）是AlphaFold2中引入的关键评估指标，用于衡量蛋白质结构预测结果在局部残基上的可信度。其取值范围为0到100，数值越高表示该氨基酸残基所在区域的结构预测越可靠。

该评分并非基于全局结构比对，而是通过分析神经网络对每对残基之间距离分布的预测一致性来生成。具体而言，AlphaFold的Evoformer模块输出一个距离概率分布张量，维度为 (L, L, bins)，其中L为序列长度，bins代表离散化距离区间（通常为64个bin）。

对于每个残基i，系统会聚合其与所有其他残基j的距离预测分布信息，并计算该残基周围预测的不确定性。常见的量化方式包括：

计算softmax后距离分布的标准差σ
使用交叉熵衡量预测分布与理想单峰分布的差异
将不确定性指标经线性变换映射至0–100区间

一种简化形式可表达为：
plDDT = 100 × (1 − σ / σ_max)
其中σ为某残基相关距离预测的标准差，σ_max为经验最大值（如设定为3.0Å或根据训练数据统计得出），从而实现归一化。

二、plDDT的计算流程与技术实现

从AlphaFold源码角度出发，plDDT的生成嵌入在“StructureModule”之后的“PredictedLDDTHead”中。该模块接收最终的原子坐标（尤其是Cα、C、N、O）作为输入，通过多层感知机（MLP）学习每个残基的置信度。

以下是关键步骤的伪代码描述：

        
def compute_plddt(logits):
    # logits shape: [B, L, 36] - 36 bins for d=2-22Å
    prob = softmax(logits, axis=-1)
    bin_centers = create_bin_centers(36)  # e.g., [2.0, 2.5, ..., 22.0]
    
    expected_dist = sum(prob * bin_centers, axis=-1)  # [B, L]
    variance = sum(prob * (bin_centers - expected_dist[..., None])**2, axis=-1)
    std_dev = sqrt(variance)  # uncertainty measure
    
    sigma_max = 3.0
    plddt = 100.0 * (1.0 - torch.clamp(std_dev / sigma_max, 0, 1))
    
    return plddt  # shape [B, L], values in [0, 100]

三、plDDT在实际应用中的表现与挑战

在真实蛋白质结构预测任务中，plDDT展现出良好的判别能力。以下为典型蛋白区域的plDDT分布示例：

残基编号	二级结构	平均plDDT	结构特征	可信度等级
10-25	α-螺旋	95.2	稳定核心区	极高
45-60	β-折叠	92.1	氢键网络完整	高
78-85	环区	70.3	柔性连接域	中等
102-110	无规卷曲	55.6	高度动态	低
130-140	α-螺旋	96.8	疏水核心	极高
160-175	环区	48.9	功能位点附近	极低
190-200	β-转角	82.4	部分受限	中高
210-220	无规卷曲	61.3	表面暴露	中等
240-250	α-螺旋	94.7	跨膜段	高
270-280	环区	50.1	结构域间铰链	低

四、多结构域蛋白中的plDDT分析案例

以典型的双结构域蛋白激酶为例（PDB ID: 1ATP），其N端和C端分别为激酶结构域与调节结构域，中间由柔性 linker 连接。AlphaFold预测结果显示：

N端结构域：平均plDDT ≈ 93.5
C端结构域：平均plDDT ≈ 91.2
linker区域（残基150-165）：plDDT下降至45–58

这表明模型准确识别了结构刚性区域与柔性区域之间的边界。值得注意的是，尽管linker区域plDDT偏低，但并不意味着预测错误，而反映了真实的构象异质性。

此类现象在抗体Fc/Fab区域、核苷酸结合开关蛋白中普遍存在，需结合生物背景进行解读。

五、可视化与集成分析流程

在现代结构生物学工作流中，plDDT常与3D可视化工具（如PyMOL、ChimeraX）集成。以下为基于Mermaid的分析流程图：

graph TD A[输入FASTA序列] --> B{运行AlphaFold} B --> C[输出PDB + pLDDT per residue] C --> D[加载至PyMOL] D --> E[按plDDT着色：蓝(>90)→红(<50)] E --> F[识别低置信区域] F --> G[设计实验验证：HDX-MS, Cryo-EM局部重构] G --> H[指导突变或结晶优化]

该流程广泛应用于药物靶点评估、蛋白工程改造及功能位点预测中。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

蛋白质结构预测评价指标pLDDT和lDDT-Cα介绍及计算公式
2024-09-08 16:33

qq_27390023的博客该分数通常在 0 到 100 之间，数值越高表示模型对该残基的预测越有信心： 90-100：高精度区域 70-90：可信区域 50-70：低精度区域错误区域 pLDDT 的计算 pLDDT 分数由深度学习模型预测出，不依赖于实际参考结构。...
Cell Systems | 探索蛋白质语言模型的边界
2023-12-05 19:39

DrugOne的博客今天为大家介绍的是来自Ali Madani团队的一篇...作者引入了一套名为ProGen2的蛋白质语言模型，模型的规模扩大到了64亿参数，并且在从基因组、宏基因组和免疫库数据库中提取的超过十亿蛋白质的不同序列数据集上训练。
大规模语言模型驱动的蛋白质结构预测方法及其创新
2025-03-07 20:32

王良一呀的博客该论文详细介绍了使用语言模型预测原子级蛋白质结构的方法和结果。：论文使用了UniRef50和UniRef90作为训练数据集，并通过随机选择250,000个序列作为验证集，并从训练集中移除了一些序列。训练数据集经过了严格的...
AlphaFold结果解读指南：pLDDT与PAE分数完全解析
2025-09-09 00:15

章雍宇的博客本文将带你深入理解AlphaFold预测结果中两个最重要的指标：pLDDT（预测局部距离差异测试）和PAE（预测对齐误差）。读完本文后，你将能够： - 准确解读pLDDT分数，判断蛋白质各区域的置信度 - 理解PAE矩阵的含义，...
AlphaFold2预测结构能否直接用于虚拟筛选？
2024-01-18 16:40

MurphyStar的博客虽然AlphaFold2能够预测出较为精确的蛋白骨架...但是，通过去除AlphaFold2预测结构中的低置信区域或使用柔性对接方法针对关键侧链添加柔性等，有助于改善对接结果。AlphaFold2预测结构相较于 apo 结构做对接更准确。
RoseTTAFold如何在线使用？
2022-03-03 16:13

林语微光的博客 2-end版本，采用官方提供训练好的模型，并根据在uniref100中针对单条序列得到msa.a3m进行预测，得到一个pred.pdb，然后再将这个pred文件通过scwrl4工具进行打包，然后输出对应的plddt；注：如何快速使用？ 5、展示...
AlphaFold 3结构预测评估指标：详解pLDDT、IPTM与PAE
2025-11-07 01:00

郁楠烈Hubert的博客你是否在解读AlphaFold 3预测结果时，面对pLDDT、IPTM和PAE等指标感到困惑？这些数值如何反映蛋白质结构的可靠性？本文将系统解析这三大核心评估指标，帮助你快速判断模型质量，优化实验设计。读完本文你将掌握：...
AlphaFold置信度指标实战指南：从pLDDT到PAE的深度解析
2025-12-27 12:04

富晓微Erik的博客本文将带你深入掌握AlphaFold两大核心置信度指标——pLDDT（预测局部距离差异测试）和PAE（预测对齐误差）的实际应用技巧，让你在短短几秒钟内就能评估预测结果的质量，避免实验验证中的常见陷阱。 ## 实战技巧：...
PyMOL中使用AlphaFold的pLDDT对蛋白进行染色
2024-10-07 12:42

伊卡洛斯洛卡伊的博客使用color_b.py脚本在PyMol可视化Alpha Fold的pLDDT的b-factor
最完整AlphaFold置信度解析：从pLDDT到PAE的实用指南
2025-09-09 00:20

葛依励Kenway的博客为何有的区域标红有的标绿？本文将系统解析AlphaFold两大核心置信度指标——pLDDT（预测局部距离差异测试）和PAE（预测对齐误差），通过代码实例与可视化指南，帮你快速判断模型可靠性，避免被"高分数陷阱"误导。读...
要读文献 | bioRxiv | AlphaFold3在抗体和纳米抗体对接方面有哪些学习成果？哪些问题仍未解决？
2024-11-08 19:52

生信小白要知道的博客研究人员将RMSD分为H3全局RMSD（通过叠加重链计算）和H3局部RMSD（仅通过叠加CDR H3残基计算），其中全局RMSD反映了环的形状和位置，而局部RMSD则仅代表环的形状。如图4A所示，无论是结合态还是非结合态，AF3和AF2.3...
AlphaFold2被超越？DeepMSA2+DMFold如何实现蛋白质互作结构预测精度突破
2025-10-10 04:26

青柠汽水308的博客 DeepMSA2与DMFold的组合在...其核心在于利用宏基因组数据革新多序列比对构建，为AI模型提供更优质的进化信息输入，从而在单体及复合物预测精度上取得显著提升，为药物研发和基础生物学研究提供了更强大的计算工具。
如何用TensorFlow预测蛋白质结构？
2025-12-27 15:04

kleo3270的博客对于AI工程师而言，掌握TensorFlow不再只是掌握一种编程工具，而是获得了参与下一次科技革命的入场券。未来，随着更多生物医学问题被转化为可学习的任务——无论是单细胞转录组解析、基因调控网络推断，还是抗体...
AlphaFold预测结果快速诊断指南：从pLDDT到PAE的实战解读
2026-01-02 09:10

孙爽知Kody的博客面对AlphaFold输出的蛋白质结构预测结果，你是否曾被五颜六色的模型和复杂的数值搞得晕头转向？...AlphaFold预测结果的可靠性评估主要依赖两个核心指标：**pLDDT**（预测局部距离差异测试）和**PAE**
使用ESM3蛋白质语言模型进行快速大规模结构、功能、SASA预测
2025-07-12 15:08

Eumenidus的博客使用蛋白质大语言模型ESM3进行蛋白质三维结构预测、功能注释、溶剂可及性表面积计算等多种任务
AI如何帮助科学家破解蛋白质折叠难题？
2025-07-13 22:11

AGI大模型与大数据研究院的博客置信度损失：让模型预测的置信度分数（pLDDT）与真实误差相关（pLDDT越高，误差越小）。优化策略：使用AdamW优化器，学习率为10−410^{-4}10−4，批量大小为256，训练周期为4周（使用1024块TPU v3）。 4.3 代码...
利用ESM3蛋白质语言模型高效实现多维度生物信息预测
2025-10-21 03:00

咖啡JSON的博客本文详细介绍了如何利用ESM3蛋白质语言模型高效实现多维度生物信息预测。该模型无需多序列比对，仅凭单条序列即可在数秒内完成蛋白质结构、功能、溶剂可及表面积及二级结构的高效预测，极大提升了科研分析效率，是...
10分钟精通AlphaFold预测结果诊断：从pLDDT到PAE的实战指南
2026-01-08 10:35

章来锬的博客当你拿到AlphaFold的蛋白质结构预测结果时，...AlphaFold预测结果的可靠性评估可以概括为"两点一线"的框架：**pLDDT**评估局部结构精度，**PAE**评估全局结构关系，两者结合形成完整的质量判断链条。 ### 核心指标定
最完整AlphaFold结果验证指南：从pLDDT到实验结构比对
2025-09-09 01:07

姜闽弋Flora的博客拿到预测结果后不知道该相信哪些区域的结构？本文将系统介绍AlphaFold结果验证的完整流程，从内置的pLDDT和PAE评分解读，到与实验结构的精确比对方法，帮助你全面评估预测模型质量。读完本文，你将能够： - 准确解读...
Hallucination Is All You Need？从BindCraft谈谈蛋白“幻觉设计”
2025-09-02 23:01

AIDD小白随想录的博客具体地，给定目标蛋白结构（或复合物），我们从随机序列开始，反复将序列输入结构预测模块（AlphaFold2/ RoseTTAFold），计算预测结构的置信度指标（如 pLDDT、ipTM），并对这些指标进行反向传播优化序列。...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月22日