南大通用数据库如何查看当前死锁信息及定位阻塞会话？

在南大通用GBase 8a/8s数据库中，如何实时查看当前发生的死锁信息并准确定位阻塞会话？常见场景下，业务出现响应缓慢或事务超时，但系统未报明确死锁错误；管理员需快速判断是否存在死锁或长事务阻塞。GBase 8a（MPP架构）默认不自动记录死锁详情，需依赖`show processlist`、`information_schema.PROCESSLIST`及`gbase.waiting_threads`等视图识别等待链；而GBase 8s（类Oracle单机/HA架构）则可通过`v$lock`、`v$session_wait`、`v$transaction`关联分析锁持有与等待关系，并结合`dbms_monitor.lock_trace_on()`开启锁跟踪。但官方未提供类似Oracle的`v$deadlock`视图或MySQL的`INFORMATION_SCHEMA.INNODB_TRX`一站式死锁快照。因此，实际运维中常因缺乏直观死锁报告、等待链解析复杂、历史死锁不可追溯等问题，导致根因定位耗时过长。如何构建标准化脚本实现“一键识别死锁+阻塞源头+被阻塞SQL”？这是DBA高频痛点。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

舜祎魂 2026-03-20 05:16

关注

```html

一、现象识别：从“业务慢”到“疑似阻塞”的初步诊断

当应用出现事务超时（如 JDBC timeout=30s）、接口响应延迟突增、批量作业卡顿，但数据库未抛出 ERROR 1213 (40001): Deadlock found 时，需启动阻塞链排查。GBase 8a/8s 均不默认记录死锁事件日志（gbase.log 中无结构化死锁堆栈），故必须依赖实时会话状态推断。关键信号包括：
• SHOW PROCESSLIST 中大量会话状态为 Waiting for lock 或 Locked（8s）/ waiting（8a）；
• information_schema.PROCESSLIST 中 TIME 字段持续增长且 STATE 长期非空；
• GBase 8a 的 gbase.waiting_threads 视图中存在循环等待路径（如 A→B→C→A）。

二、架构分治：8a（MPP）与 8s（OLTP）的监控范式差异

维度	GBase 8a（MPP）	GBase 8s（类Oracle）
核心视图	`information_schema.PROCESSLIST`, `gbase.waiting_threads`, `gbase.cluster_status`	`v$session`, `v$lock`, `v$session_wait`, `v$transaction`
锁跟踪能力	仅支持节点级等待关系快照，无事务级锁粒度	支持 `dbms_monitor.lock_trace_on(sid)` 实时捕获锁请求/持有链
死锁检测机制	由 coordinator 节点周期性扫描 `waiting_threads` 构建等待图，超时后 Kill 任一参与者（无日志记录）	基于 `v$lock` 的 `blocker`/`waiter` 关系实时检测，但不自动写入 `v$deadlock`

三、深度解析：构建等待链拓扑的SQL逻辑

以 GBase 8s 为例，以下SQL可递归识别阻塞源头（支持 Oracle 风格 CONNECT BY）：

SELECT 
  level AS depth,
  s.sid,
  s.username,
  s.osuser,
  s.machine,
  s.program,
  s.status,
  l.type,
  l.lmode,
  l.request,
  s.sql_id,
  q.sql_text
FROM v$session s
JOIN v$lock l ON s.sid = l.sid
LEFT JOIN v$sql q ON s.sql_id = q.sql_id
START WITH s.sid IN (
  SELECT sid FROM v$lock WHERE block = 1
)
CONNECT BY PRIOR l.sid = (
  SELECT sid FROM v$lock l2 WHERE l2.id1 = l.id1 AND l2.id2 = l.id2 AND l2.request > 0
)
ORDER BY level, s.sid;

四、标准化脚本：一键式死锁与阻塞分析工具（gbase-deadlock-analyzer.sh）

该脚本适配双平台，自动判断实例类型并执行对应逻辑：

步骤1：探测实例版本（SELECT @@version 匹配 8a 或 8s）
步骤2：采集基础会话快照（含 PROCESSLIST / v$session）
步骤3：构建等待图并检测环路（8a 使用 gbase.waiting_threads JOIN 自关联；8s 使用 v$lock 生成 blocker-waiter 映射）
步骤4：提取被阻塞会话的完整 SQL（通过 INFORMATION_SCHEMA.PROCESSLIST.INFO 或 v$sqltext 拼接）
步骤5：输出结构化报告（含阻塞根因 SID、持锁事务开始时间、被阻塞 SQL 片段、建议 Kill 命令）

五、可视化增强：阻塞关系 Mermaid 流程图生成

脚本可选输出 Mermaid 格式依赖图，便于快速定位瓶颈节点：

flowchart LR
  A[SID=1023
UPDATE t1 SET x=1] -->|holds TX-7F2A| B[SID=1025
DELETE FROM t2]
  B -->|waits on TX-7F2A| C[SID=1027
SELECT * FROM t1]
  C -->|waits on TX-7F2A| A
  style A fill:#ff9999,stroke:#333
  style B fill:#99ccff,stroke:#333
  style C fill:#99ff99,stroke:#333

六、历史追溯：补全死锁审计缺口的三大实践

启用锁跟踪日志：8s 环境定期执行 dbms_monitor.lock_trace_on(ALL) 并定向输出至独立 trace 文件，配合 logrotate 控制体积；
建立阻塞快照表：每日定时将 v$lock + v$session 关联结果存入 DBA_BLOCKING_HISTORY，添加 SNAPSHOT_TIME 和 IS_DEADLOCK_CANDIDATE 标记；
集成 Prometheus+Grafana：通过自定义 exporter 抓取 gbase.waiting_threads.count / v$lock.block_count 指标，设置告警阈值（如 waiting_threads > 5 持续60s）。

七、避坑指南：高频误判场景与验证方法

常见伪死锁场景需人工排除：
✓ 长事务未提交：检查 v$transaction.start_time 是否早于当前时间 10 分钟；
✓ DDL 锁竞争：8s 中 v$lock.type='TM' 且 lmode=6 表示 DDL 排他锁；
✓ 网络延迟假象：对比 PROCESSLIST.TIME 与客户端连接建立时间（CREATE_TIME 字段）；
✗ 错误认为所有 Waiting for table metadata lock 均为死锁——实际多为 ALTER TABLE 阻塞后续 DML。

```

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

南大通用GBase 8c事务与锁之全局死锁解除
2024-06-24 10:57

GBASE数据库的博客这样事务锁住的时候，后台首先等待一个预先设定的超时时间，当超过这个时间两个节点就发现了他们的等待环，那么首个发现环的节点会将自己的事务退出，从而解除全局死锁的这个问题。如上图中所示，在T1这个时刻，事务...
南大通用GBase 8c分布式问题排查之锁故障定位
2024-12-20 16:37

GBASE数据库的博客更多精彩内容尽在南大通用技术社区，南大通用致力于成为用户最信赖的产品供应商。在现代数据库系统中，锁机制是确保数据一致性和完整性的关键手段。随着分布式数据库技术的发展，锁机制的复杂性和重要性也随之增加。...
GBase 8s 数据库发生“死锁”的方案解析分享
2026-04-01 17:26

GBASE数据库的博客南大通用GBase 8s 数据库（gbase database)在运行中发生死锁是如何产生的？如何快速定位并有效避免？数据库发生死锁的原因：多个事务。，导致事务无限阻塞无法推进。
南大通用GBase 8c TRUNCATE卡死故障分析
2024-08-19 15:51

GBASE数据库的博客通常情况下，truncate操作执行...block_query可以看出阻塞的语句是会话一执行的查询，且block_pid是会话一的pid。mode：AccessExclusiveLock，ACCESS EXCLUSIVE锁会与所有锁冲突，通常情况下DDL语句会申请改类型锁。
南大通用GBase 8a排查慢SQL 分享
2026-01-12 11:51

GBASE数据库的博客登录该节点，cd /opt/GBaseMpp/gnode/tmpdata/cache_gbase/下，执行du ，找到生成临时文件较多的session id ，记录为 gnode_sid ，这...1）通过gcluster层的会话ID，前往各GNode节点，查看该SQL在各GNode层的执行情况。
数据库国产化探究及升级改造过程指导
2024-03-18 12:52

羌俊恩的博客当前官网最新版本为DM8，相较于目前主流产品架构：不同特性依靠不同内核去实现，DM8独特采用了双存储引擎架构，行存储引擎和列存储引擎可相互配合、协同工作。同时实现了计算层和存储层的分离，同一内核既支持共享...
我把 GBase 8c 锁等待和死锁排查重新捋了一遍：从阻塞链、全局事务到现场止血的一套实战方法
2026-03-27 11:10

Mike117.的博客控制事务边界，避免长事务统一热点对象的访问顺序把 DDL 和在线写流量错开对批处理、存储过程补充分步可观测性遇到分布式阻塞时，别只停留在单节点视角先止血，找到 blocker。再下钻，看是不是跨节点全局事务。最后...
图数据库Neo4j学习一基本介绍
2023-07-20 17:11

歪桃的博客图数据库的基本介绍及安装
数据库总结之高级篇
2022-07-14 00:11

。ming。的博客从上图我们可以查看出 MySQL 当前默认的存储引擎是 InnoDB，并且在 5.7 版本所有的存储引擎中只有 InnoDB 是事务性存储引擎，也就是说只有 InnoDB 支持事务。 1.是否支持行级锁MyISAM只有表级锁，而InnoDB支持行级锁...
nju南京大学计算机网络中文复习笔记
2023-07-11 23:53

thdlrt的博客协议：一个协议定义了在两个或多个通信实体之间交换的报文格式和次序,...实现数据在不同网络之间的转发和路由功能，交换、机路由器&&计算机网络层次结构OSI：物理层、链路层、网络层、传输层、会话层、表示层和应用层。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月21日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月20日