Oracle 死锁与慢查询总结

寻技术 Oracle 2023年10月02日 149

查看死锁

SELECT 
s.sid "会话ID",
s.lockwait "等待锁",
s.event "等待的资源/事件",  -- 最近等待或正在等待的资源/事件
DECODE(lo.locked_mode, 0, '尚未获得锁', 1, NULL, 2, '行共享锁', 3, '行排它锁', 4, '共享表锁',
5,'共享行排它锁',6, '排它表锁') "锁模式",
do.object_name "被锁对象",
s.status "会话状态",
sq.SQL_TEXT,
sq.SQL_FULLTEXT, 
sq.executions "SQL执行次数",
ROUND(sq.elapsed_time/1000000, 2) "SQL执行时间(秒)",
DECODE(sq.executions,0,'-',NULL,'-',ROUND(sq.elapsed_time/1000000/sq.executions, 2)) "SQL平均执行时间(秒)", 
DECODE(sq.executions,0,'-',NULL,'-',ROUND(sq.rows_processed/sq.executions, 2)) "平均返回行数", 
s.sql_exec_start "SQL开始执行时间",
sq.last_active_time "查询计划最后活跃时间",
lo.process "操作系统进程ID",
s.port "进程端口号",
s.program "进程名称", 
lo.os_user_name "操作系统用户名",
s.machine "操作系统机器名称",
'ALTER SYSTEM KILL SESSSION '''||s.sid||','||s.serial#||''';' "终止会话操作"
FROM v$sql sq 
JOIN v$session s on s.sql_hash_value = sq.hash_value
JOIN v$locked_object lo on lo.session_id = s.sid
JOIN dba_objects do on do.object_id = lo.object_id
WHERE s.username='OPT_WMS_USER' ; -- Oracle用户名称,大写

说明:

  • 如果lockwait值不为空(形如0000001F83D6C748),并且statusACTIVE,则说明存在死锁

  • event 最近等待或正在等待的资源/事件:

    • enq: TX - row lock contention :按模式6等待TX:当会话等待另一个会话已持有的行级锁时发生该事件,即某个用户正在更新、删除另一个会话希望更新、删除的行时,会发生这种情况。这种类型的TX排队等待对应于等待事件 enq:TX - row lock contention

      解决方案:已经持有锁的第一个会话执行提交或回

查看慢查询

查询执行最慢的SQL

SELECT * FROM (
  SELECT s.sql_text,
  --s.sql_fulltext, 注释掉该列,可以加快查询速度(如果需要查询完整sql文本,可以考虑通过sql_id二次查询)
  s.sql_id,
  s.executions "执行次数",
  ROUND(s.elapsed_time / 1000000, 2) "总执行时间(秒)",
  ROUND(s.elapsed_time / 1000000 / s.executions, 2) "平均执行时间", --单位:秒
  s.first_load_time "父游标创建时间",
  s.parsing_user_id "用户id",
  u.username "用户名"
  FROM v$sqlarea s
  LEFT JOIN all_users u ON s.parsing_user_id = u.user_id
  WHERE s.executions > 0
  AND u.username = 'OPT_WMS_USER' --注意 用户名大写
  ORDER BY 平均执行时间 DESC)
WHERE rownum <= 50

说明:为什么不从v$sql统计信息?这是因为即便相同的SQL,每次执行耗时也可能不一样,所以,考虑求平均值,所以需要对SQL分组统计,SQL_TEXT相同,大概率为同一条SQL,所以考虑从按SQL_TEXT分组统计的v$sqlarea读取信息。当然,出于严谨的考虑,也可以不分组统计,把v$sqlarea替换成v$sql就好了。

查询SQL执行次数,按次数降序排序

SELECT * FROM (
  SELECT s.sql_text,
    --s.sql_fulltext,
    s.sql_id,
    s.executions "执行次数",
    s.last_active_time "最后执行时间",
    s.first_load_time "父游标创建时间",
    s.parsing_user_id "执行用户id",
    u.username "执行用户", 
  RANK() OVER(ORDER BY executions DESC) executions_rank
  FROM v$sql s
  LEFT JOIN all_users u
  ON u.user_id = s.parsing_user_id) T
WHERE executions_rank <= 100;

注意:之所以从v$sql获取统计数据,是因为这里未对SQL_TEXT做GROUP BY(SQL_TEXT是完整SQL文本前1000个字符,存在截断的可能,按在这个统计可能不准确),就针对每条SQL(不管是否相同)单独统计,当然,也可以考虑按SQL_TEXT分组统计,把v$sql改成v$sqlarea就好了。

查看存在TABLE ACCESS FULL行为的SQL

SELECT s.sql_text, s.sql_fulltext, sp.sql_id 
FROM v$sql_plan sp
LEFT JOIN v$sql s on sp.sql_id = s.sql_id
WHERE sp.operation = 'TABLE ACCESS'
AND sp.options = 'FULL'
AND sp.object_owner = 'OPT_WMS_USER_B' --注意 用户名大写 --可选查询条件

V$SQL

V$SQL列出了关于共享SQL区,不含GROUP BY子句的统计,输入的原始SQL文本的每个子项各占一行。通常在查询执行结束时更新V$SQL中展示的统计信息,然而针对长耗时查询,每5秒更新一次。这样更容易在运行期间查看长时间运行的SQL语句带来的影响

Column Datatype Description
SQL_TEXT VARCHAR2(1000) 当前游标的SQL文本的前1000个字符
SQL_FULLTEXT CLOB <CLOB>方式展示的SQL语句全文。可使用该列检索SQL语句全文,而无需连接V$SQLTEXT动态性能视图。
SQL_ID VARCHAR2(13) 类库缓存中父游标的SQL标识。
SHARABLE_MEM NUMBER 子游标使用的共享内存量(字节为单位)
PERSISTENT_MEM NUMBER 子游标生存周期内使用的固定内存量(字节为单位)
RUNTIME_MEM NUMBER 子游标运行期间所需的固定内存量(字节为单位)
SORTS NUMBER 子游标完成的排序次数
LOADED_VERSIONS NUMBER 指示是否已加载上下文堆,1表示已加载,0表示未加载。
OPEN_VERSIONS NUMBER 指示子游标是否被锁定,1表示被锁定,0表示未被锁定
USERS_OPENING NUMBER 任意子游标打开的用户数。
FETCHES NUMBER 与SQL语句关联的FETCHES的次数
EXECUTIONS NUMBER 自从对象被加载到类库缓存后,该对象被执行次数。
PX_SERVERS_EXECUTIONS NUMBER 并行执行服务器执行的总次数 ( 当语句从未被并行执行时为0)
END_OF_FETCH_COUNT NUMBER 游标被加载到类库缓存后,被完整执行的次数。当游标部分执行时,此统计值不会增加,不管是因为在执行过程中失败,还是在关闭或重新执行游标之前只提取了此游标生成的前几行。根据定义,END_of_FETCH_COUNT列的值应小于或等于EXECUTIONS列的值。
USERS_EXECUTING NUMBER 执行语句的用户数
LOADS NUMBER 对象被加载或者重新加载的次数
FIRST_LOAD_TIME VARCHAR2(19) 父游标的创建时间
INVALIDATIONS NUMBER 子游标无效的次数
PARSE_CALLS NUMBER 子游标的解析调用次数
DISK_READS NUMBER 子游标的磁盘读取次数
DIRECT_WRITES NUMBER 子游标的直接写次数
BUFFER_GETS NUMBER 子游标的获取缓存区次数
APPLICATION_WAIT_TIME NUMBER 应用等待时间(微秒为单位)
CONCURRENCY_WAIT_TIME NUMBER 并发等待时间(微秒为单位)
CLUSTER_WAIT_TIME NUMBER 集群等待时间(微秒为单位)
USER_IO_WAIT_TIME NUMBER 用户I/O等待时间(微秒为单位)
PLSQL_EXEC_TIME NUMBER PL/SQL执行时间(微秒为单位)
JAVA_EXEC_TIME NUMBER Java执行时间(微秒为单位)
ROWS_PROCESSED NUMBER 已解析SQL语句返回的总行数
COMMAND_TYPE NUMBER Oracle命令类型定义
OPTIMIZER_MODE VARCHAR2(10) SQL语句执行模式(优化器模型)
OPTIMIZER_COST NUMBER 优化器给出的查询成本
PARSING_USER_ID NUMBER 最初构建此子游标的用户ID
PARSING_SCHEMA_ID NUMBER 最初构建子游标使用的模式ID
PARSING_SCHEMA_NAME VARCHAR2(30) 最初构建子游标使用的模式名称
SERVICE VARCHAR2(64) 服务名称
SERVICE_HASH NUMBER SERVICE列展示的服务名称的哈希值
MODULE VARCHAR2(64) SQL语句第一次被解析时正在执行的模块名称,该名称可通过调用DBMS_APPLICATION_INFO.SET_MODULE进行设置。
MODULE_HASH NUMBER MODULE列展示的模块名称的哈希值
SERIALIZABLE_ABORTS NUMBER 每个游标事务序列化失败并产生ORA-08177错误的次数
CPU_TIME NUMBER 此游标用于解析,执行,获取(fetch)的CPU耗时 (以微秒为单位)
ELAPSED_TIME NUMBER 此游标用于解析,执行,获取的占用时间(以微秒为单位)。如果游标采用并行执行,则ELAPSED_TIME 为查询协调器及所有并行查询slave进程的累计占用时间。
OBJECT_STATUS VARCHAR2(19) 游标的状态:VALID - 有效,无错误授权 VALID_AUTH_ERROR - 有效,有授权错误授权。VALID_COMPILE_ERROR - 有效, 有编译错误授权。VALID_UNAUTH - 有效,未授权。INVALID_UNAUTH - 无效,未授权。INVALID - 无效,未授权,但保留时间戳。
LAST_LOAD_TIME VARCHAR2(19) 查询计划被加载到类库缓存的时间
IS_OBSOLETE VARCHAR2(1) 指示游标是否已过时,是(Y) 或者否(N)。如果子游标的数量太大,则可能发生这种情况。
LAST_ACTIVE_TIME DATE 查询计划最后活跃时间(即完成SQL解析的时间,可以当做SQL最后执行的时间)
IO_INTERCONNECT_BYTES NUMBER Oracle 数据库和存储系统之间交换的I/O字节数。
PHYSICAL_READ_REQUESTS NUMBER 被监控SQL发起的物理读I/O请求
PHYSICAL_READ_BYTES NUMBER 被监控SQL从磁盘读取的字节数。
PHYSICAL_WRITE_REQUESTS NUMBER 被监控SQL发起的物理写I/O请求。
PHYSICAL_WRITE_BYTES NUMBER 被监控SQL写入磁盘的字节数
OPTIMIZED_PHY_READ_REQUESTS NUMBER 被监控SQL从数据库智能闪存缓存发起的物理读取I/O请求数
LOCKED_TOTAL NUMBER 子游标被锁定的总次数

V$SQLAREA显示共享SQL区域的统计信息,每条SQL字符串为一行。它提供内存中、已解析并准备执行的SQL语句的统计信息。V$SQLAREAV$SQL两个视图的不同之处在于,V$SQL中为每一条SQL保留一个条目,而V$SQLAREA中根据SQL_TEXT进行GROUP BY,通过VERSION_COUNT计算子指针的个数

V$SESSION

V$SESSION 显示当前会话的会话信息,常见视图字段及字段描述说明如下:

描述
SID 会话ID
SERIAL# 会话序列号。用于唯一标识会话的对象。如果会话结束,而另一个会话以相同的会话ID开始,则保证将会话级命令应用于当前会话的对象。
USER# Oracle用户ID
USERNAME Oracle用户名称
COMMAND 正在执行的命令(解析的最后一条语句)。可以通过运行以下SQL查询来查找此COMMAND列中返回的任何值 n 的命令名:SELECT Command_name FROM v$sqlcommand WHERE command_type=n COMMAND”列值为 0,则表示该命令未记录在V$SESSION中。
LOCKWAIT 会话正在等待的锁的地址。NULL值表示没有等待锁。
STATUS 会话状态:ACTIVE-会话当前正在执行SQL,INACTIVE-处于非活动状态且没有配置限制或尚未超过配置的限制的会话。KILLED-标记为被终止的会话。CACHED-为Oracle XA临时缓存的会话。SNIPED-超出某些配置限制(例如,为资源管理器消费者组指定的资源限制或用户配置文件中指定的idle_time)的非活动会话。此类会话将不允许再次激活。
SCHEMA# Schema用户ID
SCHEMANAME Schema用户名称
OSUSER 操作系统客户端用户名称
PROCESS 操作系统客户端进程ID
MACHINE 操作系统机器名称
PORT 客户端进程端口号
TERMINAL 操作系统终端名称
PROGRAM 操作系统进程名称
TYPE 会话类型
SQL_HASH_VALUE 配合 SQL_HASH_VALUE使用,用于标识当前正在执行的SQL语句。
SQL_ID 当前正在执行的SQL语句的ID
SQL_EXEC_START 会话当前执行的SQL开始执行的时间;如果SQL_IDNULL,则为NULL
SQL_EXEC_ID SQL执行标识。 如果SQL_IDNULL或者该SQL执行还未启动,则为NULL
LAST_CALL_ET 如果会话STATUS当前为ACTIVE,则该值表示自会话变为活动状态以来经过的时间(以秒为单位),如果会话STATUS当前为INACTIVE,则该值表示自会话变为非活动状态以来经过的时间(以秒为单位)
EVENT 如果会话当前正在等待,则为会话正在等待的资源或事件。如果会话不在等待中,则为会话最近等待的资源或事件。查阅: "Oracle Wait Events"

V$LOCKED_OBJECT

V$LOCKED_OBECT列出了系统上每个事务获取的所有锁。它显示了哪些会话在什么对象上以及在什么模式下持有DML锁(即TM类型的队列)。视图常见字段及描述如下:

描述
OBJECT_ID 正被锁住的对象ID
SESSION_ID 会话ID
ORACLE_USERNAME Oracle用户名
OS_USER_NAME 操作系统用户名
PROCESS 操作系统进程ID
LOCKED_MODE 锁模式。此列的数值映射到表锁的锁模式的这些文本值:0-无:请求但尚未获得的锁;1-NULL;2-ROWS_S(SS):行共享锁;3-Row_X(SX):行排它锁;4-Share(S):共享表锁;5-S/Row-X(SSX):共享行排它锁;6-独占(X):排它表锁。另请参阅:Oracle数据库概念,以获取有关表锁锁模式的更多信息
SELECT object_id "被锁住的对象ID",
locked_mode "锁模式",
session_id "会话ID",
oracle_username "Oracle用户名",
os_user_name "操作系统用户名",
process "操作系统进程ID"
FROM V$LOCKED_OBJECT;

参考连接

https://docs.oracle.com/database/121/REFRN/GUID-2B9340D7-4AA8-4894-94C0-D5990F67BE75.htm#REFRN30246

https://docs.oracle.com/database/121/REFRN/GUID-09D5169F-EE9E-4297-8E01-8D191D87BDF7.htm#REFRN30259

https://docs.oracle.com/en/database/oracle/oracle-database/21/refrn/V-SESSION.html

https://docs.oracle.com/en/database/oracle/oracle-database/21/refrn/V-LOCKED_OBJECT.html#GUID-3F9F26AA-197F-4D36-939E-FAF1EFD8C0DD

关闭

用微信“扫一扫”