死锁的主要原因是什么，可以预防吗？

一尘不染

死锁的主要原因是什么，可以预防吗？

sql-server

最近我们的一个 ASP.NET 应用程序显示了一个数据库死锁错误，我被要求检查并修复该错误。我设法找到死锁的原因是一个存储过程，它严格更新游标中的表。

这是我第一次看到这个错误并且不知道如何有效地跟踪和修复它。我尝试了所有可能的方法，最后发现正在更新的表没有主键！幸运的是，这是一个身份列。

后来我发现为部署编写数据库脚本的开发人员搞砸了。我添加了一个主键，问题就解决了。

我感到很高兴并回到我的项目中，并进行了一些研究以找出导致僵局的原因......

显然，这是导致死锁的循环等待条件。没有主键的更新显然比使用主键需要更长的时间。

我知道这不是一个明确的结论，这就是我在这里发帖的原因......

缺少主键是问题吗？
除了（互斥、保持等待、无抢占和循环等待）之外，是否还有其他导致死锁的条件？
如何防止和跟踪死锁？

阅读 208

2022-10-30

共1个答案

一尘不染

跟踪死锁是两者中比较容易的：

默认情况下，死锁不会写入错误日志。您可以使用跟踪标志 1204 和 3605 导致 SQL 将死锁写入错误日志。

将死锁信息写入 SQL Server 错误日志：DBCC TRACEON(-1, 1204, 3605)

将其关闭：DBCC TRACEOFF(-1, 1204, 3605)

有关跟踪标志 1204 的讨论以及打开它时您将获得的输出，请参阅“故障排除死锁”。 https://msdn.microsoft.com/en-us/library/ms178104.aspx

预防比较困难，基本上你必须注意以下几点：

代码块 1 按顺序锁定资源 A，然后锁定资源 B。

代码块 2 依次锁定资源 B，然后是资源 A。

这是可能发生死锁的典型情况，如果两个资源的锁定都不是原子的，则代码块 1 可以锁定 A 并被抢占，然后代码块 2 在 A 获得处理时间之前锁定 B。现在你有僵局。

为了防止这种情况，您可以执行以下操作

代码块 A（伪代码）

Lock Shared Resource Z
    Lock Resource A
    Lock Resource B
Unlock Shared Resource Z
...

代码块 B（伪代码）

Lock Shared Resource Z
    Lock Resource B
    Lock Resource A
Unlock Shared Resource Z
...

完成后不要忘记解锁 A 和 B

这将防止代码块 A 和代码块 B 之间的死锁

从数据库的角度来看，我不确定如何防止这种情况发生，因为锁是由数据库本身处理的，即更新数据时的行/表锁。我看到的问题发生最多的地方是您在光标内看到的问题。游标是出了名的低效，尽可能避免使用它们。

2022-10-30