我有一个生产数据库,其中有时需要“合并”单个表中的多余行。
假设此表中的两行都具有相同的值,但它们的ID除外。
Table "PrimaryStuff" ID | SomeValue 1 | "I have value" 2 | "I have value" 3 | "I am different"
我们还假设存在许多相关的表。由于重复项是在“ PrimaryStuff”表中创建的,因此经常在这些子表中创建行,这些行都应与PrimaryStuff表上的单个记录相关。 这些表的数量和名称不受我的控制,应在运行时动态考虑。 IE:我不知道相关记录的名称甚至数目,因为其他人可能在我不知情的情况下编辑数据库。
Table "ForeignStuff" ID | PrimaryStuffId | LocalValue 1| 1| "I have the correct FK" 2| 1| "I have the correct FK" 3| 2| "I should get pointed to an FK of 1"
为了解决PrimaryStuff的第1行和第2行的重复问题,我希望所有相关表将其FK更改为1,然后删除PrimaryStuff的第2行。这 应该 是微不足道的,好像PrimaryStuff的第1行不存在,我可以更新在第2行到第1行的主键上,所做的更改就会级联出来。我不能这样做,因为那将是PrimaryStuff的唯一索引中的重复键。
随时提出问题,我将尝试清除所有令人困惑的内容。
首先,让我们获取需要更新的行的列表(据我了解,您希望最低的ID替换所有较高的ID)
SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID, ID, SOMEVALUE FROM PrimaryStuff
我们可以删除FirstID和ID匹配的内容,这些都没有关系
SELECT FirstID, ID FROM ( SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID, ID, SOMEVALUE FROM PrimaryStuff ) T WHERE FirstID != ID
现在,我们有一个更改列表。我们可以在更新语句中使用它,将其放在临时表(或CTE,如下所示)中:
WITH ChangeList AS ( SELECT FirstID, ID FROM ( SELECT MIN(ID) OVER (PARTITION BY SomeValue ORDER BY SomeValue, ID ASC) AS FirstID, ID FROM PrimaryStuff ) T WHERE FirstID != ID ) UPDATE ForeignStuff SET PrimaryStuffId = ChangeList.FirstID FROM ForeignStuff JOIN ChangeList ON ForeignStuff.ID = ChangeList.ID
注意:代码未经测试,可能有错别字。