一尘不染

具有NULL的唯一键

mysql

这个问题需要一些假设的背景。让我们考虑一个employee有列的表namedate_of_birthtitlesalary,使用MySQL作为RDBMS。由于如果给定的某个人的名字和出生日期与另一个人相同,那么根据定义,他们就是同一个人(除非有两个巧合,即我们两个人分别于1809年2月12日出生,他们叫亚伯拉罕·林肯),所以我们将上的唯一键namedate_of_birth这意味着“不要将同一个人存储两次”。现在考虑以下数据:

id name        date_of_birth title          salary
 1 John Smith  1960-10-02    President      500,000
 2 Jane Doe    1982-05-05    Accountant      80,000
 3 Jim Johnson NULL          Office Manager  40,000
 4 Tim Smith   1899-04-11    Janitor         95,000

如果现在尝试运行以下语句,则该语句应该并且将失败:

INSERT INTO employee (name, date_of_birth, title, salary)
VALUES ('Tim Smith', '1899-04-11', 'Janitor', '95,000')

如果我尝试此操作,它将成功:

INSERT INTO employee (name, title, salary)
VALUES ('Jim Johnson', 'Office Manager', '40,000')

现在,我的数据将如下所示:

id name        date_of_birth title          salary
 1 John Smith  1960-10-02    President      500,000
 2 Jane Doe    1982-05-05    Accountant      80,000
 3 Jim Johnson NULL          Office Manager  40,000
 4 Tim Smith   1899-04-11    Janitor         95,000
 5 Jim Johnson NULL          Office Manager  40,000

这不是我想要的,但是我不能说我完全不同意发生的事情。如果说数学集

{'Tim Smith', '1899-04-11'} = {'Tim Smith', '1899-04-11'} <-- TRUE
{'Tim Smith', '1899-04-11'} = {'Jane Doe', '1982-05-05'} <-- FALSE
{'Tim Smith', '1899-04-11'} = {'Jim Johnson', NULL} <-- UNKNOWN
{'Jim Johnson', NULL} = {'Jim Johnson', NULL} <-- UNKNOWN

我的猜测是MySQL说:“由于我不 知道NULL出生日期的吉姆·约翰逊不在此表中,因此我将其添加。”

我的问题是:
即使date_of_birth并不总是知道如何防止重复?到目前为止,我想出的最好的办法是移到date_of_birth另一张桌子。但是,这样做的问题是,我最终可能会遇到两个出纳员,他们的名字,头衔和薪水相同,出生日期不同,而且没有重复的方式就无法存储它们。


阅读 363

收藏
2020-05-17

共1个答案

一尘不染

唯一密钥的 基本属性是它必须是唯一的。使该键成为Nullable的一部分会破坏此属性。

有两种可能的解决方案来解决您的问题:

  • 一种方法(错误的方法)是使用一些魔术日期来表示未知数。这只是使您克服了DBMS的“问题”,但并不能从逻辑上解决问题。预期两个“约翰·史密斯”条目的生日不明的问题。这些家伙是同一个人还是独特的个人?如果您知道它们不同,那么您又回到了同样的旧问题-您的唯一密钥不是唯一的。甚至不要考虑分配一个完整的魔术日期来表示“未知”,这确实是通往地狱的道路。

  • 更好的方法是将EmployeeId属性创建为代理键。这只是您分配给 知道 唯一的个人的任意标识符。该标识符通常只是一个整数值。然后创建一个Employee表,以将EmployeeId(唯一的,不可为空的键)与您认为是依赖属性的属性相关联,在这种情况下,名称和出生日期(其中任何一个都可以为空)。在以前使用姓名/生日的任何地方使用EmployeeId代理键。这将向您的系统添加一个新表,但是以一种可靠的方式解决了未知值的问题。

2020-05-17