一尘不染

为什么“从ELECT DISTINCT a,b从”返回比“由ELECT DISTINCT A +'|”更少的记录 \+ B来源

sql

我有一个查询,该查询选择了一堆与客户的名称和地址有关的字段,但是归结为:

SELECT DISTINCT a, b, c, ... FROM big_dumb_flat_table

它返回一堆记录(10986590)。当我替换选择列表中的逗号以将其格式化为管道分隔的串联字符串时:

SELECT DISTINCT a + '|' + b + '|' + c + '|' + ... FROM big_dumb_flat_table

它返回了248条记录。我向自己保证,在任何字段中都没有管道可能会破坏返回集合的保真度。这里发生了什么?


阅读 166

收藏
2021-05-16

共1个答案

一尘不染

尾随空格可能会导致这种情况。对于字符串比较,这些将被忽略。

CREATE TABLE #T
(
a varchar(10),
b varchar(10),
c varchar(10)
)

INSERT INTO #T
SELECT 'a ' as a, 'b' as b, 'c ' as c union all
SELECT 'a' as a, 'b' as b, 'c ' as c

SELECT DISTINCT a, b, c  
FROM #T /*1 result*/

SELECT DISTINCT a + '|' + b + '|' + c + '|'   
FROM #T /*2 results*/


SELECT DISTINCT LTRIM(RTRIM(a)) + '|' + LTRIM(RTRIM(b)) + '|' +
                LTRIM(RTRIM(c)) + '|'   
FROM #T /*1 result*/
2021-05-16