我一直在使用 PostgreSQL ,现在迁移到 MySQL 。
在我的查询中,我使用的是 PostgreSQL 的SELECT DISTINCT ON (col1, col2, col3),我想知道在 MySQL中 是否有与此语句相对应的内容。
SELECT DISTINCT ON (col1, col2, col3)
没有将使用SELECT DISTINCT ON的Postgresql查询转换为MySQL的完全等效的方法。
PostgreSQL的选择DISTINCT ON
在Postgresql中,以下查询将消除表达式(col1, col2, col3)匹配的所有行,并且将仅为每组匹配的行保留“第一col4,col5行”:
(col1, col2, col3)
SELECT DISTINCT ON (col1, col2, col3) col4, col5 FROM tablename
因此,如果您的表格是这样的:
col1 | col2 | col3 | col4 | col5 -------------------------------- 1 | 2 | 3 | 777 | 888 1 | 2 | 3 | 888 | 999 3 | 3 | 3 | 555 | 555
我们的查询将只为(1,2,3)保留一行,为(3,3,3)保留一行。结果行将是:
col4 | col5 ----------- 777 | 888 555 | 555
请注意,每个集合的“第一行”都是不可预测的,我们的第一行也可能是(888,999),除非我们指定ORDER BY:
SELECT DISTINCT ON (col1, col2, col3) col4, col5 FROM tablename ORDER BY col1, col2, col3, col4
(表达式上的DISTINCT必须与最左边的ORDER BY表达式匹配,但是ORDER BY可以包含其他表达式)。
MySQL对GROUP BY的扩展
MySQL扩展了GROUP BY的使用,以便我们可以选择未在GROUP BY子句中命名的非聚合列。每当我们选择非聚合列时,服务器都可以从该列的每个组中自由选择任何值,因此结果值将是不确定的。
所以这个Postgresql查询:
可以认为等同于以下MySQL查询:
SELECT col4, col5 FROM tablename GROUP BY col1, col2, col3
Postgresql和MySQL都将为每个(col1,col2,col3)返回“第一行”,在两种情况下,返回的行都是不可预测的,因为我们没有指定by order子句并对其进行排序。
很多人会很想使用ORDER BY转换此Postgresql查询:
与此:
SELECT col4, col5 FROM ( SELECT col1, col2, col3, col4, col5 FROM tablename ORDER BY col1, col2, col3, col4 ) s GROUP BY col1, col2, col3
这里的想法是将ORDER BY应用于子查询,以便当MySQL按col1,col2,col3分组时,它将保留col4和col5的第一个遇到的值。 这个主意不错,但这是错误的! MySQL可以自由选择col4和col5的任何值,我们不知道遇到的第一个值,它取决于优化程序。因此,我将其更正为:
SELECT t1.col4, t1.col5 FROM tablename t1 INNER JOIN (SELECT col1, col2, col3, MIN(col4) as m_col4 FROM tablename GROUP BY col1, col2, col3) s ON t1.col1=s.col1 AND t1.col2=s.col2 AND t1.col3=s.col3 AND t1.col4=s.m_col4 GROUP BY t1.col1, t1.col2, t1.col3, t1.col4
但这开始变得越来越复杂。
结论
通常,没有将Postgresql查询转换为MySQL查询的确切方法,但是有很多解决方法,生成的查询可能与原始查询一样简单,或者可能变得非常复杂,但这取决于查询本身。