将SELECT DISTINCT ON查询从Postgresql转换为MySQL

一尘不染

将SELECT DISTINCT ON查询从Postgresql转换为MySQL

mysql

我一直在使用 PostgreSQL ，现在迁移到 MySQL 。

在我的查询中，我使用的是 PostgreSQL 的SELECT DISTINCT ON (col1, col2, col3)，我想知道在
MySQL中 是否有与此语句相对应的内容。

阅读 1044

2020-05-17

共1个答案

一尘不染

没有将使用SELECT DISTINCT ON的Postgresql查询转换为MySQL的完全等效的方法。

PostgreSQL的选择DISTINCT ON

在Postgresql中，以下查询将消除表达式(col1, col2, col3)匹配的所有行，并且将仅为每组匹配的行保留“第一col4，col5行”：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

因此，如果您的表格是这样的：

col1 | col2 | col3 | col4 | col5
--------------------------------
1    | 2    | 3    | 777  | 888
1    | 2    | 3    | 888  | 999
3    | 3    | 3    | 555  | 555

我们的查询将只为（1,2,3）保留一行，为（3,3,3）保留一行。结果行将是：

col4 | col5
-----------
777  | 888
555  | 555

请注意，每个集合的“第一行”都是不可预测的，我们的第一行也可能是（888，999），除非我们指定ORDER BY：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

（表达式上的DISTINCT必须与最左边的ORDER BY表达式匹配，但是ORDER BY可以包含其他表达式）。

MySQL对GROUP BY的扩展

MySQL扩展了GROUP BY的使用，以便我们可以选择未在GROUP
BY子句中命名的非聚合列。每当我们选择非聚合列时，服务器都可以从该列的每个组中自由选择任何值，因此结果值将是不确定的。

所以这个Postgresql查询：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

可以认为等同于以下MySQL查询：

SELECT col4, col5
FROM tablename
GROUP BY col1, col2, col3

Postgresql和MySQL都将为每个（col1，col2，col3）返回“第一行”，在两种情况下，返回的行都是不可预测的，因为我们没有指定by
order子句并对其进行排序。

很多人会很想使用ORDER BY转换此Postgresql查询：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

与此：

SELECT col4, col5
FROM (
  SELECT col1, col2, col3, col4, col5
  FROM tablename
  ORDER BY col1, col2, col3, col4
) s
GROUP BY col1, col2, col3

这里的想法是将ORDER BY应用于子查询，以便当MySQL按col1，col2，col3分组时，它将保留col4和col5的第一个遇到的值。
这个主意不错，但这是错误的！ MySQL可以自由选择col4和col5的任何值，我们不知道遇到的第一个值，它取决于优化程序。因此，我将其更正为：

SELECT t1.col4, t1.col5
FROM tablename t1 INNER JOIN (SELECT col1, col2, col3, MIN(col4) as m_col4
                              FROM tablename
                              GROUP BY col1, col2, col3) s
     ON t1.col1=s.col1
        AND t1.col2=s.col2
        AND t1.col3=s.col3
        AND t1.col4=s.m_col4
GROUP BY
  t1.col1, t1.col2, t1.col3, t1.col4

但这开始变得越来越复杂。

结论

通常，没有将Postgresql查询转换为MySQL查询的确切方法，但是有很多解决方法，生成的查询可能与原始查询一样简单，或者可能变得非常复杂，但这取决于查询本身。

2020-05-17