MySQL的“分组依据”和“排序依据”

一尘不染

MySQL的“分组依据”和“排序依据”

mysql

我希望能够从电子邮件表中选择一堆行并按发件人分组。我的查询如下所示：

SELECT 
    `timestamp`, `fromEmail`, `subject`
FROM `incomingEmails` 
GROUP BY LOWER(`fromEmail`) 
ORDER BY `timestamp` DESC

该查询几乎可以按我希望的方式工作-它选择按电子邮件分组的记录。问题在于主题和时间戳记与特定电子邮件地址的最新记录不符。

例如，它可能返回：

fromEmail: john@example.com, subject: hello
fromEmail: mark@example.com, subject: welcome

当数据库中的记录是：

fromEmail: john@example.com, subject: hello
fromEmail: john@example.com, subject: programming question
fromEmail: mark@example.com, subject: welcome

如果“编程问题”主题是最新的，那么在对电子邮件进行分组时如何使MySQL选择该记录？

阅读 318

2020-05-17

共1个答案

一尘不染

一个简单的解决方案是将查询包裹与ORDER语句子选择第一和应用GROUP BY 后：

SELECT * FROM ( 
    SELECT `timestamp`, `fromEmail`, `subject`
    FROM `incomingEmails` 
    ORDER BY `timestamp` DESC
) AS tmp_table GROUP BY LOWER(`fromEmail`)

这类似于使用联接，但看起来要好得多。

在带有GROUP BY子句的SELECT中使用非聚合列是非标准的。MySQL通常会返回找到的第一行的值，并丢弃其余的行。任何ORDER
BY子句仅适用于返回的列值，而不适用于丢弃的值。

重要更新
选择非聚合列可在实践中使用，但不应依赖于此。根据MySQL文档， “这主要在以下情况下有用：每个未聚合的列中未在GROUP BY中命名的所有值对于每个组都是相同的。服务器可以从每个组中
自由选择任何值 ，因此 除非它们相同，否则这些值选择的是不确定的 。”

从5.7.5版本开始，默认情况下仅启用ONLY_FULL_GROUP_BY，因此非聚合列会导致查询错误（ER_WRONG_FIELD_WITH_GROUP）

正如@mikep在下面指出的，解决方案是使用5.7及更高版本的ANY_VALUE（）

参见 http://www.cafewebmaster.com/mysql-order-sort-group

https://dev.mysql.com/doc/refman/5.6/en/group-by-handling.html

https：//dev.mysql .com / doc / refman / 5.7 / en / group-by-handling.html

https://dev.mysql.com/doc/refman/5.7/en/miscellaneous-
functions.html#function_any-
value

2020-05-17