一尘不染

MySQL的“分组依据”和“排序依据”

mysql

我希望能够从电子邮件表中选择一堆行并按发件人分组。我的查询如下所示:

SELECT 
    `timestamp`, `fromEmail`, `subject`
FROM `incomingEmails` 
GROUP BY LOWER(`fromEmail`) 
ORDER BY `timestamp` DESC

该查询几乎可以按我希望的方式工作-它选择按电子邮件分组的记录。问题在于主题和时间戳记与特定电子邮件地址的最新记录不符。

例如,它可能返回:

fromEmail: john@example.com, subject: hello
fromEmail: mark@example.com, subject: welcome

当数据库中的记录是:

fromEmail: john@example.com, subject: hello
fromEmail: john@example.com, subject: programming question
fromEmail: mark@example.com, subject: welcome

如果“编程问题”主题是最新的,那么在对电子邮件进行分组时如何使MySQL选择该记录?


阅读 317

收藏
2020-05-17

共1个答案

一尘不染

一个简单的解决方案是将查询包裹与ORDER语句子选择 第一 和应用GROUP BY

SELECT * FROM ( 
    SELECT `timestamp`, `fromEmail`, `subject`
    FROM `incomingEmails` 
    ORDER BY `timestamp` DESC
) AS tmp_table GROUP BY LOWER(`fromEmail`)

这类似于使用联接,但看起来要好得多。

在带有GROUP BY子句的SELECT中使用非聚合列是非标准的。MySQL通常会返回找到的第一行的值,并丢弃其余的行。任何ORDER
BY子句仅适用于返回的列值,而不适用于丢弃的值。

重要更新
选择非聚合列可在实践中使用,但不应依赖于此。根据MySQL文档, “这主要在以下情况下有用:每个未聚合的列中未在GROUP BY中命名的所有值对于每个组都是相同的。服务器可以从每个组中
自由选择任何值 ,因此 除非它们相同,否则这些值选择的是不确定的 。”

5.7.5版本开始,默认情况下仅启用ONLY_FULL_GROUP_BY,因此非聚合列会导致查询错误(ER_WRONG_FIELD_WITH_GROUP)

正如@mikep在下面指出的,解决方案是使用5.7及更高版本的ANY_VALUE()

参见 http://www.cafewebmaster.com/mysql-order-sort-group

https://dev.mysql.com/doc/refman/5.6/en/group-by-handling.html

https://dev.mysql .com / doc / refman / 5.7 / en / group-by-handling.html

https://dev.mysql.com/doc/refman/5.7/en/miscellaneous-
functions.html#function_any-
value

2020-05-17