假设我有一个客户表和一个采购表。每次购买都属于一个客户。我想在一份SELECT声明中列出所有客户以及他们最近一次购买的清单。最佳做法是什么?关于建立索引有什么建议吗?
请在您的答案中使用这些表/列的名称:
id,name
id,customer_id,item_id,date
如果id保证按日期将(购买)排序,可以使用类似的语句来简化语句LIMIT 1吗?
LIMIT 1
这是greatest-n-per-group在StackOverflow上经常出现的问题的一个示例。
这通常是我建议解决的方式:
SELECT c.*, p1.* FROM customer c JOIN purchase p1 ON (c.id = p1.customer_id) LEFT OUTER JOIN purchase p2 ON (c.id = p2.customer_id AND (p1.date < p2.date OR (p1.date = p2.date AND p1.id < p2.id))) WHERE p2.id IS NULL;
说明:给定一行p1,就不应有p2同一位客户和更晚的日期(或者在有联系的情况下,更晚的日期id)。当我们发现这是事实时,则p1是该客户的最近一次购买。
p1
p2
对于指数,我会在创建复合指数purchase在列(customer_id,date,id)。这可以允许使用覆盖索引来完成外部联接。确保优化在您的平台上进行测试,因为优化取决于实现。使用RDBMS的功能来分析优化计划。例如EXPLAIN在MySQL上。
purchase
customer_id,date,id
有些人使用子查询来代替我上面显示的解决方案,但是我发现我的解决方案可以更轻松地解决联系。