假设我有一个包含3列的表格:
我有以下记录:
1, 2010-01-01 15:00:00, Some Title 2, 2010-01-01 15:00:02, Some Title 3, 2010-01-02 15:00:00, Some Title
我需要在彼此之间3秒钟之内进行GROUP BY记录。对于此表,第1行和第2行将组合在一起。
这里有一个类似的问题: Mysql DateTime组15分钟
我也发现了这一点:http : //www.artfulsoftware.com/infotree/queries.php#106
我不知道如何将这些方法转换为可以工作几秒钟的方法。SO问题上的方法的麻烦在于,在我看来,它仅适用于在已知点开始的时间范围内的记录。例如,如果我要FLOOR()以秒为单位工作,则以5秒为间隔,将15:00:04的时间与15:00:01分组,但不与15:00:06分组。
FLOOR()
这有意义吗?请让我知道是否需要进一步说明。
编辑: 对于一组数字{1、2、3、4、5、6、7、50、51、60},看来最好将它们分组为{1、2、3、4、5, 6、7},{50、51},{60},以便每个分组行都取决于该行是否在上一行的3秒内。我知道这会改变一些情况,对此感到遗憾,我对此感到遗憾。
我正在尝试模糊匹配来自不同服务器的日志。服务器#1可能会记录一个项目“项目#1”,而服务器#2将在服务器#1的几秒钟内记录相同的项目“项目#1”。我需要在两条日志行上执行一些聚合函数。不幸的是,由于服务器软件的性质,我只有标题要继续。
我使用的是汤姆·H(Tom H.)的好主意,但在这里做的有点不同:
与其寻找一切在链的开始行的,我们可以发现所有的 时间 是链条的开端,然后回去ifnd符合时代的行。
此处的查询1可以通过找出3秒钟之内没有多少时间来告诉您哪个时间是链的起点。
SELECT DISTINCT Timestamp FROM Table a LEFT JOIN Table b ON (b.Timestamp >= a.TimeStamp - INTERVAL 3 SECONDS AND b.Timestamp < a.Timestamp) WHERE b.Timestamp IS NULL
然后,对于每一行,我们可以找到最大的链开始时间戳,该时间戳小于使用查询2的时间戳:
SELECT Table.id, MAX(StartOfChains.TimeStamp) AS ChainStartTime FROM Table JOIN ([query #1]) StartofChains ON Table.Timestamp >= StartOfChains.TimeStamp GROUP BY Table.id
一旦有了这些,我们就可以根据需要对它进行分组。
SELECT COUNT(*) --or whatever FROM Table JOIN ([query #2]) GroupingQuery ON Table.id = GroupingQuery.id GROUP BY GroupingQuery.ChainStartTime
我不确定这与Tom H的答案是否足够不同,可以单独发布,但是听起来您在实施方面遇到了麻烦,并且我正在考虑此事,因此我想再次发布。祝好运!