我有一个events包含很多重叠事件的表。例如,表事件中的以下行与其他行完全或部分重叠:
events
id start end created_at 1 2019-01-23 18:30:00.0 2019-01-23 19:00:00.0 2019-01-18 21:28:27.427612 2 2019-01-23 18:30:00.0 2019-01-23 19:00:00.0 2019-01-23 01:04:05.861876 3 2019-01-23 18:00:00.0 2019-01-23 18:45:00.0 2019-01-16 17:14:50.709552 4 2019-01-23 18:30:00.0 2019-01-23 19:30:00.0 2019-01-22 19:24:05.532491 5 2019-01-23 18:30:00.0 2019-01-23 19:30:00.0 2019-01-18 17:28:40.074205 6 2019-01-23 20:00:00.0 2019-01-23 20:30:00.0 2019-01-18 15:22:30.736888 7 2019-01-23 20:15:00.0 2019-01-23 20:45:00.0 2019-01-20 20:20:20.202020
在这种情况下,我需要做的是使整个重叠时间段中的一个会议保持最新的created_at值。
id start end created_at 2 2019-01-23 18:30:00.0 2019-01-23 19:00:00.0 2019-01-23 01:04:05.861876 7 2019-01-23 20:15:00.0 2019-01-23 20:45:00.0 2019-01-20 20:20:20.202020
我一直在寻找一个答案,该答案可以处理整个表中任何数量的此类重叠事件,但尚未找到任何可行的方法。
这是一种差距与孤岛的形式。在这种情况下,请通过查找开头的重叠部分来确定岛的起点。然后,对开始次数和聚合次数进行累积总和:
select max(id), min(start), max(end), max(created_at) from (select t.*, count(*) filter (where max_end < end) over (order by start) as grouping from (select t.*, max(end) over (order by start rows between unbounded preceding and 1 preceding) as max_end from events t ) t ) t group by grouping;