一尘不染

查找非重叠序列的最大覆盖范围的算法。(即加权间隔调度概率。)

algorithm

我有一个问题与寻找最长的非重叠序列的算法非常相似。

到链接的问题,唯一的区别是,而不是找到组代表非重叠元组的 最长序列 ,我需要找到一组非重叠元组代表的 最大覆盖 ,我指的 总和元组的长度
是最大(一 元组的长度last - first + 1给定的定义 元组 中的下一个句子)。

我表示元组的方式与链接问题的方式不同。相反(starting index, length),我将元组表示为(first, last);例如,元组(3,7)表示数字集[3, 4, 5, 6, 7]。(即使端点匹配,一个元组也会 另一个元组 重叠
;即,(2,6)并且(6,8) 重叠 ,因此不能同时出现在解决方案中。)

例如,请考虑以下一组元组,排序方式为first

[(0,100), (2,50), (30,150), (60,95), (110,190), (120,150), (191,200)]

此处设置的最大值将[(0,100), (110,190), (191,200)]覆盖101 + 81 + 10 = 192。(请注意,此解决方案中的元组 不重叠 。)

解决这个问题的最简单算法的一个例子是什么,该算法的复杂性是什么?(如果可以在中解决,那就太好了O(N),但目前不知道是否可以解决。)

附录: 回想起来,事实证明,我在这里提出的问题等同于
加权区间调度问题

。这是区间调度问题的特例。

以下@j_random_hacker的答案实际上是加权间隔调度问题的已知解决方案,时间复杂度为O(N log(N))


阅读 160

收藏
2020-07-28

共1个答案

一尘不染

这是 O(nlog n)时间,O(n)空间 算法。首先,如果元组数组尚未按此顺序排列,则按其起始位置对其进行排序。我假设从零开始的数组索引。

让我们调用元组ib(i)的开始位置和结束位置e(i),以使其总长度为e(i)-b(i)+1。还要定义一个函数next(i),该函数返回第一个元组的元组列表中的位置,可以显示在元组i的右侧。注意,可以使用二进制搜索在O(log
n)的时间内计算next(i):只需将所有元组的起始位置b(i)保留在数组b []中,然后在子数组b [中搜索第一个j i + 1 .. n-1]的b
[j]> e(i)。

让我们将f(i)定义为 元组i 或之后 开始的任何不重叠元组的最大覆盖率。由于元组i本身是否处于此最佳集合中,因此我们具有:

f(i) = max(e(i) - b(i) + 1 + f(next(i)), f(i+1)) for 0 <= i < n

我们还有边界条件f(n) = 0

显然,最大可能的覆盖范围由f(0)给出。这很容易计算。在伪C ++中:

int b[] = /* Tuple beginning positions, in nondecreasing order */;
int e[] = /* Tuple end positions */;
int n = /* Number of tuples */;

// Find the array position of the leftmost tuple that begins to the right of
// where tuple i ends.
int next(int i) {
    return upper_bound(b + i + 1, b + n, e[i]);
}

int maxCov[n + 1];    // In practice you should dynamically allocate this

// After running this, maxCov[i] will contain the maximum coverage of any
// nonoverlapping subset of the set of n - i tuples whose beginning positions
// are given by b[i .. n-1] and whose ending points are given by e[i .. n-1].
// In particular, maxCov[0] will be the maximum coverage of the entire set.
void calc() {
    maxCov[n] = 0;
    for (int i = n - 1; i >= 0; --i) {
        maxCov[i] = max(e[i] - b[i] + 1 + maxCov[next(i)], maxCov[i + 1]);
    }
}

循环calc()运行n次,并且每次迭代都会对二进制搜索函数进行一次O(log n)调用upper_bound()

我们可以通过计算f(0)的max()的两个输入,查看哪个实际产生了最大值,记录是否暗示着元组0的存在,然后递归处理该大小,来构造一个实际大小的集合。余数(对应于f(next(0))或f(1))。(如果两个输入相等,那么会有多个最优解,我们可以遵循其中一个。)

2020-07-28