一尘不染

检测未知来源的时间

algorithm

如何检测无限序列中的重复数字?我尝试了 Floyd&Brent
检测算法,但一无所获…我有一个生成器,其生成的数字范围为0到9(含0)(包括0),并且我必须识别其中的一个句点。

示例测试用例:

import itertools

# of course this is a fake one just to offer an example
def source():
    return itertools.cycle((1, 0, 1, 4, 8, 2, 1, 3, 3, 1))

>>> gen = source()
>>> period(gen)
(1, 0, 1, 4, 8, 2, 1, 3, 3, 1)

阅读 217

收藏
2020-07-28

共1个答案

一尘不染

经验方法

这是一个有趣的问题。您问题的更一般形式是:

给定一个未知长度的重复序列,请确定信号的周期。

确定重复频率的过程称为傅里叶变换。在您的示例情况下,信号是干净且离散的,但是以下解决方案即使在连续嘈杂的数据下也可以使用!该FFT将尝试通过在所谓的“波空间”或“傅立叶空间”接近他们复制的输入信号的频率。基本上,该空间中的峰值对应于重复信号。信号的周期与峰值的最长波长有关。

import itertools

# of course this is a fake one just to offer an example
def source():
    return itertools.cycle((1, 0, 1, 4, 8, 2, 1, 3, 3, 2))

import pylab as plt
import numpy as np
import scipy as sp

# Generate some test data, i.e. our "observations" of the signal
N = 300
vals = source()
X = np.array([vals.next() for _ in xrange(N)])

# Compute the FFT
W    = np.fft.fft(X)
freq = np.fft.fftfreq(N,1)

# Look for the longest signal that is "loud"
threshold = 10**2
idx = np.where(abs(W)>threshold)[0][-1]

max_f = abs(freq[idx])
print "Period estimate: ", 1/max_f

这可以为这种情况提供正确的答案,10尽管如果N不对周期进行清楚的划分,您将获得接近的估计。我们可以通过以下方式将其可视化:

plt.subplot(211)
plt.scatter([max_f,], [np.abs(W[idx]),], s=100,color='r')
plt.plot(freq[:N/2], abs(W[:N/2]))
plt.xlabel(r"$f$")

plt.subplot(212)
plt.plot(1.0/freq[:N/2], abs(W[:N/2]))
plt.scatter([1/max_f,], [np.abs(W[idx]),], s=100,color='r')
plt.xlabel(r"$1/f$")
plt.xlim(0,20)

plt.show()

在此处输入图片说明

2020-07-28