他们在描述Viola- Jones对象检测框架(Viola和Jones的“鲁棒实时面部检测”)的论文中说:
用于训练的所有示例子窗口均经过方差归一化,以最大程度地减少不同照明条件的影响。
我的问题是 “他们使用哪种工具对图像进行规范化?”
我不是在寻找Viola&Jones使用的特定工具,而是会产生几乎相同输出的类似工具。我一直在关注许多haar培训教程(尝试检测手),但还不能输出良好的检测器(xml)。
我曾尝试与作者联系,但仍未回复。
一种可能的方法是在假设所有元素均呈正态分布的情况下应用普通且简单的标准化。
首先找到平均值(Mu)和标准偏差(S):
Mu = 1/N * Sum(a[i][j]) for each i,j S = sqrt(1/(N-1) * Sum((a[i][j] - Mu)^2)) for each i,j (in here N is the number of pixels, 20*20 in the viola jones case)
由此,我们可以使用标准正态分布公式(通过标准化所有值)来标准化每个像素的值:
a'[i][j] = (a[i][j] - Mu) / S
另一种方法是向量归一化,基本上说:
|a| = sqrt(sum (a[i][j]*a[i][j])) for each i,j
a'[i][j] = a[i][j] / |a|