我有对象在模型图像上说。我想计算模型图像上的对象与目标图像上的对象之间的变换(位移,缩放,旋转)。我想假设可以将对象视为2D,因此仅应计算2D转换。
首先,我想以手动方式进行操作。用户在模型图像上选择基点,然后在目标图像上选择目标点。点数应由用户定义(但不少于至少2-3点)。当点给出不同的信息时,应该对转换进行平均,例如可以据此计算匹配质量。
因此问题就在于计算两组点的转换,但是当我想在图像上进行转换时,我添加了图像处理标签。
特别欢迎的是带有一些代码或伪代码的参考和建议。
对于两点,这是一个非常容易的问题,仅应考虑线的旋转,缩放和位移,但是如何对更多的点进行处理,并对其求平均并计算一些品质因数。
当前的解决方案是:
void transformFnc(std::vector<PointF> basePoints, std::vector<PointF> targetPoints, PointF& offset, double rotation, double scale) { std::vector<Line> basePointsLines; std::vector<Line> targetPointsLines; assert(basePoints.size() == targetPoints.size()); int pointsNumber = basePoints.size(); for(int i = 0; i < pointsNumber; i++) { for(int j = i + 1; j < pointsNumber; j++) { basePointsLines.push_back(Line(basePoints[i], basePoints[j])); targetPointsLines.push_back(Line(targetPoints[i], targetPoints[j])); } } std::vector<double> scalesVector; std::vector<double> rotationsVector; double baseCenterX = 0, baseCenterY = 0, targetCenterX = 0, targetCenterY = 0; for(std::vector<Line>::iterator it = basePointsLines.begin(), i = targetPointsLines.begin(); it != basePointsLines.end(), i != targetPointsLines.end(); it++, i++) { scalesVector.push_back((*i).length()/(*it).length()); baseCenterX += (*it).pointAt(0.5).x(); baseCenterY += (*it).pointAt(0.5).y(); targetCenterX += (*i).pointAt(0.5).x(); targetCenterY += (*i).pointAt(0.5).y(); double rotation; rotation = (*i).angleTo((*it)); rotationsVector.push_back(rotation); } baseCenterX = baseCenterX / pointsNumber; baseCenterY = baseCenterY / pointsNumber; targetCenterX = targetCenterX / pointsNumber; targetCenterY = targetCenterY / pointsNumber; offset = PointF(targetCenterX - baseCenterX, targetCenterY - baseCenterY); scale = sum(scalesVector) / scalesVector.size(); rotation = sum(rotationsVector) / rotationsVector.size(); }
我可以在此代码中找到的唯一优化是从比例和旋转中消除那些与其余部分相差太大的值。
我正在寻找解决方案主张的代码或伪代码。 它也可以是对某些代码的引用。
到目前为止,我知道的答案是:
首先使用3x3仿射变换矩阵在简单的仿射变换中推广问题:
[M11 M12 M13] [M21 M22 M23] [M31 M32 M33]
由于我们已经知道第三行将始终为[0 0 1],因此我们可以简单地忽略它。
现在我们可以将问题描述为以下矩阵方程式
[xp0] [x0 y0 1 0 0 0 ] [yp0] [0 0 0 x0 y0 1 ] [M11] [xp1] [x1 y1 1 0 0 0 ] [M12] [yp1] = [0 0 0 x1 y1 1 ] * [M13] [xp2] [x2 y2 1 0 0 0 ] [M21] [yp2] [0 0 0 x2 y2 1 ] [M22] [xp3] [x3 y3 1 0 0 0 ] [M23] [yp3] [0 0 0 x3 y3 1 ]
其中xp和yp是投影坐标,x和y是原始坐标。
叫这个
proj = M * trans
然后我们可以计算出最小二乘拟合
trans = pinv(M) * proj
其中pinv是伪逆。
这为我们提供了一个仿射变换,该仿射变换最适合在最小二乘意义上给出的点。
现在显然这还将提供剪切,坐标翻转以及您不希望出现的非均匀缩放,因此我们需要以某种方式限制仿射变换以避免剪切。事实证明这很容易,我们可以使用单个矢量来描述旋转(矢量的方向)和缩放(矢量的大小),而另一个矢量将与之正交。这将自由度降低了两个。
M21 = -M12 M22 = M11
所以减少到
[xp0] [x0 y0 1 0] [yp0] [y0 -x0 0 1] [xp1] [x1 y1 1 0] [M11] [yp1] = [y1 -x1 0 1] * [M12] [xp2] [x2 y2 1 0] [M13] [yp2] [y2 -x2 0 1] [M23] [xp3] [x3 y3 1 0] [yp3] [y3 -x3 0 1]
求解完上述矩阵方程后,根据M12和M11计算M21和M22。