我有一个2D矩阵,我想对每一行进行规范。但是当我numpy.linalg.norm(X)直接使用时,它将采用整个矩阵的范数。
numpy.linalg.norm(X)
我可以使用for循环对每一行进行规范,然后对each进行规范X[i],但是由于我有3万行,因此这需要花费大量时间。
X[i]
有什么建议可以找到更快的方法吗?还是可以将其应用于np.linalg.norm矩阵的每一行?
np.linalg.norm
请注意,如perimosocordiae所示,从NumPy1.9版本开始,这np.linalg.norm(x, axis=1)是计算L2-范数的最快方法。
np.linalg.norm(x, axis=1)
由于numpy更新而复活了一个旧问题。从1.9版本开始,numpy.linalg.norm现在接受一个axis参数。[代码,文档]
这是镇上最快的新方法:
In [10]: x = np.random.random((500,500)) In [11]: %timeit np.apply_along_axis(np.linalg.norm, 1, x) 10 loops, best of 3: 21 ms per loop In [12]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2) 100 loops, best of 3: 2.6 ms per loop In [13]: %timeit np.linalg.norm(x, axis=1) 1000 loops, best of 3: 1.4 ms per loop
并证明它正在计算同一件事:
In [14]: np.allclose(np.linalg.norm(x, axis=1), np.sum(np.abs(x)**2,axis=-1)**(1./2)) Out[14]: True
如果要计算L2范数,则可以直接计算(使用自axis=-1变量沿行求和):
axis=-1
np.sum(np.abs(x)**2,axis=-1)**(1./2)
Lp-范数当然可以类似地计算。
它的速度比快得多np.apply_along_axis,尽管可能不那么方便:
np.apply_along_axis
In [48]: %timeit np.apply_along_axis(np.linalg.norm, 1, x) 1000 loops, best of 3: 208 us per loop In [49]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2) 100000 loops, best of 3: 18.3 us per loop
其他ord形式的norm也可以直接计算(具有类似的加速比):
ord
norm
In [55]: %timeit np.apply_along_axis(lambda row:np.linalg.norm(row,ord=1), 1, x) 1000 loops, best of 3: 203 us per loop In [54]: %timeit np.sum(abs(x), axis=-1) 100000 loops, best of 3: 10.9 us per loop