Numpy 有两种基本对象:ndarray (N-dimensional array object)
和 ufunc (universal function object)
。ndarray
是存储单一数据类型的多维数组,而 ufunc
则是能够对数组进行处理的函数。
例如,我们之前所接触到的二元操作符对应的 Numpy 函数,如 add
,就是一种 ufunc
对象,它可以作用于数组的每个元素。
In [1]:
import numpy as np
In [2]:
a = np.array([0,1,2])
b = np.array([2,3,4])
np.add(a, b)
Out[2]:
array([2, 4, 6])
查看支持的方法:
In [3]:
dir(np.add)
Out[3]:
['__call__',
'__class__',
'__delattr__',
'__doc__',
'__format__',
'__getattribute__',
'__hash__',
'__init__',
'__name__',
'__new__',
'__reduce__',
'__reduce_ex__',
'__repr__',
'__setattr__',
'__sizeof__',
'__str__',
'__subclasshook__',
'accumulate',
'at',
'identity',
'nargs',
'nin',
'nout',
'ntypes',
'outer',
'reduce',
'reduceat',
'signature',
'types']
除此之外,大部分能够作用于数组的数学函数如三角函数等,都是 ufunc
对象。
特别地,对于二元操作符所对应的 ufunc
对象,支持以下方法:
op.reduce(a)
将op
沿着某个轴应用,使得数组 a
的维数降低一维。
add 作用到一维数组上相当于求和:
$$ \begin{align} y & = add.recuce(a) \ & = a[0] + a[1] + ... + a[N-1] \ & = \sum_{n=0}^{N-1} a[n] \end{align} $$In [4]:
a = np.array([1,2,3,4])
np.add.reduce(a)
Out[4]:
10
多维数组默认只按照第一维进行运算:
In [5]:
a = np.array([[1,2,3],[4,5,6]])
np.add.reduce(a)
Out[5]:
array([5, 7, 9])
指定维度:
In [6]:
np.add.reduce(a, 1)
Out[6]:
array([ 6, 15])
作用于字符串:
In [7]:
a = np.array(['ab', 'cd', 'ef'], np.object)
np.add.reduce(a)
Out[7]:
'abcdef'
逻辑运算:
In [8]:
a = np.array([1,1,0,1])
np.logical_and.reduce(a)
Out[8]:
False
In [9]:
np.logical_or.reduce(a)
Out[9]:
True
op.accumulate(a)
accumulate
可以看成保存 reduce
每一步的结果所形成的数组。
与之前类似:
In [10]:
a = np.array([1,2,3,4])
np.add.accumulate(a)
Out[10]:
array([ 1, 3, 6, 10])
In [11]:
a = np.array(['ab', 'cd', 'ef'], np.object)
np.add.accumulate(a)
Out[11]:
array(['ab', 'abcd', 'abcdef'], dtype=object)
In [12]:
a = np.array([1,1,0,1])
np.logical_and.accumulate(a)
Out[12]:
array([ True, True, False, False], dtype=bool)
In [13]:
np.logical_or.accumulate(a)
Out[13]:
array([ True, True, True, True], dtype=bool)
op.reduceat(a, indices)
reduceat
方法将操作符运用到指定的下标上,返回一个与 indices
大小相同的数组:
$$ \begin{align} y & = add.reduceat(a, indices) \ & = \left[\sum_{n=indice[0]}^{indice[1]-1} a[n], \sum_{n=indice[1]}^{indice[2]-1} a[n], ..., \sum_{n=indice[-1]}^{N-1} a[n]\right] \end{align} $$In [14]:
a = np.array([0, 10, 20, 30, 40, 50])
indices = np.array([1,4])
np.add.reduceat(a, indices)
Out[14]:
array([60, 90])
这里,indices
为 [1, 4]
,所以 60
表示从下标1(包括)加到下标4(不包括)的结果,90
表示从下标4(包括)加到结尾的结果。
op.outer(a, b)
对于 a
中每个元素,将 op
运用到它和 b
的每一个元素上所得到的结果:
In [15]:
a = np.array([0,1])
b = np.array([1,2,3])
np.add.outer(a, b)
Out[15]:
array([[1, 2, 3],
[2, 3, 4]])
注意有顺序的区别:
In [16]:
np.add.outer(b, a)
Out[16]:
array([[1, 2],
[2, 3],
[3, 4]])