从根本上讲,转换
vline为numpy的ufunc毫无意义,因为ufunc始终以元素方式应用于numpy数组。因此,输入自变量必须具有相同的形状,或者必须可广播为相同的形状。您正在将形状不兼容的两个数组传递给
ufunc_vline函数(
db.shape == (6,4)和
mask.shape == (3,)),因此
ValueError您将看到。
还有其他几个问题
ufunc_vline:
np.frompyfunc(vline, 2, 1)
指定vline
应返回一个输出参数,而vline
实际上不返回任何内容(但out
在适当位置进行修改)。您将
db
第一个参数传递给ufunc_vline
,而vline
希望第一个参数传递给idx
,该参数用作的行的索引db
。
另外,请记住,
np.frompyfunc与标准Python
for循环相比,使用Python函数创建ufunc不会产生任何明显的性能优势。要查看任何重大改进,您可能需要使用低级语言(例如C)编码ufunc(请参见文档中的此示例)。
话虽如此,您的
vline函数可以使用标准的布尔数组操作轻松地向量化:
def vline_vectorized(db, mask): return db[:, 0] & np.all((mask & db[:, 1:]) == mask, axis=1)
例如:
db = np.array([ # out for mask = [1, 0, 1]# target, vector # [1, 1, 0, 1], # 1 [0, 1, 1, 1], # 0 (fit to mask but target == 0) [0, 0, 1, 0], # 0 [1, 1, 0, 1], # 1 [0, 1, 1, 0], # 0 [1, 0, 0, 0], # 0 ])mask = np.array([1, 0, 1])print(repr(vline_vectorized(db, mask)))# array([1, 0, 0, 1, 0, 0])



