有多种方法可以做到这一点,但这是一种方法:
import numpy as npdata = np.arange(1, 7)groups = np.array([0,0,1,2,2,1])unique_groups = np.unique(groups)sums = []for group in unique_groups: sums.append(data[groups == group].sum())
您 可以对 事物 进行
矢量化处理,以便根本没有for循环,但是我建议不要这样做。它变得不可读,并且将需要几个2D临时数组,如果您有大量数据,则可能需要大量内存。
编辑:这是您可以完全向量化的一种方法。请记住,这可能(并且可能会)比上述版本慢。(也许有更好的方法将其向量化,但是已经晚了,我很累,所以这只是浮现在脑海的第一件事……)
但是,请记住,这是一个不好的例子…在上述循环中,您的确在速度和可读性方面都更好。
import numpy as npdata = np.arange(1, 7)groups = np.array([0,0,1,2,2,1])unique_groups = np.unique(groups)# Forgive the bad naming here...# I can't think of more descriptive variable names at the moment...x, y = np.meshgrid(groups, unique_groups)data_stack = np.tile(data, (unique_groups.size, 1))data_in_group = np.zeros_like(data_stack)data_in_group[x==y] = data_stack[x==y]sums = data_in_group.sum(axis=1)



