您可以使用
Series.unique()method找出一列中所有唯一的元素,对于
.unique()仅返回
1元素的列,可以将其删除。范例-
for col in df.columns: if len(df[col].unique()) == 1: df.drop(col,inplace=True,axis=1)
一种不就地删除的方法-
res = dffor col in df.columns: if len(df[col].unique()) == 1: res = res.drop(col,axis=1)
演示-
In [154]: df = pd.Dataframe([[1,2,3],[1,3,3],[1,2,3]])In [155]: for col in df.columns: .....: if len(df[col].unique()) == 1: .....: df.drop(col,inplace=True,axis=1) .....:In [156]: dfOut[156]: 10 21 32 2
计时结果-
In [166]: %pastedef func1(df): res = df for col in df.columns: if len(df[col].unique()) == 1: res = res.drop(col,axis=1) return res## -- End pasted text --In [172]: df = pd.Dataframe({'a':1, 'b':np.arange(5), 'c':[0,0,2,2,2]})In [178]: %timeit func1(df)1000 loops, best of 3: 1.05 ms per loopIn [180]: %timeit df[df.apply(pd.Series.value_counts).dropna(thresh=2, axis=1).columns]100 loops, best of 3: 8.81 ms per loopIn [181]: %timeit df.apply(pd.Series.value_counts).dropna(thresh=2, axis=1)100 loops, best of 3: 5.81 ms per loop最快的方法似乎仍然是使用
unique和遍历各列的方法。



