这是一种清除10%的单元格的方法(或者说,清除现有数据帧大小所能达到的接近10%)。
import randomix = [(row, col) for row in range(df.shape[0]) for col in range(df.shape[1])]for row, col in random.sample(ix, int(round(.1*len(ix)))): df.iat[row, col] = np.nan
这是一种以10%的单元格概率独立清除单元格的方法。
df = df.mask(np.random.random(df.shape) < .1)



