我只会用numpy的
randn:
In [11]: df = pd.Dataframe(np.random.randn(100, 2))In [12]: msk = np.random.rand(len(df)) < 0.8In [13]: train = df[msk]In [14]: test = df[~msk]
只是看到它起作用了:
In [15]: len(test)Out[15]: 21In [16]: len(train)Out[16]: 79

我只会用numpy的
randn:
In [11]: df = pd.Dataframe(np.random.randn(100, 2))In [12]: msk = np.random.rand(len(df)) < 0.8In [13]: train = df[msk]In [14]: test = df[~msk]
只是看到它起作用了:
In [15]: len(test)Out[15]: 21In [16]: len(train)Out[16]: 79