一种(比较幼稚的)方式是分别存储数据框架的结构,即其列和索引,然后从预处理结果中创建一个新的数据框架,如下所示:
In [15]: data = np.zeros((2,2))In [16]: dataOut[16]: array([[ 0., 0.], [ 0., 0.]])In [17]: from pandas import DataframeIn [21]: df = Dataframe(data, index = ['first', 'second'], columns=['c1','c2'])In [22]: dfOut[22]: c1 c2first 0 0second 0 0In [26]: i = df.indexIn [27]: c = df.columns# generate new data as a numpy array In [29]: df = Dataframe(np.random.rand(2,2), index=i, columns=c)In [30]: dfOut[30]: c1 c2first 0.821354 0.936703second 0.138376 0.482180
如您所见
Out[22],我们从一个数据框架开始,然后在框架中
In[29]放置一些新数据,而行和列保持不变。我假设您的预处理将对
not数据的行/列进行混洗。



