您可以
as_matrix直接在数据框对象上使用方法将数据框转换为矩阵。您可能需要指定感兴趣的列,
X=df[['x1','x2','X3']].as_matrix()其中不同的x是列名。
对于y变量,您可以
y = df['ground_truth'].values用来获取数组。
这是一些随机生成的数据的示例:
import numpy as np#create a 5X5 dataframedf = pd.Dataframe(np.random.random_integers(0, 100, (5, 5)), columns = ['X1','X2','X3','X4','y'])
调用
as_matrix()上
df返回一个
numpy.ndarray对象
X = df[['X1','X2','X3','X4']].as_matrix()
调用从熊猫
values返回a
numpy.ndarray``series
y =df['y'].values
注意:您可能会收到一条警告:
FutureWarning: Method .as_matrix will be removed in a futureversion. Use .values instead.
要修复它,请使用
values而不是
as_matrix如下所示
X = df[['X1','X2','X3','X4']].values



