sklearn中的datasets数据库
里面有很多的data,例如有纽约房价,糖尿病数据,他也可以帮我们生成一些特定的数据帮助我们做特定的练习,比如线性回归等等
from sklearn import datasets from sklearn.linear_model import LinearRegression# loaded_data=datasets.load_boston() data_X=loaded_data.data data_y=loaded_data.target model=LinearRegression() model.fit(data_X,data_y) print(model.predict(data_X[:4,])) print(data_y[:4]) [30.00384338 25.02556238 30.56759672 28.60703649] [24. 21.6 34.7 33.4]
如果我们需要创造数值点呢
import matplotlib.pyplot as plt X,y=datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=1) plt.scatter(X,y) plt.show()
效果如下



