栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

数据集:R&D支出、GDP和能源消耗

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

数据集:R&D支出、GDP和能源消耗

数据集:R&D支出、GDP和能源消耗 1. 数据表
年份R&D支出(亿元)GDP(亿元)能源消耗(万吨标准煤)
201311906568845379732
201210298.4519470.1361732
20118687473104.1348001.66
20107062.6401512.8324939.15
20095802.1340902.8306647.15
20084616314045.4291448.29
20073710.2265810.3280507.94
20063003.1216314.4258676.3
20052450184937.4235996.65
20041966.3159878.3213455.99
20031539.6135822.8183791.82
20021287.6120332.7159430.99
20011042.5109655.2150405.8
2000895.799214.55145530.86
1999678.989677.05140569
1998551.184402.28136184
1997509.278973.03135909
1996404.571176.59135192
1995348.760793.73131176
1994265.0948197.86122737
1993240.2735333.92115993
1992297.9226923.48109170
1991163.3621781.5103783
199012518667.8298703

先将数据保存为2.2.xlsx

2. 数据预处理 2.1 导包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.formula.api import ols
2.2 读取并规范字段名称
data = pd.read_excel('2.2.xlsx')
data=data.rename(columns={'年份':'Year','R&D支出(亿元)':'RD','GDP(亿元)  ':'GDP','能源消耗(万吨标准煤)':'energyConsume'})
print(data)

处理后的数据:

    Year        RD        GDP  energyConsume
0   2013  11906.00  568845.00      379732.00
1   2012  10298.40  519470.10      361732.00
2   2011   8687.00  473104.05      348001.66
3   2010   7062.60  401512.80      324939.15
4   2009   5802.10  340902.81      306647.15
5   2008   4616.00  314045.43      291448.29
6   2007   3710.20  265810.31      280507.94
7   2006   3003.10  216314.43      258676.30
8   2005   2450.00  184937.37      235996.65
9   2004   1966.30  159878.34      213455.99
10  2003   1539.60  135822.76      183791.82
11  2002   1287.60  120332.69      159430.99
12  2001   1042.50  109655.17      150405.80
13  2000    895.70   99214.55      145530.86
14  1999    678.90   89677.05      140569.00
15  1998    551.10   84402.28      136184.00
16  1997    509.20   78973.03      135909.00
17  1996    404.50   71176.59      135192.00
18  1995    348.70   60793.73      131176.00
19  1994    265.09   48197.86      122737.00
20  1993    240.27   35333.92      115993.00
21  1992    297.92   26923.48      109170.00
22  1991    163.36   21781.50      103783.00
23  1990    125.00   18667.82       98703.00
3. 数据描述性分析
describe = data.describe()
print(describe)

结果:

              Year            RD            GDP  energyConsume
count    24.000000     24.000000      24.000000      24.000000
mean   2001.500000   2827.130833  185240.544583  202904.691667
std       7.071068   3466.864991  166428.586244   92240.219636
min    1990.000000    125.000000   18667.820000   98703.000000
25%    1995.750000    390.550000   68580.875000  134188.000000
50%    2001.500000   1165.050000  114993.930000  154918.395000
75%    2007.250000   3936.650000  277869.090000  283243.027500
max    2013.000000  11906.000000  568845.000000  379732.000000
4. 自变量与因变量关系判断
plt.figure(1);
plt.scatter(data['RD'],data['GDP']);
plt.xlabel('$RD$');
plt.ylabel('$GDP$');
plt.title('RD-GDP')
plt.figure(2);
plt.scatter(data['GDP'],data['energyConsume']);
plt.xlabel('$GDP$');
plt.ylabel('$energyConsume$');
plt.title('GDP-energyConsume')
plt.figure(3);
plt.scatter(data['energyConsume'],data['RD']);
plt.ylabel('$RD$');
plt.xlabel('$energyConsume$');
plt.title('energyConsume-RD')
plt.ioff();
plt.show();




可以看出,自1990年起的一段时间,数据变化缓慢,在图像中显示为数据点较为密集,说明这段时间内国力不够强大,居民消费水平、支出与能源消耗增长缓慢。

5. 计算相关系数
print(data[['RD','GDP','energyConsume']].corr())

结果:

                      RD       GDP  energyConsume
RD             1.000000  0.989405       0.948299
GDP            0.989405  1.000000       0.979595
energyConsume  0.948299  0.979595       1.000000

可以看出,各变量间的正相关性都很强。

6. 二元线性回归分析
lm = ols('GDP ~ RD + energyConsume', data=data).fit()
print(lm.summary())

结果:

                            OLS Regression Results                            
==============================================================================
Dep. Variable:                    GDP   R-squared:                       0.996
Model:                            OLS   Adj. R-squared:                  0.995
Method:                 Least Squares   F-statistic:                     2545.
Date:                Sun, 03 Oct 2021   Prob (F-statistic):           8.80e-26
Time:                        15:21:09   Log-Likelihood:                -256.14
No. Observations:                  24   AIC:                             518.3
Df Residuals:                      21   BIC:                             521.8
Df Model:                           2                                         
Covariance Type:            nonrobust                                         
=================================================================================
                    coef    std err          t      P>|t|      [0.025      0.975]
---------------------------------------------------------------------------------
Intercept     -4.648e+04   1.09e+04     -4.274      0.000   -6.91e+04   -2.39e+04
RD               28.8123      2.116     13.618      0.000      24.412      33.212
energyConsume     0.7405      0.080      9.312      0.000       0.575       0.906
==============================================================================
Omnibus:                       10.013   Durbin-Watson:                   0.580
Prob(Omnibus):                  0.007   Jarque-Bera (JB):                2.182
Skew:                          -0.057   Prob(JB):                        0.336
Kurtosis:                       1.527   Cond. No.                     1.06e+06
==============================================================================

参照表

根据测试,以GDP为因变量,RD、energyConsume为自变量,能更好地描述数据间的关系。
模型检验:
首先,根据R-squared=0.996,可以得出该模型对y的解释能力很强,拟合效果很好。
再次,根据Prob (F-statistic)=8.80e-26,取 α = 0.05 alpha=0.05 α=0.05,因为 8.80 e − 26 < 0.05 8.80e-26<0.05 8.80e−26<0.05,表示拒绝原假设,即认为模型是显著的。
系数检验:
由于截距Intercept,RD,energyConsume的系数检验的p值均为0.000,均小于0.05,故该系数在统计上具有显著性。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/286125.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号