栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

熊猫或统计模型中的固定效果

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

熊猫或统计模型中的固定效果

如评论中所述,从Plates版本0.20.0起已删除PanelOLS。因此,您确实有三个选择:

  1. 如果您使用Python 3,则可以

    linearmodels
    按照最新答案中的指定使用

  2. 只需在

    statsmodels
    规范中指定各种虚拟变量即可,例如使用
    pd.get_dummies
    。如果固定效果的数量很多,则可能不可行。

  3. 或进行一些基于分组的贬义然后使用

    statsmodels
    (如果您要估计很多固定效果,这将起作用)。这是您可以通过一种固定方式完成的工作的准系统版本:

    import statsmodels.api as sm

    import statsmodels.formula.api as smf
    import patsy

    def areg(formula,data=None,absorb=None,cluster=None):

    y,X = patsy.dmatrices(formula,data,return_type='dataframe')ybar = y.mean()y = y -  y.groupby(data[absorb]).transform('mean') + ybarXbar = X.mean()X = X - X.groupby(data[absorb]).transform('mean') + Xbarreg = sm.OLS(y,X)# Account for df loss from FE transformreg.df_resid -= (data[absorb].nunique() - 1)return reg.fit(cov_type='cluster',cov_kwds={'groups':data[cluster].values})

例如,假设您有一个库存数据面板:一个月内每月数月内所有股票的股票收益和其他股票数据,并且您想对固定日历月固定收益的滞后收益进行回归(其中日历月份变量为所谓的

caldt
),你还希望通过日历月到集群标准误差。您可以使用以下方法估算这种固定效果模型:

reg0 = areg('ret~retlag',data=df,absorb='caldt',cluster='caldt')

这是使用较旧版本的时可以执行的操作

Pandas

使用pandas的具有时间固定效果的示例

PanelOLS
(位于plm模块中)。注意,导入
PanelOLS

>>> from pandas.stats.plm import PanelOLS>>> df     y    xdate       id2012-01-01 1   0.1  0.22   0.3  0.53   0.4  0.84   0.0  0.22012-02-01 1   0.2  0.7 2   0.4  0.53   0.2  0.34   0.1  0.12012-03-01 1   0.6  0.92   0.7  0.53   0.9  0.64   0.4  0.5

注意,数据框必须有一个multindex集;根据索引

panelOLS
确定
time
entity
效果:

>>> reg  = PanelOLS(y=df['y'],x=df[['x']],time_effects=True)>>> reg-------------------------Summary of Regression Analysis-------------------------Formula: Y ~ <x>Number of Observations:         12Number of Degrees of Freedom:   4R-squared:         0.2729Adj R-squared:     0.0002Rmse:   0.1588F-stat (1, 8):     1.0007, p-value:     0.3464Degrees of Freedom: model 3, resid 8-----------------------Summary of Estimated Coefficients------------------------      Variable       Coef    Std Err     t-stat    p-value    CI 2.5%   CI 97.5%--------------------------------------------------------------------------------  x     0.3694     0.2132       1.73     0.1214    -0.0485     0.7872---------------------------------End of Summary---------------------------------

Docstring:

PanelOLS(self, y, x, weights = None, intercept = True, nw_lags = None,entity_effects = False, time_effects = False, x_effects = None,cluster = None, dropped_dummies = None, verbose = False,nw_overlap = False)Implements panel OLS.See ols function docs

fama_macbeth
我认为这是另一个功能(如),我计划将此功能移至
statsmodels



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/640981.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号