栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

熊猫可以将可变长的空格作为列分隔符吗?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

熊猫可以将可变长的空格作为列分隔符吗?

我认为

文档中仅缺少一个(也许是因为它在某些时候被解释为转义标记?)毕竟是正则表达式:

In [68]: data = read_table('sample.txt', skiprows=3, header=None, sep=r"s*")In [69]: dataOut[69]: <class 'pandas.core.frame.Dataframe'>Int64Index: 7 entries, 0 to 6Data columns:X.1     7  non-null valuesX.2     7  non-null valuesX.3     7  non-null valuesX.4     7  non-null valuesX.5     7  non-null valuesX.6     7  non-null values[...]X.23    7  non-null valuesX.24    7  non-null valuesX.25    5  non-null valuesX.26    3  non-null valuesdtypes: float64(8), int64(10), object(8)

由于@MRAB指出了定界符问题,因此最后几列存在一些问题:

In [73]: data.ix[:,20:]Out[73]:    X.21  X.22X.23        X.24 X.25    X.260   315  0.95 ABC transporter   transmembrane  region1   527  0.93 ABC transporter None    None2   408  0.86  RecF/RecN/SMCN        terminal  domain3   575  0.85  RecF/RecN/SMCN        terminal  domain4   556  0.72 AAA      ATPase          domain    None5   275  0.85      YceG-like      family None    None6   200  0.85       Pyridine  nucleotide-disulphide  oxidoreductase    None

但这可以在最后修复。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/647801.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号