栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

使用Pandas读取数据(.dat文件)

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

使用Pandas读取数据(.dat文件)

您可以将参数usecols与列顺序一起使用:

import pandas as pdfrom pandas.compat import StringIOtemp=u"""TIME  XGSM2004 006 01 00 01 37 600  12004 006 01 00 02 32 800  52004 006 01 00 03 28 000  82004 006 01 00 04 23 200  112004 006 01 00 05 18 400  17"""#after testing replace StringIO(temp) to filenamedf = pd.read_csv(StringIO(temp),       sep="s+",       skiprows=1,       usecols=[0,7],       names=['TIME','XGSM'])print (df)   TIME  XGSM0  2004     11  2004     52  2004     83  2004    114  2004    17

编辑:

您可以使用分隔符

regex
-2个或更多空格,然后添加,
engine='python'
因为出现警告:

ParserWarning:回退到“ python”引擎,因为“ c”引擎不支持正则表达式分隔符(分隔符> 1个字符且与“ s
+”不同的分隔符被解释为正则表达式);您可以通过指定engine =’python’来避免此警告。

import pandas as pdfrom pandas.compat import StringIOtemp=u"""TIME   XGSM2004 006 01 00 01 37 600   12004 006 01 00 02 32 800   52004 006 01 00 03 28 000   82004 006 01 00 04 23 200   112004 006 01 00 05 18 400   17"""#after testing replace StringIO(temp) to filenamedf = pd.read_csv(StringIO(temp), sep=r's{2,}', engine='python')print (df) TIME  XGSM0  2004 006 01 00 01 37 600     11  2004 006 01 00 02 32 800     52  2004 006 01 00 03 28 000     83  2004 006 01 00 04 23 200    114  2004 006 01 00 05 18 400    17


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/394941.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号