栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python利用pandas数据清洗的str属性接口的使用方法

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python利用pandas数据清洗的str属性接口的使用方法

自行去运行代码 看结果一句一句的运行

这里只有str的一部分方法 读者可联系文本处理字符串内容的方法举一反三

import pandas as pd
df { 姓名 :[ 刘备 , 蜘蛛精 , 孙悟空 , 猪八戒 , 孙权 ],
 英文名 :[ Liu bei , zhi zu jing , Zhang fei , Zhu ba jie , sun quan ],
 性别 :[ 男 , woman , 男 , man , man ],
 身份证 :[ 45645654 , 466584515 , 48486561 , 456156477 , 465153423132 ],
 居住地 :[ 巴蜀 , 盘丝洞 , 水帘洞 , 高老庄 , 东吴 ],
 身高 :[ mid:180_good , low:165_bad , hight:230_verygood , mid:170_good , low:160_bad ]
df pd.Dataframe(df)
# 字符查找类方法
# contains函数,判断某个字符串是否包含给定字符
df[ 居住地 ].str.contains( 老 )
# startswith,endswith函数判断某个字符串是否...开头结尾
df[ 姓名 ].str.startswith( 孙 )
df[ 居住地 ].str.endswith( 洞 )
# 字符的拼拆方法
# cat函数拼接 split方法 expand参数将一列扩为几列
df[ 姓名 ].str.cat(df[ 居住地 ],sep - *3)
df[[ 高矮 , 身高值 ]] df[ 身高 ].str.split( : ,expand True)
# 字符的删 换 匹配
# 去除空白字符
# strip,rstrip,lstrip
df[ 姓名 ].str.len()
df[ 姓名 ] df[ 姓名 ].str.strip()
df[ 姓名 ]
df[ 姓名 ].str.len()
# slice_replace函数使用给定字符 替换指定位置的字符 replace将指定位置的字符 替换为给定的字符串
df[ 身高 ].str.replace( : , - )
df[ 身份证 ].str.slice_replace(4,8, * *4)
# findall函数利用正则表达式,去字符串中匹配 返回查找结果的列表;extract,extractall函数接受正则表达式 抽取匹配的字符串
df[ 身高 ].str.extract( ([a-zA-Z] ) )
df[ 身高 ].str.extractall( ([a-zA-Z] ) )
df[ 身高 ].str.extract( ([a-zA-Z] ).*?([a-zA-Z] ) ,expand True)
# 其他方法
#repeat函数重复字符串几次
df[ 性别 ].str.repeat(3)
#pad side参数/center函数在字符串左边右边或左右两边添加给定字符
df[ 居住地 ].str.pad(10,fillchar * )
df[ 居住地 ].str.pad(10,side right ,fillchar * )
df[ 居住地 ].str.center(10,fillchar * )
#upper,lower函数用于将英文大小写转换
df[ 英文名 ].str.upper()
df[ 英文名 ].str.lower()
#计算字符串长度
df[ 性别 ].str.len()
#获取指定位置字符串
df[ 姓名 ].str.get(-1)
#计算给定字符在字符串中出现的次数
df[ 身份证 ].str.count( 4 )

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/267500.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号