df['公民身份证号码'].str[6:14] # 取df表中的'公民身份证号码'列的全部数据,转换为字符串str类型,再截取第6+1到14+1(不含)个字符 # 110103 19991231 789x pd.to_datetime(df['公民身份证号码'].str[6:14], format='%Y%m%d', errors='coerce') # 将8为日期字符串转为日期格式 类型为pandas._libs.tslibs.timestamps.Timestamp
(20210129已解决)Pandas通过某列值包含特定字符串过滤行_漫步量化-CSDN博客
很简明扼要,很符合python的风格。
pandas把nan替换_Yzy_gold的博客-CSDN博客
数据挖掘:使用python+pandas处理身份证号数据,获得对应省份籍贯、生日和性别 - 知乎
(这里的方法太传统不可取,只有string[6:14]有用)
使用Python将数字转换为日期格式 - 问答 - Python中文网
pandas字符串转日期函数:
df['col'] = pd.to_datetime(df['col'], format='%d%m%Y', errors='coerce')
python数据分析之pandas数据选取:df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[] - 奥辰 - 博客园
这个非常常用,分类讲解的很细,但是iloc我还是没有搞懂,有些情况下不好用。
Pandas取交集、并集、差集 - 简书
交集
pd.merge(df1,df2)



