user=pd.read_csv(‘dx_user_1024.txt’,sep=‘|’,header=0)
print(user.head())
usergroup=user[[‘规整后的主叫号码’,‘规整后的被叫号码’,‘地市’]].groupby([‘规整后的主叫号码’,‘地市’]).count().reset_index()
print(usergroup)
usergroup.set_index([‘地市’,‘规整后的主叫号码’],drop=True,inplace=True)
usergroup.sort_values(‘地市’,inplace=True)
print(usergroup)
usergroup[‘分组占比’] = usergroup[‘规整后的被叫号码’].sum(level=‘地市’)/usergroup[‘规整后的被叫号码’]
print(usergroup)



