栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

regex:取索引中的id

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

regex:取索引中的id

SQL
select date,content_id,rec_queue_name_,
-- w:word,到:结束,选第一个
regexp_extract(candidate_key_,'id=(\w+):',1) as candidate_key,count(1) as exposure
from events
where date >= '2021-10-27' and date <= '2021-11-01'
and event = 'imp_detail_page'
and channel = 'ssss_popular'
and content_id = '7ebc54c538a745fcb898d08344dbf91f'
and (rec_queue_name_ = 'zili-recent-liked-eges-cold-start-exploit-queue'
or rec_queue_name_ = 'zili-recent-related-exploit-queue-v97')
group by date,content_id,rec_queue_name_,regexp_extract(candidate_key_,'id=(\w+):',1)
python

A(.*?)B 表示截取 A/B 中间的字符串

import re
txt = 'inews_panipuri:queue:type=eges_explicit_second_coldstart_v3:when=hour:id=10e7e8fa6c5644b6b929a6b8a93f8bba:language=en:ordering=sim'
bs64_str = re.findall("id=(.*?):", txt)[0]
print(bs64_str)

def get_id(txt):
    try:
        bs64_str = re.findall("id=(.*?):", txt)[0]
    except Exception as e:
        print(e)
        print(txt)

data['id'] = data['candidate_key'].apply(lambda x:get_id(x))
data.head()
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/423593.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号