栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

基于正则表达式的词行词法分析|自然语言处理

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

基于正则表达式的词行词法分析|自然语言处理

目录
    • 1.任务一:邮箱地址和网址提取
      • 1.1任务描述
      • 1.2代码
    • 2.任务二:密码提取
      • 2.1任务描述
      • 2.2代码


1.任务一:邮箱地址和网址提取 1.1任务描述

∙ bullet ∙ 实现基于正则表达式的字符串抽取,完成对 string文本的邮箱地址和网址,并按下面格式输出。

测 试 输 入 {color{Violet}测试输入} 测试输入

(1)我的邮箱:nlp@nudt.com
(2)please click https://www.educoder.net

测 试 输 出 {color{Violet}测试输出} 测试输出

(1)提取邮箱地址如下:
nlp@nudt.com
(2)提取网址如下:
https://www.educoder.net
1.2代码
import re
string =input()

#分别生成对应正则表达式对象
regex1 = re.compile(r'w+@w+.w+')
regex2 = re.compile(r'ht{2}ps://w{3}.w+.w+')

res = regex1.findall(string)
if len(res):
    print('提取邮箱地址如下:')
for i in res:
    print(i)

res1 = regex2.findall(string)
if len(res1):
    print('提取网址如下:')
for i in res1:
    print(i)

2.任务二:密码提取 2.1任务描述

∙ bullet ∙ 实现基于正则表达式的字符串抽取,完成对 string文本的密码提取,并按下面格式输出。

测 试 输 入 {color{Violet}测试输入} 测试输入

密码是:NUDT_NLP2021

测 试 输 出 {color{Violet}测试输出} 测试输出

提取密码是
NUDT_NLP2021
2.2代码
import re
string =input()

#提取密码代码,密码中包含字母、数字、下划线
print("提取密码是")
p = re.compile('[a-z]|[A-Z]|_|d')
t = re.findall(p,string)
if t:
    for i in t:
        print(i,end="")
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/307373.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号