栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何在Python中使用正则表达式验证URL?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何在Python中使用正则表达式验证URL?

urlparse
(py2,py3)模块是解析(并验证)URL的一种简单方法。

正则表达式是太多的工作。


没有“验证”方法,因为几乎所有内容都是有效的URL。有一些标点符号规则将其拆分。没有标点符号,您仍然有一个有效的URL。

仔细检查RFC,看看是否可以构造“无效” URL。规则非常灵活。

例如

:::::
,一个有效的URL。路径是
":::::"
。漂亮的文件名,但是有效的文件名。

另外,

/////
也是有效的网址。netloc(“主机名”)为
""
。路径是
"///"
。再次,愚蠢。也有效。此URL规范化为
"///"
等效的URL

类似的东西

"bad://///worse/////"
是完全有效的。哑巴但有效。

底线 。解析它,然后查看各个部分,看看它们是否在某种程度上令人不快。

您是否希望方案始终为“ http”?您是否希望netloc始终为“
www.somename.somedomain”?您是否要让路径看起来像Unix?还是像窗户?是否要删除查询字符串?还是保留它?

这些不是RFC指定的验证。这些是您的应用程序独有的验证。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/483830.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号