栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

您能否提供一些示例,说明为什么用正则表达式很难解析XML和HTML?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

您能否提供一些示例,说明为什么用正则表达式很难解析XML和HTML?

这是一些有趣的有效XML:

<!DOCTYPE x [ <!ENTITY y "a]>b"> ]><x>    <a b="&y;>" />    <![CDATA[[a>b <a>b <a]]>    <?x <a> <!-- <b> ?> c --> d</x>

这一点欢乐就是有效的HTML:

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd" [    <!ENTITY % e "href='hello'">    <!ENTITY e "<a %e;>">]>    <title>x</TITLE></head>    <p id  =  a:b center>    <span / hello </span>    &amp<br left>    <!---- >t<!---> < -->    &e link </a></body>

更不用说针对无效构造的所有特定于浏览器的解析。

祝您好运,正则表达式!

编辑(JörgW Mittag):这是格式良好,有效的HTML 4.01的另一个不错的片段:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"  "http://www.w3.org/TR/html4/strict.dtd"> <HTML/  <HEAD/    <TITLE/>/    <P/>


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/637717.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号