栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何使用HTML Agility Pack

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何使用HTML Agility Pack

首先,将HTMLAgilityPack nuget软件包安装到您的项目中。

然后,例如:

HtmlAgilityPack.Htmldocument htmlDoc = new HtmlAgilityPack.Htmldocument();// There are various options, set as neededhtmlDoc.OptionFixNestedTags=true;// filePath is a path to a file containing the htmlhtmlDoc.Load(filePath);// Use:  htmlDoc.LoadHtml(xmlString);  to load from a string (was htmlDoc.LoadXML(xmlString)// ParseErrors is an ArrayList containing any errors from the Load statementif (htmlDoc.ParseErrors != null && htmlDoc.ParseErrors.Count() > 0){    // Handle any parse errors as required}else{    if (htmlDoc.documentNode != null)    {        HtmlAgilityPack.HtmlNode bodyNode = htmlDoc.documentNode.SelectSingleNode("//body");        if (bodyNode != null)        { // Do something with bodyNode        }    }}

(注意:此代码仅是示例,不一定是最佳/唯一方法。请不要在自己的应用程序中盲目使用它。)

该Htmldocument.Load()方法还接受一个流,该流在与.NET框架中的其他面向流的类集成时非常有用。虽然

HtmlEntity.DeEntitize()
是正确处理html实体的另一种有用方法。

Htmldocument
HtmlNode
是您最常使用的类。与XML解析器类似,它提供了接受XPath表达式的selectSingleNode和selectNodes方法。

注意

Htmldocument.Option??????
布尔属性。这些控制Load和LoadXML方法处理HTML / XHTML的方式。

还有一个名为

HtmlAgilityPack.chm
的已编译帮助文件,该文件对每个对象都有完整的引用。这通常在解决方案的基本文件夹中。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/367392.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号