您可以使用npm模块jsdom和htmlparser在Node.JS中创建和解析DOM。
其他选项包括:
- Python的BeautifulSoup
- 您可以将html转换为xhtml并使用XSLT
- NET的HTMLAgilityPack
- .NET的CsQuery(我的新宠)
- Spidermonkey和Rhino JS引擎具有本机E4X支持。仅当您将html转换为xhtml时,这才有用。
在所有这些选项中,我更喜欢使用Node.js选项,因为它使用了标准的W3C
DOM访问器方法,并且可以在客户端和服务器上重用代码。我希望BeautifulSoup的方法与W3C
dom更相似,并且我认为将HTML转换为XHTML以编写XSLT简直是可悲的。



