栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

从网页中提取链接

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

从网页中提取链接

将Java文件下载为纯文本/ html格式,并通过Jsoup或 html clean传递,两者相似,甚至可以用于解析格式错误的html 4.0语法,然后可以使用流行的HTML
DOM解析方法,例如getElementsByName(“ a”)或在jsoup中它甚至很酷,您只需使用

File input = new File("/tmp/input.html"); document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");Elements links = doc.select("a[href]"); // a with hrefElements pngs = doc.select("img[src$=.png]");// img with src ending .pngElement masthead = doc.select("div.masthead").first();

并找到所有链接,然后使用

String linkhref=links.attr("href");

取自http://jsoup.org/cookbook/extracting-data/selector-
syntax

选择器具有与

jQuery
您知道jQuery函数链相同的语法,那么您一定会喜欢它。

编辑:如果您想要更多的教程,您可以尝试一下由mkyong制作的教程。

http://www.mkyong.com/java/jsoup-html-parser-hello-world-
examples/



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/452707.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号