栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何获取目录URL的文件/目录列表?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何获取目录URL的文件/目录列表?

有一些条件:

  1. 服务器必须已启用目录列表,以便您查看其内容。
  2. 我没有办法(没有API或HTTP动词)来检索列表,因此该列表通常显示为普通HTML页面
  3. 您将必须解析此HTML页面才能找到条目。

使用JSoup这样的库可以轻松完成解析。

例如,使用JSoup,您可以

http://howto.unixdev.net/
像这样在url处获取文档:

import java.io.IOException;import org.jsoup.Jsoup;import org.jsoup.nodes.document;import org.jsoup.nodes.Element;public class Sample {    public static void main(String[] args) throws IOException {        document doc = Jsoup.connect("http://howto.unixdev.net").get();        for (Element file : doc.select("td.right td a")) { System.out.println(file.attr("href"));        }    }}

将输出:

beignets.htmlbeignets.pdfbsd-pam-ldap.htmlddns-updates.htmlDebian_on_HP_dv6z.htmldextop-slackware.htmldirlist.htmldownloads/ldif/Linux-SharePoint.htmlrhfc3-apt.htmlrhfc3-apt.tar.bz2SUNWdsee-Debian.htmlSUNWdtdte-b69.htmlSUNWdtdte-b69.tar.bz2tcshrc.htmlTest_LVM_Trim_Ext4.htmlTru64-CS20-HOWTO.html

至于您的示例网址,

http://java.sun.com/j2se/1.5/pdf
这是找不到页面,所以我认为您很不走运。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/410233.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号