栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Jsoup简单使用

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Jsoup简单使用

  • java爬虫来了,不要天天说Python,Python,Python!!!java同样也可以!
  • 我这个是maven工程!
  • 首先安装导入依赖

       org.jsoup
       jsoup
       1.14.2

编写代码
package com.nx;

import org.jsoup.Jsoup;
import org.jsoup.nodes.document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;

public class JSOUPTEST {
    public static void main(String[] args) throws IOException {
        List jds = new JSOUPTEST().goodlist("电脑");
        for (JD info : jds){
            System.out.println(info.toString());
        }
    }

    public List goodlist(String key) throws IOException {

        String url = "https://search.jd.com/Search?keyword=" + key;
        document document = Jsoup.parse(new URL(url), 30000);

        Element element = document.getElementById("J_goodsList");
        Elements elements = element.getElementsByTag("li");

        ArrayList list = new ArrayList<>();
        for (Element elements1 : elements){
            String imgurl = elements1.getElementsByTag("img").eq(0).attr("data-lazy-img");
            String price = elements1.getElementsByClass("p-price").eq(0).text();
            String title = elements1.getElementsByClass("p-name").eq(0).text();

            JD jd = new JD();
            jd.setImgurl(imgurl);
            jd.setPrice(price);
            jd.setTitle(title);

            list.add(jd);
        }
        return list;
    }
}

实体类(用来封装数据)
package com.nx;

public class JD {
    private String imgurl;
    private String price;
    private String title;

    public String getImgurl() {
        return imgurl;
    }

    public void setImgurl(String imgurl) {
        this.imgurl = imgurl;
    }

    public String getPrice() {
        return price;
    }

    public void setPrice(String price) {
        this.price = price;
    }

    public String getTitle() {
        return title;
    }

    public void setTitle(String title) {
        this.title = title;
    }

    @Override
    public String toString() {
        return "JD{" +
                "imgurl='" + imgurl + ''' +
                ", price='" + price + ''' +
                ", title='" + title + ''' +
                '}';
    }
}

效果图



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/302449.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号