栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

(进行中)书籍:网络爬虫权威指南四五六章

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

(进行中)书籍:网络爬虫权威指南四五六章

https://m.ituring.com.cn/book/tupubarticle/25962?bookID=1980&type=tubook&subject=%E7%AC%AC%204%20%E7%AB%A0%E3%80%80%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB%E6%A8%A1%E5%9E%8B

第 4 章 网络爬虫模型

#一个 Content 类的示例

import requests
from bs4 import BeautifulSoup

class Content:
    def __init__(self,url,title,body):
        self.url=url
        self.title=title
        self.body=body

def getPage(url):
    req=requests.get(url)
    return BeautifulSoup(req.text,'html.parser')


def scrapeBrooking(url):
    soup=getPage(url)
    title=soup.find('h1').text
    body=soup.find('div',{'class':'post-body'}).text
    return Content(url,title,body)
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/339716.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号