栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Python爬虫编程思想(48):项目实战:抓取起点中文网的小说信息

        本文会利用requests库抓取起点中文网上的小说信息,并通过XPath提取相关的内容,最后将经过提取的内容保存到Excel文件中。本例需要使用第三方的xlwt库,该库用来通过Python操作Excel文件,需要使用下面的命令安装xlwt库。

pip install xlwt

        使用xlwt库非常简单,首先需要创建一个workbook,相当于一个Excel文件,然后在workbook中添加若干个Sheet,接下来在每一个Sheet中的指定单元格(Cell)添加文本,最后使用workbook的save方法保存Excel文件。完整的实现代码如下:

import xlwt
# 创建Workbook对象,并指定编码为utf-8
book = xlwt.Workbook(encoding='utf-8')
# 添加第1个Sheet,名称为Sheet1
sheet1 = book.add_sheet('Sheet1')
# 添加第2个Sheet,名称为Sheet2
sheet2 = book.add_sheet('Sheet2')
# 向第1个Sheet的Cell(1,1)位置添加文本
sheet1.write(1,1,'世界,你好')
# 向第1个Sheet
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/307751.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号