1.表单的图片如下:
2.下边时相关的代码操作
import xlrd
# 1. 读取文件的地址以及工作簿和里边所有的表单信息
# workbook = xlrd.open_workbook(r"C:pythonPython Project爬虫系统学习豆瓣爬取实战保存数据excel豆瓣电影Top250.xls", "r")
# print(f"包含表单数量 {workbook.nsheets}")
# print(f"表单的名分别为: {workbook.sheet_names()}")
"""
运行结果:
包含表单数量 2
表单的名分别为: ['sheet1', 'Sheet2']
"""
"""
获取其他的信息:
表单行数(nrows)
列数(ncols)
表单名(name)
表单索引(number)
语法:
#sheet1为索引为0
sheet = book.sheet_by_index(0)
print(f"表单名:{sheet.name}")
print(f"表单索引:{sheet.number}")
print(f"表单行数:{sheet.nrows}")
print(f"表单列数:{sheet.ncols}")
"""
# 2. 读取特定的表单
# 一.按照索引获取第一个表单对象
# excel1 = workbook.sheet_by_index(0)
# print(excel1)
# 二.按照名称获取表单对象
# excel2 = workbook.sheet_by_name('Sheet2')
# print(excel2)
# 三.获取所有的表单对象,以字典的形式放入一个列表返回
# excels_lis = workbook.sheets()
# print("所有的表单有%s" % str(excels_lis))
"""
Sheet 0:
Sheet 1:
所有的表单有[Sheet 0:, Sheet 1:]
"""
# 3.读取excel的行【列】
book = xlrd.open_workbook(r"C:pythonPython Project爬虫系统学习豆瓣爬取实战保存数据excel豆瓣电影Top250.xls", "r")
sheet = book.sheet_by_index(0)
# 注:读取时行号、列号从0开始
print(f"第一行的内容是:{sheet.row_values(rowx=0)}")
print(f"第一列的内容是:{sheet.col_values(colx=0)}")
"""第一行的内容是:['电影详情链接', '图片链接', '影片中文名', '影片外文名', '评分', '评价数', '概况', '相关信息']
第一列的内容是:['电影详情链接', 'https://movie.douban.com/subject/1292052/', 'https://movie.douban.com/subject/1291546/',……
(列太多,后边就省略了) """
# 4. 获取单个单元格的内容
# book = xlrd.open_workbook(r"C:pythonPython Project爬虫系统学习豆瓣爬取实战保存数据excel豆瓣电影Top250.xls", "r")
# sheet = book.sheet_by_index(0)
# 选取行号、列号都是1的一个单元格
# print(f"单元格A2的内容是:{sheet.cell_value(rowx=1,colx=1)}")
"""
运行结果:
单元格A2的内容是:https://img2.doubanio.com/view/photo/s_ratio_poster/public/p480747492.jpg
"""



