栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

如何在python中将HTML表转换为数组

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

如何在python中将HTML表转换为数组

Pandas可以立即将html中的所有表格提取到数据框列表中,从而使您不必自己解析页面(重新设计轮子)。甲数据帧是一个强大的类型2维阵列的。

我建议继续通过Pandas处理数据,因为它是一个很好的工具,但是如果您愿意,也可以转换为其他格式(列表,字典,csv文件等)。

"""Extract all tables from an html file, printing and saving each to csv file."""import pandas as pddf_list = pd.read_html('my_file.html')for i, df in enumerate(df_list):    print df    df.to_csv('table {}.csv'.format(i))

直接从Web而不是从文件获取html内容仅需稍作修改:

import requestshtml = requests.get('my_url').contentdf_list = pd.read_html(html)


转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/668462.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号