栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

python带你采集评论数据,看看这个内容为啥吸引他(她)

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

python带你采集评论数据,看看这个内容为啥吸引他(她)

前言

大家早好、午好、晚好吖~

目录(可点击自己想看的地方)
  • 前言
      • 本篇代码提供者: 青灯教育-自游老师
  • 环境使用:
  • 代码
  • 尾语


本篇代码提供者: 青灯教育-自游老师
环境使用:
  • Python 3.8
  • Pycharm
代码

网址删了一部分,我把删了的东西放评论区,大家自行添加一下哦~

# 导入模块
import pprint
import re
import requests
import csv
import pandas as pd

# f = open('评论.csv', mode='a', encoding='utf-8', newline='')
# csv_writer = csv.DictWriter(f, fieldnames=[
#     '用户',
#     '地区',
#     '评论',
#     '日期',
# ])
# csv_writer.writeheader()


url = 'https://m..cn/comments/hotflow?id=4784937075214225&mid=4784937075214225&max_id_type=0'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

lis = []
for index in response.json()['data']['data']:
    content = ''.join(re.findall('[u4e00-u9fa5]+', index['text']))
    dit = {
        '用户': index['user']['screen_name'],
        '地区': index['source'].replace('来自', ''),
        '评论': content,
        '日期': index['created_at']
    }
    lis.append(dit)
    # csv_writer.writerow(dit)
    print(dit)
源码、解答、教程、资料有需要可以口裙:832157862
pd_data = pd.DataFrame(lis)
pd_data.to_excel('评论.xlsx')
尾语

好了,我的这篇文章写到这里就结束啦!

有更多建议或问题可以评论区或私信我哦!一起加油努力叭(ง •_•)ง

喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/1004657.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号