visual studio 2022 python 爬虫程序遇到的问题

Python 更新时间：2026-05-21 23:37:27 发布时间：1638天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

网络爬虫代码

# 编写第一个网络爬虫
from urllib3 import *
from re import *
http = PoolManager()
disable_warnings()

def download(url):
    result = http.request('GET', url)
    htmlStr = result.data.decode('utf-8')
    return htmlStr
def analyse(htmlStr):

    aList = findall(']*titlelnk[^>]*>[^<]*',htmlStr)
    result = []
    for a in aList:
        g = search('href[s]*=[s]*['"]([^>'""]*)['"]', a)
        if g != None:
            url = g.group(1)

        index1 = a.find(">")
        index2 = a.rfind("<")
        title = a[index1 + 1:index2]
        d = {}
        d['url'] = url
        d['title'] = title
        result.append(d)
    return result

def crawler(url):
    html = download(url)
    blogList = analyse(html)
    for blog in blogList:
        print("title:",blog["title"])
        print("url:",blog["url"])


crawler('https://www.cnblogs.com')

开始调试后如图：

为什么会是这样呢？

开始执行（不调试）后如图：

小白求救。。

后续：
在代码第一行加入# coding=utf-8后，开始执行（不调试）

who can tell me why ? -_-

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/589136.html

上一篇企业快速开发平台Spring Cloud+Spring Boot+Mybatis+ElementUI 实现前后端分离整合spring cloud云架构快速开发平台

下一篇 c语言学习（函数的声明和定义）

Python相关栏目本月热门文章

关于我们文章归档网站地图联系我们