最近在搞爬虫,手痒了想爬取点东西。本文是一个反例,希望大家吸取教训,更新技术手段。(没大成之前别想搞定一切)
按照爬虫惯例,使用requests请求导入包。在这里我选择爬取搜狗里的资料。
将爬取的资料写到一个html文件里,准备读取。
在输入想爬取的信息后,敲下回车即可。()这里爬取了武汉某大学的资料。结果如下:
呃。。。
看来网站的防爬虫还是做的很好。笔者技术不够。不过随着学习,我相信这个问题迟早被解决。

最近在搞爬虫,手痒了想爬取点东西。本文是一个反例,希望大家吸取教训,更新技术手段。(没大成之前别想搞定一切)
按照爬虫惯例,使用requests请求导入包。在这里我选择爬取搜狗里的资料。
将爬取的资料写到一个html文件里,准备读取。
在输入想爬取的信息后,敲下回车即可。()这里爬取了武汉某大学的资料。结果如下:
呃。。。
看来网站的防爬虫还是做的很好。笔者技术不够。不过随着学习,我相信这个问题迟早被解决。