目标:http://www.porters.vip/confusion/movie.html
目标是抓取用户评分,评分人数,累计票房,三个字段。简单一看很简单是不是,我们查看源代码,发现不是那么容易。
跟我们看到的并非如此啊。这是什么操作,仔细分析网络请求,我们发现这是使用了字体反爬虫的技术,那么我们如何破解呢?
首先我们得用网络请求这个字体文件,然后下载下来。

目标:http://www.porters.vip/confusion/movie.html
目标是抓取用户评分,评分人数,累计票房,三个字段。简单一看很简单是不是,我们查看源代码,发现不是那么容易。
跟我们看到的并非如此啊。这是什么操作,仔细分析网络请求,我们发现这是使用了字体反爬虫的技术,那么我们如何破解呢?
首先我们得用网络请求这个字体文件,然后下载下来。