HTTP请求包括四部分:
- 请求方法
- 请求网址
- 请求头
- 请求体
请求方法:主要有Get、Post
GET - 从指定的资源请求数据。
POST - 向指定的资源提交要被处理的数据。
其他的请求方法:
请求的网址(URL)
请求头:用来说明服务器要使用的附加信息,包括cookie、Referer、User-Agent。部分信息介绍如下:
请求体:
请求体一般承载的内容是POST请求中的表单数据,而对于GET请求,请求体则为空。
content-Type和POST提交数据之间的关系
爬虫中,若要构建POST请求,需正确设置content-type,并了解数据对应的C-Type
由服务器返回给客户端,可以分为三个部分:
- 响应状态码
- 响应头
- 响应体
响应状态码表示服务器的响应状态
响应头包含服务器对请求的应答信息,如Content-Type、Server、Set-cookie等。
响应体包含响应的正文数据,例如:
- 请求网页时,其响应体就是网页的HTML
- 请求图片时,响应体就是图片的二进制数据



