http协议又叫超文本传输协议,我们常用的网址http://指的就是这个东西。http协议是建立在TCP协议之上的,应用层的协议。那么我们来看看HTTP协议的内容都有哪些,我们可以使用网络调试助手,或直接在浏览器F12,网络窗口中查看,这里以访问www.baidu.com为例,在网络中我们看到访问https://www.baidu.com,他会有请求头和响应头,这就对应着浏览器的请求和百度服务器的响应(可以理解为浏览器问服务器要东西,服务器找到东西后给浏览器说:来给你)
我们来看一下请求头:
Host: www.baidu.com
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:70.0) Gecko/ Firefox/70.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8
Accept-Language: zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2
Accept-Encoding: gzip, deflate, br
Connection: keep-alive
Cookie: BIDUPSID=2CB9CB46B79027C154D9; PSTM=; BDUSS=TFKQjFrZTVKT29ZcHdYc0daSVd5TDhSdEdPdDRGOTlmZ3l5MEpCQWZaTmJZY2hjRVFBQUFBJCQAAAAAAAAAAAEAAAD3kgEvwfrDqLrE19MAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAFvUoFxb1KBcQ; BAIDUID=756ECFE21DCD550C4D3CDA0609B40E02:FG=1; ispeed_lsm=2; BD_UPN=; BDORZ=FFFB88EA3F8A630C64834BD6D0; COOKIE_SESSION=84423_0_7_4_6_12_0_2_7_3_0_2__0_0_0__0_%7C9%_25_%7C9; BDRCVFR[Fc9oatPmwxn]=G01CoNuskzfuh-zuyuEXAPCpy49QhP8; BD_HOME=1; H_PS_PSSID=1460_21091_29568_29220
Upgrade-Insecure-Requests: 1
host:访问地址
User-Agent:这个字段表示支持的浏览器版本、型号。这个字段主要可以运用于爬虫与反爬虫中。爬虫没有做伪装则没有User-Agent,服务器只需检测User-Agent字段是否符合要求就可以阻挡大部分的爬虫。
Accept:支持接收的格式
Accept-Language:接收语言
Accept-Encoding:接收压缩格式
cookie:这个字段保存着用户最近通过该服务器浏览的页面信息,服务器检索这个字段就可以获取浏览信息,进而推测用户浏览倾向进行广告推荐

再看一下响应头:
HTTP/1.1 200 OK (or 404 not found)
Bdpagetype: 2
Bdqid: 0xe6956b1b0004d0b9
Cache-Control: private
Connection: Keep-Alive
Content-Encoding: gzip
Content-Type: text/html;charset=utf-8
Date: Mon, 18 Nov 2019 13:40:51 GMT
Expires: Mon, 18 Nov 2019 13:40:50 GMT
P3p: CP=“ OTI DSP COR IVA OUR IND COM ”
Server: BWS/1.1(百度特有的服务器格式)
Set-Cookie: BDRCVFR[Fc9oatPmwxn]=aeXf-1x8UdYcs; path=/; domain=.baidu.com
Set-Cookie: BDSVRTM=224; path=/
Set-Cookie: BD_HOME=1; path=/
Set-Cookie: H_PS_PSSID=1460_21091_29568_29220; path=/; domain=.baidu.com
Strict-Transport-Security: max-age=
Traceid:
X-Ua-Compatible: IE=Edge,chrome=1
Transfer-Encoding: chunked
HTTP/1.1 200 OK :表示HTTP版本,200表示页面有内容 OK,也可能返回404,则表示没有找到页面。
Cache-Control:使用私有还是共有的cache
Content-Type: text/html;charset=utf-8:页面格式和编码方式
Date: Mon, 18 Nov 2019 13:40:51 GMT:响应时间
Set-Cookie:若在请求段没有cookie,则有的服务器会写Set-Cookie,浏览器接收到这个消息后会存储Set-Cookie到本地,下次访问作为Cookie传出。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/189920.html