HTTP网页访问应用分析
一、HTTP协议简介
HTTP,全称Hyper Text Transfer Protocol,中文名为超文本传输协议。
HTTP是一种用于从Web服务器端传送超文本标记语言(HTML-Hyper Text Markup Language)文件到客户端浏览器的传送协议,上最常见的协议之一。我们通常访问的网页,就是通过HTTP协议进行传送的。
HTTP用名字标识某一资源时(即在浏览器中输入网址),遵循统一资源名(URN-Uniform Resource Name)的规则,当前网络中最常用的URN是统一资源定位符(URL-Uniform Resource Locator),当客户端在浏览器中输入一个URL或单击一个URL超链接时,就确定了要访问的地址。
以/resource/:
http://:表示使用超文本传输协议,通知Web服务器显示Web页,客户端可不输入;
;
/:Web服务器的域名,或站点服务器的名称;
resource/:Web服务器上的子目录,类似机器中的文件夹;
:Web服务器上resource子目录中的一个网页文件,即Web服务器传送给客户端浏览器的文件。
HTTP使用TCP协议的80端口进行可靠数据传输,一个HTTP会话由客户端开始发起,包括以下步骤:
客户端在浏览器中标识希望获取信息的URL;
发起HTTP连接请求,启动客户端(UA)和一个初始;
。
宏观工作方式:
客户端(UA)直接连接到Web服务器的通讯路径如图1所示,客户端与Web服务器之间的通讯不需要任何的中介服务器,这是最简单的情况。
(图1 客户端与Web服务器直接连接)
客户端(UA)通过中介服务器连接到Web服务器的通讯路径如图2所示,客户端与Web服务器之间的通讯通过中介服务器进行转发,中介服务器可能有1个,也可能有多个。
(图2 客户端通过中介服务器与Web服务器连接)
客户端(UA)到中介服务器的通讯路径如图3所示,客户端将请求发送给中介服务器1,中介服务器1将其发送中介服务器2,中介服务器2再发给Web服务器,最后客户端收到的内容由中介服务器1发送给它,而不是Web服务器。
(图3 客户端与中介服务器通讯过程)
内部操作过程:
如图4所示,它分为四个步骤:建立连接、发出请求信息、发出响应信息、关闭连接。
(图4 HTTP协议内部操作过程)
客户端发送的HTTP报文,我们称为请求链;中介服务器或Web服务器发送的HTTP报文,称为响应链。两种报文都遵循以下格式:
一般开始行,即请求报文的请求行和应答报文的状态行;
总头;
报文头;
一个空行;
报文体。
二、分析HTTP通讯
分析HTTP访问的具体流程
,客户端主机名为“wangym”,,请求的域名是“”。
。为避免数据干扰,可以设定一个过滤器,只捕获本机的数据通讯。设定好后开始数据捕获,同时在本机的浏览器中输入,待网页全部打开后
HTTP网页访问应用分析 来自淘豆网m.daumloan.com转载请标明出处.