http协议简介.doc

http协议简介.doc

ID:49199759

大小:331.50 KB

页数:10页

时间:2020-03-01

http协议简介.doc_第1页
http协议简介.doc_第2页
http协议简介.doc_第3页
http协议简介.doc_第4页
http协议简介.doc_第5页
资源描述:

《http协议简介.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第4章WebmaiI还原技术研究4.1HTTP协议概述HTTP(HypertextTransferProtocol,超文本传输协议)是最常见的应用层协议Z一,描述了从WWW服务器传输超文本到本地浏览器的规范。HTTP协议是一种而向连接的协议,使用前必须建立TCP连接,它通常使用TCP端口号80oHTTP协议是一种典型的C/S模式应用,客户端通过浏览器向Web服务器发送URI(UniformResourceIdentifiers,统一资源标识符)以请求一个网页,而网页的内容是由标记语言(如HTML)组织的,可以包含文本,声音,图片,视频等内容。服务器在收到请求后,就把请求的网页内容返回客户端,

2、交由浏览器显示。客户端程序(浏览器)HTTP协议的工作流程基于请求/响应模式,图4-1显示了这一工作模式。一次HTTP操作称为一个事务,其典型的工作流程”】可分为五步:a.客户端与服务器建立连接;b・浏览器发送一个请求给服务器;c.服务器按照浏览器的请求内容对指定资源进行处理,并给予相应的响应信息;d.浏览器接收服务器所返回的响应,并显示在用户的屏幕上;e.关闭连接。4.2HTTP协议报文格式4.2.1HTTP协议报文格式简介HTTP协议报文有两种类型:HTTP请求与HTTP响应。二者的相同之处在于,它们都是由四部分组成的:一个起始行,消息头,一个指示消息头结束的空行,以及可选的消息实体。不

3、同之处在于:起始行的格式,头域的选项,以及消息实体的内容。HTTP请求的起始行称之为请求行,其格式参见图4-2.其屮,Url指定了服务器上特定的资源,请求方法则指定了针对该资源的具体操作方法。HTTP响应的起始行称之为状态行,其格式参见图4-2.其屮,状态码是一个三个数字的结果代码主要用于机器自动识别。其第一个数字定义响应的类别,后两个数字没有分类的作用。第一个数字可能取5个不同的值:1経:通知响应类,表示服务端已接收到请求但未完成,还需继续处理;2材:请求成功类,表示服务端已成功接收请求,并能理解和接受;3材:重定向响应类,表示要使服务端完成指定请求,客户端必须接受进一步处理;4経:请求错

4、误类,表示客户端的请求包含语法错误使得该请求不能被正确执行;5経:服务端错误类,表示客户端的请求正确,但由于服务器内部错误不能执行。状态描述是对状态码的一个简单的文本描述,主要用于帮助用户理解。请求方法SPUrlSP协议版本CRLF协议版本SP状态码SP状态描述CRLF(其中,SP表示空格,CRLF表示一个回:乍换行)图4-2HTTP协议报文起始行的格式HTTP报文的消息头紧跟在起始行后面,它是由一个或多个头域组成的。HTTP报文的消息头里面有哪些头域存在是可选的(但在请求报文屮Host头域是必需的),而且所有这些头域之间并没有固定的出现顺序。头域之间由一个CRLF序列隔开,整个消息头以一个

5、空行与消息实体隔开。从类型上说,消息头里面的头域分别归属为通用头、请求头、响应头,和实体头四类。但实际上这四类头域之间不会有明显的间隔,也没有特定的先后顺序,并且四者的格式是一致的。如图4-3所示,每一个头域由域名(大小写无关)和域值两部分组成,二者之间由一个官号加空格隔开。因此提取域值吋,以遇到域名后跟连续的冒号和空格作为开始条件,以遇到CRLF作为终止条件。域名:SP域值CRLF(其中,SP表示空格,CRLF表示一个回车换行)图4-3HTTP报文消息头的头域格式4.2.2Webmail还原相关控制信息在Webma订内容还原的过程屮,我们需要从HTTP报文屮提取一些相关的控制信息,这些控制

6、信息的来源包括:请求行、状态行、Host头域、Transfer-Encoding头域、Content-Encoding头域、Content-Length头域、Content-Type头域等。请求行屮的请求方法与URI字段联合用来判别不同的邮件操作行为。邮件数据流的流向可以根据请求方法判定。一•般而言,收邮件使用GET方法,登录邮箱、发邮件使用POST方法;而要具体判定是收发邮件还是收发附件,则需要根据不同邮件操作行为时的不同URT特征。状态行描述了一次电子邮件操作的结果。大部分时候,我们认为仅当状态码以2或者3开头时,数据流屮才会含有有效的邮件信息,才有必要对数据流进行解析。Host头域属于

7、请求头,其值用于指定被请求资源的服务器主机名和端口号(默认为80端口),这位我们判定Webmai1服务提供商提供了依据。对于不同的Webmai1服务提供商,其Webmai1的格式存在很大差异,因此准确识别Webmai1服务提供商是有必要的。Transfer-Encoding头域属于通用头,其值说明了消息实体在数据传输屮的编码方式。如果我们需要解析的电子邮件数据在传输屮使用了某种传输编码,那我们要想获取完整的邮

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。