老妪能解客户端与服务器端交互原理(HTTP数据请求与HTTP响应,包括Servlet部分)

通俗易懂客户端与服务器端交互原理(HTTP数据请求与HTTP响应,包括Servlet部分)
HTTP 介绍

1.HTTP 是一种超文本传送协议(HyperText Transfer Protocal),是一套计算机在网络中通信的一种规则。在TCP/IP体系结构中,HTTP 属于应用层协议,位于TCP/IP协议的顶层.

2.HTTP 是一种无状态的协议,意思是指在WEB浏览器客户端 和WEB服务器之间不需要建立持久的连接。整个过程就是当一个客户端向服务器端发送一个请求 request ,然后WEB服务器返回一个响应 response,之后连接就关闭了,在服务端此时是没有保留连接的信息.

3.HTTP 遵循 请求/响应  request/response 模型的,所有的通信交互都被构造在一套请求和响应模型中。

4.浏览WEB时,浏览器通过HTTP协议与WEB服务器交换信息,WEB服务器向WEB浏览器返回的文件都有与之相关的类型,这些信息类型的格式由MIME定义。

HTTP 定义的事物处理由以下四步组成:

1.建立连接
2.客户端发送HTTP请求
3.服务器段响应生成结果 回发
4.服务器端关闭连接,客户端解析回发响应头,恢复页面



1.建立连接:以下用我的另一篇文章的地址作为例子--Servlet 介绍 以及Servlet生命周期(详细)

http://lvp.iteye.com/admin/blogs/234610

客户端,也就是我请求一个地址时,即打开了到WEB服务器的HTTP端口的一个套接字。因为在网络中间作为传递数据的实体介质就是网线,数据实质上是通过IO流进行输出和输入,这就不难理解我们为什么在写一个Servlet的时候要引用 import java.io.*;的原因,包括我们在向客户端回发结果的时候要用到 PrintWriter 对象的 println()方法.

比如我在这里请求 JAVA EYE 社区的一个地址 http://www.iteye.com/
实际上首先要请求这个地址,以及一个端口 80(8080) http://www.iteye.com:80   80可以不写,是因为浏览器网页服务默认的端口号是 80

在JAVA 底层代码中是这样实现的,只不过它们已经帮我们做了
Socket socket = new Socket("www.iteye.com",8080);
InputStream in = socket.getInputStream();
OutputStream out = socket.getOutputStream();

2.客户端发送HTTP请求头
   一旦建立了TCP连接,WEB浏览器就会向WEB服务器发送请求命令,是一个ASCII文本请求行,后跟0个或多个HTTP头标,一个空行和实现请求的任意数据。

四个部分: 请求行 请求头标 空行和请求数据
1) 请求行由三个标记组成  请求方法 请求URL  HTTP版本 中间用空格分开
例如                      GET     admin/blogs/234610   HTTP/1.1
    HTTP 规范定义了8种可能的请求方法 ,最常见的是GET 和POST
GET                 检索URI中标识资源的一个简单请求HEAD               与GET方法相同,服务器只返回状态行和头标,并不返回请求文档
POST                服务器接受被写入客户端输出流中的数据的请求PUT                 服务器保存请求数据作为指定URI新内容的请求
DELETE            服务器删除URI中命名的资源的请求
OPTIONS          关于服务器支持的请求方法信息的请求
TRACE             Web服务器反馈Http请求和其头标的请求
CONNECT        已文档化但当前未实现的一个方法,预留做隧道处理


2)请求头标,由KEY:VALUE 键值组成,每行一对。请求头标通知服务器有关客户端的功能和标识。

HOST  请求的哪一个服务端地址,主地址 ,比如我所在的 lvp.iteye.com (域名解析定位到服务器端地址)
User-Agent  用户即客户端可以使用的浏览器 如 Mozilla/4.0
Accpet   客户端可以接受的MIME 类型列表 如 image/gif  text/html  application/msword 等等  还有很多
Content-length   只适用于POST 请求,以字节给出POST 数据的尺寸

3) 空行 发送回车符和退行 ,通知服务器以下不再有头标
4) 请求数据: 使用POST 传送数据,最常用使用的是 Content-Type 和Content-Length头标
总结以上 我们可以这样写出一个标准的HTTP请求

POST /admin/blogs/234610    HTTP1.1
HOST  http://lvp.iteye.com
User-Agent Mozilla/4.0
Accept  image/gif  ,text/html,application/pdf,...
key=value&key=value&key=value  (POST)请求的数据

那么,这上面的一个例子说明的就是
我要去访问的服务器端地址是 lvp.iteye.com/ 它下面的资源admin/blogs/234610

连接起来就是 http://lvp.iteye.com/admin/blogs/234610
这个页面用的是HTTP1.1规范 我的浏览器版本是Mozilla/4.0
可以支持的MIME格式为 image/gif,text/html,application/pdf...
这个MIME 格式在我们写的 response.setContentType("text/html;charset=gb2312") 中出现过
或者在
<%@ page contentType="text/html;charset=gb2312"%>中也出现过
或者在
<meta ..contentType="text/html;charset=gb2312">中也见到过

那么在这里如何理解 GET和POST 最直接的区别就是,GET方法将数据的请求跟在了所请求的URL后面,也就是在请求行里面我们是这样来做的:
GET admin/blogs/234610?key=value&key=value...HTTP
也就是实际上 用GET如此传递数据
http://lvp.iteye.com/admin/blogs/234610?name=lvpin&password=simonlv


3.服务器端接受请求,处理数据后生成响应返回数据到客户端 (部分Servlet内容穿插)
WEB 服务器解析请求  ,定义制定的资源 http://lvp.iteye.com/admin/blogs/234610

1)根据在请求是的GET/POST来按照响应的 doGet()/doPost()方法来处理(有可能是一些业务逻辑,也有可能是一些验证等等,也有可能是一些数据查询,提交等等) 其有效的数据就来源于 name=lvpin&password=simonlv,还有其它的一些封装在request对象中的数据资源。

2)处理请求之后,由response对象得到PrinterWriter 输出流对象 out,通过out.println()将数据以在客户端提交过的采用Accept中形式中的一种,如按照 response.setContentType("text/html;charset=gb2312")的格式输出流。

它的响应信息与请求信息非常类似,其区别就在于我们在请求阶段的请求行被状态行给替换了,再来看响应头

一个响应由四个部分组成;状态行、响应头标、空行、响应数据

1.状态行:状态行由三个标记组成:HTTP版本、响应代码和响应描述。
                                                                HTTP1.1    100              continue                          ------继续追加后继内容
                                                                HTTP/1.1   200               OK                                  --------一切正常
                                                                HTTP1.1    301  Moved Permanently    ---请求的文档在其它地方,会自动连接
                                                                HTTP1.1     403  Forbidden   -------绝对拒绝你访问这个资源,不管授权没有
                                                                HTTP1.1     400    Bad Request  -----客户端请求中的不良语法
                                                                HTTP1.1      404   Not Found  ---最常见,绝对是大名鼎鼎的找不到

HTTP响应码:
1xx:提示性信息,告诉客户端应该对某些其它的动作作出响应
2xx:这些就代表了请求成功
3xx:重定向,为了完成请求,必须进一步执行的动作
4xx:客户端错误
500-599:服务器端的错误

2.响应头标:像请求头标一样,它们指出服务器的功能,标识出响应数据的细节。
Date: Sat, 31 Dec 2005 23:59:59 GMT                   --响应生成的日期和时间
ContentType: text/html;charset=gb2312'                                                                                                                   Content-Length: 122 ---响应中的字节数,只在浏览器使用永久(Keep-alive)HTTP连接时需要。

3.空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标。
4.响应数据:HTML文档和图像等,也就是HTML本身。out.println("<html>").......写出的。。。


Java代码 
1.<html>  
2.<head>  
3.<title>Welcom to simon lv 's home</title>  
4.</head>  
5.<body>  
6.<!-- 这里是具体的内容,看到了这里  
7. 
8.相信大家对 HTTP 工作原理和服务器交互过程已经很清楚了吧  
9. 
10.-->   
11.</body>  
12.</html> 
<html>
<head>
<title>Welcom to simon lv 's home</title>
</head>
<body>
<!-- 这里是具体的内容,看到了这里

相信大家对 HTTP 工作原理和服务器交互过程已经很清楚了吧

-->
</body>
</html>

4.服务器端关闭连接,客户端解析回发响应头,恢复页面

1)浏览器先解析状态行,查看请求是否成功的状态代码--HTTP响应码:404 400 200 ....
2) 解析 每一个响应头标 如
ContentType: text/html;charset=gb2312                                              Content-Length: 122 ---响应中的字节数,只在浏览器使用永久(Keep-alive)HTTP连接时需要。

3) 读取响应数据HTML,根据它的语法标签<html></html>等和内容恢复标准的HTML格式页面或者其它。
4)一个HTML 文档可能包含其它的需要被载入的资源,浏览器会识别,并对这些资源再进行额外的请求,这个过程可以一直循环到所有的数据都按照响应头标中规定的格式恢复到页面中。
5)数据传送完毕,服务器端关闭连接,即无状态协议。

写了很长时间,估计里面也有些没有表达清楚的地方,但是整个流程可以清晰的展现,对于大家理解HTTP请求头和响应头的内容以及他们之间的关系应该很有帮助。