Socket

Socket

    了解Socket也有段时间了,以前总以为它很高深,自己学了之后感觉没想象的那么难。其实很多事情都是这样,在没有了解之前总感觉神秘不可测,

但了解熟悉之后其实还好,远没自己想象的那么难。Socket是进程间通信的方法之一,可用于同一主机的两个进程,也可用于不同主机的两个进程。

     Socket通信双方分为服务端和客户端,客户端是主动方,连接的建立和关闭都是由客户端发起的。建立socket时,要指定套接字地址家族

(address family)和套接字类型(type)。地址家族代表所有的协议族,最常用的是AF_INET,它指TCP/IP协议,它支持两个进程在同一台主机或不

同主机,另外还有一个地址家族AF_UINX,它只支持同主机的两个进程通信,而且只用于类UNIX操作系统,用的不多;套接字类型貌似是指传输层

协议,常用的是SOCK_STREAM,代表TCP协议,有时也会用SOCK_DGRAM,代表UDP协议。下面,以TCP类型的Socket来说明,建立Socket通信

的过程用的是OS内的TCP/IP协议,下面代码用到是Python的socket库,与C标准库中的socket API大同小异。

图片参考资料:http://www.cnblogs.com/jamiechu/archive/2012/12/17/2808165.html,有修改

Socket

 

服务端:

(1) 建立socket

指定其地址家族和类型,代码如下

listen_sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM),其实这两个参数值可省,因为他们是默认值。

(2) bind本机地址

地址格式为IP+PORT,IP可以不用填,而PORT要指定,介于1024~49151。代码如下

HOST=’’

PORT=40000

ADDR = (HOST,PROT)

listen_sock.bind(ADDR)

(3) 设置该socket为被动监听

默认的,新建的socket是主动的,也就是客户端类型的socket,主动发起连接,在服务器端要设置成被动的。并设定最大连接数,在服务端会有两个队列,

一个是正在建立连接的队列,即正在进行TCP三次握手的连接,另一个是已经建立好连接的队列,它们已经完成了三次握手,但还没有被处理。当调用

accept()时会从该队列pop出一个连接,进行处理,如recv()等,所以我称这个队列为已连接未处理队列。貌似listen(backlog)中的backlog在不同的OS

上有不同的含义,因为OS对TCP/IP的实现略有不同,一般可以理解为上面两个队列长度的最大值,也就是说它是正在建立连接和已建立但还没有处理的连

接的最大数目。当达到最大的连接数时,服务器端对新来的连接不与响应,这会导致客户端超时重发。设定监听后,OS内核会对客户端发来的TCP连接自动

完成三次握手的过程。代码如下

listen_sock.listen(10)

(4) 三次握手

既不是listen()完成,也不是accept()完成,当调用listen()设置好监听和队列长度后,内核中有相应的进程就一直监听并完成TCP的三次握手,这个过程与用

户进程是分开的,可以认为它是一个独立的内核进程,对完成三次握手的每一个连接,内核都会给它建立一个新的服务端socket,并用该socket与客户端通

信,我们称该socket为connected_socket。也就是说监听socket只用于处理所有未完成三次握手的连接,一旦完成三次握手,那它就由已连接socket处理

,而且每个已连接socket只为一个TCP连接服务。对于已建立连接队列中的TCP连接,我们需要调用accept(),它从该队列pop出一个连接,并返回该连接的

服务端socket和客户端地址IP+PORT,如果队列为空,那accept()会阻塞。

(5)  pop一个已建立好的连接,在新进程/线程中处理,循环此过程

我们可以在当前进程中处理每个connected_sock。但这样做每个TCP连接就是同步处理的,即处理一个TCP连接直至客户端关闭该连接,此时服务端也关闭

连接,然后再accept()取出下一个TCP连接并处理。在TCP连接非常多的情况下,这种处理方法显然不行,所以常用方法是为每个pop出来的connected_sock

新建一个进程或线程处理,这样这些连接发/并行。BUFSIZE=1024; data = connected_sock.recv(BUFSIZE),它是指从收件队列最多取出1024个字节

(字符串类型),如果没有数据,它会阻塞,如果客户端发起关闭该TCP,它也会立即返回空字符串。所以如果它的值长度是0,那就说明该连接已经被客户端

关闭了,那这时关闭该connected_sock就好了。有一个问题,如果我发送一个长度为0的空字符串呢?首先send_data = ''; cli_sock.send(send_data)的

返回值是0,sendall()的返回值是发送长度,0说明发送长度为0字节,也就是说没有发送,所以也就不存在发送空字符串的情况。不过,我们在编程时还是要进行

检查,如果长度为空,就不发送,因为如果发送了,那后面常常会调用recv(),这里就会一直阻塞,因为Client端没有发送数据,服务端自然就收不到数据,所以

也就不会响应,其实这就是一个死锁了,因为Client和Server端同时阻塞在了自己的recv()。在父进程中,会循环检查子进程/线程是否结束,如果结束那就做子

进程的收尾工作。

    

客户端:

 (1)与服务端第一步相同。sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

 (2)与服务端第二步相同,可省略。因为主机就是自己,而客户端PORT一般是OS自己分配

 (3)主动发起连接connect

   调用connect(addr),它会发起连接并与服务端合作完成三次握手建立连接。它会阻塞,直到出错或完成连接才返回。

   HOST = ‘xxxxx’  #server ip

   PORT = ‘yyyy’   #server的端口号

   ADDR = (HOST,PORT)

   sock.connect(ADDR)

(4)对通信的数据进行处理

sock.sendall(data)

BUFSIZE = 1024

recv_data = sock.recv(BUFSIZE) #从收件队列最多取出1024字节,如果没有数据,会阻塞

(5) 主动关闭连接

sock.close()