Socket
了解Socket也有段时间了,以前总以为它很高深,自己学了之后感觉没想象的那么难。其实很多事情都是这样,在没有了解之前总感觉神秘不可测,
但了解熟悉之后其实还好,远没自己想象的那么难。Socket是进程间通信的方法之一,可用于同一主机的两个进程,也可用于不同主机的两个进程。
Socket通信双方分为服务端和客户端,客户端是主动方,连接的建立和关闭都是由客户端发起的。建立socket时,要指定套接字地址家族
(address family)和套接字类型(type)。地址家族代表所有的协议族,最常用的是AF_INET,它指TCP/IP协议,它支持两个进程在同一台主机或不
同主机,另外还有一个地址家族AF_UINX,它只支持同主机的两个进程通信,而且只用于类UNIX操作系统,用的不多;套接字类型貌似是指传输层
协议,常用的是SOCK_STREAM,代表TCP协议,有时也会用SOCK_DGRAM,代表UDP协议。下面,以TCP类型的Socket来说明,建立Socket通信
的过程用的是OS内的TCP/IP协议,下面代码用到是Python的socket库,与C标准库中的socket API大同小异。
图片参考资料:http://www.cnblogs.com/jamiechu/archive/2012/12/17/2808165.html,有修改
服务端:
(1) 建立socket
指定其地址家族和类型,代码如下
listen_sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM),其实这两个参数值可省,因为他们是默认值。
(2) bind本机地址
地址格式为IP+PORT,IP可以不用填,而PORT要指定,介于1024~49151。代码如下
HOST=’’
PORT=40000
ADDR = (HOST,PROT)
listen_sock.bind(ADDR)
(3) 设置该socket为被动监听
默认的,新建的socket是主动的,也就是客户端类型的socket,主动发起连接,在服务器端要设置成被动的。并设定最大连接数,在服务端会有两个队列,
一个是正在建立连接的队列,即正在进行TCP三次握手的连接,另一个是已经建立好连接的队列,它们已经完成了三次握手,但还没有被处理。当调用
accept()时会从该队列pop出一个连接,进行处理,如recv()等,所以我称这个队列为已连接未处理队列。貌似listen(backlog)中的backlog在不同的OS
上有不同的含义,因为OS对TCP/IP的实现略有不同,一般可以理解为上面两个队列长度的最大值,也就是说它是正在建立连接和已建立但还没有处理的连
接的最大数目。当达到最大的连接数时,服务器端对新来的连接不与响应,这会导致客户端超时重发。设定监听后,OS内核会对客户端发来的TCP连接自动
完成三次握手的过程。代码如下
listen_sock.listen(10)
(4) 三次握手
既不是listen()完成,也不是accept()完成,当调用listen()设置好监听和队列长度后,内核中有相应的进程就一直监听并完成TCP的三次握手,这个过程与用
户进程是分开的,可以认为它是一个独立的内核进程,对完成三次握手的每一个连接,内核都会给它建立一个新的服务端socket,并用该socket与客户端通
信,我们称该socket为connected_socket。也就是说监听socket只用于处理所有未完成三次握手的连接,一旦完成三次握手,那它就由已连接socket处理
,而且每个已连接socket只为一个TCP连接服务。对于已建立连接队列中的TCP连接,我们需要调用accept(),它从该队列pop出一个连接,并返回该连接的
服务端socket和客户端地址IP+PORT,如果队列为空,那accept()会阻塞。
(5) pop一个已建立好的连接,在新进程/线程中处理,循环此过程
我们可以在当前进程中处理每个connected_sock。但这样做每个TCP连接就是同步处理的,即处理一个TCP连接直至客户端关闭该连接,此时服务端也关闭
连接,然后再accept()取出下一个TCP连接并处理。在TCP连接非常多的情况下,这种处理方法显然不行,所以常用方法是为每个pop出来的connected_sock
新建一个进程或线程处理,这样这些连接发/并行。BUFSIZE=1024; data = connected_sock.recv(BUFSIZE),它是指从收件队列最多取出1024个字节
(字符串类型),如果没有数据,它会阻塞,如果客户端发起关闭该TCP,它也会立即返回空字符串。所以如果它的值长度是0,那就说明该连接已经被客户端
关闭了,那这时关闭该connected_sock就好了。有一个问题,如果我发送一个长度为0的空字符串呢?首先send_data = ''; cli_sock.send(send_data)的
返回值是0,sendall()的返回值是发送长度,0说明发送长度为0字节,也就是说没有发送,所以也就不存在发送空字符串的情况。不过,我们在编程时还是要进行
检查,如果长度为空,就不发送,因为如果发送了,那后面常常会调用recv(),这里就会一直阻塞,因为Client端没有发送数据,服务端自然就收不到数据,所以
也就不会响应,其实这就是一个死锁了,因为Client和Server端同时阻塞在了自己的recv()。在父进程中,会循环检查子进程/线程是否结束,如果结束那就做子
进程的收尾工作。
客户端:
(1)与服务端第一步相同。sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
(2)与服务端第二步相同,可省略。因为主机就是自己,而客户端PORT一般是OS自己分配
(3)主动发起连接connect
调用connect(addr),它会发起连接并与服务端合作完成三次握手建立连接。它会阻塞,直到出错或完成连接才返回。
HOST = ‘xxxxx’ #server ip
PORT = ‘yyyy’ #server的端口号
ADDR = (HOST,PORT)
sock.connect(ADDR)
(4)对通信的数据进行处理
sock.sendall(data)
BUFSIZE = 1024
recv_data = sock.recv(BUFSIZE) #从收件队列最多取出1024字节,如果没有数据,会阻塞
(5) 主动关闭连接
sock.close()