跳转至

网络编程进阶

add_circle2025-03-03update2025-03-03

网络通信三要素

  • IP地址:网络中每一台计算机的唯一标识,通过IP地址找到指定的计算机。

  • 端口:用于标识进程的逻辑地址,通过端口找到指定进程。

  • 协议:定义通信规则,符合协议则可以通信,不符合不能通信。一般有TCP协议和UDP协议。

运输层协议

image-20220510015729135

数据传输方式

计算机之间有很多数据传输方式,各有优缺点,常用的有两种:SOCK_STREAMSOCK_DGRAM

  1. SOCKSTREAM 表示面向连接的数据流的传输方式。数据可以准确无误地到达另一台计算机,如果损坏或丢失,可以重新发送,但效率相对较慢。常见的 http 协议就使用 SOCKSTREAM 传输数据,因为要确保数据的正确性,否则网页不能正常解析。

    SOCK_STREAM是基于TCP协议的,TCP协议是一种可靠的数据传输协议。
    
  2. SOCKDGRAM 表示无连接的数据报文的传输方式。计算机只管传输数据,不作数据校验,如果数据在传输中损坏,或者没有到达另一台计算机,是没有办法补救的。也就是说,数据错了就错了,无法重传。因为 SOCKDGRAM 所做的校验工作少,所以效率比 SOCK_STREAM 高。

    SOCK_DGRAM是基于UDP协议的,而UDP协议是一种尽最大努力交付的传输协议,当然SOCK_DGRAM 没有想象中的糟糕,不会频繁的丢失数据,数据错误只是小概率事件。所以在开发中,也会有很多的应用场景,例如QQ视频聊天和语音聊天等就使用SOCK_DGRAM方式传输数据,因为首先要保证通信的效率,尽量减小延迟,而数据的正确性是次要的,即使丢失很小的一部分数据,视频和音频也可以正常解析,最多出现噪点或杂音,不会对通信质量有实质的影响。
    

TCP协议

TCP(Transmission Control Protocol,传输控制协议)是一种面向连接的、可靠的、基于字节流的通信协议,数据在传输前要建立连接,传输完毕后还要断开连接。

TCP客户端在收发数据前要与TCP服务器建立连接。建立连接的目的是保证IP地址、端口、物理链路等正确无误,为数据的传输开辟通道。

img

比较重要的字段有:

  1. 序号:Seq(Sequence Number),序号占32位,用来标识从计算机A发送到计算机B的数据包的序号,计算机发送数据时对此进行标记。
  2. 确认号:Ack(Acknowledge Number),确认号占32位,客户端和服务器端都可以发送,Ack = Seq + 1。
  3. 标志位:Flags,每个标志位占用1Bit,共有6个,分别为 URG、ACK、PSH、RST、SYN、FIN,具体含义如下:
标志位 描述
URG 紧急指针(urgent pointer)有效。
ACK 确认序号有效。此处的ACK与上面的确认好Ack不是同一个,不要混淆了。
PSH 接收方应该尽快将这个报文交给应用层。
RST 重置连接。
SYN 发起一个新连接。
FIN 释放一个连接。

TCP客户端和TCP服务端在建立连接时就要进行三次握手,同样,在TCP客户端和TCP服务端在断开连接时,则要进行四次挥手

建立连接是非常重要的,它是数据正确传输的前提;而断开连接同样重要,它让计算机释放不再使用的资源。

tcp时序图

三次握手

TCP建立连接时要传输三个数据包,俗称三次握手(Three-way Handshaking)。TCP连接必须是一方主动打开,另一方被动打开的。

img

握手之前主动打开连接的客户端结束CLOSED阶段,被动打开的服务器端也结束CLOSED阶段,并进入LISTEN阶段。

1. 首先客户端向服务器端发送一段TCP报文,其中:
   标记位为 SYN,表示请求建立新连接,
   序号为 seq=x(x为随机数),
   随后客户端进入 SYN-SENT 阶段。

2. 服务器端接收到来自客户端的TCP报文之后,结束LISTEN阶段,并返回一段TCP报文,其中:
   标志位为SYN和ACK,表示确认客户端的报文Seq序号有效,服务器能正常接收客户端数据并同意创建新连接,
   序号为 seq=y(y为随机数)
   确认号为 Ack=x+1,表示收到客户端的序号Seq并将其值加1作为自己确认号Ack的值;随后服务器端进入SYN-RCVD阶段。

3. 客户端接收服务器端的TCP确认报文之后,明确了数据传输是正常的,结束SYN-SENT阶段。并返回最后一段TCP报文。其中:
   标志位为ACK,表示确认收到服务器端同意连接的信号,
   序号为 Seq=x+1,表示收到服务器端的确认号Ack,并将其值作为自己的序号值,
   确认号为 Ack=y+1,表示收到服务器端序号Seq,并将其值加1作为自己的确认号Ack的值,
   随后客户端进入ESTABLISHED阶段。

最后握手完成,建立连接完成,开始双方互相传输数据。

举个例子:诸葛亮与周瑜合作,明天一起攻打曹操。

[Shake 1] 诸葛亮:“你好,周瑜,我这边看了天气,明天早上7点适合打曹操。”
[Shake 2] 周瑜:“好的,我这边已准备就绪。”
[Shake 3] 诸葛亮:“我已经收到了你的同意。”

那么为什么要三次握手呢?看上面的例子,如果只进行了2次握手的话,诸葛亮就不知道周瑜已经收到了他的信息,所以担心之下第二天不出兵,这样的话,周瑜第一天就要吐血了,大喊:诸葛村夫,骗了我呀!!!

四次挥手

TCP关闭连接时要传输四个数据包,俗称四次挥手(Four-Way Wavehand)。

giphy

连接的释放必须是一方主动释放,另一方被动释放。

1. 首先客户端想要释放连接,向服务器端发送一段TCP报文,其中:
   标记位为FIN,表示请求释放连接,
   序号为Seq=x(x为随机数,假设为200),
   随后客户端进入FIN-WAIT-1阶段,即半关闭阶段,并且停止在客户端到服务器端方向上发送数据(注意:可以发送报文),
   但是客户端仍然能接收从服务器端传输过来的数据。

2. 服务器端接收到从客户端发出的TCP报文之后,确认了客户端想要释放连接,随后服务器端结束ESTABLISHED阶段,进入CLOSE-WAIT阶段(半关闭状态)并返回一段TCP报文,其中:
   标记位为ACK,表示接收到客户端发送的释放连接的请求,
   序号为Seq=y(y为随机数,假设为300),
   确认号为Ack=x+1(即201),表示是在收到客户端报文的基础上,将其序号Seq值加1作为本段报文确认号Ack的值,
   随后服务器端开始准备释放服务器端到客户端方向上的连接。

客户端收到从服务器端发出的TCP报文之后,确认了服务器收到了客户端发出的释放连接请求,随后客户端进入FIN-WAIT-2阶段。

3. 服务器端发出ACK确认报文之后,经过CLOSED-WAIT阶段,做好了释放连接准备,再次向客户端发出一段TCP报文,其中:
   标记位为FIN,ACK,表示已经准备好释放连接了。
   序号为Seq=z(z为随机数,假设为400),
   确认号为Ack=x+1(即201),表示是在收到客户端报文的基础上,将其序号Seq值加1作为本段报文确认号Ack的值。
   随后服务器端进入LAST-ACK阶段。并且停止发送数据,但是服务器端仍然能够接收从客户端传输过来的数据。

4. 客户端收到从服务器端发出的TCP报文,确认了服务器端已做好释放连接的准备,进入TIME-WAIT阶段,并向服务器端发送一段报文,其中:
   标记位为ACK,表示接收到服务器准备好释放连接的信号,
   序号为Seq=x+1(即201),表示是在收到了服务器端报文的基础上,将其确认号Ack值作为本段报文序号的值。
   确认号为Ack=z+1(即401),表示是在收到了服务器端报文的基础上,将其序号Seq值作为本段报文确认号的值。

最后挥手完成,取消连接完成,双方断开通信。

客户端最后一次发送 ACK包后进入 TIME_WAIT 状态,而不是直接进入 CLOSED 状态关闭连接,这是为什么呢?

TCP 是面向连接的传输方式,必须保证数据能够正确到达目标机器,不能丢失或出错,而网络是不稳定的,随时可能会毁坏数据,所以机器A每次向机器B发送数据包后,都要求机器B”确认“,回传ACK包,告诉机器A我收到了,这样机器A才能知道数据传送成功了。
如果机器B没有回传ACK包,机器A会重新发送,直到机器B回传ACK包。

客户端最后一次向服务器回传ACK包时,有可能会因为网络问题导致服务器收不到,服务器会再次发送 FIN 包,如果这时客户端完全关闭了连接,那么服务器无论如何也收不到ACK包了,所以客户端需要等待片刻、确认对方收到ACK包后才能进入CLOSED状态。

那么,要等待多久呢?数据包在网络中是有生存时间的,超过这个时间还未到达目标主机就会被丢弃,并通知源主机。
这称为报文最大生存时间(MSL,Maximum Segment Lifetime)。

TIME_WAIT 要等待 2MSL 才会进入 CLOSED 状态。ACK 包到达服务器需要 MSL 时间,服务器重传 FIN 包也需要 MSL 时间,2MSL 是数据包往返的最大时间,如果 2MSL 后还未收到服务器重传的 FIN 包,就说明服务器已经收到了 ACK 包。

举个例子:诸葛亮与周瑜合作完成,打算一起退兵。

[wavehand 1] 诸葛亮:“你好,周瑜,我这边已经拿下荆州,要撤兵了。”
[wavehand 2] 周瑜:“好的,等我拿下江夏,也撤兵了。”
[wavehand 3] 周瑜:“我已拿下江夏,要撤兵了。”
[wavehand 4] 诸葛亮:“OK,合作愉快!”

那么为什么要四次挥手呢?看上面的例子,如果只进行了3次挥手的话,诸葛亮就不知道周瑜要撤兵了,所以一直等待周瑜退兵的信号,结果周瑜跑了,诸葛亮等来了司马懿!

十种状态

img

UDP协议

UDP(User Datagram Protocol,用户数据报协议)不可靠的、无连接的协议,采用报文传输数据,传输效率高(发送前时延小),支持一对一、一对多、多对一和多对多的交互通信、尽最大努力服务,无拥塞控制。使用UDP的应用:域名系统 (DNS);视频流;IP语音(VoIP)。

UDP的报头部分一共只有8个字节,总长度不超过65,535字节,正好放进一个IP数据包。

image-20220510040328209

TCP和UDP有哪些区别?

1、TCP面向连接(如打电话要先拨号建立连接);UDP是无连接的,即发送数据之前不需要建立连接
2、TCP提供可靠的服务。也就是说,通过TCP连接传送的数据,无差错,不丢失,不重复,且按序到达;UDP尽最大努力交付,即不保证可靠交付
3、TCP面向字节流,实际上是TCP把数据看成一连串无结构的字节流;UDP是面向报文的
UDP没有拥塞控制,因此网络出现拥塞不会使源主机的发送速率降低(对实时应用很有用,如IP电话,实时视频会议等)
4、每一条TCP连接只能是点到点的;UDP支持一对一,一对多,多对一和多对多的交互通信
5、TCP首部开销20字节;UDP的首部开销小,只有8个字节
6、TCP的逻辑通信信道是全双工的可靠信道,UDP则是不可靠信道

socket编程

socket 的原意是“插座”,在计算机通信领域,socket 被翻译为“套接字”(IP+port),它是计算机之间进行通信的一种约定或一种方式。通过 socket 这种约定,一台计算机可以接收其他计算机的数据,也可以向其他计算机发送数据。 我们把插头插到插座上就能从电网获得电力供应,同样,为了与远程计算机进行数据传输,需要连接到因特网,而 socket 就是用来连接到因特网的工具。

socket

Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的套接字相关函数就是全部,让Socket去组织数据,以符合指定的协议,如TCP或UDP就可以完成通信过程了。

套接字类型

套接字起源于 20 世纪 70 年代加利福尼亚大学伯克利分校版本的 Unix,即人们所说的 BSD Unix。 因此,有时人们也把套接字称为“伯克利套接字”或“BSD 套接字”。一开始,套接字被设计用在同 一台主机上多个应用程序之间的通讯。这也被称进程间通讯,或 IPC。套接字主要有两种类型(或两个家族),分别是基于文件型的和基于网络型的。

  • 基于文件类型的AF_UNIX

    unix一切皆文件,基于文件的套接字调用的就是底层的文件系统来取数据,两个套接字进程运行在同一机器,可以通过访问同一个文件系统间接完成本机通信。

  • 基于网络类型的AF_INET

Python 内置了2个常用模块提供给我们完成socket编程。

  • 低级别的网络服务支持基本的 Socket,它提供了标准的 BSD Sockets API,可以访问底层操作系统 Socket 接口的全部方法。
  • 高级别的网络服务模块 SocketServer, 它提供了服务器中心类,可以简化网络服务器的开发。

此处,我们先学习socket模块。

socket模块

import socket
"""
创建套接字对象
socket.socket(socket_family,socket_type,protocal=0)
socket_family 可以是 AF_UNIX 或 AF_INET。
socket_type 可以是 SOCK_STREAM 或 SOCK_DGRAM。protocol 一般不填,默认值为 0。
"""
# 获取tcp/ip套接字
# tcpsk = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# 获取udp/ip套接字
# udpsk = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)

sk = socket.socket()

常用函数

服务端套接字函数
函数 描述
s.bind(address) 将套接字绑定到地址, 在AF_INET下,以元组(host,port)的形式表示地址.
s.listen(backlog) 开始监听TCP传入连接。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,大部分应用程序设为5就可以了。
s.accept() 接受TCP连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。
客户端套接字函数
函数 描述
s.connect(address) 连接到address处的套接字。一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。
s.connect_ex(adddress) connect()函数的扩展版本,成功返回0,出错返回errno出错码,而不是抛出异常
公共套接字函数
公共socket函数
s.recv(bufsize[,flag]) 接受TCP套接字的数据。数据以字符串形式返回,bufsize指定要接收的最大数据量。flag提供有关消息的其他信息,通常可以忽略。
s.send(string[,flag]) 发送TCP数据。将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。
s.sendall(string[,flag]) 完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。
s.recvfrom(bufsize[.flag]) 接受UDP套接字的数据。与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。
s.sendto(string[,flag],address) 发送UDP数据。将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。
s.close() 关闭套接字。
s.getpeername() 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。
s.getsockname() 返回套接字自己的地址。通常是一个元组(ipaddr,port)
s.setsockopt(level,optname,value) 设置给定套接字选项的值。
s.getsockopt(level,optname[.buflen]) 返回套接字选项的值。
s.settimeout(timeout) 设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect())
s.gettimeout() 返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None。
s.setblocking(flag) 如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数据,或send()调用无法立即发送数据,那么将引起socket.error异常。
s.fileno() 返回套接字的文件描述符。
s.makefile() 创建一个与该套接字相关连的文件

实现基于tcp协议的socket通信

image-20220510042441247

先从服务器端说起。服务器端先初始化socket得到套接字对象,然后绑定端口(bind),对端口进行监听(listen),调用accept阻塞,等待客户端连接。在这时如果有个客户端初始化一个socket得到套接字对象,然后连接服务器(connect)成功,这时客户端与服务器端的连接就建立了(socket内部帮我们完成了三次握手)。客户端发送数据请求,服务器端接收请求并处理请求,然后把回应数据发送给客户端,客户端读取数据,最后关闭连接,通信结束(同样的,socket内部帮我们完成了四次挥手)。

server.py

import socket

# 实例化socket对象
# socket.socket(socket_family,socket_type,protocal=0)
# tcpsk = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 获取tcp/ip套接字
# udpsk = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)  # 获取udp/ip套接字
sk = socket.socket()

# 绑定ip和端口 (ip, port),参数是元组
sk.bind(  ("127.0.0.1", 9000)  ) # 127.0.0.1 默认代表本机ip,将来也可以是外网IP地址
# 开启监听  (等待客户端访问),可以不填,也可以写5上去
sk.listen(5)

# 程序加阻塞,直到tcp协议的三次握手建立完毕,执行下面代码
conn,addr = sk.accept()
print(conn,addr)
# 最大接受1024个字节 等待数据时,程序加了阻塞,收到数据之后,程序在向下执行
msg = conn.recv(1024)
print(msg.decode("utf-8"))

# send 负责发送,只能发送二进制的字节流
conn.send("hello, socket!".encode("utf-8"))
# 关闭此次连接 [走四次挥手]
conn.close()

# 关闭socket对象 [退还占用的端口]
sk.close()

"""
< socket.socket fd=4, family=AddressFamily.AF_INET, type=SocketKind.SOCK_STREAM, proto=0, laddr=('127.0.0.1', 9000), raddr=('127.0.0.1', 34794)> 

('127.0.0.1', 34794)
"""

client.py,代码:

import socket

# 差生一个socket对象
sk = socket.socket()
# 建立连接,指定socket服务端的IP与端口,参数是元组
sk.connect( ("127.0.0.1",9000) )

# 发送消息(发送的数据是二进制字节流)
sk.send("hi~python".encode("utf-8"))
# 等待接收消息 (发送完之后,程序添加阻塞,最大字节数1024,等待接收)
res = sk.recv(1024)
print(res.decode("utf-8"))


# 关闭连接
sk.close()

进阶版本:循环发消息与不断接收客户端连接

server.py,代码:

import socket
sk=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
# 在bind方法之前加上这句话,可以让一个端口重复使用
phone.setsockopt(SOL_SOCKET,SO_REUSEADDR,1) 
sk.bind(('127.0.0.1',9000))
sk.listen(5)

while True:                         # 新增接收链接循环,可以不断接收客户端连接
    conn,addr=sk.accept() 
    # print(conn)
    # print(addr)
    print(f'接到来自{addr[0]}的连接')
    while True:                         # 新增通信循环,可以不断的通信, 收发消息
        msg=conn.recv(1024)             # 接收消息
        # if len(msg) == 0:break        # 如果不加,那么正在链接的客户端突然断开,recv便不再阻塞,死循环发生

        print(msg,type(msg))

        conn.send(msg.upper())          # 发消息

    conn.close()                    # 断开连接

sk.close()                       # 释放socket对象

client.py,代码:

import socket
sk=socket.socket(socket.AF_INET,socket.SOCK_STREAM)

sk.connect_ex( ('127.0.0.1',9000) )           # 拨电话

while True:                              # 新增通信循环, 客户端可以不断发收消息
    msg=input('>>: ').strip()
    if len(msg) == 0: continue
    sk.send(msg.encode('utf-8'))         # 发消息( 只能发送字节类型 )
    message=sk.recv(1024)                # 收消息
    print(message.decode('utf-8'))

sk.close()                                       # 关闭socket对象

实现基于udp协议的socekt通信

image-20220510051313036

udp是无链接的,先启动哪一端都不会报错

server.py,代码:

# 循环发送消息udp
import socket
sk = socket.socket(type=socket.SOCK_DGRAM)
# 绑定地址
sk.bind( ("127.0.0.1",9000) )

while True:
    msg,cli_addr = sk.recvfrom(1024)
    print(cli_addr)
    print(msg.decode("utf-8"))

    message = input(">>>")
    sk.sendto(message.encode("utf-8"),cli_addr)

# 关闭udp链接
sk.close()

client.py,代码:

import socket
sk = socket.socket(type=socket.SOCK_DGRAM)

while True:
    # 请输入你要写入的数据
    message = input(">>>")
    sk.sendto(message.encode(),("127.0.0.1",9000))

    # 接受数据
    msg,ser_addr = sk.recvfrom(1024)
    print(msg.decode())

# 关闭udp连接
sk.close()

由于udp无连接,所以可以同时多个客户端去跟服务端通信

server.py,代码:

import socket
udpsk=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)
udpsk.bind(('127.0.0.1',9000))

while True:
    content, addr=udpsk.recvfrom(1024)
    print(f"来自[{addr[0]}:{addr[1]}]的一条消息:\033[1;44m{content.decode('utf-8')}\033[0m")
    message = input('回复消息: ').strip()
    udpsk.sendto(message.encode('utf-8'), ('127.0.0.1',9000))

client.py,代码:

import socket
udpsk = socket.socket(socket.AF_INET,socket.SOCK_DGRAM)

friends = {
    'xiaoming':('127.0.0.1',8081),
    'xiaobai':('127.0.0.1',8081),
    'xiaohei':('127.0.0.1',8081),
    'xiaolong':('127.0.0.1',8081),
}


while True:
    name = input('请选择聊天对象: ').strip()
    while True:
        content = input('>>: ').strip()
        if content == 'quit':break
        if not content or not name or name not in friends: continue
        udpsk.sendto(content.encode('utf-8'),friends[name])
        message,addr=udpsk.recvfrom(1024)
        print(f"来自[{addr[0]}:{addr[1]}]的一条消息:\033[1;44m{message.decode('utf-8')}\033[0m")
udpsk.close()

黏包问题

server.py,代码:

# 服务端
import socket
import time
# 把当前主机注册到网络
sk = socket.socket()
sk.bind(("127.0.0.1",9000))
sk.listen()

conn,addr = sk.accept()
conn.send("hello,".encode("utf-8"))
# time.sleep(1)
conn.send("world".encode("utf-8"))
conn.recv(1024)
conn.close()

sk.close()

client.py,代码:

import time
import socket
sk = socket.socket()
sk.connect(("127.0.0.1",9000))
time.sleep(0.1)
print(sk.recv(10))
print(sk.recv(10))
sk.send(b'hello')
sk.close()

上面所出现的问题就是粘包问题,所谓粘包问题主要还是因为接收方不知道消息之间的界限,不知道一次性提取多少字节的数据所造成的,粘包是由TCP协议本身是面向流(stream)造成的,所以只有TCP协议有粘包现象,而UDP是面向消息的协议,所以永远不会粘包。

黏包现象一:
    在发送端,由于两个数据短,发送的时间隔较短,所以在发送端形成黏包
黏包现象二:
    在接收端,由于两个数据几乎同时被发送到对方的缓存中,所有在接收端形成了黏包

发送包时间间隔短 或者 接受不及时,就会黏包
核心是因为tcp对数据无边界截取,不会按照发送的顺序判断

解决方案

简单解决方案

发送数据时,在统计本次完整数据的长度,先把长度发送给对端,然后对端接受到长度以后,按长度提取数据。

server.py,代码:

# 服务端
import socket
import time
# 把当前主机注册到网络
sk = socket.socket()

#在bind方法之前加上这句话,可以让一个端口重复使用
sk.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)

sk.bind(("127.0.0.1",9001))
sk.listen()

conn,addr = sk.accept()


conn.send("6".encode("utf-8"))
conn.send("hello,".encode("utf-8"))
# time.sleep(1)
conn.send("world".encode("utf-8"))
conn.recv(1024)
conn.close()

sk.close()

client.py,代码:

# 客户端
import time
import socket
sk = socket.socket()
sk.connect(("127.0.0.1",9001))
time.sleep(0.1)

# 是为了接受字符6  #sk.recv(1).decode("utf-8") 字符串
n = int(sk.recv(1).decode("utf-8"))
print(n,type(n))
print(sk.recv(n))
print(sk.recv(10))
sk.send(b'hahaha')

sk.close()
使用Struct模块来解决

为字节流加上自定义固定长度报头,报头中包含字节流长度,然后一次send到对端,对端在接收时,先从缓存中取出定长的报头,然后再取真实数据。

struct常用方法:

普通数据基本方法:
    pack     打包
    unpack   解包
二进制数据打包:
    pack_into()       打包
    unpack_from()     解包
快速使用

普通数据打包和解包,代码:

import struct
import binascii

data = (1, 'abcabc'.encode(), 2.7)
print("源数据:", data)

# (函数式)打包
packed_data = struct.pack('i3sf',*data) # 3s表示3个字节长度的字符串,abcabc是6个字节长度了,会存在丢失的情况。
# (对象式)打包
s1 = struct.Struct('i3sf')
# packed_data = s1.pack(*data)

print("打包后数据格式", type(packed_data))
print("打包后数据 :", packed_data)
print("打包后数据 :", binascii.hexlify(packed_data))

# (函数式)解包
unpacked_data = struct.unpack('i3sf',packed_data)
# (对象式)解包
# unpacked_data = s1.unpack(packed_data)
print("解包后数据格式:", type(unpacked_data))
print("解包后数据: ",unpacked_data)

# 使用struct打包数据,和解包数据的格式必须一致.
# 使用struct打包和解包数据的过程中,针对数值都会出现精度丢失的问题
# 使用struct打包和解包数据时,如果字符串超过格式指定的长度,则会出现内容丢失的情况

二进制数据打包和解包,代码:

import struct,binascii,ctypes

values1 = (1, 'abc'.encode(), 2.7)
s1 = struct.Struct('I3sf') # I 表示int,3s表示三个字符长度的字符串,f 表示 float

values2 = ('defg'.encode(), 101)
s2 = struct.Struct('4sI')

prebuffer = ctypes.create_string_buffer(s1.size+s2.size)
print('Before :', binascii.hexlify(prebuffer)) # Before : b'0000000000000000000000000000000000000000'
# 数据打包
s1.pack_into(prebuffer, 0, *values1)
s2.pack_into(prebuffer, s1.size, *values2) # s1.size 因为前面数据位已经被第一段数据占用了,此处要空出s1.size的长度

print('After pack:', binascii.hexlify(prebuffer))
print(s1.unpack_from(prebuffer, 0))
print(s2.unpack_from(prebuffer, s1.size)) # s1.size 因为前面数据位已经被第一段数据占用了,此处要空出s1.size的长度
打包格式

struct模块的常⻅的格式符意义如下:

Format C Type Python 字节数
x pad byte no value 1
c char string of length 1 1
b signed char integer 1
B unsigned char integer 1
? _Bool bool 1
h short integer 2
H unsigned short integer 2
i int integer 4
I unsigned int integer or long 4
l long integer 4
L unsigned long long 4
q long long long 8
Q unsigned long long long 8
f float float 4
d double float 8
s char[] string
p char[] string
P void * long

server.py,代码:

import socket,struct,json
sk=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
sk.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1) #就是它,在bind前加

sk.bind(('127.0.0.1',8080))

sk.listen(5)

while True:
    conn,addr=sk.accept()
    while True:
        content=conn.recv(1024)
        if not content: break
        print(f'content: {content}')
        message = input(">>>:")
        conn.send(struct.pack('i',len(message))) # 先发内容长度
        conn.sendall(message) # 再发送内容

    conn.close()

sk.close()

client.py,代码:

import socket,time,struct
sk=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
sk.connect_ex(('127.0.0.1',8080))

while True:
    msg=input('>>: ').strip()
    if len(msg) == 0: continue
    if msg == 'quit': break
    sk.send(msg.encode('utf-8'))

    l=sk.recv(4)
    x=struct.unpack('i',l)[0]
    print(type(x),x)

    r_s=0
    data=b''
    while r_s < x:
        r_d=sk.recv(1024)
        data+=r_d
        r_s+=len(r_d)

    print(data.decode('utf-8'))
消息头

消息头部可以包含信息,例如:协议版本号,指令等,当然也可以把消息长度合并到消息头部里,唯一的要求是包头长度必须是固定的(否则无法准确解包),包体则可变长。接下来我们自定义的一个包头

版本号(ver) 消息长度(bodySize) 指令(cmd)

版本号,消息长度,指令数据类型都是无符号32位整型变量,于是这个消息长度固定为3*4=12字节。示例代码:

import struct,json

if __name__ == '__main__':
    # 假设version就是版本号,body就是数据包, cmd就是消息ID[当然,这里除了body以外,都是举例而已,可有可无.]
    version = 1
    body = json.dumps({"content": "hello"})
    # print(body)
    # print(body.__len__())
    cmd = 101
    header = (version, body.__len__(), cmd)
    print(header)

    # 消息头打包
    headPack = struct.pack("3i", *header)
    print(headPack)
    print(len(headPack))  # 12

    # 消息头解包
    version, body_length, cmd = struct.unpack('iii', headPack)
    print(f"version={version}, body_length={body_length}, cmd={cmd}")

综合案例

SSH跳板机简单版本

server.py,代码:

import socket
import subprocess
import time
import struct

sock = socket.socket()
sock.bind(("127.0.0.1",8899))
sock.listen(5)

while True:
    client_sock,addr = sock.accept()
    print("客户端%s建立连接"%str(addr))
    while 1:
        try:
            cmd = client_sock.recv(1024) # data字节串
        except Exception:
            print("客户端%s退出"%str(addr))
            client_sock.close()
            break
        print("执行命令:",cmd.decode("gbk"))

        # 版本1:内存问题
        # cmd_res_bytes = subprocess.getoutput(cmd.decode("gbk")).encode()
        # client_sock.send(cmd_res_bytes)

        # 版本2:粘包问题
        # cmd_res_bytes = subprocess.getoutput(cmd.decode("gbk")).encode()
        # cmd_res_bytes_len = bytes(str(len(cmd_res_bytes)),"utf8")
        # client_sock.sendall(cmd_res_bytes_len)
        # client_sock.sendall(cmd_res_bytes)

        # 版本3:粘包解决方案

        # result_str = subprocess.getoutput(cmd.decode("gbk"))
        # result_bytes = bytes(result_str, encoding='utf8')
        # res_len = struct.pack('i',len(result_bytes))
        # client_sock.sendall(res_len)
        # client_sock.sendall(result_bytes)

        # cmd_res_bytes = subprocess.getoutput(cmd.decode("gbk")).encode()
        # cmd_res_bytes_len = bytes(str(len(cmd_res_bytes)),"utf8")
        # res_len = struct.pack('i', len(cmd_res_bytes))
        # client_sock.sendall(res_len)
        # client_sock.sendall(cmd_res_bytes)

client.py,代码:

import socket
import time
import struct

ip_port=("127.0.0.1",8899)
sk=socket.socket()
sk.connect(ip_port)


while 1:
    data = input("输入执行命令>>>")
    sk.send(data.encode())

    # 版本1 内存问题
    # res = sk.recv(1024)
    # print("字节长度:",len(res))
    # print("执行命令结果:%s"%(res.decode()))

    # 版本2 粘包问题
    # # time.sleep(5)
    # res_len = sk.recv(1024)
    # data = sk.recv(int(res_len.decode()))
    # print(res_len)
    # print(data.decode())

    # 版本3:粘包解决方案

    # length_msg = sk.recv(4)
    # length = struct.unpack('i', length_msg)[0]
    # msg = sk.recv(length).decode()
    # print("执行命令结果:",msg)

测试命令:

ipconfig
netstat -an

文件上传

server.py,代码:

import socket
import struct
import json
import os

base_dir = os.path.dirname(os.path.abspath(__file__))
base_dir = os.path.join(base_dir, 'download')


class MYTCPServer:
    address_family = socket.AF_INET
    socket_type = socket.SOCK_STREAM
    allow_reuse_address = False
    max_packet_size = 8192
    coding='utf-8'
    request_queue_size = 5
    server_dir='file_upload'

    def __init__(self, server_address, bind_and_activate=True):
        """Constructor.  May be extended, do not override."""
        self.server_address=server_address
        self.socket = socket.socket(self.address_family,
                                    self.socket_type)
        if bind_and_activate:
            try:
                self.server_bind()
                self.server_activate()
            except:
                self.server_close()
                raise

    def server_bind(self):
        """Called by constructor to bind the socket.
        """
        if self.allow_reuse_address:
            self.socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
        self.socket.bind(self.server_address)
        self.server_address = self.socket.getsockname()

    def server_activate(self):
        """Called by constructor to activate the server.
        """
        self.socket.listen(self.request_queue_size)

    def server_close(self):
        """Called to clean-up the server.
        """
        self.socket.close()

    def get_request(self):
        """Get the request and client address from the socket.
        """
        return self.socket.accept()

    def close_request(self, request):
        """Called to clean up an individual request."""
        request.close()

    def run(self):
        print('server is running .......')
        while True:
            self.conn,self.client_addr=self.get_request()
            print('from client ',self.client_addr)
            while True:
                try:
                    head_struct = self.conn.recv(4)
                    if not head_struct:break

                    head_len = struct.unpack('i', head_struct)[0]
                    head_json = self.conn.recv(head_len).decode(self.coding)
                    head_dic = json.loads(head_json)

                    print(head_dic)
                    cmd=head_dic['cmd']
                    if hasattr(self,cmd):
                        func=getattr(self,cmd)
                        func(head_dic)
                except Exception:
                    break

    def put(self,args):
        """
        文件长传
        :param args:
        :return:
        """
        file_path=os.path.normpath(os.path.join(
            base_dir, args['filename']))

        filesize=args['filesize']
        recv_size=0
        print('----->',file_path)
        with open(file_path,'wb') as f:
            while recv_size < filesize:
                recv_data=self.conn.recv(2048)
                f.write(recv_data)
                recv_size += len(recv_data)
            else:
                print('recvsize:%s filesize:%s' %(recv_size,filesize))

    def get(self, args):
        """ 下载文件
        1 检测服务端文件是不是存在
        2 文件信息 打包发到客户端
        3 发送文件
        """
        filename = args['filename']
        dic = {}
        if os.path.isfile(base_dir + '/' + filename):
            dic['filesize'] = os.path.getsize(base_dir + '/' + filename)
            dic['isfile'] = True
        else:
            dic['isfile'] = False
        str_dic = json.dumps(dic) # 字典转str
        bdic = str_dic.encode(self.coding) # str转bytes
        dic_len = len(bdic) # 计算bytes的长度
        bytes_len = struct.pack('i', dic_len) #
        self.conn.send(bytes_len) # 发送长度
        self.conn.send(bdic)  # 发送字典
        # 文件存在发送真实文件
        if dic['isfile']:
            with open(base_dir + '/' + filename, 'rb') as f:
                while dic['filesize'] > 2048:
                    content = f.read(2048)
                    self.conn.send(content)
                    dic['filesize'] -= len(content)
                else:
                    content = f.read(2048)
                    self.conn.send(content)
                    dic['filesize'] -= len(content)
            print('下载完成')


tcpserver1=MYTCPServer(('127.0.0.1',9000))

tcpserver1.run()

client.py,代码:

import socket
import struct
import json
import os
import time

base_dir = os.path.dirname(os.path.abspath(__file__))
base_dir = os.path.join(base_dir, 'local_dir')


class MYTCPClient(object):
    address_family = socket.AF_INET

    socket_type = socket.SOCK_STREAM

    allow_reuse_address = False

    max_packet_size = 8192

    coding = 'utf-8'

    request_queue_size = 5

    def __init__(self, server_address, connect=True):
        self.server_address = server_address
        self.socket = socket.socket(self.address_family,
                                    self.socket_type)
        if connect:
            try:
                self.client_connect()
            except:
                self.client_close()
                raise

    def client_connect(self):
        self.socket.connect(self.server_address)

    def client_close(self):
        self.socket.close()

    def run(self):
        while True:
            inp = input(">>: ").strip()
            if not inp: continue
            l = inp.split()
            cmd = l[0]
            if hasattr(self, cmd):
                func = getattr(self, cmd)
                func(l)

    def put(self, args):
        cmd = args[0]
        filename = args[1]
        filename = base_dir + '/' + filename
        print(filename)
        if not os.path.isfile(filename):
            print('file:%s is not exists' % filename)
            return
        else:
            filesize = os.path.getsize(filename)

        head_dic = {'cmd': cmd, 'filename': os.path.basename(filename), 'filesize': filesize}
        print(head_dic)
        head_json = json.dumps(head_dic)
        head_json_bytes = bytes(head_json, encoding=self.coding)

        head_struct = struct.pack('i', len(head_json_bytes))
        self.socket.send(head_struct)
        self.socket.send(head_json_bytes)
        send_size = 0
        t1 = time.time()
        # with open(filename,'rb') as f:
        #     for line in f:
        #         self.socket.send(line)
        #         send_size+=len(line)
        #     else:
        #         print('upload successful')
        #         t2 = time.time()
        with open(filename, 'rb') as f:
            while head_dic['filesize'] > 2048:
                content = f.read(2048)
                self.socket.send(content)
                head_dic['filesize'] -= len(content)
            else:
                content = f.read(2048)
                self.socket.send(content)
                head_dic['filesize'] -= len(content)
            t2 = time.time()

        print(t2 - t1)

    def get(self, args):
        cmd = args[0]
        filename = args[1]
        dic = {'cmd': cmd, 'filename': filename}
        """发送dic的步骤
        字典转str
        str转bytes
        计算bytes的长度
        发送长度
        发送字典
        """
        str_dic = json.dumps(dic)  # 字典转str
        bdic = str_dic.encode(self.coding)  # str转bytes
        dic_len = len(bdic)  # 计算bytes的长度
        bytes_len = struct.pack('i', dic_len)  #
        self.socket.send(bytes_len)  # 发送长度
        self.socket.send(bdic)  # 发送字典

        # 接受 准备下载的文件信息
        dic_len = self.socket.recv(4)
        dic_len = struct.unpack('i', dic_len)[0]
        dic = self.socket.recv(dic_len).decode(self.coding)
        dic = json.loads(dic)
        # 文件存在准备下载
        if dic['isfile']:
            t1 = time.time()
            with open(base_dir + '/' + filename, 'wb') as f:
                while dic['filesize'] > 2048:
                    content = self.socket.recv(2048)
                    f.write(content)
                    dic['filesize'] -= len(content)
                else:
                    while dic['filesize']:
                        content = self.socket.recv(2048)
                        f.write(content)
                        dic['filesize'] -= len(content)
                    t2 = time.time()
            print(t2 - t1)

        else:
            print('文件不存在!')


client = MYTCPClient(('127.0.0.1', 9000))

client.run()

socketserver模块

socketserver是基于原有socket模块又进行了一层封裝,为了实现tcp通信中server端的并发而构建的模块。

socketserver模块中分两大类:server类(解决链接问题)和request类(解决通信问题)

基本使用

server.py,代码:

import socketserver

# 自定义一个类 MyServer
class MyServer(socketserver.BaseRequestHandler):
    # handle 方法是每当有一个客户端发起connect来接之后,自动执行handle
    def handle(self):
        print("--->执行这句话")
# ip 端口号  |  自定义类
server = socketserver.ThreadingTCPServer(("127.0.0.1",9000), MyServer)
# 循环调用
server.serve_forever()

client.py,代码:

import socket
sk = socket.socket()
sk.connect( ("127.0.0.1",9000) )
sk.close()

TCP服务端并发处理

server.py,代码:

import socketserver

# 自定义一个类 MyServer
class MyServer(socketserver.BaseRequestHandler):
    # handle 方法是每当有一个客户端发起connect来接之后,自动执行handle
    def handle(self):
        print("--->执行这句话")
        '''     
        print(self.request) # conn
        print(self.client_address) # addr
        '''
        conn = self.request
        while True:
            msg = conn.recv(1024).decode("utf-8")
            print(msg)
            conn.send(msg.upper().encode("utf-8"))



        # conn = self.request
# ip 端口号  |  自定义类
server = socketserver.ThreadingTCPServer(("127.0.0.1",9000),MyServer)
# 循环调用
server.serve_forever()

client.py,代码:

import socket
sk = socket.socket()
sk.connect( ("127.0.0.1",9000))

while True:
    sk.send(b'hello')
    msg = sk.recv(1024)
    print(msg)


sk.close()

综合案例:FTPServer

server.py,代码:

import socketserver
import struct
import json
import os
class FtpServer(socketserver.BaseRequestHandler):
    coding='utf-8'
    server_dir='file_upload'
    max_packet_size=1024
    BASE_DIR=os.path.dirname(os.path.abspath(__file__))
    def handle(self):
        print(self.request)
        while True:
            data=self.request.recv(4)
            data_len=struct.unpack('i',data)[0]
            head_json=self.request.recv(data_len).decode(self.coding)
            head_dic=json.loads(head_json)
            # print(head_dic)
            cmd=head_dic['cmd']
            if hasattr(self,cmd):
                func=getattr(self,cmd)
                func(head_dic)
    def put(self,args):
        file_path = os.path.normpath(os.path.join(
            self.BASE_DIR,
            self.server_dir,
            args['filename']
        ))

        filesize = args['filesize']
        recv_size = 0
        print('----->', file_path)
        with open(file_path, 'wb') as f:
            while recv_size < filesize:
                recv_data = self.request.recv(self.max_packet_size)
                f.write(recv_data)
                recv_size += len(recv_data)
                print('recvsize:%s filesize:%s' % (recv_size, filesize))


ftpserver=socketserver.ThreadingTCPServer(('127.0.0.1',8080),FtpServer)
ftpserver.serve_forever()

client.py,代码:

import socket
import struct
import json
import os

class MYTCPClient:
    address_family = socket.AF_INET

    socket_type = socket.SOCK_STREAM

    allow_reuse_address = False

    max_packet_size = 8192

    coding='utf-8'

    request_queue_size = 5

    def __init__(self, server_address, connect=True):
        self.server_address=server_address
        self.socket = socket.socket(self.address_family,
                                    self.socket_type)
        if connect:
            try:
                self.client_connect()
            except:
                self.client_close()
                raise

    def client_connect(self):
        self.socket.connect(self.server_address)

    def client_close(self):
        self.socket.close()

    def run(self):
        while True:
            inp=input(">>: ").strip()
            if not inp:continue
            l=inp.split()
            cmd=l[0]
            if hasattr(self,cmd):
                func=getattr(self,cmd)
                func(l)


    def put(self,args):
        cmd=args[0]
        filename=args[1]
        if not os.path.isfile(filename):
            print('file:%s is not exists' %filename)
            return
        else:
            filesize=os.path.getsize(filename)

        head_dic={'cmd':cmd,'filename':os.path.basename(filename),'filesize':filesize}
        print(head_dic)
        head_json=json.dumps(head_dic)
        head_json_bytes=bytes(head_json,encoding=self.coding)

        head_struct=struct.pack('i',len(head_json_bytes))
        self.socket.send(head_struct)
        self.socket.send(head_json_bytes)
        send_size=0
        with open(filename,'rb') as f:
            for line in f:
                self.socket.send(line)
                send_size+=len(line)
                print(send_size)
            else:
                print('upload successful')

client=MYTCPClient(('127.0.0.1',8080))

client.run()