传输层(Transport)

传输层有两个协议
- TCP (Transmission Control Protocol) 传输控制协议
- UDP(User Datagram Protocol) 用户数据报协议

UDP一般用于实时场景

有些DNS可以用TCP 有的可以用UDP

UDP

UDP是无连接的减少了建立和释放连接的开销
UDP尽最大能力交付不保证可靠交付
- 因此UDP不需要维护一些复杂的参数首部只有8个字节（TCP的首部至少有20个字节）
UDP长度（Length）
- 占16位首部的长度+数据的长度

检验和

计算内容：伪首部+首部+数据

伪首部只在计算检验和时起作用不会传递给网络层

端口（Port）

UDP首部中端口是占用2字节
- 可以推测出端口号的取值范围是 0 - 65535
客户端的源端口是临时开启的随机端口
防火墙可以设置开启关闭某些端口提高安全性
- 比如可以在数据库的端口设置防火墙只有通过内部间接的形式可以访问

常用指令

netstat-an:查看被占用的端口
netstat-anb:查看被占用的端口、占用端口的应用程序
telnet主机端口:查看是否可以访问主机的某个端口

TCP

TCP 的首部

数据偏移

取值范围是0x0101 ~ 0x1111
乘以4：首部长度 (Header Length )
数据偏移算首部长度首部长度为多少数据就往右边偏移了多少
保留
占6位目前全为0
有些资料保留位只有三位标志字段占9位

TCP的一个细节

UDP的首部中有个16位的字段记录了整个UDP报文段的长度(首部+数据)
但是,TCP的首部中仅仅有个4位的字段记录了TCP报文段的首部长度,并没有字段记录TCP报文段的数据长度
分析
- UDP首部中占16位的长度字段是冗余的,纯粹是为了保证首部是32bit对齐
- TCP\UDP的数据长度,完全可以由IP数据包的首部推测出来
- 传输层的数据长度=网络层的总长度-网络层的首部长度-传输层的首部长度

检验和

检验和的计算内容：伪首部+首部+数据
伪首部：占用12个字节只在计算检验和时起作用不会传递给网络层

标志位（Flags）

URG（Urgent）
- 当URG为1 时，紧急指针字段才有效，表明当前报文段中有紧急数据应优先尽快传送
ACK (Acknowledgement )
- 当ACK=1时，确认号字段才有效
PSH(Push)
RST(Reset)
- 当RST=1时，表明连接中出现严重差错必须释放连接然后重新建立连接
SYN(Synchronization)
- 当SYN = 1 时，ACK=0时，表明这是一个建立连接的请求
- 如果对方同意建立连接回复SYN = 1 ，ACK = 1
Fin（Finish）
- 当Fin 为1 表明数据发送完毕要释放连接

序号确认号窗口

序号(Sequence Number) seq

占4字节
首先传输过程中的每一个字节都会有一个编号
在建立连接后 序号代表的是这一次传给对方的TCP数据部分的第一个字节的编号
序号是告诉对方我现在发到哪里了

确认号(Acknowledgment Number)

占4个字节
在建立连接后确认号代表期望对方下一次传过来的TCP数据部分的第一个字节的编号
确认号是告诉发送方我已经收到多少。请接下来发送多少的

窗口(Window)

占2个字节
这个字段有流量控制功能用于告知对方下一次允许发送的数据大小(字节为单位)

TCP的几个要点

可靠传输保证服务器传输时丢包也能把丢的包传到客户端
流量控制
拥塞控制
连接管理
- 建立连接
- 释放连接

TCP可靠传输

停止等待ARQ协议

ARQ(Automatic Repeat-reQuest) 自动重传请求

连续ARQ协议+滑动窗口协议

SACK（选择性确认）

在TCP通信过程中，如果发送序列中间某个数据包丢失（比如 1，2，3，4，5中的3丢失掉）
TCP会通过重传最后确认的分组后续的分组（最后确认的是2 会重传3，4，5）
这样原先已经正确传输的分组也可能重复发送（比如4，5）降低了TCP性能

为了改善这种情况发展出了SACK（Selective Acknowledgment 选择性确认）技术

告诉发送方哪些数据丢失哪些数据已经提前收到
使TCP只重新发送丢失的包（比如3）不用发送后续所有的分组（比如4，5）

SACK信息会放在TCP首部的选项部分

Kind:占1字节。值为5代表这是SACK选项
Length:占1字节。表明SACK选项一共占用多少字节
left Edge:占4字节,左边界
Right Edge:占4字节,右边界

一对边界信息需要占用8个字节由于TCP首部的选项部分最多40个字节所以
- SACK选项最多携带4组边界信息
- SACK选项的最大占用字节数 = 4* 8 +2 = 34

question

如果有个包重传了N次还是失败会一直持续重传到成功吗
- 取决于系统的设置比如有些系统重传五次未成功就会发送reset报文（RST）断开

发送数据大小不足接收窗口的大小
- 如果接收窗口最多能接收4个包
  - 但是发送方只发送了两个包
- 接收方应该如何确定后面还有没有两个包
  - 等待一定时间后没有第三个包
  - 就会返回确认收到两个包给发送方
为什么选择在传输层就将数据“大卸八块”分成多个段,而不是等到网络层再分片传递给数据链路层?
- 因为可以提高重传的性能
- 如果在传输层分片那对于传输层而言发了很多的包对方的传输层也会接收到这些包如果发生丢包对方的传输层能告诉发送方的传输层丢的是哪个包
- 我们需要明确的是：可靠传输是在传输层进行控制的
  - 如果在传输层不进行分段那么一旦出现数据丢失整个传输层的数据都需要进行重传
  - 如果在传输层分了段,一旦出现数据丟失,只需要重传丟失的那些段即可

TCP流量控制

如果接收方的缓存区满了发送方还在疯狂发送数据
- 接收方只能把收到的数据包丢掉大量的丢包会极大的浪费网络资源
- 所以要进行流量控制
什么是流量控制
- 让发送方的发送速率不要太快让接收方来得及接受处理且为点对点
原理
- 通过确认报文中窗口字段来控制发送方的发送速率
- 发送方的发送窗口大小不能超过接收方给出窗口大小
- 当发送方收到接收窗口的大小为0时，发送方会停止发送数据
有一种特殊情况
- 一开始接收方给发送方发送了0窗口的报文段
- 后面接收方又有了一些存储空间给发送方发送的非0 窗口的报文段丢失了
- 发送方的发送窗口一直为0 双方陷入僵局
解决方案
- 当发送方接收到0窗口通知，这时发送方停止发送报文
- 并且同时开启一个定时器隔一段时间就发个测试报文去主动询问接收方最新的窗口大小
- 如果接受的窗口大小还是0 发送方就会停止发送数据

TCP拥塞控制

拥塞控制
- 防止过多的数据注入到网络中
- 避免网络中的路由器或链路过载
拥塞控制是一个全局性的过程
- 涉及到所有的主机路由器
- 以及与降低网络传输性能有关的所有因素
- 是大家一起努力的结果
相比而言流量控制是点对点通信的控制

方法

几个缩写

MSS(Maxinum Segment Size) ：每个段最大的数据部分大小
- 在建立连接时确定
rwnd(receive window)：接收窗口大小
cwnd(congestion window): 拥塞窗口大小根据网络状况调整
swnd(send window): 发送窗口
- swnd = min(cwnd,rwnd)

方法：

慢开始 (slow start 慢启动)
拥塞避免 (congestion avoidance)
快速重传 (fast retransmit)
快速恢复 (fast recovery)

慢开始

cwnd 的初始值比较小然后随着数据包被确认方确认(收到一个ACK)
- cwnd 就会成倍增长

拥塞避免

ssthresh(slow start threshold)：慢开始阈值 cwnd打到阈值后以线性方式增加
拥塞避免(加法增大) ：拥塞窗口缓慢增大以防止网络过早出现拥塞
乘法减小：只要网络出现拥塞减半sshresh 与此同时执行慢开始算法（cwnd又恢复到初始值）
当网络频繁拥塞 sshresh 值就下降很快

快重传

接收方
- 每收到一个失序的分组后就立即发送一个重复确认
- 这样发送方能够及时知道有分组没到到达
- 而不需要等待自己发送数据时候才进行确认
发送方
- 只要连续收到三个重复确认(总共四个相同的确认) 就应当立即重传对方尚未收到的报文段
- 而不必继续等待重传计时器到期后再重传

快恢复

当发送方连续收到三个重复确认，就执行乘法减小算法把ssthresh减半
- 这是为了预防网络发生拥塞
由于发送方现在认为网络很可能没有发生拥塞
- 因此与慢开始不同之处是现在不执行慢开始算法，即cwnd现在不恢复到初始值
- 而是把cwnd值设置为ssthresh 减半后的数值
- 然后开始执行拥塞避免算法(“加法增大” ) 使拥塞窗口缓慢的线性增大

快重传+快恢复

发送窗口的最大值： swnd = min(cwnd，rwnd)

当rwnd<cwnd时,是接收方的接收能力限制发送窗口的最大值
当cwnd<rwnd时,则是网络的拥塞限制发送窗口的最大值

TCP连接管理

序号确认号深入理解

注意 ACK 代表的是标志位中的确认号字段有效而ack是代表确认号

真正的序号是一个很大的值这个值在建立连接时确定

连接过程：

具体分析

基于相对值分析
- 第一步的时候是客户端想要和服务器建立连接 SYN 为1 且ack seq为0
- 第二步是服务端做出响应这时ACK为1(0+1) 这时服务端第一次发送 seq也为0
- 第三步ack为1(0+1) 第二步ack期望从1开始的数据第三步要对这个期望做出响应所以seq 为1 但是这时数据依然是0个字节
- 第四步发送HTTP请求给服务器这时TCP数据部分假设有k个字节的数据 ack这时是期望服务器发送的数据从1开始(因为上一次服务器发送的数据还是0) seq是因为上一次服务器期望的也是从1开始所以seq的值也是1
- 只有前两次SYN标志位为1

服务端返回的5~8步
- 第N个包的序号是前面第N-1个包数据的总长度+1
- 他们的ack是k+1 因为是相对于客户端而客户端发送的字节为k

最后一步确认
- 客户端按照服务器端ack 所以seq为k+1
- ack 是期望服务器发b1+b2+b3+b4+1编号开始的字节 (注意seq的意思是序号啊！所以是最后一个包的序号加上最后一个包的长度)

如果是原生的：

实际上在上面的表格中原生值减初始值就是相对值

建立连接—三次握手

CLOSED ： client 处于关闭状态
LISTEN ：server处于监听状态等待client 连接
SYN-RCVD：表示server 接收到了SYN报文，当收到client的ACK报文时候 server进入到ESTABLISHED状态表明收到了第一次握手
SYN-SENT：表示client 已经发送了SYN报文等待server进行第2次握手
ESTABLISHED：表示连接已经建立

前两次握手的特点

SYN都为1
数据部分长度都为0
TCP头部的长度一般是32个字节
- 固定头部： 20字节
- 选项部分： 12字节
双方会交换一些信息
- 比如MSS ，是否支持SACK ，Window scale(窗口缩放系数就是窗口的值✖️这个值为窗口真正容纳大小)等
- 这些数据都放在了TCP头部的选项部分

为什么要三次握手两次不行吗

主要目的：防止server端一直等待造成资源浪费
如果建立连接只需要两次握手可能出现的情况
- 假设 client 发送的第一个连接请求报文段因为网络延迟的原因在连接释放以后的某个时间才能到达server
- 本来这个连接时早已失效的但是server收到这个失效的请求后，会误认为是client 再次发送的一个新的连接请求
- 这个时候server就会向client发出确认报文段同意建立连接
- 如果采用的不是三次握手那么只要server发出确认那么新的连接就建立了
- 由于现在client并没有真正想连接服务器的意愿，因此不会理睬server的确认也不会向server发送数据
- 但是server却以为新的连接已经建立，并且一直等待client发来数据这样server的很多资源就白白浪费掉了
如果采用三次握手的办法可以防止上述现象发生
- 例如上述的情况 client 没有向server 的确认发出确认 server 由于收不到确认 server 就知道client 并没有要求建立连接

如果第三次握手失败了会发生什么

此时server的状态为SYN-RECV 若等不到client的ACK server会重新发送SYN+ACK 包
如果server 多次重发SYN+ACK都等不到client 的ACK 就会发送RST包强制关闭连接

释放连接—四次挥手

状态解读

FIN-WAIT-1：表示想主动关闭连接
- 向对方发送了FIN报文此时进入到FIN-WAIT-1 状态
CLOSE-WAIT：表示在等待关闭
- 当对方发送FIN给自己，自己会回应一个ACK报文给对方此时则进入到CLOSE-WAIT状态
- 在这个状态下 需要考虑自己是否还有数据要发送给对方如果没有发送FIN报文给对方
FIN-WAIT-2 :只要对方发送ACK确认后主动方就会处于FIN-WAIT-2状态然后等待对方发送FIN报文
CLOSING:一种比较罕见的例外状态
- 表示你发送FIN报文后,并没有收到对方的ACK报文,反而却也收到了对方的FIN报文
- 如果双方几乎在同时准备关闭连接的话,那么就出现了双方同时发送IN报文的情況,也即会出现 CLOSING状态
- 表示双方都正在关闭连接
LAST-ACK：被动关闭的一方在发送FIN报文后最后等待对方的ACK报文
- 当收到了ACK报文后就可以进入CLOSED 状态了
TIME-WAIT
- 表示收到了对方的FIN报文了并且发出了ACK报文就等2MSL后即可进入CLOSED状态了
  - 如果FIN-WAIT-1状态下收到了对方同时带FIN 标志和ACK标志的报文时
    - 可以直接进入到TIME-WAIT 状态而无须经过FIN-WAIT-2状态
    - (如果同时受到了二次三次挥手合并那么可以没有FIN-WAIT-2状态)
CLOSED ：关闭状态

由于有些状态的时间比较短暂所以很难用netstat 的命令看到比如SYN-RCVD，FIN-WAIT-1等

细节

TCP/IP 协议栈在设计上， 允许任何一方先发起断开请求，上文演示的是client主动要求断开
client 发送ACK后需要有个TIME-WAIT阶段来等待一段时间后再真正关闭连接
- 一般是等待两倍的MSL（Maximum Segment LifeTime，最大分段生存期）
- MSL是TCP报文在Internet上的最长生存时间
- 每个具体的TCP实现都必须选择一个确定的MSL值,RFC 1122建议是2分钟
- 可以防止本次连接中产生的数据包误传到下一次的连接中(因为本次连接中的数据包都会在2MSL时间内消失了这样就可以保证不会误传)
如果client 发送ack之后马上释放了然后又因为网络的原因 server没有收到client的ACK server就会重新发送FIN
- 这个时候的情况是
  - client 没有任何响应服务器在干等着甚至多次重发FIN 会浪费资源
  - client 有个新的应用程序刚好分配了同一个端口号 新的应用程序收到server再次发送FIN后马上开始执行断开连接的操作（Server发送FIN是通过端口号）然后这个新的应用程序可能是想和server建立连接

抓包

有时候在使用抓包工具的时候可能只会看到3次挥手
- 这时其实是第2，3次挥手合并了

当 server接收到 clientl的FIN时,如果 server后面也没有数据要发送给 client了
这时,serveri就可以将第2、3次挥手合并,同时告诉 client两件事
- 已经知道 client没有数据要发
- server已经没有数据要发了

完整TCP流程

Supplements

区分长连接短连接

首先要判断是长连接还是短连接要知道为什么建立连接

如果是客户端发完请求拿到数据后马上断开连接那么就是短连接
如果建立连接以后有很多次数据交互那么就是长连接
- 长连接释放时间根据需求

假设建立连接没有断开连接

并不是对网卡造成影响而是在内存中的有socket对象会对内存有影响

Socket

客户端的socket和服务器端的socket的连接是独立的关闭等操作不会对其他造成影响

socket是一对一释放连接