什么是拥塞控制
在某段时间,若对网络中某一资源的需求超过了该资源所能提供的可用部分,网络的性能就要变坏。这种情况就叫拥塞。拥塞控制就是为了防止过多的数据注入到网络中,这样就可以使网络中的路由器或链路不致过载。拥塞控制所要做的都有一个前提,就是网络能够承受现有的网络负荷。
拥塞控制和流量控制的区别:
拥塞控制是一个全局性的过程,涉及到所有的主机,所有的路由器,以及与降低网络传输性能有关的所有因素。相反,流量控制往往是点对点通信量的控制,是个端到端的问题。流量控制所要做到的就是抑制发送端发送数据的速率,以便使接收端来得及接收。
TCP的四种拥塞控制算法(慢开始、拥塞控制、快重传、快恢复)
1. 拥塞控制概要
发送方维护一个叫做拥塞窗口cwnd的状态变量,其值取决于网络的拥塞程度,并且动态变化。
拥塞窗口cwnd的维护原则:只要网络没有出现拥塞,拥塞窗口就再增大一些;但只要网络出现拥塞,拥塞窗口就减小一些。
判断网络出现拥塞的依据:没有按时收到应当到达的确认报文(即发生重传)
不考虑流量控制的前提下,发送方将拥塞窗口作为发送窗口,即 swnd = cwnd
TCP拥塞控制维护一个慢开始门限 ssthresh:
- 当 cwnd < ssthresh,使用慢开始算法
- 当 cwnd > ssthresh,停止使用慢开始算法而改用拥塞避免算法
- 当 cwnd = ssthresh,即可使用慢开始算法,也可以使用拥塞避免算法
示例如下:
传输轮次:发送方给接收方发送数据报文段后,接收方给发送方发回相应的确认报文段,一个传输轮次所经历的时间就是往返时间RTT(RTT并非是恒定的数值)
在TCP双方建立连接时, 拥塞窗口 cwnd 的值被设置为1,同时还需设置慢开始门限 ssthresh,在执行慢开始算法时,发送方每收到一个对新报文段的确认时,就把拥塞窗口cwnd的值加1,然后开始下一轮的传输。当拥塞窗口 cwnd 增长到慢开始门限值 ssthresh 时,就使用拥塞避免算法。
2. 慢开始
假设当前发送方拥塞窗口 cwnd 的值为1,而发送窗口 swnd 等于拥塞窗口 cwnd,因此发送方当前只能发送一个数据报文段(拥塞窗口 cwnd = 发送数据报文段数)。接收方收到该数据报文段后,给发送方回复一个确认报文段,发送方收到该确认报文后,拥塞窗口的值变为2。
同理,发送方此时可以连续发送2个数据报文段,接收方收到该数据报文段后,给发送方一次发回2个确认报文段,发送方收到这两个确认报文后,将拥塞窗口的值变为4。发送方此时可连续发送4个报文段,接收方收到4个报文段后,给发送方依次回复4个确认报文,发送方收到确认报文后,将拥塞窗口变为8。以此类推。
也就是说每个传输轮次,慢开始的拥塞窗口呈指数形增大(1,2,4,8,16…),当拥塞窗口 cwnd 的值等于慢开始门限值 ssthresh,之后就改用拥塞避免算法。
3. 拥塞避免
拥塞避免算法每个传输轮次,拥塞窗口 cwnd 只能线性加1。而不是像慢开始算法时,每个传输轮次,拥塞窗口cwnd 按指数增长。同理如下图所示,假设慢开始门限值 ssthresh为16,拥塞避免算法会线性增大拥塞窗口 cwnd直至到达24。假设24个报文段在传输过程中丢失4个,接收方只收到20个报文段,给发送方依次回复20个确认报文段。一段时间后,丢失的4个报文段的重传计时器超时了,发送发判断可能出现拥塞,因此会更改 cwnd 和ssthresh。并重新开始慢开始算法。
注意:
- 慢开始是指一开始向网络中注入的报文段少,并不是指拥塞窗口 cwnd增长速度慢
- 拥塞避免并非指完全能够避免拥塞,而是指在拥塞避免阶段将拥塞窗口线性增长,使网络比较不容易出现拥塞
3. 快速重传
慢开始和拥塞避免算法是1998年提出的TCP拥塞控制算法。1990年又增加了两个新的拥塞控制算法来改进TCP的性能,也就是快重传和快恢复算法。
有时候,个别报文段会在网络中丢失,但实际上网路并未发生拥塞,但这会导致发送方超时重传,并误认为网络发生拥塞。发送方错误的重启慢开始算法,并把拥塞窗口cwnd设置为最小值1,这会导致传输速率降低。
所谓快重传,就是使发送放尽快进行重传,而不是等待超时重传计时器超时再重传
- 要求接收方不要等待发送方发送数据时才进行捎带确认,而是要立即发送确认
- 即使收到了失序的报文段也要立即发出对已收到的报文段的重复确认
- 发送方一旦收到3个连续的重复确认,就将相应的报文段立即重传,而不是等待报文段的超时重传计时器超时再重传
- 对于个别丢失的报文段,发送方不会出现超时重传,也就不会误认为出现拥塞从而将拥塞窗口cwnd重新设置为1。使用快重传可以使整个网络的吞吐量提高约20%。
4. 快速恢复
发送方一旦收到3个重复确认,就知道现在只是丢失了个别的报文段。于是不重启慢开始算法,而执行快恢复算法:
- 发送方将慢开始门限 ssthresh 值和拥塞窗口 cwnd 值调整为当前窗口的一半,并且开始执行拥塞避免算法
- 也有的快恢复的实现是把更新后的拥塞窗口 cwnd 值再增大一些,即等于新的 ssthresh + 3。这是因为既然发送方收到3个重复的确认,就表明有3个数据报文段已经离开了网络;这3个报文段不再消耗网络的资源而是停留在接收方的接收缓存中;可见现在网络中不是堆积了报文段而是减少了3个报文段。因此可以适当的把拥塞窗口扩大一些。
参考: