华为路由器——BGP路由技术详解

BGP(边界网关协议)是一个路径矢量路由协议,和传统的基于下一跳的IGP协议不同,它是基于AS(自治系统)的协议。BGP属于外部网关路由协议,它解决的是AS之间的选路问题,也正是因为这样,它更适合用户互联网。学习BGP的关键在于理解BGP的报文、邻居的建立、BGP路由属性、选路原则等。接下来详细介绍——BGP路由协议。

博文大纲:
一、了解BGP的概述;
二、掌握BGP的工作原理;
三、实验案例;
四、总结BGP的配置;

一、BGP的概述

不同于RIP、OSPF之类的路由协议,BGP是在自治系统之间进行路由学习及选路的协议。举例来说:把一个城市当做一个自治系统,RIP、OSPF路由协议就像是城市中的公交;BGP则相当于火车、高铁运行在城市与城市之间。在更好的了解BGP的概念之前,我们先介绍一下自治系统的概念。

1.自治系统

自治系统(AS)是由同一个技术管理机构管理,使用统一选路策略(运行同一种动态路由协议)的一组路由器的组合。自治系统的编号取值范围为1~65535。其中1~64511是互联网上注册的公有AS号,类似于公网地址,是全球唯一的且不可重复使用;64512~65535是私有AS号,类似于私网地址,可以重复使用但是互联网上是不可见的。

2.动态路由的分类

动态路由协议有很多种分类方法,其中按自治系统分类、按协议类型分类是比较常用的两种。

1)按自治系统分类

IGP:即自治系统内部的路由协议,主要包含RIPv1/v2、OSPF、ISIS、EIGRP(Cisco私有协议)。IGP是运行在AS内部的路由协议,它主要解决AS内部的选路问题。其主要作用是发现、计算路由

EGP:即自治系统之间的路由协议,通常指BGP。EGP是运行在AS与AS之间的路由协议,它主要解决的是AS之间的选路问题。BGP的主要作用是控制路由的传播和选择最优路由

通常情况下,会先使用IGP协议在自治系统内部计算和发现路由条目,再通过BGP协议将IGP协议产生的路由传递至其他的自治系统。

2)按协议类型分类

距离矢量路由协议:RIPv1/v2、BGP(路径矢量协议)、EIGRP(高级的距离矢量协议);
链路状态路由协议:OSPF、ISIS;

3.BGP的概念

BGP是一种运行在AS与AS之间的动态路由协议,主要作用是在AS之间自动交换无环路由信息,以此来构建AS的拓补图,从而消除路由环路并实施用户配置的路由策略。目前公网路由条目众多,IGP协议无法承载,但是对于BGP来说却能轻松应对。而且BGP相比IGP具有更多的属性特性,更加便于在大规模的网络中使用多种路由策略,所以BGP协议常用于ISP与ISP之间或跨地域总、分公司之间的路由信息交互。

BGP解决的是自治系统之间的路由学习问题。当今互联网是全球互联,在中国,互联网运营商有电信和联通。每个公司都有自己的自治系统,并且内部运行IGP协议。但是互联网又要求互联,所以通过BGP就可以在电信和联通之间的学习路由,是电信的用户可以和联通的用户之间上网聊天,发送邮件等。如图:
华为路由器——BGP路由技术详解

4.BGP的特性

BGP具有以下特性:
(1)传输协议:TCP,端口号179;
(2)BGP是外部路由协议,用来在AS之间传递路由信息;
(3)是一种增强的路径矢量路由协议;
(4)拥有可靠的路由更新机制 ;
(5)具备丰富的Metric度量方法;
(6)无环路协议设计;
(7)为路由条目附带多种属性信息;
(8)支持CIDR(无类别域间选路);
(9)丰富的路由过滤和路由策略;
(10)无需周期性更新;
(11)路由更新时只发送增量路由;
(12)周期性发送KeepAlive报文以保持 TCP连通性;

二、BGP的工作原理

BGP是跨公网、跨自治系统的路由协议,可以在自治系统之间学习路由。BGP的动态学习路由也是基于邻居,只有邻居关系正常,BGP才可以正常工作。

1.BGP邻居关系

运行BGP的路由器通常被称为BGPSpeaker(发言者),相互之间传递报文的Speaker之间互称为对等体(Peer)。BGP邻居关系的建立、更新和删除是通过对等体之间交互5种报文、6种状态机和5个表等信息来完成的,最终才可以形成邻居关系。

(1)BGP报文

BGP报文头中的Type定义了BGP的报文类型。BGP对等体之间通过5种报文进行路由信息的交互。下面详细介绍5种报文的详细信息。

1)Open报文

Open(打开)报文是TCP连接建立后发送的第一个报文,用于建立BGP对等体之间的连接关系,主要包含BGP版本、本地AS编号、Hoidtime(保存时间)等信息。对等体在接收到对端发过来的Open报文并协商成功后,将发送KeepAlive报文确认并保持连接的有效性。BGP对等体关系确认后,对等体之间才可以进行发送剩下的报文,交换路由信息。

2)Update报文

Update(更新)报文用来在BGP对等体之间更新路由信息。

Update报文可以通过多条属性系统同的就可达路由信息,也可撤销多条不可达路由信息。

  • 网络可达信息(NLRI):通过此字段发布多条具有相同属性的可达路由,这些路由信息可共享同一组路由属性,此字段由可达的目的IP地址前缀和掩码组成;
  • 撤销多条不可达路由:通过该字段发布应经失效或者不可达的路由信息。此字段由不可达的目的IP地址和掩码组成;

Update报文可以用于只撤销路由,在仅用于撤销路由时,不需要包括路径属性或NLRI。同样,也可以用于只通告可达路由,此时则不需要携带撤销路由信息。

3)Notification报文

Notification(通知)报文的作用是当BGP检测到错误信息时,立刻向对等体发出Notification报文,之后BGP连接会立即中断。要注意的是,不管当前的BGP状态当时处于何种状态,只要收到Notification报文就会返回idle状态。换而言之,BGP是不允许错误出现的一种路由协议,在选路原则中,更优的路径往往是邻居关系最久的对等体,以此反映对等体两端经历很长的时间都没有出现错误,而之前学过的其他路由协议则是越新越好。

4)Route-Refresh

用来告知对等体本地所支持路由的刷新能力。在所有BGP路由器拥有Route-Refresh(路由更新)能力的情况下,如果BGP的入口路由策略发生了变化,本地BGP路由器会向对等体发送Route-Refresh报文,收到此消息的对等体会将其路由信息重新发给本地BGP路由器。这样,可以在不中断BGP连接的情况下,对BGP路由表进行动态刷新,并应用新的路由策略。

5)KeepAlive

该报文在对等体之间周期性的发送,用以保持连接的有效性并维护器连接,KeepAlive(保持)报文只有一个BGP报文头。默认KeepAlive(保持)报文发送周期为60s,Holdtime(保存报文)为180s。KeepAlive报文类似于OSPF协议中的Hello报文,当收到对等体发过来的KeepAlive报文后会刷新Holdtime计时器,如果Holdtime计时器超时仍然没有收到KeepAlive报文,则认为对等体失效。

(2)BGP状态机

BGP状态机描述的是BGP邻居的建立过程,通过对这些不同状态的学习,可以更加深入地了解BGP的工作原理,以及排查思路。BGP状态机公有六种状态,如图:
华为路由器——BGP路由技术详解
下面详细介绍BGP的六种状态:

1)ldle状态

ldle(空闲)状态,BGP拒绝任何进入的连接请求,IdIe状态是BGP的初始状态。在ldle状态下,BGP拒绝邻居发送的连接请求。只有在收到本设备的Start事件(如运行BGP协议)后,BGP才开始尝试和其他BGP对等体进行TCP连接,并转至Commect状态。任何状态中收到NOtification报文或TCP拆链通知等Error事件后,BGP都对转至ldle状态。

2)Connect状态

Connect(连接)状态下,BGP等待TCP连接的建立完成后再决定后续操作。在Connect状态下,BGP启动连接重传定时器(通常计时器为30s),等待TCP完成连接。如果TCP连接成功,那么BGP向对等体发送Open报文,并转至OpenSent(开放)状态;如果TCP连接失败,那么BGP转至Active(活跃)状态;如果连接重传定时器超时,BGP仍没有收到BGP对等体的响应,那么BGP继续尝试和其他BGP对等体进行TCP连接,停留在Connect状态。

3)Active状态

Active(活跃)状态下,BGP将尝试进行TCP连接的建立,是BGP的中间状态。在Active状态下,BGP总是在试图建立TCP连接,如果TCP连接成功,那么BGP向对等体发送Open报文,关闭连接重传定时器,并转至OpenSent状态;如果TCP连接失败,那么BGP停留在Active状态;如果连接重传定时器超时,BGP仍没有收到BGP对等体的响应,那么BGP转至Connect状态。

4)OpenSent状态

在OpenSent(开放集)状态下,BGP等待对等体的Open报文,并对收到的Open报文中的AS号、版本号、Holdtime等进行检查。如果收到的Open安博文正确,那么BGP发送KeepAlive报文,并转至OpenConfirm(打开确认)状态;如果发现收到的Open报文有错误,那么BGP发送Notification报文给对等体,并转至IdIe状态。

5)OpenConfirm状态

OpenConfirm(打开确认)状态下,BGP等待KeepAlive或Notification报文。如果收到KeepAlive报文,则转至Established(确认)状态;如果收到Notification报文,则转至ldle状态。

6)Established状态

在Established(确认)状态下,BGP可以在对等体之间交换Update、KeepAlive、Route-refresh报文和Notification报文。如果收到正确的Update或KeepAlive报文,那么BGP就认为对端处于正常运行状态,将保持BGP连接;如果收到错误的Update或KeepAlive报文,那么BGP发送Notification报文通知对端,并转至ldle状态。

注意:Route-refresh报文不会改变BGP状态。如果收到Notification报文,那么BGP转至ldle状态。如果收到TCP拆链通知(FIN),那么BGP断开连接,转至ldle状态。

在BGP对等体建立的过程中,通常可见的三种状态是ldle、Active、Established。BGP对等体双方的状态必须都为Established,BGP邻居关系才能成立,双方通过Update报文交换路由信息。

(3)BGP数据库

BGP数据库是BGP正常工作所需要的存储空间,基于保存的内容不同,可分为如下几种:

1)IP路由表(IP-RIB)

全局路由信息库,包括所有最优的IP路由信息。

2)BGP路由表(Loc-RIB)

BGP路由信息看,包括本地BGP Speaker通告的路由信息,将其中最优路由添加到IP路由表中。
注意:先要关注BGP路由表,若BGP路由表中不是最优路由,则无法在IP路由表中可见。

3)邻居表

对等体邻居清单列表,包括对等体两端的邻居信息及邻居列表。

4)Adi-RIB-In

对等体宣告给本地Speaker的未处理的路由信息库。

5)Adj-RIB-Out

本地Speaker宣告给指定对等体的路由信息库。

(4)BGP邻居关系类型

在BGP中大致可分为两种邻居关系:

  • IBGP:同一个AS内部的BGP邻居关系,IBGP邻居通常是指运行BGP协议的对等体两端均在同一个AS域内,属于同一个BGP AS内部;
  • EBGP:AS之间的BGP邻居关系,EBGP邻居通常是指运行BGP协议的对等体两端分别在不同的AS内;

注意:IGP协议建立邻居一般要求三层直连,并且通过广播或组播建立邻居。而BGP的邻居关系是基于TCP的,也就是说只要TCP/IP可达,无论是否直连,BGP对等体彼此之间就可以建立邻居关系。所以BGP建立邻居之前首先要考虑的就是对等体之间的路径可达(是否存在路由)。务必要通过IGP或者静态路由使对等体两端互通。

华为路由器——BGP路由技术详解
如图:根据邻居之间是否属于同一个自治系统可以判断,R1和R2是EBGP邻居关系,R2和R4是IBGP邻居关系。如果AS300中有路由要传播到AS100,那么BGP的传播路径为R5→R4→R2→R1。需要注意的是,在AS200内部,除了R2和R4是IBGP邻居关系外,R2和R3、R3和R4都可以配置为IBGP邻居关系,完全取决于网络工程师的规划。

可以使用以下命令建立IBGP邻居和EBGP邻居,其中as-number后面跟邻居所在的AS好,邻居的AS号和本端的AS号相同就成为IBGP邻居,不同就为EBGP邻居。

R2的配置如下:

[R2]bgp 200                                                                                     //进入bgp视图,其中本端AS号为200
[R2-bgp]router-id 2.2.2.2                                                                 //配置BGP的router-id            
[R2-bgp]peer 12.1.1.1 as-number 100                                            //和12.1.1.1建立EBGP邻居关系
[R2-bgp]peer 34.1.1.4 as-number 200                                           //和34.1.1.4建立IBGP邻居关系

上面配置为R2设备通过有两个对等体邻居,R1:12.1.1.1为EBGP邻居,R4:34.1.1.4为IBGP邻居。需要注意的是R2和R4可达。

R5的配置如下:

[R5]bgp 300
[R5-bgp]router-id 5.5.5.5
[R5-bgp]peer 45.1.1.4 as-number 200

上面配置为R5设备通告有一个对等体邻居,R4:45.1.1.4为EBGP邻居。
需要注意的是,对等体两端若是非直连关系,需要先用IGP或者静态路由连通BGP对等体两端。

[R5]display bgp peer 
//查询BGP邻居信息;
//在结果中重点查看state一列,Established表示已经建立连接;
//BGP对等体两端同步路由信息的前提是BGP邻居关系为Established;

2.通告BGP路由的方法

BGP路由是通过BGP命令通告而成的,而通告BGP路由的方法有两种:Network方式和Import方式。

(1)Network方式

使用Network方式可以将当前设备路由表中的路由(非BGP)发布到BGP路由表并通告给邻居,需要注意的是,network的对象是路由条目而不是接口。

华为路由器——BGP路由技术详解
如图:R1和R2位于AS100内,并且R1和R2是IBGP邻居关系,R2和R3是EBGP邻居关系。R1上有两个环回接口,所以在R1的路由表中就会有两个环回接口的直连路由。要求实现通过R1上宣告1.1.1.0/32和2.2.2.0/32路由,最终R3可以通过BGP学习到。配置命令如下:

[R1]bgp 100
[R1-bgp]router-id 1.1.1.1
[R1-bgp]peer 12.0.0.2 as-number 100
[R1-bgp]network 1.1.1.1 32
[R1-bgp]network 2.2.2.2 32
//R1将自身的1.1.1.1/32和2.2.2.2/32通过Network的方式发布到BGP中

BGP通过路由和IGP不同,在IGP中,通告的是接口,以OSPF为例,假如路由器有两个接口,地址分别为192.168.1.1/24和192.168.2.1/24,那么运行IGP时,可以通告汇总地址,以使这两个接口运行OSPF协议,命令为network 192.168.0.0 0.0.255.255 area 0 。但是BGP不同,BGP通过的不是接口,而是路由,假如路由表中的实际路由为1.1.1.0/24,那么就不能执行命令network 1.0.0.0 8以8为通过,必须以实际的路由通告。

(2)Import方式

使用Import命令可以将锁学习到的路由信息重分发到BGP路由表中,是BGP宣告路由的一种方式,可以引入BGP的路由包括直连路由、静态路由即动态路由协议学习的路由。和Network方式的区别是,Import的对象是某种动态路由协议,而不是路由条目。

华为路由器——BGP路由技术详解
R2和R3是EBGP邻居关系。在AS100中运行OSPF动态路由协议,R1通过OSPF宣告了物理接口及两个环回接口,并且R2已经通过OSPF学习到1.1.1.1/32和2.2.2.2/32两条路由,这些学习的路由可以在R2上通过Import方式引入BGP协议中。配置命令如下:

[R2-bgp]import-route ospf 110
//110为运行OSPF的进程号

通过display bgp routing-table命令可以查看BGP的路由表,在输出的BGP路由中,“*” 表示有效的路由,“>”表示最优的路由,只有最优的路由才会最终放入路由表中。

如果某个BGP路由条目不优,那么原因可能有:

  • 在同步打开的情况下,从IBGP邻居学习到的路由不会通过给其他BGP邻居,也不会使用该路由哦,直到通过IGP也学习到该路由或有静态路由可以关闭同步来解决(路由进程下执行 undo synchronization);
  • BGP 路由条目的下一跳不可达;

3.BGP的配置

(1)BGP对等体的配置

BGP设备会将最优路由加入到BGP路由表,形成BGP路由。BGP设备与对等体建立邻居关系后,采取以下交互原则:
(1)从IBGP对等体获得的BGP路由,BGP设备只传递给它的EBGP对等体;
(2)从EBGP对等体获得的BGP路由,BGP设备传递给它的所有EBGP和IBGP对等体(对等体是IBGP只能传递一跳,对等体是EBGP则不限制);
(3)当存在多条到达同一目的地址的有效路由时,BGP设备只将最优路由发布给对等体;
(4)路由更新时,BGP设备只发送更新的BGP路由;
(5)所有对等体发送的路由,BGP设备都会接收;
(6)所有EBGP对等体在传递过程中下一跳改变;
(7)所有IBGP对等体在传递过程中下一跳不变;
(8)默认EBGP传递时,TTL值为1;
(9)默认IBGP传递时。TTL值为255;

1)EBGP多跳

由于默认BGP中EBGP邻居之间的TTL值为1,若EBGP对等体非直连,在传递时,TTL跳数限制会使非直连的EBGP对等体无法正常建立邻居关系,所以需要用EBGP多跳的命令来解决非直连 的邻居关系。
华为路由器——BGP路由技术详解
配置命令如下:

[R3]bgp 200
[R3-bgp]router-id 3.3.3.3
[R3-bgp]peer 12.0.0.1 as-number 100
//保证12.0.0.1可达
[R3-bgp]peer 12.0.0.1 ebgp-max-hop 2
//设置TTL值为2,使其可达

2)更新源建立邻居关系

连接公网环境设备的地址很容易出现各种各样的问题,为了避免因为接口不稳定或DOWN而导致的BGP状态的改变。通常会在同一个AS内使用冗余链路来确保BGP的稳定性,这样即使某一链路故障,也不影响BGP的邻居关系,所以经常会使用LoopBack接口IP地址和对端建立BGP邻居,因为环回接口永远是UP,所以只要至少有一条链路可达,BGP的邻居关系就不会因链路而发生改变,这种使用环回接口建立BGP邻居的方法称为更新源建立邻居。
华为路由器——BGP路由技术详解
R1的配置如下:

[R1]bgp 100
[R1-bgp]router-id 1.1.1.1
[R1-bgp]peer 3.3.3.3 as-number 100
[R1-bgp]peer 3.3.3.3 connect-interface LoopBack0

R3的配置如下:

[R3]bgp 100
[R3-bgp]router-id 3.3.3.3
[R3-bgp]peer 1.1.1.1 as-number 100
[R3-bgp]peer 1.1.1.1 connect-interface LoopBack0
//本地LoopBack接口先要让对等体可达;
//需要手动添加对等体环路接口的路由条目或者IGP自动学习对方环回接口路由

(2)保证IBGP下一跳可达

在AS边缘的BGP设备,会接收到它的BGP对等体邻居传递过来的BGP路由信息。如果是下面这种情况:
华为路由器——BGP路由技术详解
假如R1通告一条路由,经过EBGP邻居传播到AS200后,R2看到的路由下一跳为12.0.0.1,继续经过EBGP传播到R3之后,R3看到的路由下一跳是23.0.0.2。R3传播给IBGP邻居R4后,R4看到的路由下一跳依然为23.0.0.2,因为通过IBGP邻居接收的BGP路由下一跳不变。又因为R4没有下一跳地址23.0.0.2的路由,所以R1传播过来的信息无效,不能传播给其他BGP邻居,更不能放入路由表。

解决的方法:在R3上宣称下一跳为R3自己,那么R4看到的下一跳就变成了34.1.1.3,而34.1.1.3可以通过IGP学习到(因为是直连网络),从而解决了路由无效的问题。R3执行如下命令可以实现:

[R3]bgp 300
[R3-bgp]router-id 3.3.3.3
[R3-bgp]peer 23.0.0.2 as-number 200
[R3-bgp]peer 34.1.1.4 as-number 300
[R3-bgp]peer 34.1.1.4 next-hop-local

(3)BGP的属性

区别于传统的协议,BGP协议包含很多路由属性,这些属性可以非常灵活的控制BGP的选路。

1)BGP属性的分类

BGP的属性共分为公有必遵、公认任意、可选过渡、可选非过渡。如图:
华为路由器——BGP路由技术详解

  • 公有必遵:所有BGP路由器都可以识别,且必须存在于Update报文中;
  • 公认任意:所有BGP路由器都可以识别,但不要求必须存在于Update报文中,可以根据具体情况来决定是否添加到Update报文中;
  • 可选过渡:BGP路由器可以选择是否在Update消息中携带这种属性。接收的路由器如果不识别这种属性,可以转发给邻居路由器(这就是过渡的含义),邻居路由器可能会识别并使用到这种属性;
  • 可选非过渡:BGP路由器可以选择是否在Update消息中携带这种属性。在整个路由发布的路径上,如果部分路由器不能识别这种属性,可能会导致该属性无法发挥作用。因为接收的路由器如果不识别这种属性,将丢弃这种属性,而且不再转发给邻居路由器;

2)BGP属性的介绍

BGP的常用属性有Origin、AS-PATH、Next-Hop、Local-Pref和MED等。

1.Origin(起源)属性

Origin属性属于公有必遵,用阿里定义路径信息的来源,其作用是标记一条路由是怎么成为BGP路由的。

Origin包含以下三种类型:

  • IGP(i):优先级最高。通过Network命令注入BGP路由表的路由,其Origin属性为IGP;
  • EGP(e):优先级次之。通过EGP得到的路由信息,通过使用Import-route命令注入的路由,其Origin属性为EGP;
  • Incomplete(?):优先级最低。通过其他方式学习到的路由信息;
2.AS-PATH(AS路径)属性

AS-PATH属性按矢量顺序记录了某条路由从本地到目的地址所要经过的所有的AS编号。在接收路由时,设备如果发现AS-PATH列表中有本AS号,则不接收该路由,从而避免了AS间的路由环路。

AS路径列表记录了所经过的AS号,各AS号之间以逗号分隔,且离本设备最近的AS号在最前面。

当BGP Speaker发布始发于本自治系统的路由时,遵循以下原则:
(1)当BGP Speaker将这条路由通告到EBGP对等体时,便会在Update报文中创建一个携带本地AS好的AS-PATH列表;
(2)当BGP Speaker将这条路由通告给IBGP对等体是,便会在Update报文中创建一个空的AS-PATH列表;
当BGP Speaker抓饭来自于其他自治系统的路由时,遵循以下原则:
(1)当BGP Speaker将这条路由通告给EBGP对等体时,便会把本地AS编号添加到AS-PATH列表的最前面。收到此路由的BGP设备根据AS-PATH属性就可以知道去目的地址所要经过的AS。离本地AS最近的相邻AS号排在前面,其他AS号按顺序依次排序;
(2)当BGP对等体将这条路由发布给IBGP对等体时,不会改变这条路由相关的AS-PATH属性;

华为路由器——BGP路由技术详解
如图:AS200中的路由器RTA通告了一条路由18.0.0.0/8。该路由分别通过(200→300→400→100)和(200→500→100)传递到AS100中。AS100在收到的路由中会携带该路由传播路径中的所有AS列表,其中最近的放在前面。

3.Next-Hop(下一跳)属性

Next-Hop属性记录了路由的下一跳信息。BGP的下一跳属性和IGP的有所不同,IGP中的下一跳描述的是下一个路由器,而BGP中的下一跳描述的是下一个AS,所以大部分情况下不是直连设备的IP地址。

通常情况下,Next-Hop属性遵循以下原则:
(1)BGP Speaker在向EBGP对等体发布某条路由时,会把该路由信息的下一跳属性设置为本地与对端建立BGP邻居关系的接口地址;
(2)BGP Speaker将本地始发路由发布给IBGP对等体时,会把该路由信息的下一跳属性设置为本地与对端建立BGP邻居关系的接口;
(3)BGP Speaker在向IBGP对等体发布从EBGP对等体学来的路由时,并不改变路由信息的下一跳属性;

华为路由器——BGP路由技术详解
图中A~J对应每个路由器的接口的IP地址。R1通过一条BGP路由1.1.1.0,首先R2收到,因为R1和R2是邻居,而且该路由器始发于本自治系统(AS100),所以在通告给R2时下一跳为A。R2继续通告给R3,因为R2和R3是EBGP邻居,所以通告给R3时下一跳为C。R3继续通告给R4,因为R3和R4是IBGP邻居,而且该路由不是始发于本自治系统(AS200),而是由其他自治系统学习而来的,所以R3通告给R4时,下一跳不变,依然为C,同理,R5和R6的下一跳为G。

4.Local-Pref(本地优先)属性

Local-Pref属性标识BGP路由的优先级,用于判断流量离开AS时的最佳路由。当BGP的设备通过不同的IBGP对等体得到目的地址相同但下一跳不同的多条路由时,将优先级选择Local-Pref属性值最高的路由。Local-Pref属性仅在IBGP对等体之间有效,不通告给其他AS。本地优先级在AS内部传递,优先级越高越优先。

Local-Pref属性可以手动设置,如果路由器没有配置Local-Pref属性,BGP选路是将该路由的Local-Pref值按默认值100来处理。

华为路由器——BGP路由技术详解
图中,互联网路由210.52.83.0/24和210.52.82.0/24分别通过ISP1和ISP2两个自治系统传到ISP0自治系统。配置RT4中210.52.83.0/24路由的Local-Pref属性为一个更高的值200,同理配置RT3中210.52.82.0/24路由的Local-Pref属性为一个更高的值200.如此一来,ISP0中的设备去往210.52.83.0/24将会走ISP1,去往210.52.82.0/24将会走ISP2。

在RT4上,控制210.52.83.0的Local-Pref属性为200,而210.52.82.0的Local-Pref属性为100的配置如下:

[RT4]acl number 2000
[RT4-acl-basic-2000]rule 5 permit source 210.52.83.0 0.0.0.255
[RT4]route-policy test permit node 10
[RT4-route-policy]if-match acl 2000                  //满足匹配ACL的条件
[RT4-route-policy]apply local-preference 200              //修改Local-Pref为200
[RT4]route-policy test permit node 20
[RT4-route-policy]peer 1.1.1.1 route-policy test import
//和邻居1.1.1.1 入方向应用策略
5.MED属性

MED属性用于判断流量进入邻居AS是的最佳路由,当一个运行BGP的设备通过不同的EBGP 对等体得到目的地址相同但下一跳不同的多条路由时,在其他条件相同的情况下,将优先选择MED值较小者作为最佳路由,用来改变下游的选路。

MED属性仅在相邻两个AS之间传递,收到此属性的AS一方不会再将其通告给其他任何第三方AS。MED属性可以手动配置,如果路由没有配置MED属性,BGP选路时将该路由的MED值按默认值0来处理。

华为路由器——BGP路由技术详解
如图:AS200中将两条路由(210.52.83.0和210.52.82.0 )通告给AS100.其中RT1在通告是将210.52.83.0设置一个比较小的MED属性(50),RT2在通告时将210.52.82.0设置一个比较小的MED属性(50)。AS100收到这些通告后,会认为到达210.52.82.0通告RT2的路径是最优的,而到达210.52.83.0通告RT1的路径是最优的。

在RT3上,而骗子会发送给EBGP邻居RT1的路由条目中匹配210.52.82.0/24,将MED属性设置为100,其他的设置为50的命令如下:

[RT3]acl number 2000
[RT3-acl-basic-2000]rule 5 permit source 210.52.82.0 0.0.0.255
[RT3]route-policy test1 permit node 10
[RT3-route-policy]if-match acl 2000                                   //满足配置ACL的条件
[RT3-route-policy]apply cost 100                                       //修改MED属性为100
[RT3-route-policy]route-policy test permit node 20
[RT3]route-policy test permit node 20
[RT3-route-policy]apply cost 50                //没有配置条件代表匹配一切条件,修改MED值为50
[RT3]peer 1.1.1.1 route-policy test1 export

(4)BGP的选路原则

众所周知,BGP是被广泛应用于互联网ISP与ISP之间的路由协议,而BGP之所以能被众多ISP所信任,主要是因为其路径选择过程非常严格。

BGP的选路原则如下:
(1)若去往目的网络的路由下一跳不可达,则可以忽略此路由;
(2)Preferred-Value优先级以数值高的路由优先;
(3)Local-Preference优先级以数值高的路由优先;
(4)聚合路由优先级高于非聚合路由;
(5)本地手动聚合路由的优先级高于本地自动聚合的路由;
(6)本地通过Network命令引入的路由的优先级高于本地通过Import-route命令引入的路由;
(7)AS路径长度最短(最少个数)的路径优先级高;
(8)比较Origin属性,IGP优先级高于EGP,EGP优先级高于Incomplete;
(9)选择MED优先级较小的路由;
(10)EBGP路由优先级高于IBGP路由;
(11)BGP优先选择到BGP下一跳的IGP度量低的路径;
当以上全部相同,则为等价路由,可以负载分担(注:AS-PATH必须一致),当负载分担时,以下3条原则无效
(1)比较Cluster-List长度,短者优先;
(2)比较Originator_ID(如果没有Originator_ID,则用Router ID比较),选择数值较小的路径;
(3)比较对等体的IP地址,选择IP地址数值最小的路径;

三、实验案例

(1)案例环境如下:

华为路由器——BGP路由技术详解

(2)案例需求:

(1)要求实现两个AS之间的互相通信;
(2)通过修改BGP属性使实现业务需求的路径从R2切换到R3;

(3)案例实施

1)BGP基础配置

1.配置所有设备IP地址及AS200内部的OSPF协议

仅配置通告AS内部的直连路由,配置过程略!

2.建立邻居关系

在R1和R2、R1和R3配置EBGP邻居关系,使R1、R2和R3之间可以通过EBGP相互传递路由。在R2、R3和R4上配置IBGP邻居关系,使R2、R3和R4之间通过IBGP互相传递路由。

R1的配置如下:

[R1]bgp 100
[R1-bgp]router-id 1.1.1.1
[R1-bgp]peer 10.0.12.2 as-number 200
[R1-bgp]peer 10.0.13.3 as-number 200
[R1-bgp]network 1.1.1.1 32                    //通告网络1.1.1.1/32

R2的配置如下:

[R2]bgp 200
[R2-bgp]router-id 2.2.2.2
[R2-bgp]peer 10.0.12.1 as-number 100
[R2-bgp]peer 10.0.24.4 as-number 200
[R2-bgp]peer 10.0.24.4 next-hop-local

R3的配置如下:

[R3]bgp 200
[R3-bgp]router-id 3.3.3.3
[R3-bgp]peer 10.0.13.1 as-number 100
[R3-bgp]peer 10.0.34.4 as-number 200
[R3-bgp]peer 10.0.34.4 next-hop-local

R4的配置如下:

[R4]bgp 200
[R4-bgp]router-id 4.4.4.4
[R4-bgp]peer 10.0.24.2 as-number 200
[R4-bgp]peer 10.0.34.3 as-number 200
[R4-bgp]network 4.4.4.4 32

3.查看路由表

R1的路由表:

[R1]dis bgp routing-table 
//查看通过BGP学到的路由表
 BGP Local router ID is 1.1.1.1 
 Status codes: * - valid, > - best, d - damped,
               h - history,  i - internal, s - suppressed, S - Stale
               Origin : i - IGP, e - EGP, ? - incomplete

 Total Number of Routes: 3
      Network            NextHop        MED        LocPrf    PrefVal Path/Ogn

 *>   1.1.1.1/32         0.0.0.0         0                     0      i
 *>   4.4.4.4/32         10.0.12.2                             0      200i
 *                       10.0.13.3                             0      200i

R4的路由表:

[R4]dis bgp routing-table 

 BGP Local router ID is 4.4.4.4 
 Status codes: * - valid, > - best, d - damped,
               h - history,  i - internal, s - suppressed, S - Stale
               Origin : i - IGP, e - EGP, ? - incomplete

 Total Number of Routes: 3
      Network            NextHop        MED        LocPrf    PrefVal Path/Ogn

 *>i  1.1.1.1/32         10.0.24.2       0          100        0      100i
 * i                     10.0.34.3       0          100        0      100i
 *>   4.4.4.4/32         0.0.0.0         0                     0      i

此时BGP已经配置完成,会发现R4去往R1的1.1.1.1优先走R2,而R1去往R4的4.4.4.4优先走R2。接下来改变选路问题。

2)选路配置

根据要求,从R4去往R1的路由从R2改走R3。下面几种方法均可实现!

1.根据本地优先级控制选路

在R3上修改本地优先级属性并传出给R4。

[R3]route-policy lop permit node 10                    //创建名为lop的路由策略
Info: New Sequence of this List.
[R3-route-policy]apply local-preference 222            //设置本地优先级为222
[R3-route-policy]quit
[R3]bgp 200
[R3-bgp]peer 10.0.34.4 route-policy lop export              //应用策略
[R3-bgp]quit
[R3]quit
<R3>reset bgp all                    //刷新路由属性

刷新之后,在R4上查看路由表:

[R4]dis bgp routing-table 

 BGP Local router ID is 4.4.4.4 
 Status codes: * - valid, > - best, d - damped,
               h - history,  i - internal, s - suppressed, S - Stale
               Origin : i - IGP, e - EGP, ? - incomplete

 Total Number of Routes: 3
      Network            NextHop        MED        LocPrf    PrefVal Path/Ogn

 *>i  1.1.1.1/32         10.0.34.3       0          222        0      100i
 * i                     10.0.24.2       0          100        0      100i
 *>   4.4.4.4/32         0.0.0.0         0                     0      i

通过路由表可以看出此时R4去往R1的路由已经改走R3了!

2.使用AS-PATH属性控制选路

为了还原最初走R2的效果,请使用以下命令清除调用策略的语句:

[R3]bgp 200
[R3-bgp]undo peer 10.0.34.4 route-policy lop export

在R2上修改AS-PATH属性并传给R4:

[R2]route-policy as permit node 10
Info: New Sequence of this List.
[R2-route-policy]apply as-path 123 123 123 additive                  
//表示在原有的路径上行额外添加( 123、123、123)路径
[R2-route-policy]quit
[R2]bgp 200
[R2-bgp]peer 10.0.24.4 route-policy as export
[R2-bgp]quit
[R2]quit
<R2>reset bgp all

查看R4BGP路由效果:

[R4]dis bgp routing-table 

 BGP Local router ID is 4.4.4.4 
 Status codes: * - valid, > - best, d - damped,
               h - history,  i - internal, s - suppressed, S - Stale
               Origin : i - IGP, e - EGP, ? - incomplete

 Total Number of Routes: 3
      Network            NextHop        MED        LocPrf    PrefVal Path/Ogn

 *>i  1.1.1.1/32         10.0.34.3       0          100        0      100i
 * i                     10.0.24.2       0          100        0      123 123 12
3 100i
 *>   4.4.4.4/32         0.0.0.0         0                     0      i

通过路由表可以看出此时R4去往R1的路由已经改走R3了!

3.通过MED属性控制选路

如果希望R1去往R4的路由该走R3,可以使用MED属性控制R1的路由选路,使R1去往R4从R2该走R3。查看之前的配置会发现从R1去往R4走R2。,通过以下配置可以实现:

R2的配置如下:

[R2]route-policy med permit node 10
Info: New Sequence of this List.
[R2-route-policy]apply cost + 50
[R2-route-policy]quit
[R2]bgp 200
[R2-bgp]peer 10.0.12.1 route-policy med export
[R2-bgp]quit
[R2]quit
<R2>reset bgp all

查看R1的BGP路由表:

[R1]dis bgp routing-table 

 BGP Local router ID is 1.1.1.1 
 Status codes: * - valid, > - best, d - damped,
               h - history,  i - internal, s - suppressed, S - Stale
               Origin : i - IGP, e - EGP, ? - incomplete

 Total Number of Routes: 3
      Network            NextHop        MED        LocPrf    PrefVal Path/Ogn

 *>   1.1.1.1/32         0.0.0.0         0                     0      i
 *>   4.4.4.4/32         10.0.13.3                             0      200i
 *                       10.0.12.2       50                    0      200i

实验完成!

通过实验不难发现:BGP控制选路主要是通过BGP属性值的调整完成的。BGP包含大量的属性,而这些属性直接影响选路,所以BGP相对于ICP来说具有更强大控制能力。需要注意的是:BGP选路的方法有很多种,要确保选用正确的方法,同时需要注意不通属性键的优先级问题。

四、配置总结:

在配置过程中需要注意以下几点,以免出现错误:
(1)在建立邻居关系,指定对端路由器地址前,务必保证可以ping通对端路由器。
(2)AS内部建立BGP邻居关系时,最好指定对方的Loopback地址,但不要忘记更新源,参考命令: “ [R3-bgp]peer 4.4.4.4 connect-interface LoopBack 0 ” 。
(3)若在AS内部有一个以上的的路由器运行着BGP协议,对于AS内部来说,这也是IBGP协议,不要忘记更改下一跳的属性,也就是前面提到的“保证IBGP下一跳可达”,命令参考:“[R4-bgp]peer 2.2.2.2 next-hop-local”
(4)前面说到,若在两个不同AS区域的路由器上建立邻居关系,哪怕这两个路由器是直连的,也要改变它的TTL值,目的是让路由器之间用来建立邻居关系的数据包,可以多经过几个路由器,再被丢弃,因为,虽然不同AS的路由器是直连的,只有一跳即可,但是由于指定的是对端路由器的loopback地址,loopback地址的网段肯定与路由器直连的网段不是同一个网段,路由器收到该数据包后就把它当成另一个路由器上的地址了,所以在两个AS间建立邻居关系时,一定要改变它的跳数,IBGP之间建立邻居关系就不用改变TTL值了,因为在IBGP中,数据包的TTL值默认为255。改变TTL值的参考命令:“ [R1-bgp]peer 34.1.1.4 ebgp-max-hop 2 ”这条命令,需要跳几下就把数值设置为几就行,可以比实际跳数大,但是不能比实际跳数小。

———————— 本文至此结束,感谢阅读 ————————

猜你喜欢

转载自blog.51cto.com/14157628/2443977
今日推荐