这样吧,咱最近几天接到一个割接任务,要换掉一组办公网络的楼层汇聚。本来这个割接是比较简单的,加上办公网对实时性的要求也没那么高。但问题就在于:之前的楼层汇聚,型号是两台H3C 7506,做了IRF堆叠了;而这次要换成华为S7703,不支持堆叠了。于是,设备换型加上网络架构发生了变化,就使得这次网络割接的风险陡增。
假设,从老的S7506堆叠到S7703的配置翻译没有任何问题,VRRP的协商也是完全正常,让你来考虑一下,如何降低这次割接的风险,你该怎么想呢?
靠你在那里用嘴和人描述吗?估计这种事情是说不清楚的吧!
我建议,这种情况还是简单画一个割接图,把场景给人说画清楚了,然后再谈割接的步骤,就能把一切风险扼杀在摇篮里了。
不信啊?咱就画着看看吧。
先说好,这次把S7506换成S7703,完全是因为S7506放在那里占地方,也觉得有点浪费,所以才考虑换成高度仅为4U的S7703。所以呢,你必须先把S7506下架一台,才能上架一台S7703。
所以,咱先把网络架构简单的画出来,再画一个矩形框,里面标注“未上架的设备。”
初始的状态,如下图所示:
看上面的图,就是网络割接前的状态,简单的描述一下:
(1)两台待更换的办公汇聚BG-DS(型号为S7506,配置IRF堆叠),与上行两台核心交换机配置OSPF路由协议,连接核心-2的链路加大Cost值为1000,这使得流量到了BG-DS上可以优先走核心-1;
(2)办公汇聚BG-DS与下行交换机之间用二层链路连接(下面的BG-AS-1/2/3都是纯二层交换机),BG-DS与BG-AS-1/2/3均用二层链路聚合进行连接。
而这次网络割接呢,你要是画一下图,就能发现风险:
我们先看第一个步骤,先把连接S7506备机的线缆移除,但暂时保留堆叠线:
如果把S7506的IRF成员2上的线缆(除堆叠线)全部移除,此时三台BG-AS与IRF成员1还有连线,且成员1和核心-1之间的连线还在,所以,网络业务不会受到影响。
所以,此时可以放心大胆的把S7506的IRF成员2下架了,如下图所示:
这个时候,咱也没别的选择,只能是先把一台S7703的BG-DS-2。但这台S7703上架了,你就会发现好几个“致命”的问题,如下图所示:
这个风险怎么规避呢?实际上你也可以看出来,对于下面的接入层交换机BG-AS-1/2/3而言,只要你断开一条连接到汇聚交换机的线路,就能保证网络流量正常。由于S7506是老设备,迟早要下线的,所以要断开的线路是BG-AS-1/2/3到S7506的链路。但你也不能一次性把BG-AS-1/2/3的线路全断了,只能是“逐台进行”。
先断开AS-1到S7506之间的连线,再连接AS-1到S7703-2之间的连线,趁着AS-1是单线连接汇聚的状态,取消AS-1上的上联链路聚合。这个过程如下图所示:
然后再断开AS-2与S7506的连线,再连接AS-2与S7703的连线,取消AS-2上的链路聚合;
照着这个步骤继续操作,得到网络的一个稳定的中间状态如下图所示:
现在,就可以把S7703-1拿来替换S7506成员1,再加上必要的连线,就能得到网络割接后的最终状态了。
在这里还是要提醒一嘴:在这里有个假设,是两台S7703上的配置是100%正确的。当然,这需要在S7703上对配置命令进行多次检查,并且提前开机,进行内部互联测试,设备运行状态正常且VRRP协商正常后才可上架。
所以呢,你说把图画好重要不重要?
尤其是对于一些经验不足的工程师,在无法判断其割接风险的时候,一定要把图画好,把做变更的点标记好,这样一下子就能看出来风险点在哪里,从而做好预判,把风险扼杀在摇篮之中。