当前位置: 澳门新濠3559 > 服务器运维 > 正文

IP网络作为承载互联网,并使用了华为提供的SD

时间:2019-11-08 03:17来源:服务器运维
腾讯DCI上线基于集中控制的SR-TE方案,腾讯dci上线sr-te 交通拥堵已经成为当今时代与每个人息息相关的问题,它直接影响了我们在现代社会的生活体验。传统的分布式交警管控方式,已

腾讯DCI上线基于集中控制的SR-TE方案,腾讯dci上线sr-te

交通拥堵已经成为当今时代与每个人息息相关的问题,它直接影响了我们在现代社会的生活体验。传统的分布式交警管控方式,已无法解决急速扩张的汽车保有量与紧张的公路资源之间的矛盾,这显然也不是互联网时代解决问题的一贯思路。所以我们有了品类繁多的互联网导航系统,它可以在出发前就根据全城的实时路况为驾驶者推荐最优路线,甚至当途中突遇堵车时,可以快速调整路线。这是一个看上去很棒的方法,前提是所有的驾驶者都会听从电子导航的指挥,但看看路上的漫漫长龙,就能感受到现实的骨感。假如能有一个超级警察,可以让所有的车辆都按照规定线路行驶;并且摩托车、小汽车、大货车的通行情况可以根据当前的路况随时调整;当发生拥堵时,可以让救护车、消防车、公交车等具有畅通无阻的特殊通道,相信城市交通问题将大大缓解。那么问题来了,这个超级警察什么时候才能降临呢,5年后,10年后,也许更久。但这科幻般的场景,在腾讯的网络世界里已然来临。

2017年12月,腾讯DCI网络深圳Region成功上线了全球首个基于交换机实现的SDN集中控制的Segment Routing Traffic Engineering方案。该方案经过三年多的研究探索及15个月的开发测试,基于Segment Routing技术和SDN思想,率先实现了对10w服务器级别的IDC园区间通讯,进行全局视角的、带宽利用率和链路质量等多维度、可定义约束条件的智能调度。腾讯DCI网络向着打造软件定义的、开放的高度智能化网络的目标又迈出了重要一步。

图1 网络拓扑展示示意图

背景介绍

腾讯DCI网络自创建之初,至今已经历过数次技术演进,其中2011年的IP向MPLS技术的演进,是腾讯DCI网络发展的重要里程碑之一。随着腾讯在各领域业务的极速增长以及开放生态的需求,DCI网络需要提供多业务承载的、灵活性和扩展性更强的QoS能力;另一方面,传统的基于IP路由技术的网络,在流量调度方面的能力显得捉襟见肘。

MPLS技术在运营商网络中已有超过十年的成熟应用,基于MPLS技术实现的RSVP-TE协议,提供了完整的流量工程方案,网络设备可以基于不同的服务等级进行隧道带宽预留和路径计算。但是RSVT-TE由于协议设计和实现的复杂性,在实际应用中遇到了很多问题。比如其复杂的协议交互流程,对设备的软件实现带来了很大的挑战,并且当网络规模不断扩大,TE Tunnel数量逐渐增多,所有隧道路径的首节点、传输节点、尾端节点都需要维护大量的LSP信息,这对于设备性能的消耗十分显著。

如今腾讯在全球已拥有百万级服务器规模,面对如此庞大的网络,以及在云上用户业务对网络性能提出的更加严苛的要求下,我们必须选择一个更加有效的流量工程方案。也正是在这样的背景下,IP网络作为承载互联网,并使用了华为提供的SDN远程实验室。腾讯DCI网络在刚刚过去的几周,完成了再一次的重大技术演进,基于SDN集中控制的SR-TE流量调度方案成功上线。

Tencent Defined SR TE

Segment Routing技术自提出以来就在行业内引发了广泛的关注和讨论,作为以太网领域“继MPLS之后最具革新意义的网络协议”,现在已经具备了多个RFC draft,同时业界主流网络设备供应商也纷纷在软硬件方面提供了全面支持。但是至少到目前为止,还没有形成一个统一的、标准的应用方案。腾讯作为全球互联网行业的领导者和先行者,结合自身网络场景特点和需求,借助SR和SDN技术自主设计了完整的SR TE集中控制流量调度方案。该方案无需网络设备供应商对现有IGP协议进行拓展开发,SR相关控制层面完全由控制器实现,为方案的快速落地和稳定运行奠定了基础。之所以选择了SR技术,除了其在设计理念上利用了源路由技术天然避免了LSP对传输节点和尾节点的压力,更是看重了其与SDN思想完美结合的能力。传统的分布式流量工程方案只能基于单一节点进行流量调度,引入了SDN控制器,就可以实现基于全局信息对Tunnel进行路径计算,从而达到提高整网利用率的效果;同时,将路径计算的控制层转移到控制器,为用户自定义、可编程的实现流量调度提供了极大的便利。

图2 方案部署流程示意图

为了提高方案的可靠性,我们设计部署了TE的Hot-Standby保护、多场景的BFD保护等方案,同时结合控制器和智能网管系统开发实现了一键隔离、一键逃生等功能,确保在链路故障、网络节点故障、控制器故障等场景下业务流量可以进行优雅切换。

开放定制的控制系统

作为一个SDN集中控制方案,在设计时对转发层面进行尽量简化的同时,势必将更多的控制层功能上移到了控制器,在逻辑上增加了控制器的实现复杂度,这也是SDN控制器最有价值的部分。考虑到腾讯复杂、多厂商设备共存的网络场景,我们选择了具有丰富南向协议、平行可扩展的开源控制器平台Opendaylight作为我们底层的核心控制器平台,并结合SR-TE流量调度方案进行了定制化的开发与增强。

图3 SDN控制器架构示意图

图3为我们控制器的一个整体架构。在南向,我们使用当前成熟的BGP-LS协议动态收集网络拓扑与TE属性,并结合腾讯智能网管平台所提供的多维度网络参数(i.e流量,延时,丢包率等),使用定制化的路径计算算法进行TE LSP路径的动态实时调整,以实现“上帝视角”的网络资源最优分配。在网络故障或拥塞场景下,算法可根据隧道优先级进行智能优化,优先将低优先级隧道绕行,解决网络拥塞问题,同时保障网络SLA。在腾讯复杂的网络场景下,存在着多厂商转发设备共存的环境。在控制器南向方面,我们使用成熟的NETCONF协议。同时,我们致力于推动基于OpenConfig YANG的配置标准化。通过统一模型,屏蔽多厂商设备差异,实现转发设备的统一管理和配置。未来,我们会继续探索更加高效的南向通道(如:BGP SR-TE Policy等),以实现控制器更加快速敏捷的调整网络路径。在可靠性方面,我们增强优化了开源ODL平台的集群机制,解决了网络延时场景下数据同步效率问题,实现了控制系统的跨区域部署容灾,提供了最可靠的DCI网络控制系统。网络的开放性一直是我们在SDN探索道路上的目标之一。在SR-TE流量调度系统中,我们将智能网络路径计算能力通过控制器北向接口开放给腾讯丰富的业务场景,实现业务定制化的网络算路请求。如:流量负载均衡、延时最短、丢包率最低等。

简化的数据平面

完善的SDN控制器设计和实现,大大降低了对转发设备的复杂度要求,让整个方案在基于ASIC芯片的交换机上实现成为可能。无论交换机厂商采用商用套片还是自研芯片,只需要在现有逻辑下增加对Segment Routing相关表项和标签栈封装的支持即可,无需对现有Pipeline进行改变;另外通过对现有ACL能力的运用,可以完整的实现CBTS(Class-Based Tunnel Selection)功能。这意味着我们不需要再通过购买昂贵的基于NP芯片的路由器来实现复杂的流量工程,每100G网络建设成本下降为之前的1/10甚至更低。随着ASIC芯片厂商对于用户最前沿技术需求的不断追逐,以及芯片设计上逐渐提升的可编程能力,我们看到尤其在OTT基础网络场景中,交换机和路由器在能力上的界限已逐渐模糊,相信未来成本相对较低的基于ASIC芯片的核心交换机会成为DCI网络的主流。

收益与展望

全新的流量调度方案帮助腾讯提升网络平均带宽利用率15%以上,在每年超过100T的数据中心互联带宽建设背景下大大降低了网络建设成本,并且对多点故障等极端场景下引发的流量拥塞可实现秒级自动检测和调度。未来随着骨干网IPv6技术的推进,基于Segment Routing技术的流量调度方案也将会随之进行更具有创造性的演进,诸君敬请期待。

本文转自“鹅厂网事”公众号

目前网络中的局限:
  • RSVP-TE多用于广域网流量工程,通过逐条建立路径,每个节点都需要维护大量的状态信息,会受限于规模,不支持大规模部署;同时RSVP-TE不支持等价路径分担,使网络利用率不高。
  • 网络中应用和网络离的很远,即网络中数据传送常常是不区分服务的(待深入理解)

SR可以有效解决上面两个问题,一是通过segment list确定路径信息,中间节点完全不需要维持路径状态信息,只负责转发,适合大规模部署;二是SR是实在的应用驱动网络,应用提出需求,如带宽、时延等,控制器基于全局拓扑,如链路状态、连路利用率信息计算路径,并映射到segment list所定义的路径上。

IP网络从1982年TCP/IP 成为互联网前身的ARPANET标配以来,随着互联网的发展而迅猛扩展。在数据网络方面基本已经一统天下,做到了 everything over IP。IP网络作为承载互联网,物联网,云计算以及VR,AI等未来各种无限可能的数据服务的底层网络,其灵活性,扩展性以及对业务的支持可编程需求要求网络更快的完成自身演进。

6月16~6月17日,德国柏林阳光明媚,IETF Hackathon在InterContinental酒店完美收官。本次大赛汇集了包括Telefonica、SKT、中国移动、思科、北邮、麻省理工学院等全球各大运营商、设备商、教育与科研机构在内的150+位开发者和标准专家,其中有30+人参加了ONOS相关的4个Hackathon比赛项目,这些项目由来自ONOS和华为的技术专家提供技术支持,并使用了华为提供的SDN远程实验室。

SR 体系结构

整个体系上,SR采用了类似于SDN架构:数据平面和控制平面相分离。数据平面定义了 如何将segment应用于数据包上,即节点如何根据segment处理一个数据包。控制平面定义了segment 标识如何在节点之间通告,一般通过内部网关协议(IGP)的链路状态信息,这就要求对现有网络路由协议(IS-IS、OSPF)进行适当修改,已经有相应的文献进行了研究。同时控制平面也处理SR路径的计算。
SR实现了源路由和隧道模式

澳门新濠3559 1

本次Hackathon活动使用的华为SDN远程实验室,为现场开发者提供了所需的复杂网络环境,并顺利实现与现场ONOS控制器完成对接,成为业界首次创新使用远程连接方式支持IETF Hackathon活动。

Segment知识点:
  • Segment :任意类型指令的一种标识。不能局限于MPLS所说的标签,要看所承载的网络和功能,若运行于MPLS网络,segment语义上为标签;若运行于IPv6网络,语义上为IPv6地址。
  • Segment分为全局和本地,对全局segment,全局可见,全局有效,而本地segment全局可见,本地有效。
  • 另外一个概念:SRGB,预留出来的全局标签范围,默认为16000-23999,全局segment在SRGB中取值。通告全局segment,先通告SRGB,再加一个索引,如通告SRGB范围为 16000-23999,索引为1,则生成的全局segment为16001。注意一个区域内必须保证节点通告的SRGB一致。

从IP网络的整体发展看,从网络的基本可以清晰的分为三个阶段,当然这三个阶段的网络在现实世界是并存的。

下面请跟随小编共同回顾ONOS开放编程与IETF标准完美结合的奇妙世界吧。

SR基本工作原理:

内部网关协议中使用 prefix-SID 的几种用法

纯IP网络 (IP战胜了其他网络层协议,成为数据网络的主流)

Day 1开场篇

1. 全局SID使用

澳门新濠3559 2

全局SID示例

上图为SR转发示意图,假设A点要发送数据包到Z点,会经过以下几个过程,首先,底层网络节点交换node SID(segment ID),控制器或者决策中心根据应用需求(带宽、时延等)结合生成一个segment list,压入数据包。上图中,到Z的数据包压入了三个SID,首先第一个SID 16072 为active状态,说明数据先转发到SID 为16072的节点C,路由生成依赖于原有的IP路由,可以负载均衡(ECMP)。到C后发现第一个SID为自己,则弹出,置下一个SID 29003为active状态,以此类推,最终到达节点Z。
一个支持SR的节点(交换机或路由器等)必须支持以下三种操作:

  • CONTINUE:基于active SID 的转发行为
  • PUSH:添加一个segment ID 到数据包头部,并将该SID置为active 状态。
  • NEXT:将下一个SID置为active 状态。
  • MPLS based 网络
  • SDN 网络
  • 纯IP网络

【8:30】来自不同运营商、标准组织的合作伙伴开始入场,络绎不绝。现场准备了应景的纪念品哟,盆友们说:It’s very nice! It’s very cool!

2. 局部SID与全局SID的结合

澳门新濠3559 3

结合示例

上图中24045为局部SID,在本区域内有效,每个节点维持了与邻接节点之间的 邻接SID,通常用于 节点之间有多条路径时,指定路径。例如节点 4 到节点5有两条链路,则每条链路指定一个局部SID。

回退到几十年前,IP网刚诞生时,IP协议和IP网络还是有很多竞争对手的,比如IPX,Appletalk,Netbios,这些现在听着很久远的协议当时还是很流行的。比如IPX在企业网就远比IP流行。当年的网络和网络设备复杂性很大程度体现于支持多种网络层协议,支持从E1到OC-12,OC-48的多种网络速率和接口类型。IP以及Ethernet仅是众多选择中的一种。

澳门新濠3559 4

3. 实现负载均衡

澳门新濠3559 5

负载均衡

上图中 PE1和PE2拥有自己的全局SID外,还向外通告了一个共同的SID 16100,则节点A到16100可以进行多路负载均衡的同时还能相互形成冗余,提高网络的抗毁性。

APPANET 选择TCP/IP组合后,IP的简单易用,Ethernet的低成本,再加上互联网的病毒式传播,短短的20年。这三者的强力组合就像 Intel + 微软一样,横扫数据网络。 可以认为应用层发轫的Everything Over IP 水到渠成,到了2000年左右,语音网络,视频网络和数据网络,已经可以说是 Everything Over IP了。

【9:00】IETF主席Jari Arkko进行开场致辞,欢迎各位参赛者到来,并介绍了举办Hackathon的意义:IETF制定标准和可运行的代码,可运行代码对校验标准有效性、发现错误与差距,获得经验非常重要。通过Hakathon的开发活动产生的可运行代码,可以促进对标准的改进。之后,IETF联合主席介绍了Hackathon活动的日程。

SR应用

可以广泛应用于流量工程、网络冗余配置等等。

纯IP网络主要在统一网络层协议和简化传输介质上贡献显著。

澳门新濠3559 6

总结:

基于Openflow协议的SDN架构对现有网络改动太大,如需要交换机支持openflow协议,同时上层架构如路由协议也要进行改动以支持控制器集中控制。虽然不同于openflow在整个SDN架构中为南向接口协议这一地位,SR则提供了一种更有效的演变方式,甚至可以完成在现有网络架构中支持转发与控制平面分离而不需要openflow协议参与,具有很强大的灵活性。

参考资料:
1、Filsfils C, Nainar N K, Pignataro C, et al. The segment routing architecture[C]//Global Communications Conference (GLOBECOM), 2015 IEEE. IEEE, 2015: 1-6.
2、http://www.jianshu.com/p/03653ef39d0d

纯IP网络的转发

Day1+Day2竞技篇

  • 从本质上说是逐跳基于目的IP地址转发
  • 完成这个动作的方式是通过 IGP + BGP 路由协议来实现
  • 附加的网络调控手段:PBR,ACL, IP-Based QoS

【9:45】进入实际操作环节,小伙伴们熟悉编辑环境、交流技术原理、进行编程操作。现场讨论火爆,非常投入,不仅讨论如何编程实现,还对标准协议进行了深入讨论。通过集体智慧的碰撞,不仅激发了伙伴对ONOS的兴趣,还加深了对ONOS的认知,更为重要的是获得了用户对ONOS的需求以及对标准一些的改进建议。此外,客户对远程实验室节约成本、便利表示了肯定,并表示愿意与ONOS及华为在未来基于IETF标准领域开展更多合作。

这个阶段的网络主要实现连通的目的,通过IGP和BGP路由协议,获取AS域内和域间路由。构成网络的路由器或交换机根据路由表,形成转发表。当IP报文到达接口,入方向的芯片提取IP报文头,根据目的IP查找转发表,找到出端口。

澳门新濠3559 7

多年来,大多数企业网,园区网以及相当多运营商的公众网都采用这种方式。优点是简单,大多数设备都支持。随着路由协议的大规模使用和设备的大规模部署,作为整体系统的健壮性,可扩展性和稳定性以及建网成本都有了很大的优化。相应的网络设备芯片体系也日趋完备。

看,小伙伴们讨论得多认真啊,想不想搬个板凳围观啊?

但从服务的角度则看起来乏善可陈。当业务对网络有连通以外的要求时,比如要基于源地址进行选路时,设备可以通过PBR(Policy-based routing)实现。但这并不是一种普世的服务,对于少量,临时,非做不可的需求,可以用CLI在某些节点配置,但没有人会疯狂到在全网通过PBR去做路由。网络工程师通常称PBR这样的实现叫做“Feature”。

控制器要实现网络控制,必须要与网络互通,必须要有转发设备返回控制响应。你是不是会认为现场得搭几十台路由器啊?NO!NO!NO!这里必须介绍一下支撑本次Hackathon活动的重要角色——华为SDN远程实验室。开发者只需使用浏览器登录华为SDN远程实验室网站,就可以预约和使用远程实验室提供的网络环境了,实现拓扑收集、业务下发和流量测试等功能,不需要在现场搭建网络环境,消除了网络准备的时间和硬件成本,快捷、高效地满足了开发者活动的需要。只要有Internet,任何人都可以随时、随地使用华为SDN远程实验室。

在那些年里,厂商们各自都有很多Feature。用于炫技,用于投标,用于教育客户。用于不那么完美的解决某些实际问题。

澳门新濠3559 8

Feature 有两个隐含的意思:

现场使用的华为SDN远程实验室

  • 不是随便的阿猫阿狗就能实现的,是一种能力
  • 起了这个Feature是对网络和设备而言都有代价有条件的

澳门新濠3559 9

另一个现象是当某些需求用Feature无法满足,或者是设备的性能瓶颈,或者是功能瓶颈时,网络工程师又设计出各种appliance,叠加了特殊功能的各种大box和小Box,最著名的就是防火墙,还有4-7层交换,广域网优化等。这些设备说到底,还是在对IP报文的处理上,解决了“基于目的地址寻址”以外的问题。

ONOS操作界面

总结来说,在纯IP网络时代,是靠路由协议+feature+appliance满足基本需求的。

Day2分享篇

MPLS based网络

【14:00】经历了一天的讨论、编程,终于到了分享成果的时刻。

在IP协议和IP网络PK掉ATM时,尽管ATM协议的复杂和设备昂贵等诸多原因导致了市场的失败。 IP网也由衷的羡慕ATM实现的虚电路的优势,对于无连接的IP来说,如果能形成一个按需的虚电路,能够根据用户的特点提供不同的服务质量和转发路径,是非常有吸引力的事情,再加上当时转发性能的一些瓶颈,综合因素促成了MPLS的诞生和流行。

作为业界主流控制器,ONOS提供了最适合运营商的开源控制器平台,支持丰富的南北向接口和标准协议。本次大赛ONOS采用了IETF四个标准协议:分段路由(Segment Routing)、ACTN(Abstraction and Control of TE Networks,流量工程的抽象控制)、PCECC(PCE as Central Controller,集中控制PCE)和YANG元数据注解扩展(Yang Metadata Annotation Extension)。

当MPLS开始规划化使用和部署时,两个基本概念是代表了运营商期盼已久的事情。

ACTN

FEC转发等效类

韩国SKT Shin Jong Yoon先生分享成果

FEC(Forwarding equivalence class) ,对于相同分类的一组数据报文,提供相同的转发处理方式。 这里所说的相同分类,相同的目的地址仅是其中的一种,基于不同的标准进行自由的网络转发一直是网络工程师的愿景之一。

此场景是ONOS控制器北向接口标准的应用开发。小组成员完成两个Used case。一是通过ONOS控制器开发了一个新API,帮助物理分散的DC选择最佳头端。二是在ACTN的两层控制器架构之间,用YANG模型实现了一个网络生存性工具,分析现有网络和业务,给出链路预警,从而提升运维效率。ACTN提出的层次化控制器架构提供了跨域、跨厂商的解决方案。不同域的控制器抽象拓扑通过基于IETF YANG模型的北向接口与协同器交互,管理跨域的TE网络,并完成端到端业务发放。帮助运营商敏捷运营,提升用户体验。

LSP:Label-switched path

BGP-LSSegment Routing/BGP Flowspec

LSP 基于FEC对报文的分类,实现了端到端的对IP报文封装,在每跳基于Label进行转发的单向虚电路,正如IP网络向Frame Rely,ATM, SONET/SDH 学习的初衷,MPLS把网络分为Core 和Edge两个部分,其基本想法是Edge设备封装各种需求,Core部分仅完成标签转发。

中国移动Zhengqiang Li先生分享成果

在全网通过Label的分发机制,从Edge节点通过Label替代目的IP地址,在网络的提供了转发平面的抽象。

此场景为ONOS南向接口开发。小组成员完成了BGP FlowSpec Download to FIB特性、BGP-LS SR扩展特性在ONOS控制器上的开发,与网络(采用华为SDN远程实验室提供的网络环境)进行互通测试等即定目标。该标准在IETF属于比较热门的技术,通过该技术兼容现网设备,利用BGP的成熟度,将SDN能力快速引入现网,从而加快SDN的部署。

MPLS的强大之处在于基于标签交换,开发了一系列服务。

PCECC

  • VPN服务:L3VPN,L2VPN,VPLS
  • TE:Traffic Engineering 服务
  • Multicast 服务

澳门新濠3559 10

其中最成功的要算部署相当广泛的L3VPN服务。其背后原因可能是三层网络隔离而出现的巨大市场需求。即使在没有L3VPN的互联网,IPsec,SSL VPN等技术也发展起来。

华为Dhruv Dhody先生分享成果

其他的VPN如VPLS,尽管有一定的使用。但由于其市场需求有限,且有一些MPLS网络共性的缺点和自身弱点,始终没有大规模实施。

该场景用ONOS南向插件进行开发,小组成员通过编程实现LSP标签更好的同步,增加了数据库版本,避免数据库在所有场景均完全同步。PCECC通过集中控制基于网络拓扑来进行路径计算并进行统一的标签分配,提升网络敏捷性及可扩展性。

MPLS 当年雄心勃勃,在IETF有多个WG,无数RFC在同时演进。但复杂套着复杂,最后很多内容变成曲高和寡的纸上文章。至少在能接触到的中国运营商和企业网层面无法大规模落地。

YANG元数据注解扩展

MPLS服务的共性弱点

澳门新濠3559 11

多层协议累加带来的复杂度和协议之间的配合问题

CiscoMahesh Jethanandani先生分享成果

以实现VPLS的网络为例,至少需要如下协议:

小组成员对ONOS编程实现了草案样例,对标准改进也碰撞出新的火花。YANG语言是主流的SDN控制器南/北向接口的建模语言,当前主要用来对NETCONF进行数据建模。YANG元数据注解扩展是对当前YANG模型工具的重要补充。针对不同工具自动生成一致的代码,该代码可跨平台、跨厂商使用。帮助运营商跨不同控制器建立应用,提升运营效率。

  • IGP - 最底层的PE的/32 路由
  • LDP - 用于外层标签,PE的寻址
  • BGP - 用于Internet服务,尽管不是VPLS必须的,但IP服务的BGP,其实也是运营商的标配。
  • MP-BGP - 用于topology发现和提供内层标签

Day2荣誉篇

当多层协议并存时,网络服务的脆弱性来自每台设备上的每个协议是否能正常工作。同时,不同协议之间的配合存在问题时,也可能导致问题,比如经典的LDP和IGP之间的同步问题。

【15:30】经过15个团队精彩分享之后,IETF 联合主席Barry Leiba公布了奖项。

另外VPLS自身也存在一些弱点,比如:

ONOS团队凭借出色的表现、创新的成果,在本次大赛设置的5个奖项中,斩获Best Progress in Hackathon、Best Feedback to WG和Most Important to IETF三顶桂冠。

  • 需要Full-Mesh
  • 在转发平面实现MAC地址 learning
  • 不支持CE的Multihoming

获奖团队部分成员合影

MPLS-TE

番外篇

TE最希望解决的问题是IGP路由协议相同的最短路径视角造成的流量过于集中在少量路径上,需要提高整个网络的利用率。因此TE需要建立和维护大量的端到端tunnel。维护这些tunnel的代价可谓不菲。而在分布式的网络架构下,TE始终没有解决好tunnel计算/维护/排障的问题,TE也局限在部分运营商网络内使用。

5种软饮料、15种不同口味的茶包、咖啡、牛奶、精美的甜点、新鲜的水果,为开发者提供体能和视觉的“加油站”。

当然我们经过了多年之后,我们也知道理想中的FEC不过是存在想象中的美好,现实中99.9%的报文仍然是按照目的地址进行转发。受限于芯片,设备,协议/标准化,设备,操作等诸多因素制约。

澳门新濠3559 12

通过对MPLS服务的简单分析,我们很容易看出,MPLS用Label较好的解决了转发平面的抽象,但并没有解决控制平面抽象。正是其控制平面的复杂性给网络带来的影响削弱了其部署范围。 控制平面的复杂性究其本质,还是每个协议各管一段,各满足一种需求造成的。要做VPN,需要L3VPN 或VPLS,要做流量工程,需要TE,要做QoS,需要IP or MPLS Qos 等等。 如果这些都要,你的设备是否都同时支持?你是否敢都部署?你是否愿意运维这张网络?相信大多数网工无论是运营商,集成商还是厂商背景的面对这些问题都一脸苦笑。

澳门新濠3559 13

所以很多技术很多年后,还是被称为Advanced Technology,而非普世应用。很多时候,泛泛的说,能否实现某个功能?能,但能的前提条件太多:网络设计考虑,大量配置的复杂度,设备硬件性能支持,多厂家互通时不同设备对相同feature的配置方法和缺省行为,互操作性和兼容性,排障的可操作性。

怎么样,够高大上吧?IETF Heckathon,期待与你下次重逢!

久而久之,能就成了个理论上的,理想化的说法。 而非实打实可以简单落地的能力。

关于ONOS

Segment Routing 是否是白衣骑士?

ONOS是一个满足运营商可靠性、高性能、高灵活度等性能要求的开源SDN操作系统, ONOS生态系统主要包括SDN创立者组成的ON.Lab以及全球领先网络运营商和网络通信厂商,包括AT&T、Verizon、NTT、SK、中国联通、Nokia、Ciena、Cisco、Ericsson、Fujitsu、华为、Intel以及NEC。在ONOS发展过程中不断有新的成员加入,包括大量技术创新公司和教育科研组织,目前成员已经超过60家。国内的北京邮电大学和SDNLAB也是ONOS的合作伙伴。ONOS是Linux基金会下的项目之一,Linux目前支持多个开源软件项目,促进项目之间的协调合作,推动业内的创新与发展。

这两年,SR横空出世,让人眼前一亮,很有些传统网络救世主的样子,SR有两个显著的优点超越了前一阶段的MPLS 相关协议。

本文转载自:

  • 确实是非常精巧的运用了MPLS和IGP协议,大幅度省略了对标签分发协议的需求。简化了协议和网络设计。
  • SR不负责路径的计算,只负责转发。中间node真正做到了仅基于Label转发,通过在头端设备的多层压栈把路径地图内嵌在数据包头。好似带着几个锦囊出发,每到一个关键节点,再打开一个锦囊,查看下一关键节点名字和路径。 SR因此超越了最短路径算法对报文的转发限制又无需维护繁琐的无数tunnel。SR更像一个航海大师,只要有明确的航线(路径)就能按照要求去航行。

但很明确的是,SR虽好,仍然需要有人去计算和设计路转发路径。谁更合适来做?显然是SDN。

SDN网络

控制平面和具体的网络设备解耦,是SDN最重要的特点。控制平面只有在解耦后才能形成强大的大脑,对千变万化的业务层需求进行适配和编排后,再用不同方式下发成设备的转发。毋庸置疑,控制平面是否集中,集中后又如何保持HA和对全网拓扑变化的快速收敛都是问题。

从这个层面看,控制平面集中与其说是SDN的特点,不如说是这个阶段SDN为了实现而付出的必然而且必要的代价。

从某个角度说:路由需要完成的内容主要是以下三项:

  1. 建立拓扑,相当于网络地图
  2. 传递不同Node的路由信息,相当于不同村庄的居民
  3. 根据不同需求,计算出的从甲地到乙地的路径

从这3点看,SDN天然比路由协议有优势。因为天然就有全网视图,因为天然就已知各Node的信息。因为对接业务编排,能够综合各种需求,进行全局的选路计算。但从落地情况看也不完全如此,主要是第1点,在拓扑变化时,SDN的收敛能力在现阶段不如传统路由协议快速有效。

网络服务 vs. 网络为你而服务

简单梳理完网络的三个发展阶段,我们可以比较清楚的看到网络的变化是从最初提供可达性的IP网络,到有基本网络分割服务的MPLS 网络,到以需求为中心,能够按需提供服务的SDN网络。

事实证明为每一种需求单独创造协议是行不通的,既增加控制平面的复杂性又不具有快速演进的能力。

网络一直被应用所诟病和抱怨的是,部署速度和同时满足多种需求的灵活性。网络越大就越趋近于简单,基础的可达服务,而非能为某个application,某个临时连接,或者某个重要用户提供的即时定制服务。提供这样服务的代价在设计层面是不可规模化的,在运维层面是全手工打造的,在排障层面是灾难性的。

如何让网络在更多维度,更细颗粒度上为上层工作,除了有统一的北向接口,能够用一个大脑理解拓扑,管理设备,设计路径是一切成为的可能的基础。

思科服务部门对网络生命周期有个定义,首字母连起来是PPDIOO 分别代表P(Prepare),P(Plan),D(Design),I(Implement),O(Operate),O(Optimize)。其中的前2个步骤Prepare和Plan主要从需求入手,依次明确战略,资源,关键任务,概念设计及里程碑等内容。从技术角度看可以归并到设计里。

ITIL 服务周期定义分为5个阶段,分别是

  • Service Strategy 战略
  • Service Design 设计
  • Service Transition 跃迁
  • Service Operation 运营
  • Continual Service Improvement 持续改进

同样从具体技术层面,可以把战略和设计合并为设计。

通常的网络实践经验来看,也可以总结为设计(含测试) - 部署 - 运维(含排障) - 优化四个阶段。

设计阶段

MPLS网络的设计阶段最终的产出物是做好测试验证的LLD(Low Level Design)。

通常在HLD(High Level Design)中明确基本布点,流量,互通,QoS等需求后要在LLD中进行量化和给出落地方案。

MPLS 网络的设计,简单来说重点就是路由协议+ 设备 = 配置。 因为需要支持多种协议,要做较多考虑。

设备层面:

  • 要测试验证不同厂商设备的协议兼容情况
  • 要考虑设备支持多种协议后的性能情况

协议实现层面

多种协议的并存情况下,各种单独设计之间是否有冲突。如起MPLS以后,不同厂商对QoS模型的缺省影响不同,需要手工配置一致。

SDN网络只需要考虑控制器的部署位置,网元设备的端口数量,一些必要的配套服务存在等几个基本条件即可。简化了网络设计。

澳门新濠3559,部署阶段

部署通常包括:

  • 分配和管理各种虚拟资源:IP地址段,VLAN,AS No. 等
  • 配置模板:基于配置文件分块后大致相同的配置内容通常集中配置好,或者做初始配置后,逐个设备单独登录配置。

MPLS-base网络即使有配置脚本,也需要有基于协议状态的复杂检查过程,才能确定网络部署正确。

相比而言,SDN的网络设备配置简单,通常可轻松的实现自动化,部分设备还可实现启动后自动部署,其本质也是因为网元设备和控制器之间的多对一关系实现的。

很难的一个事情是MPLS网络的设计加部署时间周期,把事情考虑周全了,测试验证做做,写写文档,1-2个月真不算慢的。加上设备到货,安装,没3个月以上是建不起来的。网络的搭建时间过长,这是大家都有体会也很无奈的一件事。从根上说,我理解问题还是协议/配置/设备三者之间的耦合关系过深。

运维阶段

监控,变更和排障是运维阶段的三大任务。

监控

从共性看,拓扑发现及变化,链路延迟,丢包,流量的监控,分析,告警。是两类网络都不可或缺的功能。

从区别看,MPLS网络运维需要监控多种路由协议的状态,因为是全分布式,每个协议在每个接口都可能有Peer,需要对多种状态进行监控或者事后的排障。底层故障对上层协议会造成相关影响,如何管理和屏蔽大量告警事件是挑战。

SDN有一点优势在于能更多的进行白盒监控,即通过对系统内部的性能指标进行监控了解系统的运行状态,因为从南向看,SDN只需要监控少数几种协议,监控相对简单,而面对业务变更更是随时随地API可以满足的。主要复杂度集中在控制平面和业务编排,监控也主要集中在控制平面健壮性,用户业务状况,以及控制和转发的一致性等方面。在大型网络里因底层链路故障导致的大量路径计算和重新优化会需要控制及时反应。面向最终用户的Web接口又会需要对各种请求和配置变更做出实时响应和分析。网络至此更大程度是一个复杂的计算和业务系统。

监控的高级阶段一是关联和联动底层数据,二是对用户数据进行挖掘。从这个层面看,两种网络都还有很长的路要走。

变更

如果说大量的长途故障来自于底层链路,属于推土机挖断光纤惹的祸,那变更产生的人为配置错误是则是故障的另一主要来源。变更的原因很多(软件升级,硬件更换升级,业务部署,结构优化等等),最终都会落实到调流量,改配置上。

网络部署后随着运维时间推移,各种不同业务需求对网络进行不同的要求后,很难再维护统一的配置模板了。各种临时的,非标的配置需求逐渐在不同设备上 生根发芽,枝繁叶茂。到最后,没有人去敢删除那些可能已经不用的临时配置。那些配置也就半永久的存在不同设备上。传统网络配置长在设备上,各种配置的来龙去脉又只有当事人清楚。时间一长,人,设备,需求的变化会导致配置和实际情况脱节,和现网运维人员脱节。随便说说,哪张网络没有一堆无法说清的Policy,一堆无法删除的ACL。

有一种说法是:当有了netconf+Yang后, 传统CLI被替代,也可以自动化。但实际情况是,不论Yang的推广和落地时间,就算所有厂商设备都通过Netconf接口可下发,但复杂配置的一致性,配置检查及检查后的配置删除回滚以及配置管理仍然是有挑战的任务。 所以配置下发的自动化 不= SDN,归根结底的问题是分布式复杂性过多和物理设备紧耦合造成。

SDN则基本摆脱了设备配置的问题。基础架构数据通过自发现和初始定义可以全部在GUI实现。业务数据通过GUI和API实现,软件升级时,控制平面的前端,后端,业务编排,底层控制器各组件既可以分别升级也可以统一升级。对转发没有明显影响。

排障

MPLS网络排障充分体现了网络的复杂性,对协议,厂商设备,具体配置,网络拓扑,排障工具的理解,运用和分析能力。排障时间对运维和生产网业务是有压力的影响。这反过来也影响网络设计时,有可能倾向于更保守的选择技术和设备。期望减少排障的难度。

SDN的排障更多需要和Devops结合,通过软件化手段解决。复杂永远不会消失,只会转移。传统网工面临的挑战之一就是原有在CLI上的排障手段和思路可能不适用在SDN上,是API还是其他软件工具。需要抱着开放心态,在运维过程中逐步的探索。

优化

网络的优化不是必然存在的,有时候,优化的潜台词是现有网络不能满足新的需求,需要设备部分更新换代才能实现新Feature来满足新的需求。

MPLS Base网络在优化时,前面的设计,部署,运维的麻烦还得重来一次。

SDN网络则基本就是两点

  1. 控制器集群的Scale-out 随网络规模扩大后的横向扩容
  2. 网元设备的Scale-out 横向扩容

综上所述,网络的运营想要搞好(故障率低,稳定,满足业务速度快,质量高),在SDN技术产生前,似乎必然需要一个属于精英俱乐部的网络队伍去完成这些内容。

  • 复杂的Design和完备的设备测试
  • 强悍的运维,7/24 随时Ready处理复杂故障
  • 强大的工具支撑
  • 严格复杂的变更体制和专业团队

运营商由于网络规模的原因,可以得到厂商或集成商最优先的支持,同时具有相当完备且聚焦网络运维的工程师团队。这也是为什么多年来最有实力的运营商一直是网络运维的翘楚。但反过来想想,这也是网络需要进步的一个证据,网络需要更简单,更灵活,更快的部署和适应业务,更方便和白盒化的监控性能。

SDN网络则基本在软件框架内解决了按业务所需的路径计算,南向接口的全部自动化,当然,SDN作为一种软件化的理念,必然面临更多软件问题直接影响网络的情况出现,网络部署和运维更多变成软件的部署和运维。所有软件会遇到的头痛问题,SDN都会遇到。

结语

啰里啰嗦说了不少,回头看下,很多是正确的废话。其实这么多年感受下来MPLS网络说到底存在很大的一个问题就是路由协议(路由策略),设备和配置之间的深耦合

  • 路由协议(路由策略)通过本地配置来实现
  • 配置在不同厂商设备上的实现不尽相同
  • 基于本地配置,内容复杂,多协议等原因,自动化和可编程的难度大,不彻底。

澳门新濠3559 14

SDN到底应该是如何实现和落地,这一两年已经开始很多实践方面的探索,大的愿景已经有了,但具体的落地和途径其实还是有很多争论的。 是沿着MPLS网络继续发展到SDN,还是从本质问题上更进一步做的更彻底些。还有待时间检验。数据网络已成为数据时代的风火水电,不同范围,不同规模,不同运营者的网络其具体发展技术路径和适用技术不尽相同,每一代网络的产生和占领市场都在其当时特定情况下符合逻辑。也许纯IP网络,MPLS-Based 网络和SDN 三者将长期共存,共同发展。

“未来已来,只是分布不那么平均”,我们可以相信发生在云计算上的事情,一定也会发生在网络上。按需,动态,资源池化,API化,高度自动化和灵活的业务抽象必将成为网络的主要特征。

【编辑推荐】

编辑:服务器运维 本文来源:IP网络作为承载互联网,并使用了华为提供的SD

关键词: