在当今的网络市场,不论是超大规模的云数据中心、HPC集群,还是企业网络,80%以上的网络设备中所用的都是Broadcom的交换芯片。在2019年,Broadcom的三大主要网络芯片产品线都有了不小的进展。Broadcom先是在2月份正式出货Jericho 2芯片,紧接着在6月份发布了Trident 4芯片,而在年底的12月初又推出了Tomahawk 4芯片。持续而稳定的芯片迭代节奏,使得Broadcom牢牢地巩固了其在网络领域的霸主地位。
Broadcom首款7nm交换芯片Trident 4
作为一家在上世纪90年代初期成立的公司,Broadcom最开始是为电缆调制解调器和机顶盒提供芯片。1999年1月,在以1.04亿美元收购了Maverick Networks公司后,Broadcom才走上了为数据中心交换机和路由器提供芯片的道路。时至今日,在Broadcom的产品线中,仍然有以Maverick命名的一个芯片系列。在2002年9月,Broadcom又以5.33亿美元的价格收购了Altima Communications公司。在当时,Broadcom已经开始为数据中心网络设备提供自研的ASIC芯片,但这些芯片只能提供相当简单的二层网络交换特性。因此,来自Maverick的网络芯片仍然属于Broadcom的高端产品,这些芯片同时提供二层交换和三层路由功能。Altima所开发的网络芯片主要用于SMB局域网设备上,虽然无法提升Broadcom的技术实力,但为Broadcom带来了更多的网络产品客户、一群有网络芯片设计经验的工程师和不少网络芯片相关的专利。
在本世纪初的那几年里,数据中心还只有中等规模,远远没有达到超大规模水平;公有云还只是人们所讨论的公用计算(utility computing)和网格计算(grid computing)内容里的一个话题。但此时数据中心对刀片服务器的抛弃,使得Broadcom开始更认真地看待交换网络。Broadcom发布了一系列针对10Gbps速率以太网交换机的芯片,不过当时Broadcom并未给予这些芯片特定的命名(codename)。在2007年,Broadcom发布了Scorpion芯片,提供24个10GbE或40GbE网络端口,聚合带宽达到1Tbps。就在这款芯片发布的前一年,Amazon刚刚推出了公有云,数据中心的规模呈现出爆炸性的增长态势,这为Broadcom商用交换芯片的发展提供了强大助力。于是在2009年12月,Broadcom以1.78亿美元的价格收购了专门从事数据中心高端交换芯片开发的Dune Networks公司。这一收购为Broadcom带来了代号为Jericho的系列产品,Broadcom最终将这一产品线命名为StrataDNX。Jericho芯片用于开发具有深度包缓存的交换机,是Broadcom商用交换芯片里最核心的产品,契合了超大规模数据中心和云厂商对其网络骨干节点的需求。
由Broadcom Jericho2(88690)和FE9600(88790)构建的交换系统
在2010年Broadcom又推出了Trident产品系列,瞄准了需要更多网络协议特性和带宽,但不需要深度包缓存的企业市场。相比于Cisco、Juniper等网络设备厂家当时在用的一些芯片,Trident系列产品极大地增加了Broadcom的商业价值。在2014年Broadcom又推出了Tomahawk产品线,这一类产品剔除了超大规模数据中心和云厂家不需要的一些网络特性(网络协议),但却增加了路由功能和大表项,并且在端口速率上直接从25Gbps起步。
Broadcom三类芯片的发展方向
通俗的来说:
l Tomahawk属于“傻快”型,拿来做高端数据中心交换机;
l Trident属于“智商”型,拿来做高端企业级/园区级交换机;
l Jericho属于城府型,拿来做城域汇聚交换机/路由器;
到了2019年,Jericho 2芯片已经可以提供9.6Tb/s的聚合带宽、24个400GbE端口、拥有基于HBM的深度包缓存。Trident 4芯片已经可以提供12.8Tb/s的聚合带宽、32个400GbE端口或128个100GbE端口、采用PAM4(脉冲幅度调制:Pulse Amplitude Modulation)技术使单链路速率提升到50Gbps,含有210亿个晶体管的这块芯片成为了Broadcom首款采用7nm技术的芯片。至于刚刚发布的Tomahawk 4芯片,在使用7nm工艺的同时,进一步将芯片上的晶体管数量提升到310亿个,能够提供的端口数量翻倍提升到64个400GbE。Broadcom让Trident 4和Tomahawk 3芯片做到了管脚兼容,由于SERDES数量的增加,Trident 4无法再与Tomahawk 4管脚兼容,但下一代的Trident 5说不定可以做到这点。
Tomahawk芯片的发展历程
随着超大规模数据中心对网络扁平化的追求,Tomahawk系列芯片对互联网厂家的吸引力越来越大,其发展速度也越来越快。在2014年发布的第一代Tomahawk芯片使用的还是TSMC的28nm制程,只有70亿个晶体管,只能提供128个长距SERDES,运行在25Gbps NRZ速率上。而现在的Tomahawk 4芯片已经可以提供512个长距“Blackhawk”SERDES,运行在50Gbps PAM4速率上。Broadcom实现了1.5年-2年性能翻倍的迭代速度。
另外值得一提的是,不论是StrataXGS还是StrataDNX产品线的产品,Broadcom都采用了单一硅片、7nm工艺的设计方式,而没有采用目前在CPU领域非常流行的Chiplet设计方法。使用单硅片的设计方式有利于功耗和性能,但在单一芯片上集成310亿个晶体管,对芯片容错性的设计会有非常高的要求。
Tomahawk 4芯片带来的网络结构扁平化
Tomahawk 4芯片的推出有助于进一步使网络结构扁平化、降低芯片成本和减少网络时延。在使用Tomahawk 3芯片的情况下,如果想达到25.6Tbps的聚合带宽,需要使用6片交换芯片。位于下部的4片Tomahawk 3芯片,每片需要拿出6.4Tbps带宽用于连接上一级的两个交换芯片,剩下的6.4Tbps带宽(64个100GbE端口)用于和下端的服务器连接,这样才能构成一个无阻塞的网络系统。
当使用Tomahawk 4芯片的时候,一切都变得简单了。一片Tomahawk 4芯片就可以提供25.6Tbps的聚合带宽,替代了之前6片Tomahawk 3芯片构成的网络系统。Broadcom给出了一款使用Tomahawk 4芯片的2U盒式交换机设备的原型图,使用QSFP-DD接口和1分4电缆,这款2U盒式交换机就可以直接与服务器相联。由于减少了芯片的使用量,按Broadcom的说法,整体成本将会降低75%。当然,就Tomahawk 4芯片本身来说,其售价必然会比Tomahawk 3更高。
Tomahawk 4芯片带来的网络跳数和延时的减少
除了带宽和成本,使用基于Tomahawk 4芯片的交换机之后,网络延时也将会有明显减少。在由基于Tomahawk 3芯片的交换机构成的网络中,服务器对NVMe存储介质的访问至少要经过3跳(hop)。但使用基于Tomahawk 4芯片的交换机之后,只需要1跳(hop)就能够实现数据的访问。按Broadcom的说法,网络延时将会减少60%左右。对用户而言,这将体现在更快的业务响应速度上。
使用TomaHawk3芯片的阿里自研128个100G端口交换机
Broadcom的Tomahawk 3芯片已经在阿里、腾讯、京东、今日头条,甚至Facebook、微软Azure的数据中心网络设备里大量应用了,在2019年的云栖大会上,阿里就展示了其自研的128个100G端口交换机。Tomahawk 4芯片的推出必然会在未来的3-4年里推动这些大型互联网公司数据中心架构的进一步升级。
而随着5G网络建设的全面铺开,运营商的骨干网和各类企业网也必然会有不同程度的升级,这两块市场则是Jericho 2芯片和Trident 4芯片大展身手的好场合。
总 结
虽然网络领域不时会有新公司冒出,如Barefoot(已被Intel收购)、Innovium(也推出了12.8Tbps交换芯片)等,甚至Cisco在前不久还宣布将出售自研的交换芯片。但在短期来看,Broadcom的领导者地位还无人能够撼动。在Tomahawk和Trident均升级到第4代产品的时候,我们最值得期待的恐怕就是2020年基于这些芯片的交换机推向市场了。
推荐阅读:
400G交换进入新时代:Broadcom正式发布Tomahawk 4芯片
Broadcom首款7nm交换芯片Trident 4正式发布
图片来自网络,版权归原作者所有
本文仅代表作者观点,与就职单位无关。