Achronix对国产FPGA发展的启示

https://zhuanlan.zhihu.com/p/68379506

在全球范围内,FPGA行业的主要市场份额常年被赛灵思和英特尔两家公司牢牢掌握。随着时间的积累,这两家公司逐渐构建起一道由上万件核心技术专利组成的“护城河”,而这条护城河也成功阻止了很多FPGA公司进一步发展的脚步。一些存活下来的公司,比如Lattice和Microsemi,往往只能靠剑走偏锋,专攻低功耗、航空航天等特殊的应用领域。

然而,今年5月底,一家名为Achronix的美国公司发布了一款名为Speedster7t的FPGA产品,主打高速网络传输、机器学习加速等领域。这些应用场景既属于FPGA的传统优势项目,也包含了近年来正在蓬勃兴起的FPGA全新应用。很明显,Achronix公司就是要借这款产品和赛灵思与英特尔等巨头FPGA公司正面对决。

 

这家名字有些拗口的公司成立至今已有15年。在这些年里,Achronix从无到有、从小到大,逐渐发展起来,并在今天有了和巨头FPGA公司一决高下的底气。在接下来的文章中,老石将具体分析Achronix最新FPGA的性能特点,以及它的发展历程对于我们国产FPGA行业有哪些启示。

 

Achronix是谁

Achronix公司成立于2004年,总部位于美国硅谷的Santa Clara,在印度设有研发中心,在深圳也设有分支机构。虽然距成立至今已有15年时间,Achronix目前仍然是一家私人公司,外界猜测其总融资金额大概在1.8亿美元到2亿美元之间。

值得注意的是,Achronix已于2017年第一季度实现盈利,其季度营收也由2016年第四季度的500万美元,一年后跃升至4000万美元,并成为当时世界上发展速度最快的半导体公司之一。

Achronix近年的飞速发展一方面得益于FPGA技术本身的不断广泛应用,另一方面得益于它自身的技术进步。有意思的是,作为无晶圆厂芯片公司,Achronix曾由英特尔代工,发布了世界上首个基于FinFET技术的FPGA,甚至早于赛灵思以及后来被英特尔收购的FPGA第二大厂Altera。Achronix的这款FPGA,也是英特尔代工制造的首个FPGA

除了“传统”FPGA芯片产品之外,Achronix还是目前主要的嵌入式FPGA(eFPGA)的主要IP提供商,见下图。在之前的文章曾经介绍过,包括Facebook在内的一些大型互联网企业据信也是Achronix的eFPGA IP的主要或潜在客户。

图片来自Achronix

 

与传统FPGA相比,eFPGA的最主要特点是能将可编程逻辑单元与其他ASIC IP整合到同一款SoC中,在缩小芯片面积的同时降低系统功耗,如下图所示。关于eFPGA的更多内容,有兴趣的读者可以查看老石之前的文章,《啥是eFPGA》,在本文不再赘述。

 

图片来自Achronix

 

Speedster7t:对标Agilex和ACAP的全新FPGA

今年五月底新发布的Speedster7t系列FPGA,应该算是Achronix的技术集大成者,这也给了Achronix叫板赛灵思和英特尔的信心和勇气。事实上,这款FPGA的确有不少让人眼前一亮的技术特点值得我们关注。

(图片来自Achronix)

 

在工艺制程方面,Speedster7t将基于台积电的7纳米工艺制造,这与赛灵思的“ACAP”芯片使用的是相同的制造工艺。由于台积电的7纳米工艺与英特尔的10纳米工艺属于同代,因此Speedster7t在工艺制程上和英特尔的旗舰FPGA“Agilex”相比不落下风。

在芯片架构方面,Achronix的这款FPGA最大的特点之一就是采用了遍布芯片的2D片上网络技术,这与赛灵思的ACAP再一次不谋而合。

片上网络技术(NoC)是当前为了应对带宽瓶颈而逐渐兴起的重要技术,在老石之前的文章中曾多次提及。特别是在高速网络应用中,如5G、数据中心网络等领域,已经开始需要FPGA线速处理高达400Gbps的以太网流量。如果使用传统的设计方法,需要1024位宽的数据总线,并运行在724MHz的时钟频率下才能满足带宽要求。此外,可编程逻辑单元往往需要从芯片的不同位置传输数据,包括片上和片外的存储器、以及特定的硬件加速模块,如机器学习加速器等等。为了在片上进行大量数据传输和搬运,必须采用全新的片上网络NoC技术。

在Speedster7t上采用了横向和纵向的2D片上网络,并使用256位宽的AXI总线实现,运行在高达2GHz的频率下,从而提供单路512Gbps、总共20Tbps的片上网络带宽。

除了满足带宽要求,通过使用片上网络还能将片上逻辑单元划分成相对粗粒度的区域,从而极大降低布局布线算法的复杂度,也能提高时序收敛的速度。老石相信,片上网络技术将会是未来FPGA架构发展的一个重要方向

此外,Speedster7t上集成了多个机器学习处理器(Machine Learning Processor – MLP),它可以支持不同定点数及浮点数的运算操作,如下图所示。此外,这款FPGA还能在片上最多集成300Mb的内存单元,以满足人工智能和机器学习相关应用的实现。虽然片上内存的容量距离赛灵思UltraScale+系列高达500Mb的片上内存还有一定差距,但已经和英特尔Stratix10系列FPGA的片上内存容量差不多。

图片来自Achronix

 

除了片上网络和机器学习处理器之外,Speedster7t还集成了很多高速接口,如PCIe Gen5、GDDR6、112Gbps SerDes等等,本文不再详述。欲获取这款FPGA更多的技术信息和资料,请在知识星球“老石谈芯-进阶版”查看。

 

Achronix的发展历程对国产FPGA的重要启示

Achronix历时15年的发展,从无到有,从小到大,直到今天能和两大FPGA巨头公司一较高下,这其中有着很多值得我们国产FPGA公司借鉴的启示和经验。

首先,技术的发展没有捷径,不要过分迷信“弯道超车”。Achronix的技术积累并非一蹴而就,而是需要长达十几年的时间不断沉淀和创新。特别是对于专利壁垒极高的FPGA产业,不论是芯片架构、关键IP、高速接口等芯片硬件设计,还是FPGA设计工具和生态系统建设,都不太可能通过一次次“弯道超车”实现。只有不断在正确的赛道上积累和加速,才能像Achronix那样,有朝一日在主流舞台和那些主要玩家们同场竞技。

第二,拥抱新技术、新方向。正如前文提到的,在Achronix的新一代FPGA上采用了片上网络技术、机器学习处理器等诸多新技术,这些技术只有在赛灵思和英特尔的最高端FPGA中才有使用。这正说明了FPGA公司拥抱和使用最新技术的重要性。FPGA的发展一直遵循摩尔定律,而这些新科技和新方向,也使得FPGA将摩尔定律不断延续。

第三,离开“舒适区”,敢于对决的勇气。和Lattice、Microsemi等其他FPGA公司不同,Achronix选择在人工智能、高速网络处理等领域和传统FPGA巨头硬刚,其自信和勇气就着实令人佩服。对于我国的FPGA公司,也应该努力走出自己的传统业务领域,向不断蓬勃涌现的新兴FPGA应用领域发起冲击。

 

结语

不积跬步,无以至千里。在人心浮躁、技术虚无,人人造芯、但不知芯为何物的今天,老石认为,文中这家公司十几年的坚守和奋斗应该能够给予我们一些启示。


注:本文仅代表作者个人观点,与任职单位无关。)

本文系老石原创,如需转载请先联系老石获取授权。

关注公众号“老石谈芯”,看更多原创芯文、芯情、芯事

更多芯片与FPGA技术解读,欢迎加入知识星球:“老石谈芯-进阶版”,一个关乎技术与观点的互动社区

原文地址:https://www.cnblogs.com/ztguang/p/15170192.html