加速器墙将成为后摩尔定律的新问题吗?
实际上,我们每年都希望电子产品都能遵循这样的物理定律:人们可以以同样的价格得到能力更强的更好的产品。因此,当我们说摩尔定律不再适用于我们今天的产业发展时,这种影响是十分深远的。
"摩尔定律告诉我们晶体管的尺寸会缩小,并且我们可以将更多的晶体管集成在一个特定的区域中,从而具备更强的处理能力以及更低的成本。50年来,摩尔定律在这个行业中一直都十分有效,但如今这条定律已经很难再维持下去了。摩尔定律是有关密度微缩的速率,但我们正以一种可预测的速度走向尽头,再经过几个世代就会达到实体极限了。"
后摩尔时代的不适应性
整整50年来,计算机的底层元件都遵从着摩尔定律:在价格不变的情况下,集成在芯片上的晶体管数量每隔18到24个月将增加一倍,计算成本呈指数型下降。摩尔定律成就了各种技术变革,例如互联网、基因组测序等。
然而现在,摩尔定律的趋势第一次放缓了。芯片行业进入了一个不确定的时代,在同样的投入下,收益变得越来越低。芯片制造商面临的一个经济问题,相比与芯片体积,大多数人对芯片的价格更敏感,要求芯片要做到经济实用。随着晶体管尺寸的不断缩小,我们遇到了原子极限,先前标准、规则结构的晶体管结构已经无法维系。
发展决定算力需突飞猛进
在深度学习激发的人工智能热潮下,AI计算系统设计与优化的重要性愈发明显。同时算法的发展对整个计算需求所造成的挑战会变得更大,提高整个AI计算系统的性能与效率迫在眉睫。
人类的算力需求每3.43个月就会翻倍,每年大约增加10倍,这样的发展趋势将会继续。在未来,AI计算系统将要面临计算平台优化设计、复杂异构环境下计算效率、计算框架的高度并行与扩展、AI应用计算性能等挑战。事实证明,我们真正需要的是超过现在100万倍的计算能力,而不仅仅是几十倍的增长。
从计算需求来看,AI计算系统的设计与优化之路似乎任重道远。因此,推动AI发展的动力中,算力起到了最为关键的作用。算法是否有创新发展难以量化跟踪,而数据的巨大体量也难以计算,但算力是可以量化的,虽然使用大量的算力暴露出了当前AI算法不够高效的问题,但是,重要的技术突破依然必须在足够的算力基础上才能实现。
目前加速器芯片的类别
①GPU方面,形成了NVIDIA+AMD七三开的市场格局,NVIDIA深度打造应用场景生态,构建壁垒,而AMD作为同时具备CPU+GPU模块化能力的厂商,有望在云算力时代颠覆原有服务器芯片产业格局,成为最大赢家;
②FPGA方面,技术壁垒高,多用于军事领域,美国厂商垄断市场,国内处于渐进式突破阶段,份额还非常低;
③ASIC方面对下游细分领域需求量有较高要求,典型如区块链应用,国内厂商发展迅速,ASIC领域是国内厂商有望实现弯道超车的较好选择。
芯片专用化可能起到负面作用
芯片专用化,使得各类原本运行在通用CPU之上的软件及其内部常见算法得以在定制化硬件上带来更快的处理速度,被认为是摩尔定律失效之后,我们能够在接下来一到两代芯片当中继续驱动计算能力保持增长的一种方法。但它不会长时间奏效。根据行业专家预测,芯片专用化不能产生摩尔定律所能产生的那种收益,加速器的发展速度将放缓,而且这会比预期的更快发生。
研究人员评估了特定应用集成电路(简称ASIC)上的视频解码、GPU上的游戏帧速率、FPGA上的卷积神经网络以及ASIC上的比特币采矿。结果并不令人振奋:专用芯片的增益很大程度上取决于每平方毫米硅上可用晶体管数量的增加。换句话说,离开了摩尔定律,芯片专用化本身的力量是有限的。
多年来,芯片制造商已经使用了各种手段来跟上摩尔定律的步伐,包括增加更多的核心,驱动芯片内部的线程,以及利用各种加速器。然而更快更好的系统不仅需要通过处理器技术实现,还需要通过架构来实现。系统架构本身也面临着诸多挑战,特别是功率和密度,这也限制了性能。
加速器芯片使算力时代的高算力需求得以实现,云计算服务器的算力配置模式,将使得CPU+加速器的模块化能力成为未来主流,加速器芯片的竞争力以及模块化综合竞争力成为未来半导体产业竞争的重要因素。
后摩尔时代要摆脱惯性束缚
实际上,我们每年都希望电子产品都能遵循这样的物理定律:人们可以以同样的价格得到能力更强的更好的产品。因此,当我们说摩尔定律不再适用于我们今天的产业发展时,这种影响是十分深远的。
如果你无法轻松规划这些新方法,保持后摩尔定律时代18到24个月的增长率依然是徒劳的。生态系统中有CPU,但是如果你想利用CPU和其他加速器,你需要开放的方案。有些人采用专门的方案,这很有用,但成本高昂。
要想在后摩尔时代的世界保持继续进步,需要半导体行业与不同的制造商、学术界进行工程合作,创造易于编程环境的开放标准。相信公司可以添加更多晶体管,并能管理成本曲线。将这一切结合起来,也许它真的能够促进计算进一步加速。