国足征召10名新人入队,更新换代( 四 )


半导体技术尽管已经发展了几十年 , 相关产业也早已成熟 , 但是升级半导体工艺和架构技术却是越来越难 , 半导体工艺进入10nm以后升级速度明显放缓 , 难度和开发成本剧增 , 就连英特尔的10nm工艺也难产好几年 , 放到手机处理器上也是如此 , 这一点仅仅从主流手机芯片的核心数量和频率就能看出来 , 每一年虽说都在换代 , 但是提升并不是很大 。
为什么GPU每一代的更新性能上都有「重大突破」 , 而CPU近年来的更新换代被视为「挤牙膏」?
首先 , 我们不能被手机SOC吹上天的7nm、5nm、3nm带跑偏了 。栅极宽度代表的工艺制程nm数并不能代表一切 。举个例子:台积电的7nm和英特尔的10nm名义上差一代 , 实际上半斤八两 。英特尔10nm一个单位占面积54*44nm , 每平方毫米1.008亿个晶体管;而台积电7nm一个单位占面积57*40nm , 每平方毫米1.0123亿个晶体管 。
两者并没有代差 。芯片的性能要从晶体管密度、栅极间距、最小金属间距、鳍片高度、栅极长度等指标来看 。CPU并不是一成不变它也一直在突破1、高性能计算领域比如英特尔的AVX-512是一组能够针对各种工作负载和用途(例如科学模拟、金融分析、人工智能 (AI)/深度学习、3D 建模与分析、图像和音频/视频处理、加密及数据压缩)提高性能的新指令 。
借助多达两个512位融合乘加 (FMA) 单元 , 应用程序在512位矢量内的每个时钟周期可打包32次双精度和64次单精度浮点运算 , 以及八个64位和十六个32位整数 。2、云服务和数据中心英特尔为云服务提供了从底层硬件到系统软件虚拟化的全套支持 , 而CPU性能的进步 , 单芯片核心数提升 , 功耗降低 , 让云服务得以爆炸式的增长 , 虚拟化技术让云服务使用更加便捷安全 。
3、个人应用英特尔的6核本来是打算用在10nm桌面平台 , 被AMD逼得提前献祭出来 。有市场竞争的关系 , 但架构改进 , 功耗控制等确实比以前好了 。另外 , 看看现在的笔记本续航和性能 , 还觉得挤牙膏只能说要求过高了 。GPU的“重大突破”1、GPU的“重大突破”一部分要归功于工艺制程的提升集成电路一直都是根据摩尔定律发展 , 每2年左右晶体管数量翻倍 。
显卡架构本身并行扩展性非常好 , GPU的流处理器个数成倍的增长 , 就会出现所谓的“重大突破” 。其实这是制程工艺升级换代的必然结果 。随着工艺制程的提升 , CPU也在突破 。比如:每代志强CPU核心数量平均提升30% , 性能至少提升50% 。所以这个重大突破的头衔 , 送给芯片代工厂家更合适 。2、GPU的“重大突破”一部分要归功于架构的调整举个例子:NVIDIA的CUDA演进了这么多年了 , SMX/SMM数目组合不断调整提高效率 , SM内部的CUDA核心的单双精度浮点计算配比、寄存器缓存大小、存取单元个数、指令缓冲区大小、 warp调度器重新设计等一直在变 , 并且是面向应用的要求而变 , 迎合市场需求 , 显得很受欢迎 。
Maxwell架构阉割双精度单元 , 大幅降低功耗 , 让单精度性能大幅提升 , 改进SM效率变高 , 实现制程不变功耗降低 , 单精度性能提升的壮举!(游戏主要看单精度浮点计算性能)Pascal架构制程从上一代的28nm跃迁到16nm , 相当于一次跨越了两代制程工艺 , 再加上架构继续改进 , 缓存变大 , 新的工艺使得功耗大大降低 , 频率拉高 , 上一代阉割的双精度单元也加回来了 , 从而实现了性能重大突破 。

推荐阅读