DDR,GDDR,HBM的进化和区别

DDR就是双倍速率。

  • 1600MHz的内存条为例,X64的位宽,带宽就是:1600MHz*2倍速率*64bit/8/1000=3.2*8=25.6GB/s;
    • 8ChannelIntel ICX处理器为例,带宽可以达到8*25.6GB/s=204.8GB/s
    • 8ChannelAMD ROME处理器为例,带宽可以达到8*25.6GB/s=204.8GB/s
  • 1333MHz的内存条为例,X64的位宽,带宽就是:1333*2倍速率*64bit/8/1000=2.666*8=21.328GB/s;
    • 6ChannelIntel SKL处理器为例,带宽可以达到6*21.328GB/s=127.968GB/s

 

GDDR可以做到四倍速率。

  • 1750MHz的内存为例,单个颗粒X64的位宽,带宽就是:1750MHz*4倍速率*64bit/8/1000=7*8=56GB/s
    • Nvidia Geforce GTX 1080 Ti为例,使用了11GBGDDR5X,内存时钟是2750MHz4倍频,内存频率是11GHz,内存位宽是X352bit,那么内存带宽为:2750MHz*4倍速率*352bit/8/1000=484GB/s
    • Nvidia Geforce RTX 2080 Ti为例,使用了11GBGDDR6,内存时钟是3500MHz4倍频,内存频率是14GHz,内存位宽是X352bit,那么内存带宽为:3500MHz*4倍速率*352bit/8/1000=616GB/s

优点是带宽比较高,功耗比较低。

缺点是,适合并发,不适合随机访问;时序复杂,工艺要求高;不适合配合CPUCache line的读取。

 

HBM双倍速率,但是堆叠提高位宽。

2013年是HBM2016年是HBM2

优势在堆叠,通过TSV和基底通信

每个die2128bit位宽的Channel

4层堆叠叫做4-Hi,带宽可以达到4*2*128=1024bit

  • HBM500MHz的内存为例,单个颗粒的带宽可达到:500Mhz*2倍频*2Channel*128bit*4Die/8/1000=1GHz*1024bit/8=128GB/s
  • HBM2时钟加倍,以500MHz的内存为例,单个颗粒的带宽可以达到2*128GB/s=256GB/s

Nvidia Tesla V100S为例(GPUHBM之间使用硅中介进行2.5D的封装)

应当是使用了4颗,带宽为:1107MHz*2倍频*4096bit/8/100=1113.568GB/s

HBM的优势封装比较小,堆叠设计。缺点是TSV工艺造成成本比较高。


万事走心 精益求美


原文地址:https://www.cnblogs.com/kongchung/p/11955514.html