计算显卡对比

科学计算显卡的几个主要性能指标:
1、运算能力:FLOPS 每秒浮点运算次数,TFLOPS表示每秒万亿(10^12)次浮点计算;
2、计算性能: 
3、显存大小:显存大小也决定了实验中能够使用的样本数量和模型复杂度。
4. cuda 核心数量
 
1、CUDA compute capability对比(computer capability 并不代表显卡的计算能力,主版本号说明GPU的架构,副版本号相当于更新的版本)
    GTX Titan x :5.2
    GTX 980      :5.2
 Tesla P100 :
    Tesla K80    :3.7
    Tesla K40    :3.5
    K4200         : 3.0
 
2、计算性能(TFLOPS) 比较
                                单精度single        双精度double
 
    GTX Titan x :     7                            0.2 
    GTX 980      :      4.6                        0.15
      Tesla P100 :      10.6                     5.3
    Tesla K80    :      8.73                      2.91 
    Tesla K40    :      4.29                      1.43
    K4200         :       2.0
 
    单精度能够保证小数点后6到7位计算准确(2^23),双精度则是14到15位(2^52)
 
3、显存大小
 
    GTX Titan x :12Gb
    GTX 980      :4Gb
     Tesla P100 :  16G
    Tesla K80    :24Gb
    Tesla K40    :12Gb
    K4200         :4Gb
 
4. cuda 核心数量
    GTX Titan x 
    GTX 980    
    Tesla P100 : 3584
    Tesla K80    : 4992
    Tesla K40    : 2880
    K4200      
 
5、价格比较(网上商城京东淘宝报价)
    GTX Titan x :8000+-
    GTX 980      :6000+-
    Tesla P100    : 45000++ 
    Tesla K80    :33000+-
    Tesla K40    :25000+-
    K4200         :6000+-
 

1、GTX 系列显卡优缺点:

    优点:单精度计算能力强大,显存最大12Gb,性价比高
 
    缺点:双精度计算能力弱,没有计算纠错ECC 内存,对于超高精度计算不利
 
2、Tesla 或 quadro显卡优缺点:
    优点:双精度计算能力最强,拥有ECC内存增强计算准确率,
 
    缺点:单精度计算能力差,价格较高
 
总结:单从性能上选择,Tesla K80是最强大的,但也最贵;综合性价比来考虑 GTX Titan X 最好。
 
 
 
原文地址:https://www.cnblogs.com/cofludy/p/7356383.html