NVIDIA Tesla A100安培OctaneBench渲染性能曝光,9月有望发布RTX 30系列
虽然NVIDIA已发布了Ampere“安培”架构和相关加速卡产品,也公布了其运算性能,但我们始终还没有看到Ampere安培的真正实力。现在,来自全球*级的渲染公司OTOY的CEO,首次曝光了基于Ampere“安培”架构打造的Tesla A100加速卡在应用场景下的性能表现。
NVIDIA Tesla A100在OctaneBench渲染测试中,达到了446分,这是目前为止该测试应用最高的分数,比现有图灵架构产品快了43%左右。已知目前图灵架构下的GRID RTX 8000在该测试中得分是328分,可见其的强大。
其实,Tesla A100加速卡并非完整的安培核心,核心被砍掉了20组SM,也就是108组SM,所以内包括6912个FP32 CUDA核心。不过需注意的是,它还有独立的3456个FP64(双精度)CUDA核心和432个Tensor Cores核心。
官方给出的理论性能是,单精度浮点计算能力可提供约19.5 TFLOPS,而双精度为9.7 TFLOPS算力。而在Tensor Float(TF32)单精度高达156 TFLOPS,这是因为新架构升级拥有第三代Tensor核心,可以让Tensor Cores在没有改动代码的情况下提高20倍的单精度性能。另外,新的Tensor Cores还加入了针对双精度浮点支持,相比Volta GV100性能提升2.5倍。
另外,Tesla A100配备了40GB超大容量HBM2E显存,拥有6144 bit超级带宽,总带宽高达1.6TB/s。如果是NVLink技术双卡的话,能够提供最高600GB/s带宽,支持PCIe 4.0,最高数据传输速度提升到了64GB/s。
对于普通消费者而言,其实这种加速卡几乎没有什么意义,不少玩家其实更关心RTX 30系列。据业内人士最新透露,Q3季度NVIDIA确定会推出基于安培架构的桌面消费级显卡,时间大概在9月内,首发确定有RTX 3080和RTX 3080 Ti两款。