Nvidia发布顶级计算卡 Tesla V100!

在GTC 2017大上,NVIDIA正式发布了史上最强大的“核弹”–旗舰计算卡Tesla V100。Tesla V100是基于Volta架构的产品,内置了5120个CUDA单元,核心频率为1455MHz,搭载16GB HBM2显存,单精度浮点性能15 TFLOPS,双精度浮点7.5 TFLOPS,显存带宽900GB/s。此外,Tesla V100还增加与深度学习高度相关的Tensor单元,Tensor性能号称可以达到120 TFLOPS。

Nvidia 发布顶级计算卡 Tesla V100!
黄仁勋

  如此“堆料”让Tesla V100拥有超过210亿个晶体管,核心面积达到了创纪录的815平方毫米,采用的是12nmFFN工艺制造(其实是16nm深度改良)。

Nvidia 发布顶级计算卡 Tesla V100!
V100计算卡

  作为对比,上代旗舰Tesla P100不过只有3584个CUDA核心,拥有153亿个晶体管,核心面积610平方毫米(16nm FET+工艺)。同时,Tesla V100的二级缓存及寄存器大小也有所增加,L2缓存由Tesla P100的4096KB增加到了6144KB,每组SM单元的寄存器文件大小总数从14336KB增加到了20480KB。

Nvidia 发布顶级计算卡 Tesla V100!
核心架构

  NVIDIA表示,Tesla V100将首先用在用于深度学习超算DGX-1上,内部拥有8张Tesla V100计算卡,峰值计算性能高达960 TFLOPS,号称用8个小时就能完成TITAN X八天的工作量。

Nvidia 发布顶级计算卡 Tesla V100!
Tesla V100渲染图

  价格方面,DGX-1的售价为14.9万美元,约合人民币102万元。

Nvidia 发布顶级计算卡 Tesla V100!

原文链接

Nvidia 发布顶级计算卡 Tesla V100!

更多推荐

百度李彦宏:AI时代的从业者需要有跨界整合能力

深度学习算法可以去掉视频的缓冲轮,观看速度将变得更加流畅

李飞飞:全球AI人才稀缺,人工智能的发展可能还不及牛顿时代

OpenAI开发的分级强化学习算法旨在解决高级操作

麻省理工学院试图让人工智能学会“吓人”

本文为ATYUN(www.atyun.com)编译作品,ATYUN专注人工智能

请扫码或微信搜索ATYUN订阅号及时获取最新内容

猜你喜欢

转载自blog.csdn.net/whale52hertz/article/details/86629180