显卡 3090 vs v100 - 代码天地

显卡 3090 vs v100

编程语言 2024-11-02 18:21:05 阅读次数: 0

1.3090

Date: 2020 Ampere
Pielines/ Cuda cores: 10496

2.V100

Date: 2018 Volta
Pielines/ Cuda cores: 5129

3.结构 & Core比较:

v100优点:
- v100功耗小
- v100较快的双精度(fp64)和混合精度(fp16+fp32)
- pcie版的NVLink与2080ti完全一致
v100缺点:
- 不支持整数格式计算，即INT4、INT8, 即无量化推理能力, 除非上turing架构
- 不支持半精度的bf16, 只支持fp16 (bf: Google brain floating point format, 可加快训练速度)
- 不支持单精度fp32
- 不支持awq量化、支持gptq量化
- 不支持flash-attention、支持vllm

4. 理论性能(Theoretial Performance)

- 3090 vs. A100					NVIDIA RTX 3090    		NVIDIA A100 40 GB (PCIe)     Difference
- FP16 (half) performance    		35.58 TFLOPS    		77.97 TFLOPS    			 42.39 TFLOPS (119%)
- FP32 (float) performance    		35.58 TFLOPS    		19.49 TFLOPS    			 16.09 TFLOPS (-45%)
- FP64 (double) performance    		556 GFLOPS    			9746 GFLOPS    		 		 9190 GFLOPS (1653%)
- Pixel Rate    					189.8 GPixel/s    		225.6 GPixel/s    			 35.8 GPixel/s (19%)
- Texture Rate    					556 GTexel/s    		609.1 GTexel/s    			 53.1 GTexel/s (10%)

多类N卡比较

4.性能详细对比

在这里插入图片描述

Reference

https://technical.city/en/video/GeForce-RTX-3090-vs-Tesla-V100-PCIe-32-GB
https://zhuanlan.zhihu.com/p/667255235
https://bizon-tech.com/gpu-benchmarks/NVIDIA-RTX-3090-vs-NVIDIA-A100-40-GB-(PCIe)/579vs592
https://www.bilibili.com/read/cv33373992/?from=readlist

猜你喜欢

转载自blog.csdn.net/disanda/article/details/142799145

显卡 3090 vs v100

显卡性能对比：P100、RTX3090、A40、A100、A800、H100

【2021】3090挖矿算力，3090挖矿收益，3090显卡算力

世上最全NVDIA GPU参数列表： V100， A100， A800，H100，3090，4090， A40， A30等性能参数

NVDIA各型号GPU性能与参数列表： 3090，4090，A40，A5000，V100性能参数对比

【docker】3090显卡对应docker中cuda版本

RTX 3090 Ti 正式发布！30系列显卡的封顶之作！

3090显卡安装cuda11.3 （Windows10）

A5000 VS 3090，谁更强？

(四)PaddlePaddle支持RTX30系列显卡(3070、3080、3090)，支持CUDA11.0/11.1/11.2，cuDNN v8.0.5/v8.04

【显卡】AMD和Nvidia显卡系列&相关对比（A100 vs RTX4090）

vs 开发 qt 遇到无法找到 Visual Studio 2010 的生成工具(平台工具集 =“v100”) 解决方案

Nvidia 系列显卡大解析 B100、A40、A100、A800、H100、H800、V100 该如何选择，各自的配置详细与架构详细介绍，分别运用于哪些项目场景

A100 vs H100 vs 4090：百张显卡实测深度学习性价比

【PyTorch】切记：GeForce RTX 3090 显卡仅支持 CUDA 11 以上的版本！

英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择，含架构技术和性能对比带你解决疑惑

显卡缺货终于到头了：4000多块可得3070Ti，比原价便宜2000块拿下3090Ti

【环境】Linux下Anaconda/ Miniconda安装+百度Paddle环境搭建+Cudnn（3090显卡+CUDA11.8+cudnn8.6.0）

L20 实测，3090 vs L20 孰强孰弱？

POJ 3090

显卡

Nvidia发布顶级计算卡 Tesla V100!

A30、V100性能测试对比报告

Ubuntu+Tesla V100环境配置

V100架构深度优化指南

比黄金更贵的显卡，疯狂H100

本周AI热点回顾：GPT-3开始探索付费使用；这个视频「橡皮擦」让你瞬间消失;英伟达最强消费级显卡RTX 3090出炉...

使用autodl服务器，两个3090显卡上运行， Yi-34B-Chat-int4模型，并使用vllm优化加速，显存占用42G，速度23 words/s

海思Hi3519AV100╱Hi3556AV100 V100 安全启动 secure boot

HI3559A V100拥有极为出色的图像处理能力

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)