双卡 RTX 5090 深度体验：AI 推理框架选择与性能限制实测 - 代码天地

双卡 RTX 5090 深度体验：AI 推理框架选择与性能限制实测

企业开发 2025-04-09 19:18:54 阅读次数: 0

最近有幸拿到了一台配备双卡 NVIDIA GeForce RTX 5090 显卡的工作站PC，这无疑是许多追求极致性能的开发者梦想装备。不过，新硬件的到来往往伴随着一些挑战，尤其是在软件适配和性能表现方面。

通过销售渠道了解到，目前国内市场上暂时还没有涡轮散热版的 RTX 5090，我们拿到的是风扇版。这意味着在多卡配置时需要特别注意散热和空间。

在本文中，我们将分享在 Ubuntu 系统下配置这台双卡 5090 机器进行 AI 推理的实践过程，重点探讨大家可能关心的几个问题：用什么推理框架？性能如何？是否存在传闻中的性能限制？这也是一次深度的体验和实测。

一、测试平台概览

首先，简单介绍一下我们的测试平台配置：

CPU: Intel Core i9-14900K
散热器: 雅浚 EA5SE360 水冷
主板: 华硕 PRO WS W680-ACE 工作站主板
内存: 海盗船 DDR5 5200 32GB * 2
固态硬盘: 金士顿 NV3 2TB PCIe 4.0 M.2
电源: 长城 2200W 金牌认证电源
机箱: 定制 10 槽位金河田 9125B
显卡: NVIDIA GeForce RTX 5090 * 2 (风扇版)

系统环境:

操作系统: Ubuntu 22.04
NVIDIA 驱动: 570.133.07
CUDA 版本: 12.8

nvidia-smi 确认两张 RTX 5090 均被正确识别，CUDA 12.8 环境就绪。

二、 AI 推理框架的选择：Ollama、SGLang 还是 vLLM？

拿到新卡，自然要跑一下 AI 模型。但面对新硬件，推理框架的选择至关重要。哪个框架能无缝衔接，哪个又需要我们“动手”解决兼容性问题呢？

2.1 Ollama：开箱即用，配置简单

好消息是，Ollama 已经支持使用 RTX 5090 进行推理。配置过程非常简单，对于想快速上手体验的用户来说是首选。

2.2 SGLa

猜你喜欢

转载自blog.csdn.net/nulifancuoAI/article/details/146706930

双卡 RTX 5090 深度体验：AI 推理框架选择与性能限制实测

英伟达RTX 5090和RTX 5080

AI大牛李沐的双卡RTX 3090TI装机视频来了！

【速读指南】英伟达RTX 5090，对比RTX 4090有哪些惊艳升级？

RTX 4090：AI时代的性能首选

RTX5090震撼发布！快速一览CES 2025新一代显卡！

HDU5090 深度优先搜索

RTX5090震撼发布，国行16499元起，黄仁勋「美国队长」pose亮翻全场

RTX 4090深度学习性能实测奉上！模型训练可提升60~80%

双路RTX3090深度学习工作站方案

RTX

RTX

个人 AI 的革命：Nvidia‘s Chat with RTX 深度探索

探索 AI 新高度：NVIDIA RTX 4090显卡性能全面解析

全网首发，Llama3 实测 RTX 4090 性能

TITAN RTX 与 RTX 3090 参数的对比，探计单双精度的问题

HDU - 5090 Game with Pearls

深度学习-ubuntu18.04+RTX3080下安装rangnet++推理版踩坑全纪录

Nvidia RTX3070解码性能

Pytorch/paddle单机多卡RTX 3060×2的Ubuntu深度学习训练环境配置+代码模板+常见问题解决

N卡 RTX3070/RTX3080/RTX3090挖矿算力推测最高算力86MH

rtx3060性能相当于什么水平 rtx3060参数

CODE[VS] 5090 众数题解

leetcode 5090 Toss Strange Coins

有三AI卡牌，caffe深度学习框架

AI换脸教程——DeepFaceLab_NVIDIA_RTX3000_series

ubuntu18.04+RTX2080深度学习环境搭建

深度学习平台配置 Pytorch+RTX3090+Pycharm

2K 100+FPS展现超凡性能耕升 RTX 4070搭配DLSS 3实现流畅光追游戏体验

插双卡时紧急号码选择的sub

今日推荐

deepseek热度已过？

MOOC习题:“GPS数据处理”题目个人解析(C语言)

DeepSeek接入微信公众号小白保姆教程

图+语义：RDF语义处理组件Neosemantics功能列表

大语言模型Prompt工程之使用GPT4生成图数据库Cypher

大语言模型Prompt工程之使用GPT3.5生成图数据库Cypher

GPT-3.5 生成 Fabric Cypher

生成 Cypher 能力：GPT3.5 VS ChatGLM

LangChain 2 ONgDB：大模型+知识图谱实现领域知识问答

生成 Cypher 能力：MOSS VS ChatGLM

Neo4j/ONgDB 图数据库快速处理 Excel 文件

LangChain-Agents 入门指南

周排行

blog公告

Lucene：基本增删改查（Java方式）

1、类库

android环信集成单聊功能

删除数据库表数据SQL语句

rhel6.3安装Percona XtraDB Cluster 5.7时错误的解决方法

天梯赛-堆栈（线段树）

ES6原生Class

20120607

张正友标定算法原理详解

每日归档

更多

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)

2025-04-02(0)