没人比 DeepSeek 更懂英伟达显卡 - 代码天地

没人比 DeepSeek 更懂英伟达显卡

业界资讯 2025-04-08 05:10:51 阅读次数: 0

在 DeepSeek 开源周的第二天，该团队发布了 DeepEP，这是针对 MoE 模型的通信库，能提高 GPU 内核之间的吞吐量并降低延迟。此外该库还支持低精度操作，比如 FP8。

DeepSeek 团队在仓库的 README 中写道：

为了追求极致性能，我们发现并使用了一个在文档描述之外的 PTX 指令：ld.global.nc.L1::no_allocate.L2::256B。

这条指令会导致未定义行为：使用非一致性只读 PTX 修饰符 .nc 访问易失性 GPU 内存。

但是，在 Hopper 架构上，经过测试，使用 .L1::no_allocate 可以保证正确性，并且性能会好得多。

根据博主「karminski-牙医」的解读，no_allocate 这个指令出现在 CUDA PTX ISA 文档的第 214 页，但只是草草说了句用途，并没有详细解释能带来什么提升。

DeepSeek 团队从这么“深”的地方挖掘到了一个不被官方详细介绍的指令——并且带来极致的性能提升，可见他们对 CUDA 的研究程度之深，以及在 GPU 领域的积累。

CUDA PTX ISA 文档：https://docs.nvidia.com/cuda/pdf/ptx_isa_8.7.pdf

猜你喜欢

转载自www.oschina.net/news/335876

没人比 DeepSeek 更懂英伟达显卡

没人比我更懂HTML

没人比你更懂Event Loop

断更问题说明(虽然也没人看)

读完这45篇论文，“没人比我更懂AI了”

看我这篇没人比你更懂RecyclerView的预加载

掌握这17张图，没人比你更懂RecyclerView的预加载

【今日小记】程序员的孤独，没人懂

中创|没人比我更懂！马斯克发出警告：人类要小心人工智能

deepseek给你更详细的学习路径

深入理解jvm--字节码引擎（没人看就潦草更~_~）

DeepSeek-R1 幻觉问题严重：比 DeepSeek-V3 更容易产生幻觉

英伟达Llama Nemotron-253B开源：直逼DeepSeek-R1，推理性能新标杆

英伟达显卡与驱动匹配

英伟达下一代显卡利用AI技术让人物头发更逼真

移动开发没人要了？

英伟达 253B 开源新王登场，Llama 4 三天变陪衬！直逼 DeepSeek-R1 成推理天花板

英伟达下场，首次优化DeepSeek-R1！B200性能狂飙25倍，碾压H100

Ubuntu无法安装英伟达显卡

Ubuntu 18.04安装英伟达显卡驱动

ubuntu16.04安装英伟达显卡

英伟达显卡驱动及CUDA相关网站

ubuntu18.04 安装英伟达显卡

Ubuntu系统安装英伟达显卡

详细英伟达各显卡型号

英伟达显卡系列与架构、代表产品

国产山寨没人管？

日常（我赌没人看）

博客没人看有尴。。。

工资要9000，没人要！

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)