【大模型实战篇】DeepSeek-R1面临的DDOS攻击以及与O系列的差距

1. 问题

虽然不可否认DeepSeek-R1作为一款大模型表现出色，其开源也推动了技术的进步。然而，在这份热闹的背后，我们仍需保持冷静。该推理模型在某些特殊场景下存在问题：其think过程可能会持续不断地输出，直到达到token上限后才会停止。这不仅会导致大量token的消耗，还可能直接造成算力和资金的浪费。并且无法接收新的真正请求，GPU资源可能被占满，导致大模型的DDOS问题产生。

2. DeepSeek-R1 ddos现象

输入：树中两条路径之间的距离。

DeepSeek处于一直输出think过程，不能输出终止的token。最后只能强制停止think过程了。

3. O系列表现

初步结论：

O系列模型，一直处于第一梯队，表现很稳定。

希望deepseek能继续加油，带来更好的推理模型，听说5月会带来R2模型。

1. 问题

2. DeepSeek-R1 ddos现象

3. O系列表现

猜你喜欢

目录

热门文章