【大模型实战篇】DeepSeek-R1面临的DDOS攻击以及与O系列的差距

1. 问题 

        虽然不可否认DeepSeek-R1作为一款大模型表现出色,其开源也推动了技术的进步。然而,在这份热闹的背后,我们仍需保持冷静。该推理模型在某些特殊场景下存在问题:其think过程可能会持续不断地输出,直到达到token上限后才会停止。这不仅会导致大量token的消耗,还可能直接造成算力和资金的浪费。并且无法接收新的真正请求,GPU资源可能被占满,导致大模型的DDOS问题产生。

2. DeepSeek-R1 ddos现象

        输入:树中两条路径之间的距离。

        DeepSeek处于一直输出think过程,不能输出终止的token。 最后只能强制停止think过程了。

3. O系列表现

初步结论:

        O系列模型,一直处于第一梯队,表现很稳定。

        希望deepseek能继续加油,带来更好的推理模型,听说5月会带来R2模型。