刚测试了一下,确实能够看到无关内容DeepSeek疑似出现漏洞DeepSeek被指能看到他人对话内容`` 和 `` 是模型训练时使用的格式标记,用户手动输入后,模型以为自己还在训练流程里,于是开始复述训练时记住的数据片段。你看到的不是别人的实时对话,而是模型在背课文。
这个问题叫训练数据记忆提取(Training Data Extraction),所有大模型都有。Google DeepMind 2023 年就做过实验,用特定输入从 ChatGPT 和 PaLM 里提取出了大量训练数据原文。ICLR 2025 收录的 Magpie 论文甚至反过来利用这个机制批量生产训练数据。
假如有人反驳:吐出来的内容里有今天的日期,训练数据怎么可能是今天的?原因很简单,DeepSeek 每个会话的系统提示词里都写着当天日期,模型续写时自然会带上这个日期。
到目前为止,还没有人能证实这些内容确实属于某个真实存在的「其他用户」。


