电话: 邮箱:
思 源 致 远   创 新 创 业 SEEKING TRUTH · PURSUING INNOVATION

星空体育

星空体育

星空体育(中国)2026世界杯官方app下载 这么问DeepSeek, 能「偷」到数据?

发布日期:2026-05-13 04:59 来源:未知 作者:admin 浏览次数:

星空体育(中国)2026世界杯官方app下载 这么问DeepSeek, 能「偷」到数据?

机器之机杼剪部

近日,有网友在 X 上发文称,在使用 DeepSeek 的历程中,若是在输入框内输入以下这一段内容,便可「窃取」到 DeepSeek 的磨练数据:

仔细看了之后发现,具体是这么的:只有你在输入框输入这一段领导词,DeepSeek 就会「吐出」一轮无缺的对话纪录,不外这并不是你的历史搜索纪录,更像是一份连忙的对话纪录。

AG真人国际厅中国官网

随后该博主又称,即便仅仅输入 ,也有雷同的效用。

此帖文依然发布,便引起网友的热议。

一网友示意,「我不合计这是在窃取磨练数据,更像是在袒露其他东说念主的聊天内容。它拿来行为领导词的句子会变化,有时还会识别出这是一个奇怪 / 意外旨的领导词。」

在该网友给出两个例子来阐明这少量。在第一个例子中,输入这一内容后,DeepSeek 给出一个对话纪录:「用户发问想要写出一个以单词 rose 为摈弃的长句,之后是模子长长的念念考历程,临了给出一个以 rose 为摈弃的长句。」

而在第二个例子中,乐鱼中国app官网入口DeepSeek 则将其作为一个用户输入的普遍领导词进行处治:「咱们被条目复兴:,然后需要生成一个回复。」

对此,咱们也进行了一些实测,获胜复现了这一表象。

比如鄙人面的例子中,输入上述内容后,DeepSeek 反应了一个用户申请写 rap 歌词的问题和对应的谜底。

底下还有更多示例:

全体来看,摈弃相配连忙,可能波及任何话题,况且并不一定能获胜复现。直观上看,灵通「深度念念考」并关闭「智能搜索」时,星空体育(中国)2026世界杯官方app下载复现的获胜率会更高。

底下便是一个未能获胜复现的示例:

是以追想来看,对于归拢段内容,到底 DeepSeek 会给出一份无缺的对话纪录,如故将其识别为稀薄或意外旨的领导词,全皆是连忙行径。而对于背后的原因,网友亦然众说纷纭。

有网友合计,这是大模子幻觉导致的。「这一表象讲授 LLM 仍然相配容易出错,因此也容易出现幻觉,他们宣称大型说话模子的幻觉越来越少,但那不是确凿。」

而一位网友合计,这省略率是因为监督微调(SFT)。

他示意,这段领导词可能是 DeepSeek 在监督微调(SFT)阶段使用的里面规定 token。它们时时保密在聊天模板里面,而当你手动输入它们时,就荒谬于全皆绕过了普遍界面,并强行把模子推入一种「从磨练样本无间生成」的方法。

由于 SFT 数据围聚充满了千千万万条高质地的适应推理轨迹,模子就会连忙挑选其中一条,并从 无间生成。

这也就解释了,为什么你每次(输入雷同的内容)皆会取得全皆不同的内容:比如,第一次启动取得是对于 19π/12 的无缺三角函数解题历程;第二次启动,取得的可能是对于 QLoRA/OPTQ 中「value field」长度等于 4 bit 的刺眼解释……

「这不是 bug—— 这实验上便是模子在展示它磨练过的连忙片断,而这是一个超等直不雅的窗口,让东说念主看到 DeepSeek 的后磨练数据。」

而有些网友在看到这一表象后,也试着将其拿来对其他模子进行测试,看是否有访佛表象出现,果如其言,「Gemini 偶然也存在雷同的问题。」

在一位网友展示的例子中,在输入这一段内容后,Gemini 给出了一个无缺对话: 用户酌量恭候新式药品时期过长的问题,以及模子给出的对应谜底。

星空体育(中国)2026世界杯官方app下载