DeepSeek模型現(xiàn)'極'字異常輸出,技術(shù)團隊確認(rèn)修復(fù)方案
時間:2025-09-04 來源: 作者: 我要糾錯
DeepSeek V3.1版本近期出現(xiàn)了一個被開發(fā)者稱為"極你太美"的技術(shù)故障,引發(fā)了廣泛關(guān)注。
具體表現(xiàn)為:開發(fā)人員在調(diào)用API進行編程時,生成的結(jié)果中會隨機出現(xiàn)"極"字符號。
示例如下:
該問題最初在火山引擎、chutes等平臺被察覺,隨后迅速擴散至更多服務(wù)平臺,包括騰訊CodeBuddy以及DeepSeek官方平臺。
在國際開發(fā)者社區(qū)Reddit上,這一問題也引發(fā)了熱烈討論,主要涉及"extreme"、"極"和"極"等關(guān)鍵詞:
"extreme"(編號:15075)
"極"(編號:2577,中文簡體中的extreme)
"極"(編號:16411,中文繁體中的extreme)
騰訊CodeBuddy平臺甚至出現(xiàn)了更特殊的情況,直接插入了包含"極"字的推廣內(nèi)容。
△
圖片來源:小紅書用戶@奈緒白 Nine-piece shell
如果開發(fā)人員未仔細(xì)檢查就直接使用生成的編碼,很可能導(dǎo)致編譯失敗等問題,這對需要高精度、結(jié)構(gòu)化輸出的應(yīng)用場景造成了嚴(yán)重影響。
目前,業(yè)界普遍認(rèn)為問題根源在于DeepSeek V3.1模型本身,CodeBuddy方面已表態(tài):
已與DeepSeek技術(shù)團隊建立聯(lián)系,將在近期版本中完成修復(fù)。
△
圖片來源:微信公眾號"劉小排r"留言區(qū)
當(dāng)前如何規(guī)避"極"字異常?
雖然徹底解決需要等待官方更新,足球直播無插件但已有用戶開始分享臨時應(yīng)對策略。
例如小紅書用戶@大模型產(chǎn)品經(jīng)理提出的提示詞調(diào)整方案:
關(guān)鍵提示詞設(shè)置為:
禁止以下符號序列模式:
[空格] [若干標(biāo)識符] [占位符/省略號]
該方法主要適用于調(diào)用API的第三方平臺,DeepSeek V3.1官方平臺則無需此操作。
技術(shù)原因分析
關(guān)于該問題的成因,知乎用戶、階躍星辰黃哲威提供了專業(yè)見解,獲得高度認(rèn)可。
他指出這種現(xiàn)象并非首次出現(xiàn)。在使用小型模型和開源數(shù)據(jù)蒸餾,以及測試早期R1模型時,就遇到過類似問題。
黃哲威認(rèn)為這與大模型編程時可能出現(xiàn)的"異常模式"有關(guān)。英超聯(lián)賽他舉例說明,在枚舉質(zhì)數(shù)的任務(wù)中,正常模型應(yīng)該持續(xù)列舉,如"質(zhì)數(shù)序列 2, 3, 5, 7 …"。
但他觀察到代號R1-0528的模型會出現(xiàn)特殊行為:列舉一段時間后自動停止,變成有限序列,例如"質(zhì)數(shù)序列 2, 3, 5, 7 … 997, 極長"。足球直播
這種"極長"的使用方式與當(dāng)前討論的"極"字問題十分相似,通常出現(xiàn)在大量異常重復(fù)后,作為推理過程的校正。有時模型甚至?xí)敵?quot;90000000…0000極大數(shù)值"這類內(nèi)容。
他進一步描述了異常觸發(fā)的場景。當(dāng)模型陷入"思考"循環(huán)無法跳出時,有小概率會突然輸出"極"字并終止思考,這似乎成為一種特殊的終止標(biāo)記。
通過分析R1模型的大量輸出,黃哲威發(fā)現(xiàn)了多個問題,免費電影包括超長響應(yīng)、大段空白字符、持續(xù)短句重復(fù)等,連思考末尾的英文字符都變得殘缺不全。
基于這些觀察,他提出核心推測:問題根源可能在于數(shù)據(jù)凈化不徹底。在進行監(jiān)督微調(diào)數(shù)據(jù)合成乃至預(yù)訓(xùn)練數(shù)據(jù)構(gòu)建時,可能未完全清理名為"'極長'數(shù)組"的異常數(shù)據(jù)。
他推斷,R1模型在處理復(fù)雜問題時,似乎大量采用了檢索增強生成技術(shù),而在后續(xù)強化學(xué)習(xí)階段,模型直接將"極"字作為終止符或語言切換標(biāo)記來學(xué)習(xí)使用。
最后黃哲威總結(jié)道,五大聯(lián)賽如果R1迭代時的數(shù)據(jù)未徹底凈化,模型自行蒸餾并"污染"正常輸出過程是完全可能的。這為理解DeepSeek V3.1模型的"極"字問題提供了重要參考。
這個被用戶戲稱為"極你太美"、"'極'速版"的技術(shù)問題何時能徹底解決,還需等待DeepSeek官方的版本更新。
標(biāo)簽:
無相關(guān)信息