深度求索宣布DeepSeek-V3.1正式發(fā)布。經(jīng)查,目前新版模型已經(jīng)默認同步上線官網(wǎng)、App,面向C端用戶完全免費。
據(jù)介紹,DeepSeek-V3.1具備128K超長上下文處理能力,支持混合推理架構(gòu)(一個模型同時支持思考模式與非思考模式)。
此外,新版模型擁有更高的思考效率,相比R1能在更短時間內(nèi)給出答案。
不僅如此,DeepSeek-V3.1擁有更強的Agent(智能體)能力,通過Post-Training(后訓(xùn)練)優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。
比如,在代碼修復(fù)測評SWE與命令行終端環(huán)境下的復(fù)雜任務(wù)(Terminal-Bench)測試中,以及在需要多步推理的復(fù)雜搜索測試(browsecomp)與多學(xué)科專家級難題測試(HLE)上,DeepSeek-V3.1均大幅領(lǐng)先DeepSeek-R1-0528。
另外,DeepSeek-V3.1思考效率提升有了巨幅提升。經(jīng)過思維鏈壓縮訓(xùn)練后,V3.1-Think在輸出token數(shù)減少20%-50%的情況下,各項任務(wù)的平均表現(xiàn)與R1-0528持平。
對于DeepSeek R2發(fā)布延遲的原因,DeepSeek總結(jié)稱,主要由于采用國產(chǎn)昇騰芯片進行訓(xùn)練時遇到技術(shù)挑戰(zhàn),以及公司對模型質(zhì)量的高標準要求。雖然之前有8月發(fā)布的傳聞,但已被官方否認。目前看來,我們可能需要再等待幾周的時間,但具體日期還需以官方消息為準。