
體育資訊4月24日訊 今日上午Deepseek官方微博公眾號(hào)更新,宣布全新系列模型 DeepSeek-V4 的預(yù)覽版本正式上線并同步開源。
以下為公眾號(hào)內(nèi)容:
今天,我們?nèi)孪盗心P?DeepSeek-V4 的預(yù)覽版本正式上線并同步開源。
DeepSeek-V4 擁有百萬字超長(zhǎng)上下文,在 Agent 能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國(guó)內(nèi)與開源領(lǐng)域的領(lǐng)先。模型按大小分為兩個(gè)版本:
即日起登錄官網(wǎng) chat.deepseek.com 或官方App,即可與最新的 DeepSeek-V4 對(duì)話,探索 1M 超長(zhǎng)上下文記憶的全新體驗(yàn)。API 服務(wù)已同步更新,通過修改 model_name 為 deepseek-v4-pro 或 deepseek-v4-flash 即可調(diào)用。
DeepSeek-V4-Pro:性能比肩頂級(jí)閉源模型
Agent 能力大幅提高:相比前代模型,DeepSeek-V4-Pro 的 Agent 能力顯著增強(qiáng)。在 Agentic Coding 評(píng)測(cè)中,V4-Pro 已達(dá)到當(dāng)前開源模型最佳水平,并在其他 Agent 相關(guān)評(píng)測(cè)中同樣表現(xiàn)優(yōu)異。目前 DeepSeek-V4 已成為公司內(nèi)部員工使用的 Agentic Coding 模型,據(jù)評(píng)測(cè)反饋使用體驗(yàn)優(yōu)于 Sonnet 4.5,交付質(zhì)量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距。
豐富的世界知識(shí):DeepSeek-V4-Pro 在世界知識(shí)測(cè)評(píng)中,大幅領(lǐng)先其他開源模型,僅稍遜于頂尖閉源模型 Gemini-Pro-3.1。
世界頂級(jí)推理性能:在數(shù)學(xué)、STEM、競(jìng)賽型代碼的測(cè)評(píng)中,DeepSeek-V4-Pro 超越當(dāng)前所有已公開評(píng)測(cè)的開源模型,取得了比肩世界頂級(jí)閉源模型的優(yōu)異成績(jī)。
DeepSeek-V4-Flash:更快捷高效的經(jīng)濟(jì)之選
相比 DeepSeek-V4-Pro,DeepSeek-V4-Flash 在世界知識(shí)儲(chǔ)備方面稍遜一籌,但展現(xiàn)出了接近的推理能力。而由于模型參數(shù)和激活更小,相較之下 V4-Flash 能夠提供更加快捷、經(jīng)濟(jì)的 API 服務(wù)。
在 Agent 測(cè)評(píng)中,DeepSeek-V4-Flash 在簡(jiǎn)單任務(wù)上與 DeepSeek-V4-Pro 旗鼓相當(dāng),但在高難度任務(wù)上仍有差距。
結(jié)構(gòu)創(chuàng)新和超高上下文效率
DeepSeek-V4 開創(chuàng)了一種全新的注意力機(jī)制,在 token 維度進(jìn)行壓縮,結(jié)合 DSA 稀疏注意力(DeepSeek Sparse Attention),實(shí)現(xiàn)了全球領(lǐng)先的長(zhǎng)上下文能力,并且相比于傳統(tǒng)方法大幅降低了對(duì)計(jì)算和顯存的需求。從現(xiàn)在開始,1M(一百萬)上下文將是 DeepSeek 所有官方服務(wù)的標(biāo)配。
DeepSeek-V4 和 DeepSeek-V3.2 的計(jì)算量和顯存容量隨上下文長(zhǎng)度的變化
Agent 能力專項(xiàng)優(yōu)化
DeepSeek-V4 針對(duì) Claude Code 、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 產(chǎn)品進(jìn)行了適配和優(yōu)化,在代碼任務(wù)、文檔生成任務(wù)等方面表現(xiàn)均有提升。
API 訪問
目前,DeepSeek API 已同步上線 V4-Pro 與 V4-Flash,支持 OpenAI ChatCompletions 接口與 Anthropic 接口。訪問新模型時(shí),base_url 不變, model 參數(shù)需要改為 deepseek-v4-pro 或 deepseek-v4-flash。
V4-Pro 與 V4-Flash 最大上下文長(zhǎng)度為 1M,均同時(shí)支持非思考模式與思考模式,其中思考模式支持 reasoning_effort 參數(shù)設(shè)置思考強(qiáng)度(high/max)。對(duì)于復(fù)雜的 Agent 場(chǎng)景建議使用思考模式,并設(shè)置強(qiáng)度為 max
請(qǐng)大家注意:舊有的 API 接口的兩個(gè)模型名 deepseek-chat 與deepseek-reasoner 將于三個(gè)月后(2026-07-24)停止使用。當(dāng)前階段內(nèi),這兩個(gè)模型名分別指向deepseek-v4-flash 的非思考模式與思考模式。
寫在后面的話
「不誘于譽(yù),不恐于誹,率道而行,端然正己?!?/p>
感謝每一位用戶的信任與支持,大家的肯定、建議和期許,是我們不竭探索、持續(xù)進(jìn)步的動(dòng)力,也讓我們始終堅(jiān)守初心,專注于不懈的創(chuàng)新。
我們將始終秉持長(zhǎng)期主義的原則理念,在嘗試與思考中踏實(shí)前行,努力向?qū)崿F(xiàn) AGI 的目標(biāo)不斷靠近。