基石智算CoresHub 正式上線 DeepSeek-V3 滿血模型,為用戶帶來(lái)全新的 AI 體驗(yàn)。DeepSeek-V3 模型以卓越的性能,助力各行業(yè)實(shí)現(xiàn)智能化升級(jí)。青云科技旗下AI算力云——基石智算提供更靈活的調(diào)用方式,助力開(kāi)發(fā)者快速構(gòu)建高效智能應(yīng)用。

DeepSeek-V3 模型亮點(diǎn)
DeepSeek-V3 模型在自然語(yǔ)言處理領(lǐng)域取得重大突破。它擁有龐大的預(yù)訓(xùn)練數(shù)據(jù),對(duì)各種復(fù)雜語(yǔ)境理解精準(zhǔn),無(wú)論是日常對(duì)話、專業(yè)文檔分析,還是創(chuàng)意寫(xiě)作,V3 模型都能快速生成高質(zhì)量、邏輯清晰的回復(fù)。通過(guò)優(yōu)化算法架構(gòu),它的運(yùn)算速度大幅提升,響應(yīng)時(shí)間更短,為實(shí)時(shí)交互場(chǎng)景提供有力支持。
DeepSeek-V3 在知識(shí)類任務(wù)(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平,接近當(dāng)前表現(xiàn)最好的模型 Claude-3.5-Sonnet-1022。
● 長(zhǎng)文本:在長(zhǎng)文本測(cè)評(píng)中,DROP、FRAMES 和 LongBench v2 上,DeepSeek-V3 平均表現(xiàn)超越其他模型。
● 代碼:DeepSeek-V3 在算法類代碼場(chǎng)景(Codeforces),遠(yuǎn)遠(yuǎn)領(lǐng)先于市面上已有的全部非 o1類模型,并在工程類代碼場(chǎng)景(SWE-Bench Verified)逼近 Claude-3.5-Sonnet-1022。
● 中文能力:DeepSeek-V3 與 Qwen 2.5-72B 在教育類測(cè)評(píng) C-Eval 和代詞消歧等評(píng)測(cè)集上表現(xiàn)相近,但在事實(shí)知識(shí) C-SimpleQA 上更為領(lǐng)先。
DeepSeek-V3 與R1 對(duì)比
DeepSeek-V3 作為一個(gè)通用 NLP 模型,適用于廣泛的應(yīng)用場(chǎng)景,能夠高效處理各種文本生成、摘要和對(duì)話任務(wù)。DeepSeek-R1 則專注于邏輯推理和問(wèn)題求解,借助強(qiáng)化學(xué)習(xí)優(yōu)化推理能力,適用于推理密集型任務(wù)。

DeepSeek-V3 調(diào)用方式
基石智算提供了兼容 OpenAI 接口規(guī)范的使用方式。支持多種調(diào)用方式,用戶僅需創(chuàng)建 API 密鑰,即可通過(guò) AI 應(yīng)用或第三方客戶端完成對(duì)特定模型的調(diào)用訪問(wèn)。
具體使用方式參考:
https://docs.coreshub.cn/console/big_model_server/call_scenario/截至目前,基石智算已上線 DeepSeek 全系列模型,包括 V3、R1、Janus-Pro 等模型的滿血、量化及蒸餾版本,并支持直接調(diào)用 API、云端一鍵部署、私有化部署等多種模型使用方式,滿足不同用戶對(duì)于數(shù)據(jù)安全、應(yīng)用場(chǎng)景的個(gè)性化需求。
