以下文章來源于Gitee AI,作者馬建倉
Gitee AI 剛剛上線了DeepSeek-R1-Distill-Qwen-1.5B
、DeepSeek-R1-Distill-Qwen-7B
、DeepSeek-R1-Distill-Qwen-14B
、DeepSeek-R1-Distill-Qwen-32B
四個較小尺寸的 DeepSeek 模型。更值得關注的是,本次上線的四個模型均部署在國產沐曦曦云 GPU 上。
與全尺寸 DeepSeek 模型相比,較小尺寸的 DeepSeek 蒸餾版本模型更適合企業內部實施部署,可以極大的降低落地成本。
同時,這次 Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平臺,更是實現了從芯片到平臺,從算力到模型,全國產研發、中國制造。
DeepSeek R1 是一款大型混合專家(MoE)模型,擁有 6710 億個參數,支持 128000 個 Token 的大輸入上下文長度。在數學、代碼和自然語言推理等任務上表現出色。
本次部署在沐曦曦云 GPU 上的是四個 DeepSeek R1 蒸餾模型,以更小參數量的資源占用,實現了性能與大參數模型旗鼓相當。
曦云系列通用 GPU 產品(包括 C550、C500、C500X、C290、C280、N260 等型號)采用完全自主研發的 GPU IP,擁有完整的知識產權,并具備強大的多精度混合計算能力及高帶寬顯存支持。同時,沐曦產品搭載先進的時空互聯技術和全球兼容的 MXMACA 軟件棧,可廣泛應用于智能、通用計算和數據處理等場景。
在本次部署適配工作中,得益于沐曦曦云良好的 CUDA 兼容性,同時得到沐曦的算力供應商超訊通信的鼎力支持,最終實現了模型的快速部署、穩定調用。
更多國產芯片適配工作已在緊鑼密鼓進行中,各位開發者敬請期待。
2024 年初上線以來,Gitee AI 平臺以 Serverless API、模型引擎、AI 應用為核心功能與服務,致力于讓開發者輕松構建和部署 AI 應用,為企業客戶提供更加智能、高效的 AI 應用解決方案。
目前 Gitee AI 上的DeepSeek-R1-Distill
系列模型現已面向全體開發者免費使用!免費使用!免費使用!
本次上線的模型參數雖小,但它們表現并不亞于大參數模型,如下圖中的DeepSeek-R1-Distill-Qwen-14B
,雖然參數較小,但簡單任務相較于大參數模型其響應速度更快,同時也具備體現思考過程的能力:
模型自強、算力自強、平臺自強,100%國產AI的新時代已然來臨。與其在“制裁-替代-再制裁”的循環中疲于奔命,不如和我們一起在國產 AI 的土壤上,種出下一個時代的參天大樹。
點擊文末閱讀原文訪問 Gitee AI,體驗基于沐曦算力的 DeepSeek R1,開啟你的100%國產AI開發之旅!
Gitee AI 的 Serverless API 提供了文本生成、視覺模型、圖像處理、語音識別、語音生成、向量與重排模型、代碼生成等 9 種類型共 52 個大模型的 API 使用。通過購買模型資源包,即可通過極低的價格即可盡享眾多主流模型。