<form id="dhnpx"></form>

          Gitee AI 聯合沐曦首發全套 DeepSeek R1 千問蒸餾模型,全免費體驗!
          發布時間:2025-02-04 19:27:21 瀏覽次數:831

          以下文章來源于Gitee AI,作者馬建倉

          Gitee AI 剛剛上線了DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四個較小尺寸的 DeepSeek 模型。更值得關注的是,本次上線的四個模型均部署在國產沐曦曦云 GPU 上。

          圖片

          與全尺寸 DeepSeek 模型相比,較小尺寸的 DeepSeek 蒸餾版本模型更適合企業內部實施部署,可以極大的降低落地成本。

          同時,這次 Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平臺,更是實現了從芯片到平臺,從算力到模型,全國產研發、中國制造。

          100%國產AI的力量

          國產模型 DeepSeek R1

          DeepSeek R1 是一款大型混合專家(MoE)模型,擁有 6710 億個參數,支持 128000 個 Token 的大輸入上下文長度。在數學、代碼和自然語言推理等任務上表現出色。

          本次部署在沐曦曦云 GPU 上的是四個 DeepSeek R1 蒸餾模型,以更小參數量的資源占用,實現了性能與大參數模型旗鼓相當。

          圖片

          國產 GPU 沐曦曦云

          曦云系列通用 GPU 產品(包括 C550、C500、C500X、C290、C280、N260 等型號)采用完全自主研發的 GPU IP,擁有完整的知識產權,并具備強大的多精度混合計算能力及高帶寬顯存支持。同時,沐曦產品搭載先進的時空互聯技術和全球兼容的 MXMACA 軟件棧,可廣泛應用于智能、通用計算和數據處理等場景。

          圖片

          在本次部署適配工作中,得益于沐曦曦云良好的 CUDA 兼容性,同時得到沐曦的算力供應商超訊通信的鼎力支持,最終實現了模型的快速部署、穩定調用。

          更多國產芯片適配工作已在緊鑼密鼓進行中,各位開發者敬請期待。

          國產平臺 Gitee AI

          2024 年初上線以來,Gitee AI 平臺以 Serverless API、模型引擎、AI 應用為核心功能與服務,致力于讓開發者輕松構建和部署 AI 應用,為企業客戶提供更加智能、高效的 AI 應用解決方案。

          圖片

          100%國產AI免費跑

          目前 Gitee AI 上的DeepSeek-R1-Distill系列模型現已面向全體開發者免費使用!免費使用!免費使用!

          本次上線的模型參數雖小,但它們表現并不亞于大參數模型,如下圖中的DeepSeek-R1-Distill-Qwen-14B,雖然參數較小,但簡單任務相較于大參數模型其響應速度更快,同時也具備體現思考過程的能力:

          圖片

          模型自強、算力自強、平臺自強,100%國產AI的新時代已然來臨。與其在“制裁-替代-再制裁”的循環中疲于奔命,不如和我們一起在國產 AI 的土壤上,種出下一個時代的參天大樹。

          點擊文末閱讀原文訪問 Gitee AI,體驗基于沐曦算力的 DeepSeek R1,開啟你的100%國產AI開發之旅!


          Gitee AI 的 Serverless API 提供了文本生成、視覺模型、圖像處理、語音識別、語音生成、向量與重排模型、代碼生成等 9 種類型共 52 個大模型的 API 使用。通過購買模型資源包,即可通過極低的價格即可盡享眾多主流模型。

          圖片


          閱讀全文


          天天躁日日躁狠狠躁综合