新華三DeepSeek大模型一體機(jī)性能配置全揭秘

  行業(yè)動(dòng)態(tài)     |      2025-02-24 10:55:06


近日,圖靈中試基地聯(lián)合新華三集團(tuán)推出的靈犀Cube大模型一體機(jī)(DeepSeek版)正式發(fā)布,該產(chǎn)品包含純享版和使能版兩大系列,共計(jì)六大款型12款產(chǎn)品,覆蓋14B至671B規(guī)模的DeepSeek大模型。作為業(yè)界首個(gè)基于“智算-算法-治理”模式深度耦合DeepSeek的大模型一體機(jī),靈犀Cube不僅實(shí)現(xiàn)了不同體量大模型的快速部署與上線,更解決了大模型落地實(shí)踐中面臨的場(chǎng)景適配不足、運(yùn)維成本高等難題,為AI應(yīng)用落地按下“加速鍵”。

靈犀Cube純享版

開箱即用,輕量極簡(jiǎn)

descript

快速交付,輕松上手:預(yù)裝DeepSeek大模型,提供可視化對(duì)話界面,支持二次開發(fā)和API接口調(diào)用,開箱即用,無需復(fù)雜配置。

極致性價(jià)比:軟硬件深度定制,輕量級(jí)軟件平臺(tái)持續(xù)迭代,未來支持AI商店,提供更多免費(fèi)模型、鏡像和優(yōu)質(zhì)數(shù)據(jù)集等AI資產(chǎn)一鍵下載,降低使用門檻。

強(qiáng)勁性能:

?純享旗艦版671B模型單機(jī)推理時(shí),在較好體驗(yàn)的上下文長(zhǎng)度場(chǎng)景下,真實(shí)并發(fā)數(shù)>32@15 Tokens/s;

?純享經(jīng)濟(jì)版32B模型單機(jī)推理時(shí),在較好體驗(yàn)的上下文長(zhǎng)度場(chǎng)景下,真實(shí)并發(fā)數(shù)>16@10 Tokens/s。

?如需支持32B推理時(shí)更高并發(fā),或未來需要掛載知識(shí)庫(kù),純享標(biāo)準(zhǔn)版會(huì)是您更優(yōu)的選擇,該款可選支持70B模型預(yù)裝。

靈犀Cube使能版

AI賦能,不止于DeepSeek

descript

功能強(qiáng)大,靈活易用:提供全面易用的可視化平臺(tái),支持多模型推理、知識(shí)庫(kù)掛載、AI應(yīng)用編排、模型蒸餾、微調(diào)等,滿足多樣化需求。

生態(tài)豐富,開放兼容:除預(yù)裝DeepSeek官方模型外,還提供H3C AIGC系列產(chǎn)品靈犀使能平臺(tái)LinSeer Hub、靈犀推理引擎LinSeer RT、靈犀AI助手LinSeer Copilot軟件安裝,支持用戶知識(shí)庫(kù)掛載、流程編排、智能體創(chuàng)建、內(nèi)置多種智慧應(yīng)用。

高效推理,場(chǎng)景定制:基于異構(gòu)算力,實(shí)現(xiàn)多元模型推理,提供高并發(fā)、低延時(shí)的推理服務(wù)。同時(shí)可結(jié)合用戶實(shí)際落地場(chǎng)景提供AIGC應(yīng)用定制開發(fā)、知識(shí)庫(kù)構(gòu)建等專家服務(wù),深度結(jié)合用戶業(yè)務(wù)場(chǎng)景,提供DeepSeek等開源模型及商業(yè)模型的靈活適配、敏捷接入,保持底層模型技術(shù)“新鮮”。

全流程支持,持續(xù)優(yōu)化:通過統(tǒng)一的模型管理、推理部署、服務(wù)監(jiān)控為大模型推理提供支持,實(shí)現(xiàn)從提示詞工程、向量知識(shí)庫(kù)、流程編排、智能體創(chuàng)建等場(chǎng)景化應(yīng)用工具鏈,幫助用戶快速落地行業(yè)智能應(yīng)用,支持AI應(yīng)用持續(xù)優(yōu)化和穩(wěn)定運(yùn)行,賦能百行百業(yè)智慧轉(zhuǎn)型。

新華三靈犀Cube大模型一體機(jī)依托全棧智能的應(yīng)用和高效澎湃的算力,實(shí)現(xiàn)了大模型場(chǎng)景化應(yīng)用的一站式交付,打通大模型落地的“最后一公里”。近期國(guó)產(chǎn)化方案一體機(jī)也將上線。未來,新華三集團(tuán)將繼續(xù)秉持“精耕務(wù)實(shí),為時(shí)代賦智慧”的理念,不斷迭代產(chǎn)品與解決方案,以持續(xù)創(chuàng)新的能力,加速百行百業(yè)走向AGI時(shí)代。