
“計(jì)算機(jī)技術(shù)的發(fā)展史告訴我們,當(dāng)更多的計(jì)算能力交到開發(fā)者手中時(shí),他們總能發(fā)掘出新的應(yīng)用場景和更多的任務(wù)去解決以前所解決不了的問題,或者是更高程度的優(yōu)化以前的Solution。” ——中軟國際金融AI實(shí)驗(yàn)室主任簡仁賢

近日,中軟國際金融AI實(shí)驗(yàn)室主任簡仁賢接受鳳凰衛(wèi)視直播訪問,對deepseek突破創(chuàng)新及對產(chǎn)業(yè)影響發(fā)表觀點(diǎn)歡迎簡總做客《前行者》訪談欄目!最近DeepSeek迅速出圈火爆全球,前不久您也剛接受了鳳凰衛(wèi)視直播間訪問。請問DeepSeek到底好在哪里?又會(huì)帶來怎樣的影響?
簡仁賢:DeepSeek憑借低成本、高效能的全開源模式,打破了訓(xùn)練大語言模型需巨額投入,和大語言模型只有閉源模型才能夠做得最好的迷思。DeepSeek-V3基礎(chǔ)模型通過混合精度優(yōu)化、混合專家模型等技術(shù),將訓(xùn)練成本降低至十分之一甚至二十分之一;R1推理模型則通過多階段訓(xùn)練大幅降低推理成本,顯著降低了AI模型開發(fā)的門檻。全開源優(yōu)勢讓開發(fā)者可直接基于現(xiàn)有成果微調(diào),無需從零訓(xùn)練。這些技術(shù)使DeepSeek以不到600萬美元成本訓(xùn)練出與上億美元模型相當(dāng)?shù)男阅?,掀起了一場AI革命。
今年,DeepSeek帶來的幾個(gè)重大的趨勢會(huì)更為明顯。閉源模型(如OpenAI)主導(dǎo)的"黑盒時(shí)代"正在終結(jié),開源模型將成為主流;高端訓(xùn)練芯片需求增長放緩,推理芯片市場爆發(fā);AI Agent將進(jìn)一步繁榮,以及由此帶來的對數(shù)據(jù)中心和GPU計(jì)算資源的需求將持續(xù)上升。您能具體闡釋下DeepSeek帶來的這幾點(diǎn)影響嗎?
簡仁賢:DeepSeek的技術(shù)架構(gòu)顯著降低了對高端硬件的依賴。傳統(tǒng)大模型訓(xùn)練需數(shù)千塊高端GPU,而DeepSeek通過優(yōu)化算法,使得中小機(jī)構(gòu)甚至可用消費(fèi)級顯卡(如NVIDIA 4090)進(jìn)行微調(diào)。低功耗、低成本顯卡(如未來NVIDIA 5090/6090)將成為主流,Mac mini等設(shè)備已能流暢運(yùn)行DeepSeek 7B/14B模型。芯片毛利率或從當(dāng)前的92%高位回落,推動(dòng)硬件普惠化。由此,DeepSeek-R1增強(qiáng)技術(shù)進(jìn)一步釋放潛力:通過注入領(lǐng)域?qū)<覕?shù)據(jù)(如醫(yī)療、法律、金融的鏈?zhǔn)剿伎紨?shù)據(jù)),開發(fā)者能快速訓(xùn)練出專業(yè)級模型,每個(gè)企業(yè)都可擁有專屬智能體。軟件架構(gòu)開始深度集成開源模型生態(tài),DeepSeek的開源模式和多模態(tài)分析技術(shù)也將催生更多創(chuàng)新應(yīng)用,一些缺乏透明度的閉源公司可能面臨泡沫化風(fēng)險(xiǎn),被迫轉(zhuǎn)向開源架構(gòu)或垂直場景。企業(yè)可企業(yè)通過云端算力資源與本地化部署結(jié)合,自主部署本地模型,擺脫對云端模型API的依賴,實(shí)現(xiàn)"模型自由"。預(yù)計(jì)全球?qū)⒂谐?0萬家企業(yè)基于其模型開發(fā)定制化智能體(如投資分析Agent、醫(yī)療診斷Agent),中小型企業(yè)首次獲得與大廠對等的AI能力。軟件行業(yè)迎來模型應(yīng)用定制化服務(wù)紅利期。結(jié)合低訓(xùn)練成本與開源生態(tài),可負(fù)擔(dān)的通用人工智能(Affordable AGI)將成為現(xiàn)實(shí)。DeepSeek通過創(chuàng)新的技術(shù)整合(如混合專家模型、混合精度計(jì)算等),在保持強(qiáng)大推理能力的同時(shí),大幅降低了AI模型的訓(xùn)練和推理成本,降幅達(dá)50-60倍,調(diào)用價(jià)格也降低了96.3%。盡管單次計(jì)算成本下降,根據(jù)杰文斯悖論,技術(shù)效率提升往往會(huì)刺激需求增長。隨著AI在各行各業(yè)的廣泛應(yīng)用(如醫(yī)療、教育、金融等),更多的場景模型和AI智能體將涌現(xiàn),帶動(dòng)數(shù)據(jù)中心、邊緣及端側(cè)算力建設(shè),驅(qū)動(dòng)算力整體需求增長。基于以上改變,您對政府/企業(yè)決策者有什么建議?
簡仁賢:從微軟、亞馬遜、英偉達(dá)等科技巨頭,到Perplexity等企業(yè)都已經(jīng)上線DeepSeek,再到600萬美元訓(xùn)練頂尖模型的成本突破,這場由開源力量驅(qū)動(dòng)的變革,正在重構(gòu)全球AI產(chǎn)業(yè)格局,從芯片、軟件到商業(yè)模式的未來的軟件的范式將因此革新。全球AI正實(shí)現(xiàn)從“主權(quán)AI”到平權(quán)AI”,開啟一個(gè)前所未有的創(chuàng)新爆炸時(shí)代。對于決策者而言,理解DeepSeek的技術(shù)貢獻(xiàn)與邏輯至關(guān)重要,在技術(shù)層,優(yōu)先采用開源架構(gòu),建立本地化模型部署能力,避免受制于閉源服務(wù)商;在戰(zhàn)略層,聚焦高質(zhì)量領(lǐng)域數(shù)據(jù)積累,利用R1推理能力打造垂直場景護(hù)城河;在生態(tài)層,參與開源社區(qū)協(xié)作,推動(dòng)模塊化Agent開發(fā),搶占AI軟件新生態(tài)的先機(jī)。簡仁賢:目前,中軟國際已將自主研發(fā)的JointPilot人工智能平臺接入DeepSeek-R1,中軟國際模型工場基于昇騰云、DeepSeek模型,推出升級版一站式AI解決方案服務(wù)。例如,在金融領(lǐng)域,可助力智能風(fēng)險(xiǎn)評估、精準(zhǔn)客戶營銷;在制造業(yè),可賦能設(shè)備故障預(yù)測、生產(chǎn)流程優(yōu)化;在醫(yī)療領(lǐng)域,可實(shí)現(xiàn)智能診斷、輔助治療決策等,進(jìn)一步提升企業(yè)生產(chǎn)效率、打造新質(zhì)生產(chǎn)力。中軟國際科創(chuàng)中心以“DeepSeek+昇騰”為引擎,將DeepSeek全參模型滿血版部署在全國產(chǎn)化智算環(huán)境中,實(shí)現(xiàn)671B參數(shù)的DeepSeek模型穩(wěn)定運(yùn)行,并面向社會(huì)提供DeepSeek的昇騰遷移、模型部署、模型蒸餾、模型精調(diào)、SAAS應(yīng)用、Agent開發(fā)等多樣化AI服務(wù)。未來,中軟國際也將幫助企業(yè)和開發(fā)者把更多以DeepSeek-R1為代表的推理模型接入實(shí)際應(yīng)用場景,更廣泛的滿足生產(chǎn)級、高要求場景的業(yè)務(wù)提效需求,并助力各個(gè)領(lǐng)域提供服務(wù),各行各業(yè)推出更多適配場景的AI應(yīng)用和服務(wù)。