DeepSeek下的自研大模型如何做?一個(gè)字“卷”!
從人類科技發(fā)展歷史看,今天只是AI的第一天。想要總結(jié)deepseek的創(chuàng)新路徑為時(shí)甚早,試圖復(fù)制deepseek的成功為時(shí)更早。
2025-02-17 11:01:35
來(lái)源:通信世界全媒體 包建羽??

通信世界網(wǎng)消息(CWW)當(dāng)前,DeepSeek掀起的“模型熱”還在持續(xù)升溫。

正如通信世界全媒體年初所預(yù)測(cè)的,2025年大模型乃至智能體將迎來(lái)進(jìn)一步繁榮,行業(yè)大模型將深度融入核心業(yè)務(wù)與應(yīng)用、AI終端以及智能體將加速落地。具體到如何實(shí)現(xiàn),DeepSeek仿佛一陣“及時(shí)雨”,憑借低成本、高效能以及廣泛的應(yīng)用場(chǎng)景,為行業(yè)實(shí)踐提供了良好的技術(shù)支撐與應(yīng)用基礎(chǔ)。

可喜之余,對(duì)于渴望在未來(lái)大模型領(lǐng)域闖出一片天的企業(yè)來(lái)說(shuō),結(jié)合自身的業(yè)務(wù)需求與數(shù)據(jù)特點(diǎn),在充分發(fā)揮DeepSeek優(yōu)勢(shì)之上,“卷”出更具有獨(dú)特競(jìng)爭(zhēng)力的自研大模型乃至智能體,似乎更值得深思。

前期“卷”接入

實(shí)現(xiàn)“共進(jìn)共生”

最直觀來(lái)看,目前DeepSeek掀起的“模型熱”主要表現(xiàn)為DeepSeek的“接入熱”。

其中既包括英偉達(dá)、亞馬遜以及微軟等國(guó)外科技巨頭,也包括極具市場(chǎng)潛力的中國(guó)本土企業(yè),從底層的軟硬件設(shè)計(jì)研發(fā)企業(yè)到互聯(lián)網(wǎng)大廠、運(yùn)營(yíng)商、垂直領(lǐng)域AI公司再到中小型初創(chuàng)企業(yè),選擇DeepSeek似乎已成為當(dāng)下算力成本飆升與商業(yè)化路徑尚未明晰的必然抉擇。

自DeepSeek開(kāi)放API以來(lái),其生態(tài)版圖快速擴(kuò)張。據(jù)不完全統(tǒng)計(jì),目前全球已有超過(guò)200家企業(yè)宣布接入DeepSeek。就目前來(lái)看,接入方式主要分為三類:一是API直接調(diào)用,即企業(yè)直接調(diào)用DeepSeek的云端API,快速集成其通用能力,如文本生成、代碼編寫(xiě)等。二是模型微調(diào),即企業(yè)基于DeepSeek基座模型,注入私有數(shù)據(jù)進(jìn)行領(lǐng)域適配,從而實(shí)現(xiàn)自身模型優(yōu)化。三是開(kāi)源共建,這主要體現(xiàn)在底層架構(gòu)與設(shè)計(jì)層面,企業(yè)針對(duì)DeepSeek開(kāi)放的部分模型權(quán)重,借助社區(qū)協(xié)作進(jìn)行自身優(yōu)化。

總體來(lái)看,接入是方式,優(yōu)化是目的。隨著企業(yè)對(duì)接入方式的逐漸深入,我們可以發(fā)現(xiàn),企業(yè)自研模型與DeepSeek的接入部署,逐漸呈現(xiàn)出全面化、智能化、差異化的特點(diǎn),兩者結(jié)合的模式也逐漸呈現(xiàn)“共生進(jìn)化”特征。

針對(duì)功能補(bǔ)充類,調(diào)用API逐漸深入到應(yīng)用場(chǎng)景接入,例如三大運(yùn)營(yíng)商在云能力率先接入的基礎(chǔ)上,已逐漸拓展至to B端、to C端的特色場(chǎng)景與產(chǎn)品服務(wù);多家車(chē)企探索將DeepSeek接入智能座艙,實(shí)現(xiàn)語(yǔ)音助手功能升級(jí)、AI多語(yǔ)義指令識(shí)別等。

針對(duì)模型部署開(kāi)發(fā)類,私有化部署與產(chǎn)品成為保障安全的選擇,多家企業(yè)如中國(guó)電信、聯(lián)想、新華三、浪潮等均推出了DeepSeek智算一體機(jī),實(shí)現(xiàn)一體化開(kāi)箱即用的私有化部署。與此同時(shí),DeepSeek模型私有化部署服務(wù)也涵蓋安裝部署、系統(tǒng)調(diào)優(yōu)和運(yùn)行維護(hù),可提供適配多種算力的部署包及支持,幫助企業(yè)在自有業(yè)務(wù)場(chǎng)景中構(gòu)建安全可靠的智能環(huán)境。

針對(duì)技術(shù)融合類,單向的知識(shí)蒸餾訓(xùn)練,即單純接入DeepSeek,可提煉其模型能力至自研模型,降低自身部署成本;多向的模型聯(lián)合訓(xùn)練,即企業(yè)自研大模型與DeepSeek大模型進(jìn)行深度聯(lián)合訓(xùn)練,可以促進(jìn)聯(lián)合創(chuàng)新,為企業(yè)帶來(lái)更廣闊的發(fā)展空間。

中期“卷”經(jīng)驗(yàn)

挖掘價(jià)值站穩(wěn)市場(chǎng)

接入與優(yōu)化滿足當(dāng)前初步部署應(yīng)用的需求,但也不可否認(rèn),DeepSeek的崛起為自研通用大模型以及行業(yè)大模型帶來(lái)了沖擊。

在技術(shù)競(jìng)爭(zhēng)方面,DeepSeek的低成本訓(xùn)練模式和高效推理能力是其優(yōu)勢(shì)所在,也為自研大模型帶來(lái)了新的技術(shù)競(jìng)爭(zhēng)壓力。就拿DeepSeek V3來(lái)說(shuō),其訓(xùn)練成本僅為557.6萬(wàn)美元,使用 2048 張 H800 GPU 卡,相比同等規(guī)模的模型(如GPT-4、GPT-4o、Llama 3.1),訓(xùn)練成本大幅降低。這迫使大模型研發(fā)者不得不重新審視技術(shù)路線,加大在降低訓(xùn)練成本和提升推理效率方面的研發(fā)投入。

在應(yīng)用場(chǎng)景拓展方面,DeepSeek-R1在科研、數(shù)據(jù)分析、代碼生成等復(fù)雜場(chǎng)景表現(xiàn)出色,DeepSeek-V3適合內(nèi)容創(chuàng)作、長(zhǎng)文本生成等場(chǎng)景??陀^來(lái)看,這兩類大模型已較為廣泛地覆蓋了當(dāng)下通用大模型的應(yīng)用場(chǎng)景,行業(yè)開(kāi)始出現(xiàn)了新的選擇,即對(duì)已入局者以及仍觀望者亮出了新挑戰(zhàn)。

在市場(chǎng)格局重塑方面,DeepSeek的開(kāi)源和低成本特性,吸引了大量合作伙伴,包括云服務(wù)廠商、算力企業(yè)等,改變了通用大模型的市場(chǎng)格局。對(duì)于行業(yè)大模型來(lái)說(shuō),強(qiáng)調(diào)其自身價(jià)值之前,似乎必須先證明自己模型對(duì)行業(yè)專屬數(shù)據(jù)與場(chǎng)景的理解,比直接調(diào)教通用模型懂得更多。

基于此,對(duì)于企業(yè)自研大模型來(lái)說(shuō),想要在市場(chǎng)繼續(xù)站穩(wěn)腳跟,正視挑戰(zhàn)與機(jī)遇,揚(yáng)長(zhǎng)避短、提升差異化競(jìng)爭(zhēng)力迫在眉睫。

面向低成本、低算力部署趨勢(shì),大模型行業(yè)應(yīng)借鑒經(jīng)驗(yàn),與自身結(jié)合的基礎(chǔ)上更傾向于研發(fā)和應(yīng)用能夠在低成本、低算力條件下運(yùn)行的技術(shù)和模型,以降低使用門(mén)檻、擴(kuò)大應(yīng)用范圍。

面向當(dāng)下訓(xùn)練需求逐漸轉(zhuǎn)向推理需求,充分挖掘數(shù)據(jù)價(jià)值有望使部分企業(yè)脫穎而出。對(duì)此,企業(yè)應(yīng)重視數(shù)據(jù)質(zhì)量的提升,解決數(shù)據(jù)孤島問(wèn)題,加強(qiáng)數(shù)據(jù)的整合和共享,借助日漸先進(jìn)的數(shù)據(jù)處理技術(shù)和算法,充分挖掘數(shù)據(jù)的價(jià)值,為大模型優(yōu)化提供有力支持。

證明自研大模型存在的必要,企業(yè)仍需挖掘自身的差異化優(yōu)勢(shì),結(jié)合自身所在行業(yè)的特點(diǎn)和資源,找到獨(dú)特的應(yīng)用場(chǎng)景和價(jià)值點(diǎn),實(shí)現(xiàn)差異化競(jìng)爭(zhēng)。例如,猿輔導(dǎo)的猿力大模型在與DeepSeek融合后找準(zhǔn)了教育場(chǎng)景下的個(gè)性化學(xué)習(xí)體驗(yàn),通過(guò)定制化學(xué)習(xí)方案,并自動(dòng)調(diào)整學(xué)習(xí)節(jié)奏,使孩子逐漸找到學(xué)習(xí)自信。

后期“卷”效用

兼顧效率與商業(yè)化

隨著大模型出現(xiàn)并滲透進(jìn)日常生活,大模型競(jìng)爭(zhēng)也進(jìn)入2.0階段,從長(zhǎng)遠(yuǎn)來(lái)看,大模型已由傳統(tǒng)的技術(shù)競(jìng)賽轉(zhuǎn)向商業(yè)化效率競(jìng)爭(zhēng)。

就行業(yè)啟示來(lái)看,低成本推理成為剛需。隨著市場(chǎng)競(jìng)爭(zhēng)的加劇,算力成本曲線已然成為決定市場(chǎng)格局的關(guān)鍵因素。數(shù)據(jù)閉環(huán)能力成為新價(jià)值。不同于單純追求數(shù)據(jù)量,當(dāng)下更為數(shù)據(jù)的內(nèi)容質(zhì)量以及應(yīng)用質(zhì)量。

從效率角度出發(fā),企業(yè)應(yīng)全方位提升模型的研發(fā)、訓(xùn)練與應(yīng)用效率。首先,在研發(fā)環(huán)節(jié),企業(yè)可以嘗試在算法和架構(gòu)設(shè)計(jì)下功夫,同時(shí)借助自動(dòng)化代碼生成工具,減少人工編寫(xiě)代碼的時(shí)間和錯(cuò)誤。其次,在訓(xùn)練過(guò)程中,合理利用分布式計(jì)算技術(shù),優(yōu)化訓(xùn)練算法值得探索。最后,進(jìn)入應(yīng)用階段,注重推理效率提升,借助模型壓縮等先進(jìn)技術(shù)與經(jīng)驗(yàn),提高推理速度。

從商業(yè)化角度出發(fā),企業(yè)應(yīng)精準(zhǔn)定位市場(chǎng)需求,制定合理的商業(yè)模式。一方面,企業(yè)可以針對(duì)特定行業(yè)的需求,開(kāi)發(fā)定制化的大模型解決方案。另一方面,企業(yè)可以將大模型作為基礎(chǔ)平臺(tái),開(kāi)發(fā)一系列的應(yīng)用產(chǎn)品和服務(wù)。

以運(yùn)營(yíng)商為例,憑借其自身龐大的用戶數(shù)據(jù)資源,可以充分發(fā)揮自身的網(wǎng)絡(luò)和服務(wù)優(yōu)勢(shì),優(yōu)化迭代一系列to C端的應(yīng)用產(chǎn)品和服務(wù)。例如:基于自然語(yǔ)言處理大模型優(yōu)化智能客服系統(tǒng)、5G新通話應(yīng)用以及AI智能助手等,并且根據(jù)用戶的使用習(xí)慣和歷史數(shù)據(jù),為用戶提供個(gè)性化的服務(wù)推薦,從而增強(qiáng)用戶黏性,挖掘存量市場(chǎng)。

總而言之,大模型2.0時(shí)代已經(jīng)來(lái)臨,低成本推理、差異化競(jìng)爭(zhēng)、數(shù)據(jù)價(jià)值挖掘以及產(chǎn)業(yè)鏈定位,構(gòu)成了這個(gè)時(shí)代大模型企業(yè)發(fā)展的關(guān)鍵拼圖。企業(yè)有待將這些要素緊密結(jié)合,積極調(diào)整戰(zhàn)略,以適應(yīng)時(shí)代的變化,在市場(chǎng)競(jìng)爭(zhēng)的洪流中穩(wěn)步前行,不斷發(fā)展壯大。

原創(chuàng)文章
最新文章
1
同益空氣能多箭齊發(fā) 2025 中國(guó)供熱展,創(chuàng)新戰(zhàn)略引領(lǐng)產(chǎn)業(yè)升級(jí)趨勢(shì)
2
向心而新,同益煥新!同益空氣能亮相2025中國(guó)供熱展,創(chuàng)新引領(lǐng)暖通行業(yè)新趨勢(shì)
3
海信全球第二、百吋第一背后:打贏AI時(shí)代的高端大屏之戰(zhàn)
4
海信空調(diào)七代雙向新風(fēng)技術(shù)亮相,改寫(xiě)空調(diào) “呼吸” 規(guī)則
5
奧維數(shù)據(jù):容聲506冰箱霸榜線下行業(yè)產(chǎn)品TOP1
6
1.0到4.0的蛻變,海信冰箱如何做到分子級(jí)保鮮?
7
全場(chǎng)景家庭綠電,讓華寶新能走上綠色能源市場(chǎng)變革浪潮之巔
8
百度發(fā)布2024年第四季度及全年財(cái)報(bào),AI是“救贖”還是“負(fù)擔(dān)”?
9
2024年全球電視出貨量達(dá)2.08億臺(tái),中國(guó)電視市場(chǎng)潛力十足
10
海信全球首款RGB-Mini LED電視國(guó)內(nèi)首次亮相
11
真我官宣接入DeepSeek!挑戰(zhàn)同檔最智能天璣8400游戲神機(jī)
12
1月線上智能門(mén)鎖:開(kāi)年市場(chǎng)冷熱不均,價(jià)格再回千元以內(nèi)
13
從家電到機(jī)器人 家電巨頭競(jìng)逐新戰(zhàn)場(chǎng)
14
多地舊房改造、廚房局改補(bǔ)貼細(xì)則出爐,今年裝修省錢(qián)了!
15
蘋(píng)果iPhone 16e 正式發(fā)布 4499元起
16
蘋(píng)果機(jī)器人計(jì)劃:2028年量產(chǎn)?別急,慢慢等!
17
賦能超1000萬(wàn)輛汽車(chē)!OPPO以閃充技術(shù)定義出行快充新體驗(yàn)
18
“格力專賣(mài)店”改名“董明珠健康家”,好處是什么?
19
開(kāi)創(chuàng)家庭綠電新紀(jì)元:華寶新能全場(chǎng)景家庭綠電創(chuàng)新峰會(huì)解碼零碳未來(lái)技術(shù)路徑
20
市場(chǎng)調(diào)研機(jī)構(gòu)Omdia:海信激光電視出貨量連續(xù)6年穩(wěn)居全球第一
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512