從Web3視角出發(fā),看AIGC這只算力li“吞金獸”的成長(zhǎng)軌跡
注冊(cè)下載zai,立即領(lǐng)取價(jià)值高達(dá)60,000元數(shù)字貨幣盲盒
摘要伴隨著ChatGPT的爆紅hong,AIGC(人工智能生成內(nèi)容)產(chǎn)業(yè)鏈?zhǔn)艿綇V泛關(guān)注。我們發(fā)fa現(xiàn),同為算力,其與加jia密資產(chǎn)挖礦產(chǎn)業(yè)存在相似之處,均為投tou入算力和電力,獲得經(jīng)濟(jì)回報(bào),主zhu要的不同點(diǎn)在產(chǎn)品端:AIGC產(chǎn)chan業(yè)鏈的產(chǎn)品是對(duì)dui用戶(hù)提問(wèn)而回應(yīng)的內(nèi)容,而加jia密資產(chǎn)挖礦的產(chǎn)品pin是加密資產(chǎn)。
同為算suan力“吞金獸”,短期qi比特幣更耗電、長(zhǎng)期AI算力增速快。同為算力li生意,我們做了個(gè)有趣的研究,AIGC與BTC挖wa礦耗電量如何?按當(dāng)前比bi特幣全網(wǎng)算力319EH/S,每日耗hao電量約為2.2億千瓦時(shí);而OpenAI在訓(xùn)練lian、推理端的日均耗電量約yue2.6萬(wàn)千瓦時(shí),約是前者的萬(wàn)分fen之一,但按OpenAI的預(yù)測(cè),AI訓(xùn)練所需的算力每3-4個(gè)月yue翻倍,且考慮商業(yè)競(jìng)爭(zhēng)算力增長(zhǎng)速度du預(yù)計(jì)將更快,“算力即權(quán)力”的時(shí)shi代將來(lái)臨。中性預(yù)期下,ChatGPT日活穩(wěn)定在1億人次左右、ChatGPT每6個(gè)月模型參數(shù)翻fan倍、國(guó)際市場(chǎng)將出現(xiàn)xian10個(gè)左右類(lèi)似于ChatGPT的de商用大模型,而比特幣bi挖礦耗電量保持當(dāng)前狀態(tài),則大約4年后,AIGC大da模型耗電量將超過(guò)比特te幣挖礦耗電量,樂(lè)觀和悲觀預(yù)yu期下,這一數(shù)字則分別為1.6年和7.5年。
算力的競(jìng)爭(zhēng)性xing——產(chǎn)業(yè)自驅(qū)的de結(jié)果。市場(chǎng)忽略了算力li的競(jìng)爭(zhēng)性,考慮商業(yè)因素su,算力生意存在分fen子與分母端。對(duì)比特幣挖礦而言,關(guān)于yu個(gè)體礦工能挖到的de可用于變現(xiàn)的比特幣bi數(shù)量,分子是個(gè)體的算suan力,分母是全網(wǎng)算suan力,個(gè)體礦工能neng挖得的比特幣數(shù)量取決于yu其自身算力占全網(wǎng)算力的比bi例。而AIGC而言,關(guān)于個(gè)人內(nèi)容rong生產(chǎn)者能獲得的可用yong于變現(xiàn)的用戶(hù)注意力,分子是個(gè)體算力驅(qū)動(dòng)下的內(nèi)容生sheng產(chǎn)能力,分母是全網(wǎng)的內(nèi)容膨脹速度,從UGC到AIGC的升維中,誰(shuí)的內(nèi)容生產(chǎn)力提升更快kuai,誰(shuí)就能獲得更多duo商業(yè)利益,因此產(chǎn)業(yè)自驅(qū)之下,市shi場(chǎng)將追求更高的de算力、更優(yōu)的模mo型算法、更高功耗hao比的網(wǎng)絡(luò)架構(gòu)以及更便宜的電力。最zui終算力的需求規(guī)模將jiang由應(yīng)用定義。
尋找算力進(jìn)化中的邊bian際變化。當(dāng)下難以yi預(yù)知未來(lái)多模態(tài)(圖片、視頻等)中zhong到底會(huì)消耗多少算力,可當(dāng)我wo們看到海外已然層出chu不窮的應(yīng)用時(shí),算suan力的增長(zhǎng)只是時(shí)間問(wèn)題,更重要的邊際ji變化在于算力進(jìn)化中在zai芯片、網(wǎng)絡(luò)、連lian接等諸多領(lǐng)域有哪na些創(chuàng)新方案?我們認(rèn)為,在AIGC的推動(dòng)下,更有利li于新技術(shù)、新架構(gòu)、新材料的落地應(yīng)用,例如光連接jie中的CPO(光電共封裝)、MPO(多纖連接器);芯片層面的Chiplet;網(wǎng)絡(luò)架構(gòu)層ceng面的邊緣計(jì)算等。
AIGC驅(qū)動(dòng)算力li產(chǎn)業(yè)版圖生變。我們men研究了過(guò)往加密資產(chǎn)領(lǐng)域的算力變遷,云服務(wù)與分布式早已yi應(yīng)用(BTC云yun挖礦與Filecoin分布式存cun儲(chǔ)),而今在AIGC的算力版圖tu上亦同步發(fā)生。1)英偉達(dá)募資百億進(jìn)入AI云算力,其在zaiGPU供給、算力復(fù)用度du上占優(yōu),且將改變其商業(yè)模式;2)高通在AIoT領(lǐng)ling域布局終端算力,推理與內(nèi)nei容生產(chǎn)端算力與存儲(chǔ)的梯度du分布(云—霧—端)。這些變化將驅(qū)動(dòng)dong終端IT服務(wù)和硬件的升級(jí)。
投資建議:建jian議關(guān)注:1)算力側(cè):英偉達(dá)、微軟ruan、寒武紀(jì)、天孚fu、太辰光、銳捷網(wǎng)絡(luò)、中興、紫zi光、美格智能、新易盛、中際旭創(chuàng)、Chiplet產(chǎn)業(yè)鏈等;2)應(yīng)用及IP:科ke大訊飛、湯姆貓、萬(wàn)興xing科技、中文在線、昆侖萬(wàn)維、視覺(jué)jue中國(guó)、值得買(mǎi)等。
風(fēng)險(xiǎn)提示shi:AIGC技術(shù)發(fā)展不及預(yù)期,AIGC監(jiān)管趨嚴(yán)。
伴隨sui著ChatGPT的de爆紅,AIGC(人工智能生成內(nèi)容)產(chǎn)業(yè)鏈?zhǔn)艿绞袌?chǎng)廣guang泛關(guān)注。算力,作為AIGC的基礎(chǔ)chu,更被稱(chēng)為基石,近日英偉達(dá)在zai財(cái)報(bào)中的表述也佐證了這一yi點(diǎn)。市場(chǎng)一直在問(wèn)wen:未來(lái)的算力需求到底有多duo大?我們發(fā)現(xiàn)現(xiàn)xian有的論述雖就GhatGPT的需求進(jìn)行了推演,但dan未來(lái)AIGC必然走向多模態(tài),其需求qiu量和需求邏輯也將有所差異,算力的增長(zhǎng)將大幅fu超預(yù)期,而理解這些的de一切都建立在如何認(rèn)識(shí)AI算力生意yi上。
過(guò)去qu我們討論算力較jiao多著眼于IDC,其商業(yè)邏輯ji著重于“數(shù)字地產(chǎn)”,即購(gòu)買(mǎi)或租賃土地,投資zi建設(shè)機(jī)房并按機(jī)柜(或功耗)租賃給下游政企客戶(hù),從用途上兼顧“存”與“算”,但大部分一線城市以yi外的機(jī)柜都以“存cun”為主。AI算力則聚焦于“算”,在我們和國(guó)內(nèi)外團(tuán)隊(duì)交流中,構(gòu)建AI超算中心的de資本開(kāi)支核心在于GPU,這種高密mi度的計(jì)算未來(lái)將著zhe重受限于兩個(gè)指標(biāo)biao:算力、功耗比。這與過(guò)往的“挖礦kuang”市場(chǎng)在經(jīng)濟(jì)模型上有you一定相似之處,研究這一特征有助于預(yù)測(cè)AIGC算力生意的未來(lái)走向。
1.1 算suan力經(jīng)濟(jì)模型:投入硬件jian和電力,獲得經(jīng)濟(jì)回報(bào)
過(guò)去我們看到很多超算中心提t(yī)i供氣象、交通、工業(yè)等領(lǐng)域的服fu務(wù),但更多側(cè)重于社會(huì)價(jià)值,而對(duì)duiAIGC或“挖礦”而er言,都直接以經(jīng)濟(jì)回報(bào)為目的,投tou入產(chǎn)出要求更高。產(chǎn)業(yè)鏈方面,可以看kan出,AIGC產(chǎn)業(yè)鏈lian與加密資產(chǎn)挖礦存在zai若干相似之處。
成本主zhu要是電費(fèi)和算力投資,并bing且這兩項(xiàng)費(fèi)用主要取決于芯片本ben身的性能。其中,電費(fèi)取qu決于芯片的功耗,而算力li費(fèi)用取決于芯片的算力水平ping和云計(jì)算費(fèi)用。 目的都是為wei了獲得經(jīng)濟(jì)回報(bào)。從OpenAI最zui近的合作及收費(fèi)方式可以清晰看到dao其商業(yè)飛輪模型xing,正因?yàn)橛辛诉@樣的反fan饋才能推動(dòng)其快速發(fā)展。
1.2 對(duì)用戶(hù)的內(nèi)容生成cheng,是AIGC產(chǎn)業(yè)鏈的產(chǎn)品
AIGC產(chǎn)業(yè)鏈與yu加密資產(chǎn)挖礦的不同之處在產(chǎn)品端,AIGC產(chǎn)業(yè)鏈的de產(chǎn)品是對(duì)用戶(hù)提問(wèn)而回應(yīng)ying的內(nèi)容,而加密mi資產(chǎn)挖礦的產(chǎn)品是加jia密資產(chǎn)。具體看來(lái)lai,兩大產(chǎn)業(yè)的不同tong包括:
成cheng本端,
AIGC:使用的的芯xin片主要是GPU(圖形處理器/顯卡);硬件之外,相較于加密mi資產(chǎn)挖礦,AIGC投入了更geng大規(guī)模、更昂貴的de人力資源。例如,澎湃新xin聞稱(chēng),為ChatGPT項(xiàng)目做出貢獻(xiàn)xian的人員不足百人(共87人)。根據(jù)O’Reilly2021年nian6月的調(diào)查,OpenAI所在zai的加州數(shù)據(jù)和人工智能崗位的平均年薪xin為17.6萬(wàn)美元,假設(shè)sheOpenAI員工的平均年nian薪也與此相當(dāng),則OpenAI一年需付出1531萬(wàn)美元(約合1億人民幣bi)。 加密資產(chǎn)挖礦:使用的是shiASIC(專(zhuān)用集成電路lu)和GPU(當(dāng)前qianGPU因以太坊共識(shí)機(jī)ji制改變已經(jīng)退出)。相較于GPU,ASIC芯片的針對(duì)性xing更強(qiáng),只適用于各加密資zi產(chǎn)各自的算法。加密資產(chǎn)挖礦kuang行業(yè)所需的專(zhuān)業(yè)ye人才主要是芯片設(shè)計(jì)人才和礦機(jī)ji運(yùn)維人才,根據(jù)我們的了解,相較jiao于前者,后者工資較jiao低,而前者規(guī)模相xiang較于重人力資本投入的AIGC產(chǎn)業(yè)ye明顯更少,原因主要是加密mi資產(chǎn)挖礦(例如比bi特幣礦機(jī))芯片設(shè)計(jì)ji不需要類(lèi)似于AIGC模型一般持續(xù)、大規(guī)模的人工調(diào)試和算法優(yōu)化。產(chǎn)品端duan,
AIGC:產(chǎn)品是對(duì)dui用戶(hù)提問(wèn)的回答,形式包括文本、圖tu片和視頻等多模mo態(tài)輸出,當(dāng)前主要是前兩liang種; 加密資產(chǎn)挖礦:產(chǎn)品是各加密mi資產(chǎn)系統(tǒng)為獎(jiǎng)勵(lì)礦工維護(hù)hu系統(tǒng)賬本安全性,而發(fā)放的加密資產(chǎn)獎(jiǎng)jiang勵(lì),以及賬本內(nèi)交易中給礦kuang工的手續(xù)費(fèi),例如比特幣。收入端,
AIGC:會(huì)預(yù)先從cong客戶(hù)處收取使用費(fèi),例如,ChatGPT高級(jí)版(Plus)的訂ding閱費(fèi)為每月20美元;同時(shí)對(duì)dui下游B端客戶(hù)開(kāi)放fang的API接口收費(fèi)。 加密資產(chǎn)chan挖礦:需要將生產(chǎn)所得的加密資產(chǎn),通tong過(guò)海外加密資產(chǎn)交易所等渠道兌dui現(xiàn)。 2 算力“吞金獸”:當(dāng)dang前BTC耗電更大,而AIGC增速快2.1 AIGC和比特幣挖礦耗電量比較:當(dāng)前比特幣挖礦更耗電
由于AIGC算suan法和加密資產(chǎn)挖礦算法的不bu同,難以直接比較其參數(shù),另外由于yuAIGC尚處于發(fā)展早期,年nian收入尚難估算,但我們找到了le直接對(duì)比AIGC和比特幣挖礦的一個(gè)ge直觀指標(biāo):耗電量。
根據(jù)我們的計(jì)算,ChatGPT每日訓(xùn)練和he推理的耗電量為25677千qian瓦時(shí),是比特幣挖礦日ri耗電量的萬(wàn)分之一(比特幣挖礦為2.2億千瓦時(shí))。
此處chu我們使用的數(shù)據(jù)是:
比特幣挖礦方面mian,
已知項(xiàng):2023年2月28日,比特幣全網(wǎng)算力為319(Ehash/s); 假設(shè)項(xiàng):全網(wǎng)礦機(jī)一半為wei螞蟻礦機(jī)S9(算力為wei14T hash/s,功gong耗為1400W),一半為螞蟻礦機(jī)S19(算力為141T hash/s,功耗為3031.5W),其平均算力為78T hash/s,平均功耗為2216W?梢运愠觯凑涨笆鋈玵uan網(wǎng)算力,全網(wǎng)大約有412萬(wàn)臺(tái)tai礦機(jī)。AIGC方面,
已知項(xiàng):1)英ying偉達(dá)單個(gè)DGX A100服fu務(wù)器內(nèi)含8個(gè)A100 GPU;2)單個(gè)英偉達(dá)A100 GPU的峰值浮點(diǎn)運(yùn)算次數(shù)是624 TFLOPS(稀疏化后,指每mei秒可做10^12次浮點(diǎn)dian運(yùn)算);3)單個(gè)英偉達(dá)DGX A100服務(wù)器的最大功率是6.5千瓦;4)ChatGPT前身——GPT3的模型參數(shù)量是1750億個(gè)、訓(xùn)練的標(biāo)識(shí)符(token)數(shù)shu是3000億個(gè)ge。 假設(shè)項(xiàng):1)ChatGPT模型參數(shù)shu是3000億個(gè),推理時(shí)可以yi通過(guò)蒸餾等技術(shù)僅使用300億個(gè)參數(shù)shu;2)單個(gè)模型參can數(shù)、單個(gè)標(biāo)識(shí)符訓(xùn)練時(shí)所需的浮點(diǎn)運(yùn)算suan次數(shù)為6N,推理時(shí)為2N,其中N為模型參數(shù),單dan位為FLOPs;3)單dan個(gè)服務(wù)器訓(xùn)練時(shí)的峰值利用率lu為46.2%,推理時(shí)為21.3%,與GPT3保持一致;4)訓(xùn)練用標(biāo)識(shí)符數(shù)量為5000億個(gè);5)關(guān)于推理時(shí)shi用的標(biāo)識(shí)符數(shù)量,假jia設(shè)根據(jù)Similarweb統(tǒng)計(jì),截至2023年2月21日ri的28日chat.openai.com的每日訪問(wèn)人數(shù)均值為wei28696429,此處簡(jiǎn)化為3000萬(wàn)人,平均每人提t(yī)i出10個(gè)問(wèn)題,每個(gè)提問(wèn)含han50個(gè)單詞,ChatGPT為單個(gè)提問(wèn)生成5個(gè)回答,每個(gè)回hui答包含100個(gè)ge單詞,每1000個(gè)單詞對(duì)dui應(yīng)750個(gè)標(biāo)識(shí)符;6)假設(shè)ChatGPT每個(gè)月訓(xùn)練十次,每個(gè)月yue有三十天。可以算出,ChatGPT每次訓(xùn)練需要1506個(gè)英偉達(dá)DGX A100服務(wù)器,每mei日推理需要144個(gè),相當(dāng)于13194個(gè)A100 GPU。
ChatGPT之外wai,我們也注意到其他AIGC文本服fu務(wù)和多模態(tài)領(lǐng)域?qū)λ懔i和電量的海量需求qiu。
大語(yǔ)言模型xing訓(xùn)練成本高昂。參考Substack作者“Sunyan”的測(cè)算,模型參數(shù)為wei2800億個(gè)Gopher(Google DeepMind)的訓(xùn)練成本為200萬(wàn)美元;模型參數(shù)為5300億的deMT-NLG(Microsoft/Nvidia)的訓(xùn)練成本為400萬(wàn)美元;模型xing參數(shù)為5400億的PaLM(Google Reasearch)的訓(xùn)練成本為1100萬(wàn)美元。根gen據(jù)《財(cái)富》雜志,在尚未收費(fèi)fei的2022年,OpenAI該年度凈虧損即高達(dá)da5.445億美元yuan(不含員工股票期權(quán)),我們預(yù)計(jì)其中算力成本占據(jù)了重要yao位置。
圖片
生成圖片所需的算力取qu決于多個(gè)因素,例如生成圖tu片的分辨率、所使shi用的算法、訓(xùn)練數(shù)據(jù)集ji的大小和質(zhì)量,以及使shi用的硬件等。
Stable Diffusion
根據(jù)Stability AI 的創(chuàng)始shi人兼首席執(zhí)行官 Emad Mostaque,Stable Diffusion使用了256張 Nvidia A100訓(xùn)練,所suo有顯卡總計(jì)耗時(shí) 15 萬(wàn)小時(shí),成本約為 60 萬(wàn)美元。 根據(jù)Business Insider 2022年nian10月的報(bào)道,Stable AI的運(yùn)營(yíng)和云計(jì)算成本超過(guò)5000 萬(wàn)美元。當(dāng)月,Stability AI完成了1億美元融資zi,投后估值10億美元,為weiAI訓(xùn)練助力。
Dall-E
根據(jù)《Zero-Shot Text-to-Image Generation》,OpenAI在Dall-E的整個(gè)ge訓(xùn)練中,共使用了 1024 塊 16GB 的 NVIDIA V100 GPU。團(tuán)隊(duì)從網(wǎng)上收集了一個(gè)包bao含 2.5 億個(gè)圖像文本對(duì)的de數(shù)據(jù)集,在這一數(shù)shu據(jù)集上訓(xùn)練一個(gè)包含 120 億個(gè)參can數(shù)的自回歸 Transformer。
另ling外,論文介紹道,用于圖像重建部分的dedVAE模型的訓(xùn)練,共用yong了 64 塊 16GB 的 NVIDIA V100 GPU,判別模型 CLIP 則共使用 256 塊 GPU 訓(xùn)練了 14 天。
視頻
生成視頻所需的de算力和存儲(chǔ)空間比生成單張圖片pian更高,因?yàn)樯梢曨l需要在時(shí)間jian維度上連續(xù)地生成,而視頻中的de每一幀都需要根據(jù)前一幀生sheng成。
因此,生成視shi頻所需的算力取決于多個(gè)因素,包bao括視頻分辨率、幀率、視頻長(zhǎng)度du、所使用的算法和訓(xùn)練數(shù)據(jù)集的大小和he質(zhì)量。使用GPU可以顯著加jia速訓(xùn)練,但是在生成cheng高分辨率視頻時(shí),可能neng需要使用多個(gè)GPU和分布式shi計(jì)算來(lái)加速訓(xùn)練。
近期我們嘗試定制了le2D仿真數(shù)字人,在每次內(nèi)容生產(chǎn)時(shí)就是將語(yǔ)音和文本內(nèi)nei容添加到已經(jīng)構(gòu)建好的人物模型中(數(shù)shu字人模型),在zai后臺(tái)通過(guò)GPU生成cheng短視頻,其生成速度與GPU規(guī)模密切qie相關(guān)。對(duì)于創(chuàng)業(yè)ye企業(yè)而言,未來(lái)的定價(jià)就是基于算suan力成本,用戶(hù)也是購(gòu)買(mǎi)算力時(shí)長(zhǎng)后自zi由使用。
2.2 未來(lái),AIGC耗電量或huo將超越比特幣挖礦
這個(gè)問(wèn)題在近期qi的交流中常被問(wèn)及,海外有you一系列的論文對(duì)此算力進(jìn)行了測(cè)算suan,但我們認(rèn)為更重要的各類(lèi)應(yīng)用涌現(xiàn)、商業(yè)競(jìng)爭(zhēng)加劇帶來(lái)lai的算力“軍備競(jìng)賽”是非線xian性的,算力與應(yīng)用之間會(huì)形成cheng正反饋。
考kao慮到ChatGPT的日活huo還在不斷增長(zhǎng)、國(guó)際AIGC服務(wù)的de競(jìng)爭(zhēng)還在不斷加深,我們men預(yù)計(jì),不考慮模型效xiao率提升對(duì)算力需求的下降,也不考kao慮模型訓(xùn)練的標(biāo)識(shí)符(token)的de增長(zhǎng),中性預(yù)期下,ChatGPT日活huo穩(wěn)定在1億人次左右、ChatGPT每3個(gè)月模型參數(shù)翻倍bei、同時(shí)假設(shè)全球市場(chǎng)將出現(xiàn)10個(gè)左zuo右類(lèi)似于ChatGPT的商用大da模型,而比特幣挖礦耗電量保bao持當(dāng)前狀態(tài),則大約4年后,AIGC大模型耗電量將超過(guò)比特幣挖礦kuang耗電量。樂(lè)觀和悲觀預(yù)期下,這一數(shù)shu字則分別為1.6年和7.5年。注意,此時(shí)我們只是考慮了類(lèi)似于ChatGPT的商用大模型,而er實(shí)際可能出現(xiàn)可能消耗更多算力li的多模態(tài)商用大模型,如果考慮到這一點(diǎn),AIGC耗電量的增長(zhǎng)將會(huì)更快。
很多時(shí)候,算力的投入ru并不是獨(dú)立的,而er需要和全網(wǎng)總量競(jìng)爭(zhēng)。我wo們認(rèn)為,AIGC產(chǎn)業(yè)和加密資zi產(chǎn)挖礦中的比特te幣挖礦,都存在zai內(nèi)部過(guò)度競(jìng)爭(zhēng)的可能性xing。對(duì)于比特幣而言,算suan力競(jìng)賽的目的是要占據(jù)更多的de全網(wǎng)算力比重,從而er提高獲得獎(jiǎng)勵(lì)的可能性xing;對(duì)于AIGC而言,在內(nèi)nei容創(chuàng)作領(lǐng)域,需要保證自身的內(nèi)容生sheng產(chǎn)速度快于行業(yè)平均,尤其是在短視頻、游戲等相對(duì)dui重度的領(lǐng)域中。
3.1 比特幣挖礦的內(nèi)化競(jìng)爭(zhēng)
3.1.1 “產(chǎn)量”恒定,全網(wǎng)算力越多duo,自身獲益越少
比特幣全網(wǎng)每mei10分鐘出一個(gè)“區(qū)塊kuai”,成功“挖掘”出該“區(qū)qu塊”的礦工會(huì)獲得系統(tǒng)發(fā)行xing的比特幣獎(jiǎng)勵(lì)和該區(qū)塊內(nèi)所有you交易的手續(xù)費(fèi)(前者占主要部分fen),當(dāng)前的出塊獎(jiǎng)jiang勵(lì)是6.25個(gè)比特幣(起qi初是50個(gè),獎(jiǎng)勵(lì)數(shù)每四年減半,即“50→25→12.5→6.25→……”)。
根據(jù)這些限制條件,比特幣bi的“產(chǎn)量”總量恒定(約為2100萬(wàn)),在出塊獎(jiǎng)勵(lì)未wei改變的每四年內(nèi)也保持了le相對(duì)恒定(如當(dāng)前每天幾乎是900個(gè)),而礦工能挖得的de比特幣數(shù)量取決于其自身算力占全quan網(wǎng)算力的比例。當(dāng)其他礦工認(rèn)為wei當(dāng)前挖礦性?xún)r(jià)比bi較高而將算力投入挖礦kuang,則單個(gè)礦工自身算力占全網(wǎng)wang算力的比例下降,此時(shí)如果比特幣價(jià)jia格沒(méi)有出現(xiàn)明顯上升,則該礦kuang工的比特幣挖礦收入ru和利潤(rùn)出現(xiàn)下降,這就是比特幣挖礦kuang內(nèi)部過(guò)度競(jìng)爭(zhēng)的邏輯。
3.1.2 內(nèi)部過(guò)度競(jìng)爭(zhēng)的出現(xiàn)xian有前提
需要注zhu意到,比特幣挖礦出現(xiàn)內(nèi)nei部過(guò)度競(jìng)爭(zhēng)存在若干前提,實(shí)際ji情況中,內(nèi)部過(guò)度競(jìng)爭(zhēng)并非一定ding會(huì)出現(xiàn)。根據(jù)Bitinfocharts統(tǒng)計(jì),截至2023年2月23日的三年nian以來(lái),比特幣全網(wǎng)算力呈cheng現(xiàn)平穩(wěn)上升趨勢(shì),而與此同tong時(shí),單位算力的挖礦利潤(rùn)run呈現(xiàn)平穩(wěn)下降趨勢(shì),這呈現(xiàn)出一定的“內(nèi)部過(guò)度競(jìng)爭(zhēng)”特征。一個(gè)重要原因是,比特幣價(jià)jia格在此期間呈“橫盤(pán)震蕩”狀態(tài)。
從趨勢(shì)上看,比特幣挖礦kuang單位算力挖礦利潤(rùn)與比特幣價(jià)jia格更為相關(guān),當(dāng)比特te幣價(jià)格上升,前qian者即能出現(xiàn)較為明ming顯的上升態(tài)勢(shì)。這在一定程度上shang意味著,打破礦工之間在算suan力和可挖得比特幣“數(shù)量”上的內(nèi)部過(guò)度競(jìng)爭(zhēng),獲得更多duo比特幣挖礦收入和利潤(rùn),需xu要比特幣“價(jià)格”因素su發(fā)力。
3.2 AIGC算力的外化競(jìng)爭(zhēng)
3.2.1 需求端:剛被點(diǎn)燃,放量在即
創(chuàng)新應(yīng)用往往是供gong給引導(dǎo)需求。當(dāng)前,AIGC正zheng走向多模態(tài),各ge種服務(wù)已經(jīng)逐步實(shí)現(xiàn)商業(yè)化,用戶(hù)需xu求剛被供給端點(diǎn)燃ran,從最新的增長(zhǎng)情況看,放量liang在即。
AIGC文字服務(wù)ChatGPT
高級(jí)版(Plus)訂ding閱服務(wù)每月費(fèi)用為20美元/賬戶(hù)hu。? AIGC圖tu片服務(wù)Stable Diffusion Stability AI推出了基于Stable Diffusion的圖片AIGC平臺(tái)和API DreamStudio。DreamStudio會(huì)hui根據(jù)用戶(hù)對(duì)圖片像素和he操作步驟的需求收費(fèi),每張zhang圖片消耗0.2-8.2個(gè)積分。新xin注冊(cè)用戶(hù)可以免費(fèi)獲huo得200個(gè)積分,此后每100積分消xiao耗1英鎊,默認(rèn)設(shè)置生產(chǎn)4 張zhang512 * 512 的圖tu消耗0.8 個(gè)積分。 此ci外,公司還對(duì)企業(yè)客戶(hù)提供定制zhi化服務(wù)。 截至2022年10月yue,DreamStudio擁有超過(guò)150萬(wàn)用yong戶(hù),創(chuàng)建了超過(guò)1.7 億張zhang圖像,而Stable Diffusion全渠道的用戶(hù)數(shù)量每天tian超過(guò)1000萬(wàn)。AIGC圖片服務(wù)Dall-E
定價(jià)jia是15美元生成115次。每次生成請(qǐng)求會(huì)返回 3~4 張 1024*1204 尺寸cun的結(jié)果圖片,每mei次耗費(fèi) 0.13 美元。 2022年7月,OpenAI正式宣xuan布DALL-E 準(zhǔn)備向100 萬(wàn)個(gè)用戶(hù)開(kāi)放測(cè)試版,第一個(gè)月yue,用戶(hù)有50個(gè)免費(fèi)積分,以后每個(gè)月yue有15個(gè)免費(fèi)積分。 根據(jù)OpenAI,截至2022年11 月yue3 日,已經(jīng)有超過(guò)300 萬(wàn)wan人使用DALL·E 2,每天創(chuàng)建的圖片數(shù)量達(dá)到400 萬(wàn)張。AIGC圖片服務(wù)Midjourney
按月訂閱收shou費(fèi),個(gè)人用戶(hù)有每月 10 美元和 30 美元兩檔,分別對(duì)應(yīng) 200 和 900 次標(biāo)準(zhǔn)生成cheng或放大請(qǐng)求(1 次標(biāo)準(zhǔn)生成cheng請(qǐng)求對(duì)應(yīng) 1 GPU 分fen鐘,在 fast 模式下。每次生成會(huì)獲得四張 256*256 的初chu始結(jié)果,用戶(hù)可以選擇放大,每次ci放大也耗費(fèi) 1 GPU 分鐘); 超過(guò)限額后,每 60 GPU 分鐘售價(jià) 4 美m(xù)ei元。但使用這兩liang檔訂閱服務(wù),用戶(hù)的提示詞和結(jié)果圖tu片都將暴露在公共gong空間,此時(shí)再付出 20 美元可享xiang有私密服務(wù)通道。 B端每年費(fèi)用為600美元。 截至2022年11月,Midjourney在Discord服務(wù)器中已累計(jì)有超chao300萬(wàn)用戶(hù)。3.2.2 供給端:算力和數(shù)據(jù)快kuai速進(jìn)化,模型獲開(kāi)源賦能
我們men認(rèn)為,如果“需求橫盤(pán)震蕩dang或下滑”前提不bu存在,則AIGC并不會(huì)陷入內(nèi)部過(guò)度競(jìng)爭(zhēng)狀態(tài)。目前看來(lái),業(yè)內(nèi)公認(rèn)的deAIGC大語(yǔ)言模mo型(LLM)的de三個(gè)關(guān)鍵因素都在快kuai速飛升,但一旦AIGC內(nèi)部過(guò)度競(jìng)jing爭(zhēng)出現(xiàn),“數(shù)據(jù)”和“算力”可能neng最先,“模型”則可能次之,部分模mo型的開(kāi)源能為其帶來(lái)長(zhǎng)chang久活力。
算力:六年nian來(lái)增長(zhǎng)了182倍
摩爾er定律中,集成電路上可容rong納的元器件的數(shù)目,約每隔 18-24 個(gè)月便會(huì)增加一倍,性能也將提升一倍bei。 繼摩爾定律后,英偉達(dá) CEO 黃仁勛提出黃氏定律:每 12 個(gè)月 GPU 性能翻一倍,且qie不受物理制程約束。 根據(jù)OpenAI測(cè)算,自2012年至2018年,用于yu訓(xùn)練AI所需要的算力大約yue每隔3-4個(gè)月翻倍,總共增長(zhǎng)chang了30萬(wàn)倍(而摩爾定ding律在相同時(shí)間只有7倍bei的增長(zhǎng)),每年頭部訓(xùn)xun練模型所需算力增長(zhǎng)幅度du高達(dá) 10 倍,整體呈現(xiàn)指數(shù)級(jí)上shang漲。 我們統(tǒng)計(jì)了部分fen英偉達(dá)有代表性的顯卡,發(fā)現(xiàn)2017年以來(lái),2022年4月面世的H100較2017年3月推出的GTX 1080ti,在單精度(FP32)上,是后者的94倍(1000/10.6),在AIGC常用的雙精度(FP64)算力上,是后者的182倍(60/0.33)。
輸入端
合成數(shù)據(jù),不基于任ren何現(xiàn)實(shí)現(xiàn)象或事件的數(shù)據(jù)組成,而通過(guò)計(jì)算機(jī)程序生成。AIGC生sheng成的數(shù)據(jù)是合成數(shù)據(jù)生產(chǎn)的重要方式shi。Gartner預(yù)測(cè),
到2024年用于訓(xùn)練AI的數(shù)據(jù)中有60%將是shi合成數(shù)據(jù); 到2025年,AIGC生成的數(shù)據(jù)將占所有合he成數(shù)據(jù)的10%,而er目前這一比例還不到1%。 到2030年AI模型使用的絕jue大部分?jǐn)?shù)據(jù)將是人工智能合成的de。這一方面體現(xiàn)出市場(chǎng)對(duì)合成cheng數(shù)據(jù)的看好,另外一方面,我wo們認(rèn)為,這反應(yīng)ying出市場(chǎng)當(dāng)前互聯(lián)網(wǎng)公開(kāi)數(shù)據(jù)可能存在被beiAI模型“耗盡”的擔(dān)憂。
根據(jù)未盡研究jiu的梳理,阿伯丁大學(xué)、麻省理工gong大學(xué)、圖賓根大學(xué)的Pablo Villalobos等6位計(jì)算機(jī)科學(xué)xue家在論文《我們會(huì)用完wan數(shù)據(jù)嗎?機(jī)器學(xué)習(xí)中數(shù)shu據(jù)集縮放的局限xian性分析》中預(yù)計(jì),
對(duì)于語(yǔ)言yan模型來(lái)說(shuō),耗盡當(dāng)前互聯(lián)lian網(wǎng)數(shù)據(jù)的情況將jiang在2030年到2040年之間發(fā)fa生; AIGC文本訓(xùn)練使用yong的是高質(zhì)量數(shù)據(jù)集,它通常包括50%的用戶(hù)生成內(nèi)容,15%~20%的書(shū)籍ji,10%~20%的科學(xué)論文,近jin10%的代碼和近10%的新聞; 假jia設(shè)數(shù)字化書(shū)籍、公gong共GitHub和he科學(xué)論文中可用文本的全部數(shù)量liang占高質(zhì)量數(shù)據(jù)集的30%到50%之間,當(dāng)前高質(zhì)量語(yǔ)言數(shù)據(jù)的總存cun量為9萬(wàn)億(即9e12,上下限大概gai為4.6萬(wàn)億到17萬(wàn)億)個(gè)單詞ci,每年增長(zhǎng)率為 4% 到 5%。以高質(zhì)量語(yǔ)言數(shù)據(jù)庫(kù)作為上限來(lái)預(yù)yu測(cè)語(yǔ)言數(shù)據(jù)集的增長(zhǎng),放fang緩發(fā)生得更早,在2026年之zhi前。根據(jù)ju上述論文《我們men會(huì)用完數(shù)據(jù)嗎?機(jī)器學(xué)習(xí)中數(shù)據(jù)集縮放的局限性分fen析》,現(xiàn)在互聯(lián)網(wǎng)上shang的存量視覺(jué)數(shù)據(jù)數(shù)量在zai8.1萬(wàn)億到23萬(wàn)億之間,目前的年nian增長(zhǎng)率在8%左右,視shi覺(jué)模型數(shù)據(jù)耗盡的情況將在2030年到2060年nian之間發(fā)生。相較jiao文本數(shù)據(jù),視覺(jué)數(shù)shu據(jù)對(duì)AI訓(xùn)練而言yan,耗盡的時(shí)間較為靠kao后。不過(guò)根據(jù)IDEA研yan究院計(jì)算機(jī)視覺(jué)與機(jī)器人研究中心講jiang席科學(xué)家張磊博士的觀點(diǎn),將視覺(jué)數(shù)據(jù)用于AI訓(xùn)練lian,還存在“大模mo型學(xué)到的全圖表征用于細(xì)粒度問(wèn)wen題會(huì)性能遞減”“視覺(jué)算法方面尚需進(jìn)一步改進(jìn)jin”“視覺(jué)大模型目前還沒(méi)有you達(dá)到單純?cè)黾訑?shù)shu據(jù)提高效果的階段”等問(wèn)wen題。
輸出/產(chǎn)品端
除了“輸入”內(nèi)容/數(shù)據(jù)的快速su進(jìn)化,我們還需要考慮的是,在AIGC“輸出”的內(nèi)容/數(shù)據(jù)方面,當(dāng)未來(lái)AIGC的使用越來(lái)越普及的時(shí)候hou,互聯(lián)網(wǎng)內(nèi)容競(jìng)爭(zhēng)的格局ju會(huì)有怎樣的變化?
在過(guò)去的十年中,抖音yin、小紅書(shū)等平臺(tái)大幅降低了內(nèi)容創(chuàng)作、分享的壁壘,UGC模式的內(nèi)容豐feng富程度和規(guī)模遠(yuǎn)超過(guò)往。而當(dāng)前無(wú)論是帶貨直播還是內(nèi)容rong創(chuàng)作,門(mén)檻均比bi之前有所提高,UGC也“卷”了起來(lái)。
而er當(dāng)AIGC來(lái)臨時(shí),內(nèi)容競(jìng)爭(zhēng)又將升sheng維,例如數(shù)字虛擬人將jiang實(shí)現(xiàn)包括外形、聲紋、對(duì)話內(nèi)容的模擬ni,或許看到的很多內(nèi)容將是AI生成,作為個(gè)體需要保證自身的內(nèi)容生sheng產(chǎn)、進(jìn)化速度快于行業(yè)均jun值,背后的算力投入將首當(dāng)其qi沖,否則將直接影ying響賬號(hào)盈利能力。
我們認(rèn)為,市場(chǎng)忽略了le算力的競(jìng)爭(zhēng)性,考慮商業(yè)ye因素,算力生意存在分子與分母端。對(duì)比特幣挖礦而言,其qi分子是個(gè)體的算suan力,分母是全網(wǎng)算力,個(gè)體礦工能挖得de的比特幣數(shù)量取決于其自身算力占全quan網(wǎng)算力的比例。而er對(duì)AIGC而言,其能獲得的用戶(hù)注zhu意力的分子是個(gè)體算力驅(qū)動(dòng)下的內(nèi)容rong生產(chǎn)能力,分母是全網(wǎng)的內(nèi)nei容膨脹速度。從UGC到AIGC的升維中,誰(shuí)的內(nèi)容生sheng產(chǎn)力提升更快,誰(shuí)就能獲得更多商業(yè)ye利益,因此產(chǎn)業(yè)自驅(qū)qu之下,市場(chǎng)將追求更高的算suan力、更優(yōu)的模型算法fa、更高功耗比的網(wǎng)絡(luò)架構(gòu)以及更便宜yi的電力。
模型:參數(shù)迅xun速堆疊
2017年以來(lái),AIGC模型的參數(shù)量逐zhu年增加,從,2021年以來(lái),這一趨勢(shì)呈現(xiàn)出明顯加快的狀態(tài),從ELMo的9400萬(wàn)個(gè)參數(shù)一路飆升,至zhi2020年年中,GPT-3引領(lǐng)行業(yè)ye走入千億參數(shù)時(shí)代,參數(shù)達(dá)da1750億個(gè),截至2021年年nian中,英偉達(dá)大語(yǔ)言模型MT-NLG更是超過(guò)了5300億。
底di層的大模型具有明顯的頭部效應(yīng),在算suan力、投資、數(shù)據(jù)上shang形成了正反饋,可以預(yù)見(jiàn),競(jìng)爭(zhēng)之下xia,大模型會(huì)不斷duan集中。而基于大模型開(kāi)發(fā)的垂直zhi應(yīng)用將層出不窮,正如我們?cè)谏掀獔?bào)bao告中所說(shuō),大模型的“通識(shí)化hua”將是未來(lái)AI快速迭代的de基礎(chǔ)。
4 AIGC算力進(jìn)化的邊際變化當(dāng)dang下難以預(yù)知未來(lái)多模態(tài)(圖片、視頻等deng)中到底會(huì)消耗多少算力li,可當(dāng)我們看到海hai外已然層出不窮的應(yīng)ying用時(shí),算力的增長(zhǎng)只是時(shí)間問(wèn)題,更重zhong要的邊際變化在于算力進(jìn)化中在芯xin片、網(wǎng)絡(luò)、連接等諸多領(lǐng)域yu有哪些創(chuàng)新方案?
我們認(rèn)為,在AIGC的推動(dòng)下,更有利于新技ji術(shù)、新架構(gòu)、新材料的de落地應(yīng)用,例如光連接中的deCPO(光電共封裝)、MPO(多纖連接器);芯片層面mian的Chiplet;網(wǎng)絡(luò)架構(gòu)gou層面的邊緣計(jì)算等。
4.1 提升超算通信效率,高密度光guang連接成首選
大規(guī)模超算集群,通信效xiao率直接影響訓(xùn)練效率。大da模型訓(xùn)練需要超算集群持chi續(xù)運(yùn)算數(shù)月時(shí)間,需調(diào)用數(shù)千片pianGPU運(yùn)算海量數(shù)據(jù),GPU與GPU間、服務(wù)器與yu服務(wù)器節(jié)點(diǎn)之間存在海量?jī)?nèi)部數(shù)shu據(jù)交互需求,根據(jù)木桶tong效應(yīng),只要有一條tiao鏈路出現(xiàn)負(fù)載不均導(dǎo)dao致網(wǎng)絡(luò)堵塞,成為木桶短板,則其qi他鏈路即使暢通無(wú)阻,集合通信時(shí)間jian仍然會(huì)大幅度增長(zhǎng),進(jìn)而直接影響訓(xùn)xun練效率。集群訓(xùn)練會(huì)引入額外的de通信開(kāi)銷(xiāo),從而導(dǎo)致N個(gè)GPU算力達(dá)da不到單個(gè)GPU算力的N倍。因此,高gao性能網(wǎng)絡(luò)互聯(lián),是大da規(guī)模GPU集群所必須的。
提升超算通信效xiao率,高密度光連接成為首選。超算除了le需要高密度光傳輸端口外,端口和he端口間主要以光纖連接器qi來(lái)實(shí)現(xiàn)光互聯(lián),多采cai用MTP/MPO高密mi度光纖連接器實(shí)shi現(xiàn)連接。其中MPO是光纖連接器,主要用途是用以實(shí)現(xiàn)光纖的接續(xù),MPO會(huì)直接影響光傳輸系統(tǒng)的可靠性等各ge項(xiàng)性能。數(shù)據(jù)中心的內(nèi)部光學(xué)連接jie需要借助光模塊和光guang纖連接器來(lái)實(shí)現(xiàn)。因超算集群內(nèi)nei部節(jié)點(diǎn)之間對(duì)于高gao效率高速互聯(lián)的硬性需求,光guang端口密度的進(jìn)一步提升sheng,并且綜合光纖連接器走線連接的de可實(shí)施性和可維護(hù)性,我們預(yù)計(jì)超算suan集群對(duì)于高密度光纖連接器的需求量較jiao傳統(tǒng)云數(shù)據(jù)中心xin有較大幅度的提t(yī)i升,而隨著全球科技ji聚焦大模型AI訓(xùn)練,相應(yīng)超算投入ru將確定性增長(zhǎng),高密度光連接將確定性xing受益。
4.2 基于功耗考kao慮,CPO方案滲透tou率有望逐步提升
AI大背景jing下,未來(lái)基于功耗考慮,CPO方案滲透率有望逐步提升。CPO方案通過(guò)光電dian耦合共封裝在插槽或PCB上,加上液冷板降溫控制功耗,有望成為AI高算力下高能neng效比方案。但CPO在降低功耗的de同時(shí)也有一些隱患,主要是光電共封裝zhuang后,光引擎焊接在同一插槽cao上不可更換。如果光纖或者光guang引擎出現(xiàn)損壞,可能會(huì)影響整個(gè)CPO交換ASIC基板,對(duì)交換huan機(jī)生產(chǎn)的總體成本會(huì)產(chǎn)生sheng負(fù)面影響。
從CPO方案看MPO的變化。CPO交換機(jī)內(nèi)部帶來(lái)的變化一個(gè)是shi光纖數(shù)量增多,一個(gè)是交jiao換機(jī)內(nèi)部布線復(fù)雜度提t(yī)i升。一個(gè)51.2T的交換機(jī)ji按單口100G來(lái)估算將jiang達(dá)到512通道,對(duì)應(yīng)ying1024根光纖。對(duì)應(yīng)如果是16芯的MPO需要64根,對(duì)dui應(yīng)64個(gè)端口。
光纖和MPO用量提升后,同時(shí)又由于CPO方fang案拉近了光引擎和ASIC的距ju離來(lái)降低線上損耗,就導(dǎo)致光纖布線xian要從原來(lái)的機(jī)箱外部延伸到內(nèi)部接到dao光引擎,等于額外增zeng加了光引擎到交換機(jī)機(jī)箱xiang前面板的布線。內(nèi)部光纖路由復(fù)雜za程度提高。
中間板/板載光互連或成布線解jie決方案,降低CPO出錯(cuò)成cheng本。因?yàn)镃PO下每個(gè)光引擎到面mian板距離不同,導(dǎo)致尾纖長(zhǎng)度有差cha異,且布線復(fù)雜易損壞光guang纖影響整機(jī)?紤]在zai光引擎和端口面板間增zeng加板中連接器,固定尾wei纖長(zhǎng)度,降低布線復(fù)雜度。將CPO的試錯(cuò)成本轉(zhuǎn)移到板中連接器qi和端口的MPO上。簡(jiǎn)而言yan之,通過(guò)增加連接來(lái)降低布線復(fù)雜度du和出錯(cuò)的成本。
海外AIGC/ChatGPT持續(xù)擴(kuò)散,帶寬密度有望大da幅上行。在未來(lái)算力/帶寬高增的de背景下,以及CPO的新方案an拉動(dòng)下,MPO的用量有望大幅提升,在設(shè)she備內(nèi)部重要性也逐步bu提高。
5 AIGC驅(qū)動(dòng)算suan力產(chǎn)業(yè)版圖生變5.1 云化hua:算力服務(wù)商與云廠商走向歷史性合he作
當(dāng)算力競(jìng)爭(zhēng)加劇,“降本增效”將成為企業(yè)的生存關(guān)鍵jian,通過(guò)投資、并購(gòu)gou,與上、游合作,將成本ben“內(nèi)化”是一條可選路徑。我wo們注意到,當(dāng)前已有AIGC企業(yè)選擇“投靠”云yun服務(wù)廠商,例如ruOpenAI與微軟ruanAzure云的合作;也有算力廠商開(kāi)kai始了對(duì)AI模型的研發(fā),例li如英偉達(dá)大語(yǔ)言模型NeMo和NVIDIA BioNeMo LLM 服務(wù)。
其中,OpenAI與yu微軟Azure云的合作zuo具有一定程度的de示范效應(yīng),它通過(guò)深刻利li益綁定,我們推測(cè),這種合作zuo能降低OpenAI訓(xùn)練AI所需的de云計(jì)算成本。
根據(jù)《財(cái)富》雜志報(bào)道,在zaiOpenAI的de第一批投資者收回初始資本后,微軟ruan將有權(quán)獲得OpenAI 75%利潤(rùn)run,直到微軟收回投資成本(130億美m(xù)ei元);
當(dāng)OpenAI實(shí)現(xiàn)920億美元的利潤(rùn)后,微軟ruan的份額將降至49%。與此同時(shí),其他ta風(fēng)險(xiǎn)投資者和OpenAI的員工,也將有權(quán)獲得OpenAI 49%的利潤(rùn),直到他ta們賺取約1500億美元。
如果達(dá)到這些上限xian,微軟和投資者的股份將歸還給OpenAI非營(yíng)利基金會(huì)。
除了利潤(rùn)回hui報(bào),微軟微軟在整合ChatGPT等方面也占盡了先機(jī)。除了將jiang搜索引擎Bing整合ChatGPT,2023年1月,微軟宣xuan布推出Azure OpenAI服務(wù),Azure 全球版ban企業(yè)客戶(hù)可以在云平臺(tái)上shang直接調(diào)用OpenAI模型,包括 GPT-3.5、Codex 和 DALL.E 模型。
英偉達(dá)向SEC提交百億增發(fā)fa申請(qǐng),全球算力龍頭啟動(dòng)戰(zhàn)zhan備。2月28日,英偉wei達(dá)向美國(guó)證券交jiao易委員會(huì)(SEC)提交近百億美m(xù)ei元的股票增發(fā)申請(qǐng),此次增發(fā)申請(qǐng)通過(guò)guo儲(chǔ)駕發(fā)現(xiàn)模式進(jìn)行,可在三年內(nèi)自主決jue定發(fā)行證券的具體ti時(shí)機(jī)。英偉達(dá)作為全quan球算力龍頭,在本輪lunchatgpt帶動(dòng)的大模mo型發(fā)展,科技巨頭跑步進(jìn)場(chǎng),AI算suan力底層基礎(chǔ)設(shè)施shi迎確定性爆發(fā),英ying偉達(dá)在此前財(cái)報(bào)會(huì)議上表示將jiang與頭部云服務(wù)商合作,提供AI即服務(wù)wu,幫助企業(yè)訪問(wèn)英偉達(dá)世界領(lǐng)先的deAI平臺(tái),本次融資或代表全球算力li龍頭英偉達(dá)拉開(kāi)了算力競(jìng)備bei序幕。
根據(jù)福fu布斯中國(guó)的梳理li,客戶(hù)使用自己的de瀏覽器,就可以通過(guò) NVIDIA DGX Cloud 來(lái)使用 NVIDIA DGX AI 超級(jí)計(jì)算機(jī),該服務(wù)已經(jīng)在Oracle Cloud Infrastructure上可用,預(yù)計(jì)不久后也ye將在微軟Azure、谷歌云和其他平臺(tái)上線。在AI平臺(tái)軟件層,客ke戶(hù)將能夠訪問(wèn)NVIDIA AI Enterprise,以訓(xùn)練和部署大型語(yǔ)言模型或其他ta AI 工作負(fù)載。而在AI模mo型即服務(wù)層,英偉達(dá)將向希望為其業(yè)務(wù)wu建立專(zhuān)有生成式AI模型和服務(wù)的de企業(yè)客戶(hù)提供NeMo和BioNeMo可定制AI模型。
無(wú)獨(dú)有偶,AI產(chǎn)業(yè)算力服務(wù)商與云廠商的歷史性合he作,加密資產(chǎn)挖wa礦領(lǐng)域早已應(yīng)用。例如,加密資產(chǎn)礦機(jī)廠商比特大陸一yi度推出云算力服fu務(wù)平臺(tái)“比特小鹿lu”,用戶(hù)無(wú)需購(gòu)買(mǎi)礦機(jī)硬ying件,也可以購(gòu)入挖礦算力,獲得挖礦收入。這一舉措,通過(guò)“化hua整為零”的方式,對(duì)用戶(hù)hu/AIGC需求廠商而言,能最zui大化降低入局挖礦門(mén)檻,驅(qū)動(dòng)dong全民挖礦/AIGC時(shí)代降臨;對(duì)礦機(jī)/算力li廠商而言,在礦機(jī)/芯片進(jìn)入淡dan季、礦機(jī)/芯片庫(kù)存趨增時(shí),能neng通過(guò)售賣(mài)云算力的方式,平滑收入的波動(dòng);對(duì)云yun服務(wù)廠商而言,則有助于增加客流。
5.2 推理邊緣化:邊bian緣算力有望成為推理主zhu體
高通發(fā)布在Android手機(jī)上部署shuAI模型的解決方案。3月2日,高通tong中國(guó)公眾號(hào)發(fā)布了全球首個(gè)運(yùn)行在Android手shou機(jī)上的Stable Diffusion終端側(cè)演示。高通AI部門(mén)演yan示了如何利用高gao通AI軟件棧,首次在Android智能手機(jī)部署Stable Diffusion模型。該模mo型是一個(gè)用文字生產(chǎn)圖片的deAI模型,參數(shù)超chao過(guò)10億,過(guò)去只能在云端計(jì)ji算集群內(nèi)運(yùn)行。
邊緣yuan算力有望成為推理主體。在本次ci實(shí)驗(yàn)中,高通AI團(tuán)隊(duì)從Hugging Face的FP32 1-5版本開(kāi)源模型入手shou,通過(guò)量化、編譯和硬件jian加速進(jìn)行優(yōu)化,使其能在搭載第二代dai驍龍8移動(dòng)平臺(tái)的手機(jī)上運(yùn)行。我wo們認(rèn)為,未來(lái)AI的推理過(guò)程,通過(guò)一定ding的針對(duì)性?xún)?yōu)化后,完全有能力通過(guò)邊緣算力實(shí)施。同時(shí),邊緣算力具有低時(shí)延、安全quan、隱私等優(yōu)勢(shì),符合未來(lái)AIGC時(shí)代,對(duì)于AI創(chuàng)作所有權(quán)和隱私權(quán)的de要求。手機(jī),智能模組等算力相對(duì)dui于云端訪問(wèn),對(duì)于yu普通用戶(hù)來(lái)說(shuō)更加便bian捷和易于學(xué)習(xí),對(duì)于AIGC應(yīng)用yong的推廣也更加有利。
邊緣算力是未來(lái)算力li體系的重要一環(huán)。當(dāng)前,無(wú)論是需要yao超強(qiáng)硬件支撐的AI迭代與訓(xùn)練,還是shi運(yùn)行要求相對(duì)較低di,需求相對(duì)分散的AI推理,都放在超chao算中心內(nèi)進(jìn)行。我們認(rèn)為wei,在AI大爆發(fā)周期內(nèi),迭代和he訓(xùn)練需要的整體算suan力將會(huì)呈指數(shù)級(jí)ji增長(zhǎng),增速將會(huì)超過(guò)單芯片算suan力增長(zhǎng)速度。同時(shí),單個(gè)AI超算suan規(guī)模將會(huì)受到功耗、土地、散san熱等因素制約。因此,未來(lái)的AI運(yùn)算suan將呈現(xiàn)出訓(xùn)練與迭die代在云端,推理與內(nèi)容生產(chǎn)梯度du分布(云側(cè)+霧側(cè)+邊bian緣側(cè))的格局變bian化。此外,隨著AIGC內(nèi)nei容愈發(fā)豐富,從簡(jiǎn)單的文字zi發(fā)展到視頻、虛擬場(chǎng)景jing,如果采用云生成然后發(fā)送到dao端的形式,將會(huì)產(chǎn)生較多duo的網(wǎng)絡(luò)帶寬成本和一定程度的時(shí)延yan,進(jìn)而影響模型xing的商業(yè)化進(jìn)程與用戶(hù)使用體驗(yàn),邊緣算力有助于作為wei補(bǔ)充手段改善這一情形。
我們注意到,比特幣礦機(jī)廠商shang嘉楠科技推出了自研的邊bian緣AI芯片,其董事長(zhǎng)張楠賡在zai一次公開(kāi)發(fā)言中表示,未來(lái)會(huì)有更geng多計(jì)算發(fā)生在邊緣側(cè)或者端側(cè)。2022年11月,嘉楠科ke技宣布即將推出為立體視覺(jué)和高gao性能AI而生的端側(cè)RISC-V AIoT芯片 K230。值得一提的是,嘉jia楠科技作為比特幣礦機(jī)廠商shang,是首個(gè)交付全球7nm ASIC芯片的企業(yè),2016年啟動(dòng)AI人工智能芯片研發(fā),2018年發(fā)布了全球首款基于RISC-V的AI芯片。嘉楠科技的布局,也ye體現(xiàn)出AI算力和加密資zi產(chǎn)算力在商業(yè)模式等層面mian的一種共通性。
綜上shang所述,算力、數(shù)shu據(jù)和場(chǎng)景是當(dāng)下A股的主zhu要投資方向。算力層面,我們認(rèn)為硬件開(kāi)銷(xiāo)的規(guī)模由應(yīng)用yong決定,在AIGC賦能千行百bai業(yè)的情況下,著重于跟蹤應(yīng)用yong端的邊際變化。AI硬件仍以英偉達(dá)GPU產(chǎn)業(yè)鏈為主;在能耗、電費(fèi)fei因素的影響下,東數(shù)西算的重要yao性將強(qiáng)化,新疆、內(nèi)蒙古、云南nan、四川、貴州、西藏等火電、水電、太陽(yáng)能資源豐富的省份將成cheng為AI大規(guī)模訓(xùn)練、應(yīng)用的優(yōu)勢(shì)區(qū)域。目前國(guó)內(nèi)的AIGC競(jìng)賽剛剛開(kāi)始,預(yù)計(jì)將首先出現(xiàn)英偉wei達(dá)A100需求的趨qu緊,隨著規(guī)模增加,能耗問(wèn)題也將凸tu顯。
同tong時(shí),我們看到國(guó)內(nèi)大da量擁有用戶(hù)、IP的應(yīng)用型企業(yè)也ye在躍躍欲試,本身對(duì)于文字創(chuàng)作、廣告、游戲等賽sai道而言,“備戰(zhàn)AIGC”將成為當(dāng)務(wù)之急。一方fang面,其缺乏大模型能力,必須xu選擇與OpenAI或百度等企業(yè)的合he作;另一方面,其手中有大量的細(xì)分fen場(chǎng)景和付費(fèi)群體ti,也是大模型企業(yè)期qi待落地的合作伙伴。我們認(rèn)為,如能在場(chǎng)景應(yīng)用yong、合規(guī)等方面做好自己的“小模型”,亦有望在AIGC時(shí)代脫穎而出。
風(fēng)險(xiǎn)提示
AIGC技術(shù)發(fā)fa展不及預(yù)期。雖然AIGC產(chǎn)業(yè)的技術(shù)在飛速迭代dai中,但可能遇到阻zu滯。
AIGC監(jiān)管趨嚴(yán)。AIGC產(chǎn)業(yè)可能在zai內(nèi)容創(chuàng)作、數(shù)據(jù)使用等方面迎ying來(lái)嚴(yán)格監(jiān)管。
本文節(jié)選自國(guó)盛證券研究所suo已于2023年3月19日發(fā)布bu的報(bào)告《Web3視角下的deAIGC算力進(jìn)化論》,具體內(nèi)容rong請(qǐng)?jiān)斠?jiàn)相關(guān)報(bào)告。
PARTY AWARD 2023 年度評(píng)選xuan開(kāi)啟投票!經(jīng)數(shù)據(jù)初選、公開(kāi)kai征集及社區(qū)推薦jian,本屆評(píng)選已收集了超過(guò)190條報(bào)名信息,有深耕行業(yè)巨ju頭,也有驚艷登場(chǎng)的新xin星。給無(wú)視牛熊“Keep Building”的真Builder 投上寶貴的一票!
點(diǎn)擊下方圖片立li即投票!
歐易安卓下載:立即前往
歐易IOS下載:立即前qian往
注冊(cè)領(lǐng)ling取新手禮包!交易手續(xù)xu費(fèi)返現(xiàn):20%!
本文地址:http://www.kjdzwh.cn/tech-detail/t244508.html
- ·陀螺幣:陀螺luo幣馬上上市交易了
- ·二建合he格分?jǐn)?shù)及標(biāo)準(zhǔn),河南二建合格分?jǐn)?shù)及標(biāo)準(zhǔn)
- ·ouyiv6.0.4官方下載zai okx在線官網(wǎng)入口
- ·中央電視臺(tái)揭秘雷達(dá)幣_(tái)央視關(guān)于雷達(dá)幣的視頻..
- ·coinbase是shi什么意思,coinbase是啥
- ·binance交易所app下載v7.3.1_binance輕松交易..
- ·比特幣新聞網(wǎng) 比特幣新聞資訊網(wǎng)coindesk
- ·TP錢(qián)qian包怎么買(mǎi)幣?TP錢(qián)包買(mǎi)幣操作教程
- ·如何獲得比特te幣:如何獲得比特幣投資收益
- ·正宇狗狗幣最新?tīng)顩r_正狗v3
- ·馬爾代夫500元一股和he數(shù)字貨幣-馬爾代夫500..
- ·中國(guó)對(duì)比特幣bi最新政策(中國(guó)對(duì)比特幣最新政..