欧美精品一级高清手机在线,亚洲AV永久纯肉无码精品动漫,在线观看国产日韩欧美,97精品久久人人妻人人做人人爱,免看一级a一级久久,2020久久精品永久,国产狂喷潮在线观看中文,无码av免费线播放

大模型“免費(fèi)”送，廠商們圖什么？

辰樹

06/05

參照云計(jì)算價(jià)格戰(zhàn)的經(jīng)驗(yàn)，此番大模型價(jià)格戰(zhàn)或許可以吸引更多下游企業(yè)認(rèn)真審視大模型，有望基于相關(guān)技術(shù)探索出更多良性的商業(yè)模式。

本文來自于微信公眾號(hào)“壹度Pro”（ID：yiducaijing2021），作者：辰樹，投融界經(jīng)授權(quán)發(fā)布。

2024年618，傳統(tǒng)電商行業(yè)不再喧囂，但大模型市場卻開啟了慘烈的“價(jià)格戰(zhàn)”，甚至部分企業(yè)直接免費(fèi)送大模型服務(wù)。

5月15日，字節(jié)跳動(dòng)宣布，豆包主力模型企業(yè)市場定價(jià)為0.0008元/千Tokens，0.8厘可處理1500多個(gè)漢字，比行業(yè)便宜99.3%。

一周后，阿里云也對(duì)外宣布，通義千問GPT-4級(jí)主力模型Qwen-Long的API輸入價(jià)格降至0.0005元/千Tokens，直降97%。

阿里云卷入“價(jià)格戰(zhàn)”后，百度、騰訊云、科大訊飛等企業(yè)也接連宣布自家的大模型降價(jià)。其中百度甚至宣布，兩款基礎(chǔ)模型可免費(fèi)調(diào)用。

不可否認(rèn)的是，隨著技術(shù)逐漸成熟，大模型的成本正不斷下探。為了盡快俘獲更多企業(yè)客戶，拓寬市場影響力，上游算力提供商確實(shí)需要盡力降價(jià)。

然而需要注意的是，盡管大模型成本正逐步下探，但目前大部分企業(yè)的大模型業(yè)務(wù)依然面臨算力、人力成本高企的挑戰(zhàn)，沒能盈利。在此背景下，上游算力提供商不斷降價(jià)，甚至免費(fèi)送大模型，顯得十分反常。

這種非理性的價(jià)格戰(zhàn)，其實(shí)凸顯出了上游企業(yè)亟待通過讓利，打通大模型商業(yè)閉環(huán)的內(nèi)在焦慮。

價(jià)格戰(zhàn)背后，大模型商業(yè)困局難解

2023年以來，隨著ChatGPT爆火，諸多科技公司都看到了AI大模型蘊(yùn)含著巨大的商業(yè)價(jià)值，因而加碼相關(guān)業(yè)務(wù)。2024年3月，國家數(shù)據(jù)局局長劉烈宏透露，中國10億參數(shù)規(guī)模以上大模型數(shù)量已超100個(gè)。

大模型“免費(fèi)”送，廠商們圖什么？

然而隨著越來越多企業(yè)入局相關(guān)產(chǎn)業(yè)，大模型商業(yè)模式不健全，成本高、落地難、下游企業(yè)持觀望態(tài)度等問題愈發(fā)凸顯。

由于需要采購高性能計(jì)算機(jī)，并且需要進(jìn)行模型訓(xùn)練，大模型的成本異常高昂。以O(shè)penAI為例，其訓(xùn)練GPT-4的FLOPS約為2.15e25，一次訓(xùn)練成本為6300萬美元。The Information報(bào)道，2022年，OpenAI虧損約為5.4億美元左右，約擴(kuò)大一倍。

目前，大部分企業(yè)都意識(shí)到了大模型的參數(shù)越多，商業(yè)想象力越大，因而持續(xù)加碼模型訓(xùn)練。不過問題也隨之而來，那就是大模型僅僅問世兩年時(shí)間，下游創(chuàng)收手段十分有限。

整體而言，大模型有兩種創(chuàng)收模式，一是直接向用戶收取訂閱費(fèi)，二是向開發(fā)者收取API調(diào)用費(fèi)。比如，2023年初，OpenAI推出了會(huì)員訂閱服務(wù)ChatGPT Plus，費(fèi)用為20美元/月，可使用基于GPT-4的模型，并且提供更快的響應(yīng)時(shí)間、優(yōu)先訪問等權(quán)限。

不過，據(jù)Reddot聯(lián)合創(chuàng)始人Pierre Herubel測算，即使以每月?lián)碛?00萬訂戶估計(jì)，ChatGPT Plus每年或只能為OpenAI帶來2.4億美元左右收入，很難幫助公司扭虧為盈。

因此，目前以O(shè)penAI為代表企業(yè)的發(fā)力重點(diǎn)，是向企業(yè)收取API調(diào)用費(fèi)。參照云計(jì)算的經(jīng)驗(yàn)，外部的企業(yè)從零開始訓(xùn)練大語言模型非常困難，傾向于采購成熟的AI大模型技術(shù)，一旦這些企業(yè)探索出具備想象力的商業(yè)模式，即可反哺上游算力提供商，進(jìn)而實(shí)現(xiàn)多方共贏。

對(duì)此，2023年11月，百度創(chuàng)始人兼CEO李彥宏曾表示，不斷地重復(fù)開發(fā)基礎(chǔ)大模型是對(duì)社會(huì)資源的極大浪費(fèi)，“AI原生時(shí)代，我們需要100萬量級(jí)的AI原生應(yīng)用，但是不需要100個(gè)大模型?！?/span>

算力提供商作出表率，但B端企業(yè)仍持觀望態(tài)度

由于大部分大模型算力提供商都是平臺(tái)型企業(yè)，推出大模型技術(shù)后，這些企業(yè)紛紛在內(nèi)部試水相關(guān)技術(shù)的商業(yè)化，以圖給下游客戶做出商業(yè)化表率。

比如，2023年阿里云峰會(huì)上，時(shí)任阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇表示：“阿里巴巴所有產(chǎn)品未來將接入‘通義千問’大模型，進(jìn)行全面改造?！?/span>

以釘釘為例，接入大模型后，其支持AI生成推廣文案、繪圖方式創(chuàng)建應(yīng)用、視頻會(huì)議中生成摘要等功能。釘釘總裁葉軍認(rèn)為，大模型將會(huì)讓釘釘?shù)氖杖朐鲩L百分之幾十。

無獨(dú)有偶，過去一段時(shí)間，騰訊也積極探索AI技術(shù)的商業(yè)化應(yīng)用。2023年財(cái)報(bào)中，騰訊對(duì)外表示：“廣告AI模型的改進(jìn)顯著提升了精準(zhǔn)投放的效果…… 這些發(fā)展帶動(dòng)了高質(zhì)量的收入來源，推動(dòng)毛利增長 23%?！?/span>

自有業(yè)務(wù)挖掘出AI的商業(yè)價(jià)值后，上游算力提供商正致力于針對(duì)垂直行業(yè)的細(xì)分需求，提供定制大模型能力。

比如，2023年6月，騰訊云宣布開啟“騰訊云行業(yè)大模型生態(tài)計(jì)劃”，致力于推進(jìn)大模型在產(chǎn)業(yè)領(lǐng)域的創(chuàng)新和落地。據(jù)悉，騰訊云已為傳媒、文旅、政務(wù)等10余個(gè)行業(yè)提供了超50個(gè)大模型行業(yè)解決方案。

然而需要注意的是，平臺(tái)型企業(yè)大多擁有自研大模型技術(shù)，無論是試錯(cuò)還是使用成本都更低，往往只會(huì)對(duì)外宣傳商業(yè)路徑清晰的大模型落地案例。

反觀外部的企業(yè)需要采購上游的大模型技術(shù)，探索成本相對(duì)更高，并且商業(yè)模式不清晰，很難擁有足夠的積極性。見實(shí)團(tuán)隊(duì)披露的《AI應(yīng)用需求與付費(fèi)意愿調(diào)研報(bào)告》顯示，46.2%的企業(yè)AI預(yù)算在1萬元以下，另有22.2%和24%的企業(yè)預(yù)算分別為1萬-5萬元以及5萬元-10萬元，這些中腰部企業(yè)沒有足夠的預(yù)算探索AI。

此前，大部分主力模型產(chǎn)品的API輸入價(jià)格不菲，比如，Qwen-Long為0.02元/千tokens，1萬元只可以購買5億個(gè)tokens。如果一個(gè)產(chǎn)品有500萬月活，1萬元的預(yù)算，一個(gè)月平均只能供每個(gè)用戶使用100個(gè)tokens，顯然不夠。

成本雖屢屢下探，但算力提供商已急不可耐

顯而易見，當(dāng)下限制大模型B端商業(yè)化落地的主要障礙，就是API成本過高，限制了B端企業(yè)探索相應(yīng)的商業(yè)閉環(huán)。因此，目前算力提供商的發(fā)力方向，就是致力于通過技術(shù)手段，壓低大模型的成本，降低B端企業(yè)的使用成本。

開頭提到，字節(jié)跳動(dòng)旗下豆包主力模型企業(yè)市場定價(jià)為0.0008元/千Tokens，比行業(yè)便宜99.3%。對(duì)此，火山引擎總裁譚待表示：“豆包模型的超低定價(jià)，來源于我們有信心用技術(shù)手段優(yōu)化成本，而不是補(bǔ)貼或是打價(jià)格戰(zhàn)爭奪市場份額?！?/span>

無獨(dú)有偶，2024年5月6日，深度求索開源了第二代MoE模型DeepSeek-V2，性能更強(qiáng)，訓(xùn)練成本更低。據(jù)悉，DeepSeek可節(jié)省42.5%訓(xùn)練成本，減少93.3%的KV緩存，最大吞吐量提高5.76倍。整體而言，DeepSeek-V2消耗的顯存（KV Cache）只有同級(jí)別Dense模型的1/5-1/100。

不過，這并不意味著當(dāng)下大模型行業(yè)的價(jià)格戰(zhàn)十分正常。2024年5月，談及大模型的發(fā)展趨勢時(shí)，零一萬物CEO李開復(fù)接受采訪時(shí)表示：“未來整個(gè)行業(yè)的推理成本每年降低10倍是可以期待的，而且這個(gè)趨勢是必然的?！蔽磥恚竽Ｐ偷某杀緦⒊孰A梯狀下探，但目前大模型的價(jià)格卻斷崖式下探，甚至部分企業(yè)免費(fèi)送，降價(jià)幅度遠(yuǎn)超上游成本降幅。

上游算力提供商之所以如此內(nèi)卷，很大程度上都是希望俘獲更多的B端企業(yè)，一方面實(shí)現(xiàn)規(guī)模效應(yīng)，另一方面，讓B端企業(yè)無負(fù)擔(dān)地探索良性的商業(yè)模式。對(duì)此，譚待表示：“大的使用量，才能打磨出好模型，也能大幅降低模型推理的單位成本……大模型從以分計(jì)價(jià)到以厘計(jì)價(jià)，將助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新?！?/span>

盡管激烈的價(jià)格戰(zhàn)之下，大模型已經(jīng)進(jìn)入“免費(fèi)時(shí)代”，但其實(shí)大部分上游算力提供商為了后續(xù)創(chuàng)收，都留有更為隱晦的收費(fèi)手段。

目前，大部分大模型僅推理用的token降價(jià)，而訓(xùn)練和部署成本依然不低。比如，阿里的qwen-turbo 模型百萬個(gè)token推理只要2元，若是訓(xùn)練，就需要30元，部署時(shí)，每月需要2萬元。

由此來看，大模型進(jìn)入“免費(fèi)時(shí)代”，很大程度上其實(shí)只是一個(gè)宣傳意義上的噱頭。如果下游企業(yè)想要用上成套大模型服務(wù)，那么不能不付出更高的使用成本。

而之所以上游算力提供商僅僅降低推理用的token成本，主要是因?yàn)橥ㄟ^內(nèi)部應(yīng)用，其對(duì)于大模型的商業(yè)價(jià)值足夠自信，希望降價(jià)的噱頭起到引流的作用。

版權(quán)聲明本文經(jīng)授權(quán)發(fā)布，不代表投融界立場。如若轉(zhuǎn)載請聯(lián)系原作者

大模型 AI 算力

評(píng)論

還可輸入300個(gè)字

發(fā)布留言