在近日舉辦的2024年云棲大會上,阿里再次成為了焦點。
今年5月,阿里云宣布旗下通義千問的多款商業(yè)化及開源模型進行大幅降價,最高降價幅度高達97%;云棲大會上,通義千問三款主力模型再次大幅降價,最高降幅達85%。
自阿里在5月率先“開卷”之后,字節(jié)跳動旗下云服務火山引擎、百度智能云、騰訊云、科大訊飛等均官宣旗下大模型大幅下調(diào)價格,行業(yè)降價幅度達到了90%左右。
不僅國內(nèi)大模型廠商跟進價格戰(zhàn),行業(yè)風向標 OpenAI 也在今年7月推出了GPT-4o mini ,商用價格較GPT-3.5 Turbo 便宜了60% 以上。
可以預見,在阿里再掀“價格戰(zhàn)”之后,大模型價格還將繼續(xù)下調(diào),甚至可能走向“負毛利”。在互聯(lián)網(wǎng)行業(yè)的發(fā)展史中,“虧本換規(guī)模”并不是某個企業(yè)的孤例,要改變整個行業(yè)的商業(yè)模式,必然需要投入更高的成本。
但在這個過程中,如何平衡價格、質(zhì)量與服務也成為了大模型企業(yè)必須思考的問題,企業(yè)想要“活下來”,就不能只吃“低垂的果實”。
規(guī)模比利潤更重要
國內(nèi)大模型已從“以分計價”的定價模式走向“以厘計價”的新時代。今年5月,阿里通義千問大模型的API調(diào)用輸出價格,從0.02元/千Tokens降至0.0005元/千Tokens。
在9月再次降價之后,阿里云Qwen-Turbo(128k)、Qwen-Plus(128k)、Qwen-Max 三款模型每千 tokens的最低調(diào)用價格再次刷新下限,分別降至0.0003元、0.0008元、0.02元。
圖片
對于再次降價,阿里云CTO周靖人表示,每一次降價都是一個非常嚴肅的過程,要從整個產(chǎn)業(yè)發(fā)展,開發(fā)者、企業(yè)用戶的反饋等各方面進行權(quán)衡,(降價)不是“價格戰(zhàn)”,(大模型價格)還是太貴了。
隨著一個行業(yè)的成熟發(fā)展,其走向降價趨勢也是必然的,比如半導體行業(yè)的“摩爾定律”,即處理器的性能大約每兩年翻一倍,但工藝的進步會使成本下降為之前的一半。
但目前來看,大模型行業(yè)的降價速度已經(jīng)遠超“摩爾定律”,降價幅度接近100%,在這樣的背景下,大模型企業(yè)還能盈利嗎?或許對大模型行業(yè)來說,當前規(guī)模比利潤更重要。
一方面,暫時讓渡利潤已是大模型行業(yè)的共識,業(yè)內(nèi)人士認為,大模型行業(yè)甚至可能已經(jīng)到了“負毛利時代”。
據(jù)《財經(jīng)》雜志報道,阿里云、百度智能云等多位負責人曾透露,今年5月以前,國內(nèi)大模型推理算力毛利率高于60%,和國際同行基本一致,但在5月接連降價后,毛利率則跌至負數(shù)。
在大模型降價以后,使用者數(shù)量會持續(xù)增多,短期內(nèi)調(diào)用次數(shù)越多,大模型的虧損就越大,因為每次調(diào)用模型都要消耗價格不菲的算力,也就是說大模型企業(yè)不僅要降低售價,還要面臨更高的成本投入。
但另一方面,大模型降價帶來的效果也是顯著的。以阿里云為例,在大模型降價以后,阿里云百煉平臺的付費客戶數(shù)比上一個季度增長了超過200%,更多企業(yè)放棄私有化部署,選擇在百煉上調(diào)用各類AI大模型,目前百煉已服務超30萬個客戶。
過去一年,百度文心大模型的降價幅度也超過90%,不過,百度在2024年Q2財報電話會上披露,文心大模型日均調(diào)用量超6億次,半年內(nèi)增長超10倍。
如此看來,大模型企業(yè)寧愿犧牲利潤也要降價,所求的正是“預期”,即犧牲短期利益來換取長期回報。
有業(yè)內(nèi)人士估計,目前各家大模型企業(yè)在模型調(diào)用領(lǐng)域的收入不會超過10億元,相較于百億元級別的總營收,這筆收入只是“九牛一毛”。
但在未來1-2年,大模型調(diào)用次數(shù)至少有10倍以上的指數(shù)級增長,短期來看,用戶規(guī)模越大,大模型的算力成本越高;但長期來看,在云服務領(lǐng)域,算力成本有望隨著客戶需求增長逐漸攤薄,企業(yè)將會迎來“回報期”。
隨著行業(yè)的持續(xù)發(fā)展,AI對算力的拉動會越來越明顯,阿里CEO吳泳銘曾表示,在算力市場上,超過50%的新需求都是由AI驅(qū)動產(chǎn)生的,大模型正在加速商業(yè)化。
一方面,降價大大降低了企業(yè)客戶的使用門檻和試錯成本,特別是對政務、制造、能源等傳統(tǒng)行業(yè)來說,它們的業(yè)務規(guī)模更大,增量空間也更大。
當大模型能夠像其他基礎設施一樣人人可用時,大模型的市場空間才能有望實現(xiàn)大幅增長,在這之前,大模型企業(yè)難免需要讓利給企業(yè)和開發(fā)者。
另一方面,大模型降價后存量收入會下降,但增量收入會增長。以百度為例,大模型不僅帶來了直接收入,比如文心大模型等產(chǎn)品的調(diào)用等,還能帶動間接業(yè)務的收入,比如百度智能云業(yè)務。
過去幾年,外界對百度智能云戰(zhàn)略不乏質(zhì)疑,其在公有云市場并不占優(yōu)勢,但在AI公有云這個細分市場,百度開始彎道超車。目前,百度智能云的大模型收入占比已從2023年四季度的4.8%提升到了2024年二季度的9%。
所以,目前大模型行業(yè)的共識,就是規(guī)模比利潤更重要,這一觀點在互聯(lián)網(wǎng)時代也是老生常談,比如“千團大戰(zhàn)”“網(wǎng)約車大戰(zhàn)”“電商大戰(zhàn)”等。大模型企業(yè)不能回避“價格戰(zhàn)”,就只能將活過價格戰(zhàn)作為初步目標,希望能成為淘汰賽結(jié)束后的最終受益者。
阿里著力“AI大基建”
阿里也深知這一道理,其在近日宣布大模型再次降價后,也提出了“AI大基建”的概念。阿里云副總裁張啟表示,現(xiàn)在的AI相當于1996年前后的互聯(lián)網(wǎng),當時的上網(wǎng)資費很貴,這也限制了移動互聯(lián)網(wǎng)的發(fā)展,只有把資費降下來,才有可能談未來的應用爆發(fā)。
所以,阿里除了在2024年云棲大會上提出大模型再次降價之外,還發(fā)布了新一代的開源大模型,一口氣上架了100 多個模型,涵蓋多個尺寸的大語言模型、多模態(tài)模型、數(shù)學模型和代碼模型,創(chuàng)造了大模型開源的“數(shù)量之最”。
阿里云CTO周靖人表示,阿里云堅定不移地推進開源戰(zhàn)略,希望把選擇留給開發(fā)者,讓開發(fā)者會基于自己的業(yè)務場景去做模型能力增強和推理效率增強的權(quán)衡與選擇,同時也能更有效服務企業(yè)。
根據(jù)阿里的統(tǒng)計,截至 2024 年 9 月中旬,通義千問開源模型下載量突破 4000 萬,Qwen 系列衍生模型總數(shù)超過 5 萬個,成為僅次于 Llama 的世界級模型群,而Llama正是大模型開源界的“頭把交椅”,全球下載量接近3.5億。
在“百模大戰(zhàn)”結(jié)束之后,多位行業(yè)大佬均認為“卷模型不如卷應用”,大廠也開始聚焦“卷生態(tài)”。百度董事長李彥宏曾表示,“沒有構(gòu)建于基礎模型之上的、豐富的AI原生應用生態(tài),大模型就一文不值。”
目前,通過國家網(wǎng)信辦備案的大模型已達190多個,注冊用戶超6億,但仍難以解決大模型“最后一公里”問題,難點不僅是大模型應用太少,還有大模型不夠“接地氣”,比如在醫(yī)療、金融等專業(yè)領(lǐng)域中,單純依靠“喂數(shù)據(jù)”訓練,大模型還是很難直接落地應用。
大廠不可能躬身入局每一個細分行業(yè)來完成“最后一公里”,但可以通過打造完整的應用生態(tài),由下游企業(yè)或其他開發(fā)者自行“煉成”符合需求的模型產(chǎn)品,不僅能進一步優(yōu)化資源配置,也能在這個過程中積累更多高質(zhì)量數(shù)據(jù),最終反哺給基礎大模型開發(fā)。
阿里選擇降價、開源,本質(zhì)就是希望降低大模型的使用門檻,通過更低的價格來驗證大模型的應用價值,讓更多企業(yè)和創(chuàng)作者參與進來。只有大模型能夠真正滿足企業(yè)的復雜業(yè)務場景需求,生態(tài)才能發(fā)展起來,行業(yè)才能進入新的階段。
不過,“百模大戰(zhàn)”最終可能只會留下3-5家大模型企業(yè),目前來看,行業(yè)第一梯隊已經(jīng)呼之欲出,它們也可能會是大模型行業(yè)未來最基本的底座。
因此,頭部的大模型企業(yè)更不可能主動放棄價格戰(zhàn),讓出自己的市場份額。除此以外,不少獨角獸也希望憑借價格戰(zhàn)殺出一條“生路”,部分企業(yè)也認為小模型或更具性價比。
事實上,今年5月的大模型價格戰(zhàn)并非始于阿里,而是一條名為“DeepSeek V2”的鯰魚,在行業(yè)普遍推理價格還是百元/Tokens的背景下,其將支持32k上下文的模型API定價為1元/百萬Tokens(計算)、2元/百萬Tokens(推理)。
目前來看,大模型淘汰賽或還會持續(xù)2-3年,雖然最終留下的大模型企業(yè)并不會多,為了活下去,企業(yè)們也不得不使出渾身解數(shù),但問題是,當“低垂的果實”都被摘完之后,當下大模型行業(yè)的解題思路早已不是“便宜就完事”。
模型能力仍是關(guān)鍵
不過,對于大模型“價格戰(zhàn)”一事,行業(yè)也有不同的看法。零一萬物創(chuàng)始人李開復曾表示,沒有必要打瘋狂的價格戰(zhàn),因為大模型不光要看價格,還要看技術(shù),如果是技術(shù)不行,然后靠賠錢來做生意,(公司)不會對標這樣的定價。
火山引擎總裁譚待在談及價格戰(zhàn)時也表示,當前主要關(guān)注的是應用覆蓋,而不是收入,要有更強的模型能力才能解鎖新場景,這才更有價值。
目前來看,“價格戰(zhàn)”的本質(zhì)還是因為產(chǎn)品能力不足,各家模型能力趨于同質(zhì)化,暫時無法形成斷檔的差距,所以才希望通過價格戰(zhàn)來增加大模型的普及,也能幫助廠商增加市場份額。
但等到市場摘完“低垂的果實”,新問題也會接踵而來,企業(yè)能否扛下下一階段的價格戰(zhàn);大模型能否和對手拉開差距;自己會否成為最終能夠留下來的企業(yè),這些問題依然需要解決。
所以,大模型企業(yè)在打價格戰(zhàn)的同時,也深知產(chǎn)品、技術(shù)、現(xiàn)金流的重要性,既要抗住降價壓力,又要和對手拉開技術(shù)差距,持續(xù)提升模型性能和產(chǎn)品落地,才能形成良性的商業(yè)閉環(huán)。
一方面,大模型企業(yè)并非單純依賴“價格戰(zhàn)”。通常來說,大模型的推理包含時間、價格、生成 Token 數(shù)量三個變量,不能拋開單位時間內(nèi)的并發(fā)數(shù)量,只看 tokens 價格。
因為在實際跑業(yè)務的過程中,推理事件越復雜,越有可能要增加并發(fā)量。但目前降價大模型普遍使用的是預置模型(不支持增加并發(fā)量),真正大規(guī)模、高性能、支持高并發(fā)的模型推理均未有大幅降價。
另一方面,通過技術(shù)來進一步優(yōu)化大模型的推理成本。以百度為例,旗下的百舸異構(gòu)計算平臺對智算集群的設計、調(diào)度、容錯等環(huán)節(jié)進行了專項優(yōu)化,能夠?qū)崿F(xiàn)萬卡集群上的模型有效訓練時長占比超過98.8%,線性加速比、帶寬有效性分別高達95%,幫助客戶解決算力短缺和算力成本偏高等問題。
微軟CEO薩蒂亞·納德拉曾舉例表示,過去一年 GPT-4 性能提升了6倍,但成本降低到了之前的1/12,性能/成本提升了70倍。不難看出,大模型技術(shù)的發(fā)展才是行業(yè)持續(xù)降價的底氣。
最后,則是打造出更有差異化的產(chǎn)品。低價策略能夠幫助大模型企業(yè)筑造生態(tài),但隨著AI領(lǐng)域的不斷發(fā)展,創(chuàng)新速度的加快也使得技術(shù)更新?lián)Q代周期縮短,是否能夠持續(xù)提供有競爭力的產(chǎn)品,能否在實際應用中解決用戶痛點,才是大模型企業(yè)的核心競爭力。
目前,大模型行業(yè)的商業(yè)邏輯,已經(jīng)從卷模式、卷成本,邁入到卷生態(tài)、卷技術(shù)的新階段。當然,低價還是快速建立生態(tài)壁壘的重要手段,但通過技術(shù)降低成本,才是推動大模型快進到“價值創(chuàng)造階段”的關(guān)鍵要素。
接下來,大模型企業(yè)的新戰(zhàn)場將會是“性價比”,要在當前的價格基礎上,進一步提高大模型的質(zhì)量和性能,讓模型能力更強、更多元,這么做或許不一定能孵化出“超級應用”,但吸引更多中小企業(yè)、創(chuàng)業(yè)公司的加入,才有機會為大模型企業(yè)帶來爆發(fā)式增長的機會。