首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 頭條資訊 >> 正文

從智算服務(wù)市場格局看運營商競爭策略

2024年9月10日 08:24  天翼智庫  

依據(jù)IDC發(fā)布的《中國智算服務(wù)市場(2023下半年)跟蹤》報告,我國智算服務(wù)市場的增量幾乎全部來自GenAI IaaS和智算集成服務(wù)。其中,GenAI IaaS市場由火山引擎、阿里巴巴和商湯科技等引領(lǐng),智算集成服務(wù)市場則是華為一家獨大,呈現(xiàn)出與公有云和IT集成服務(wù)截然不同的市場格局,但又遵循著與云服務(wù)類似的發(fā)展規(guī)律。

我國智算服務(wù)市場格局

據(jù)IDC統(tǒng)計,2023年下半年,我國智算服務(wù)1市場整體規(guī)模達到114.1億元,同比增長85.8%。其中,GenAI IaaS市場呈0到1式增長,規(guī)模達到32.2億元,為整體智算服務(wù)貢獻了59%的增量;Non-GenAI IaaS市場緩慢增長至45.9億元,僅貢獻3%的增量;智算集成服務(wù)2受各地政府大力推進智算中心建設(shè)等因素驅(qū)動,市場規(guī)模達到36.0億元,同比增長129.4%,貢獻了38%的增量。

競爭格局方面,火山引擎、商湯科技和華為的表現(xiàn)引人注目。

GenAI IaaS市場:火山引擎、阿里巴巴、商湯科技、百度和騰訊占據(jù)前五位,份額合計約70%,市場集中度與公有云IaaS相近。其中,火山引擎和商湯科技這兩家并不屬于公有云第一梯隊的廠商,份額分別達到21%和15%,這意味著生成式AI或?qū)⒋呱碌脑凭揞^。

智算集成服務(wù)市場:華為、新華三、百度、寒武紀(jì)和中國電子云占據(jù)前五位,份額合計約55%,市場集中度遠高于IT咨詢與集成服務(wù)以及定制化開發(fā)服務(wù)等市場(CR5僅為15%~20%)。其中,華為獨占超過45%的份額,成為絕對霸主;百度、寒武紀(jì)、中國電子云等主營業(yè)務(wù)各異的非傳統(tǒng)系統(tǒng)集成服務(wù)廠商,也分別取得了2%上下的份額。這或許說明與傳統(tǒng)IT服務(wù)相比,智算集成服務(wù)更加要求供應(yīng)商在資源和服務(wù)等方面擁有差異化優(yōu)勢。

TOP廠商的核心競爭力

1.火山引擎:背靠字節(jié)跳動,火山終于“爆發(fā)”

作為字節(jié)跳動旗下的云廠商,火山引擎依托豐沛智算資源、領(lǐng)先萬卡集群和開放模型平臺等在2023年實現(xiàn)高速擴張,同比增速超過150%,并正通過進一步激發(fā)應(yīng)用生態(tài)為增長飛輪注入更多動能。

豐沛智算資源:在人工智能被打上“落地變緩”“負(fù)增長”等這些標(biāo)簽的2022年,火山引擎為滿足抖音等字節(jié)跳動自有業(yè)務(wù),以及自動駕駛和生物信息計算等新興領(lǐng)域頭部客戶的需求,持續(xù)囤積智算資源,順理成章地在生成式AI爆發(fā)且算力供不應(yīng)求的情況下,成為了智譜AI、月之暗面、Minimax、零一萬物和百川智能等一眾AI初創(chuàng)公司的算力底座。

萬卡集群技術(shù):隨模型參數(shù)量從千億邁向萬億,以及推理需求不斷增長,大模型的算力要求升級,高效率且高穩(wěn)定的萬卡集群成為新一輪智算基礎(chǔ)設(shè)施競賽的必選項。字節(jié)跳動聯(lián)合北京大學(xué)發(fā)表論文3,針對在萬卡集群上訓(xùn)練大模型的效率和穩(wěn)定性問題提出MegaScale生產(chǎn)系統(tǒng)。論文顯示,在12288塊GPU上訓(xùn)練1750億參數(shù)大語言模型時,MegaScale實現(xiàn)了55.2%的算力利用率(MFU),是英偉達Megatron-LM的1.34倍。

開放模型平臺:與阿里云、百度智能云等先卷大模型不同,火山引擎首先將匯聚和開放第三方大模型作為重點,推出火山方舟MaaS平臺。通過搭建模型需求端和供給側(cè)間的橋梁,火山引擎在幫助模型廠商拓展客戶的同時也實現(xiàn)了自身收入增長。

激發(fā)應(yīng)用生態(tài):隨AI大模型的普及度和滲透率不斷提升,推理工作負(fù)載將遠大于訓(xùn)練工作負(fù)載;鹕揭婵礈(zhǔn)這一趨勢,將字節(jié)跳動豆包大模型的推理輸入價格降至0.8厘/千tokens,以期降低客戶試錯成本,繁榮AI應(yīng)用生態(tài)。

2.商湯科技:大裝置發(fā)揮大作用

商湯科技2014年以視覺AI起家,2018年開始打造由模型層、深度學(xué)習(xí)平臺和計算基礎(chǔ)設(shè)施等三部分構(gòu)成的AI基礎(chǔ)設(shè)施——SenseCore商湯AI大裝置。依托大裝置,商湯科技不僅對外提供豐富的AI云產(chǎn)品和行業(yè)解決方案,也實現(xiàn)了自有“日日新”大模型體系的高速迭代。在“大裝置+大模型”驅(qū)動下,商湯科技2023年生成式AI收入突破11.8億元,同比增長近200%。

前瞻性布局智算中心:商湯科技2020年起陸續(xù)在上海、深圳、廣州、福州、濟南和重慶等多地建設(shè)智算中心,截至2023年底,上線GPU數(shù)量達到45000張,總運營算力達到12 EFLOPS。其中,上海臨港智算中心于2020年啟動建設(shè),2022年正式運營,24年4月算力規(guī)模達到8.1 EFLOPS,位居我國乃至全球前列。

打造高效穩(wěn)定萬卡集群:商湯科技已實現(xiàn)萬卡互聯(lián),集群線性加速比超過90%,同時保證超30天穩(wěn)定訓(xùn)練不間斷和訓(xùn)練間斷半小時恢復(fù)。

高性價比推理服務(wù):商湯科技2023年將推理服務(wù)性價比提升300%,大幅降低大模型推理單位成本。

3.華為:領(lǐng)先芯片和全棧服務(wù)顯身手

領(lǐng)先AI芯片:在美不斷升級對華半導(dǎo)體出口管制和我國信創(chuàng)進程加速的背景下,華為昇騰910B作為少數(shù)可與英偉達A100等海外高端GPU抗衡的國產(chǎn)AI芯片之一,是華為得以拿下眾多智算中心建設(shè)項目的殺手锏。

全棧智算服務(wù):基于30余年的ICT服務(wù)經(jīng)驗,華為已形成從規(guī)劃、集成、運維到模型使能和人才培養(yǎng)等的端到端智算集成服務(wù),幫助客戶建好和用好智算基礎(chǔ)設(shè)施。

運營商競爭策略

回顧云服務(wù)發(fā)展歷程,1.0階段,亞馬遜和阿里巴巴等互聯(lián)網(wǎng)大廠將自有資源和技術(shù)向其他互聯(lián)網(wǎng)企業(yè)開放,順利打開市場;2.0階段,中國電信等運營商抓住政企上云機遇,憑借不斷提升的技術(shù)實力和長年累積的服務(wù)經(jīng)驗實現(xiàn)規(guī)模擴張。

如今,智算服務(wù)1.0因“百模大戰(zhàn)”開啟,火山引擎和商湯科技等對智算資源和技術(shù)早有儲備的企業(yè)占得市場先機。面對將由行業(yè)大模型帶動的智算服務(wù)2.0,運營商已從資源、技術(shù)、產(chǎn)品和服務(wù)等多方面做好準(zhǔn)備,如中國電信規(guī)劃并建設(shè)覆蓋全國的“2+3+7+X”公共智算云池,打造國產(chǎn)萬卡智算集群,加快構(gòu)建“息壤”一體化智算服務(wù)體系和能力等。

然而,由于其他智算服務(wù)提供商,如AI企業(yè)、互聯(lián)網(wǎng)/云廠商和其他央國企等,多同樣具備政企服務(wù)經(jīng)驗,因此運營商在智算服務(wù)2.0將面臨比云服務(wù)2.0更為嚴(yán)峻的競爭環(huán)境。建議:

一是強化安全可信,針對在AI時代被進一步放大的數(shù)據(jù)(含算法、代碼等)隱私與安全問題,依托機密計算4等技術(shù),打造可在AI全生命周期內(nèi)保障數(shù)據(jù)和模型等的機密性與完整性的智算基礎(chǔ)設(shè)施,讓客戶安心使用AI IaaS;

二是繁榮模型生態(tài),秉持開放共贏理念,幫助自研和第三方模型、MaaS平臺與AI應(yīng)用等觸達客戶;

三是升級集成服務(wù),理解與把握政企客戶對智算基礎(chǔ)設(shè)施的當(dāng)下和長遠需求,提供從建到用再到后續(xù)升級的高水平全棧服務(wù)。

注釋:

1.IDC將智算服務(wù)定義為以GPU、FPGA、ASIC等AI專用算力為主的基礎(chǔ)設(shè)施服務(wù),主要包括智算集成服務(wù)和智算基礎(chǔ)設(shè)施即服務(wù)(AI IaaS)。其中,AI IaaS市場又分為面向生成式AI的GenAI IaaS和面向渲染、仿真、視聯(lián)網(wǎng)推理等非生成式AI的Non-GenAI IaaS等兩個細(xì)分市場。

2.智算集成服務(wù)指廠商在幫助客戶建設(shè)私有智算基礎(chǔ)設(shè)施過程中提供的咨詢、集成、開發(fā)、運維等專業(yè)和管理服務(wù)。

3.《MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs》。

4.機密計算是一種通過在基于硬件的可信執(zhí)行環(huán)境(TEE)中執(zhí)行計算來保護使用中的數(shù)據(jù)的技術(shù)。

本文作者

魏玥

戰(zhàn)略發(fā)展研究所

副主任分析師

碩士,高級工程師,長期從事ICT產(chǎn)業(yè)研究,近年來專注云計算、人工智能、產(chǎn)業(yè)數(shù)字化等領(lǐng)域。

編 輯:路金娣
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國電信邵廣祿:面向AI大模型的智算集群及網(wǎng)絡(luò)的實踐和展望
精彩專題
CES 2024國際消費電子展
2023年信息通信產(chǎn)業(yè)盤點暨頒獎禮
飛象網(wǎng)2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像