2024年11月12日,優(yōu)刻得憑借自研的云端算力引擎“孔明”智算平臺,成功入選中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)發(fā)布的《2024年人工智能先鋒案例集》,成為AI Infra領(lǐng)域的先鋒企業(yè),不斷驅(qū)動多模態(tài)大模型的創(chuàng)新應用與發(fā)展。
為響應國家“人工智能+”行動號召,中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟、工業(yè)和信息化部新聞宣傳中心、中國信息通信研究院2024年共同啟動了“2024年人工智能先鋒應用案例”征集活動,征集工作得到了行業(yè)和社會的廣泛響應。旨在甄選并推廣具有高價值、標桿性、真落地的行業(yè)典型案例,更好地推動我國人工智能技術(shù)應用及產(chǎn)業(yè)發(fā)展。
在多模態(tài)大模型應用領(lǐng)域,行業(yè)普遍面臨算力資源成本高昂、資源調(diào)度管理復雜以及模型訓練和推理的低效瓶頸,導致眾多模型廠商在推進大模型技術(shù)的過程中,被限制了數(shù)據(jù)處理、實時推理和模型迭代上的能力和速度。
在這樣的背景下,優(yōu)刻得“孔明”智算平臺應運而生。以其多元異構(gòu)的算力資源、高效便捷的管理服務、安全可靠的運行環(huán)境,為大模型訓練和推理過程提供穩(wěn)定高效的算力支持和集群調(diào)度能力,以幫助AI企業(yè)更好地管理異構(gòu)資源,并根據(jù)負載動態(tài)分配不同任務。
以先進的技術(shù)架構(gòu)為模型廠商提供強大的算力支持和調(diào)度管理能力,“孔明”智算平臺具備三大核心特性:
●多元算力統(tǒng)一調(diào)度
“孔明”智算平臺可對萬卡集群統(tǒng)一納管。支持對同構(gòu)和異構(gòu)GPU、高速計算網(wǎng)絡、本地NVMe及并行文件存儲的統(tǒng)⼀調(diào)度管理。智算集群的彈性擴展能力,可根據(jù)客戶當前的資源數(shù)量進行集群動態(tài)管理。
●高效分布式訓練
“孔明”智算平臺提供了穩(wěn)定可靠的模型研發(fā)環(huán)境。平臺預置主流算法框架,支持多任務同時訓練,并可根據(jù)優(yōu)先級搶占資源。此外,其斷點續(xù)訓的能力,可實現(xiàn)大模型訓練任務異常時自動拉起,大幅縮短算力閑置時間,使得模型開發(fā)者能夠更充分地利用GPU算力資源,以更低成本、更高效率來訓練和優(yōu)化模型,加速AI大模型在各領(lǐng)域的落地應用。
●可視化智能運維
“孔明”智算平臺對集群管理人員提供了可視化的資源管理界面,可對算力分配、算力監(jiān)控、算力使用情況進行運營分析,極大程度簡化了算法工程師的重復操作。通過多項目團隊同時協(xié)作,減少管理成本、提升模型研發(fā)和部署應用效率。目前,平臺已廣泛應用于大模型訓練、城市治理、自動駕駛、生物醫(yī)藥、工業(yè)制造等領(lǐng)域。
近年來,優(yōu)刻得持續(xù)發(fā)力大模型領(lǐng)域,提供了一整套涵蓋算力基礎(chǔ)設施建設、訓練流程優(yōu)化、智算調(diào)度平臺、高性能網(wǎng)絡與存儲等在內(nèi)的智算解決方案,不斷夯實大模型智算底座助力大模型廠商快速實現(xiàn)模型的研發(fā)與迭代工作。
優(yōu)刻得“孔明”智算平臺的成功入選,不僅是對優(yōu)刻得AI技術(shù)底座的實力認可,更是對其在推動人工智能產(chǎn)業(yè)發(fā)展方面所做努力的肯定。未來,優(yōu)刻得將以更加智能、高效的智算解決方案賦能更多AIGC創(chuàng)新應用落地。歡迎登錄UCloud優(yōu)刻得官網(wǎng)體驗“孔明”智算平臺。