隨著工業(yè)電子信息產(chǎn)業(yè)的發(fā)展,高性能計(jì)算已經(jīng)逐步由單機(jī)處理逐漸發(fā)展至集群化,很多企業(yè)存在自建高性能計(jì)算集群的需求。但在實(shí)際生產(chǎn)及使用方面,仍存在諸多方面的問題,例如集群搭建和維護(hù)工作繁重,需要投入很多物力和人力,使企業(yè)無法全力聚焦在主要業(yè)務(wù)上。另外,或硬件設(shè)備更新迭代速度快,計(jì)算量快速膨脹,新技術(shù)層出不窮,初期規(guī)劃無法適應(yīng)新的業(yè)務(wù)需求。因此,充分借用云端的集群管理能力,成為越來越多客戶的高性價(jià)比選擇。
針對(duì)科學(xué)計(jì)算、基因工程、氣象電力、生物醫(yī)藥、工程制造等高算力場(chǎng)景, 近期,UCloud推出了全新升級(jí)的高性能計(jì)算集群,并新增獨(dú)占集群管理功能,為高算力業(yè)務(wù)場(chǎng)景下的客戶提供便捷高效的集群管理服務(wù)。
針對(duì)用戶需求,支持獨(dú)占集群與共享集群
EPC高性能計(jì)算集群集成UCloud的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等資源,為客戶提供便捷管理、可彈性伸縮的高性能計(jì)算服務(wù)。目前EPC分為獨(dú)占集群和共享集群兩種形態(tài):
獨(dú)占集群為客戶創(chuàng)建的私有集群,客戶可獨(dú)占集群內(nèi)的所有算力資源,自定義集群內(nèi)部運(yùn)行環(huán)境,自主安裝系統(tǒng)應(yīng)用。也是本次產(chǎn)品升級(jí)的重點(diǎn),下面會(huì)詳細(xì)介紹一下。同時(shí)提供可多點(diǎn)掛載的共享存儲(chǔ),同項(xiàng)目下的所有計(jì)算節(jié)點(diǎn)共享存儲(chǔ)空間,在滿足客戶多節(jié)點(diǎn)共享數(shù)據(jù)的需求外,也一定程度上減低客戶的存儲(chǔ)成本,做到真正的降本增效。
共享集群則為所有用戶共享的算力的計(jì)算集群,客戶無需關(guān)注資源的調(diào)度和管理,僅根據(jù)自身需求,提交計(jì)算任務(wù)即可。
獨(dú)占集群
獨(dú)占集群模式下,UCloud提供兩種資源部署方式,一種是集群部署,一種是節(jié)點(diǎn)組。在集群部署模式下,UCloud為客戶提供作業(yè)調(diào)度軟件的自動(dòng)化部署功能,客戶僅需要根據(jù)自身的實(shí)際業(yè)務(wù)需要來選擇計(jì)算資源配置,磁盤以及網(wǎng)絡(luò)資源,系統(tǒng)即可為客戶一鍵創(chuàng)建高性能計(jì)算集群。
客戶可以通過登錄節(jié)點(diǎn)提交和分配計(jì)算任務(wù),在計(jì)算節(jié)點(diǎn)執(zhí)行計(jì)算任務(wù)。產(chǎn)品架構(gòu)如下圖所示:
在節(jié)點(diǎn)組部署模式下,UCloud為客戶提供批量創(chuàng)建計(jì)算節(jié)點(diǎn)的能力,用戶可一次性選擇創(chuàng)建單臺(tái)或者多臺(tái)計(jì)算節(jié)點(diǎn),同步配置磁盤、網(wǎng)絡(luò),提供部分科研場(chǎng)景下的常用軟件,無需關(guān)注基礎(chǔ)的環(huán)境搭建,開機(jī)即可運(yùn)算,科研效率大大提升。
共享存儲(chǔ)
EPC高性能集群提供了支持多點(diǎn)掛載的共享存儲(chǔ),同項(xiàng)目下的所有節(jié)點(diǎn)資源均可掛載在同一塊共享存儲(chǔ)上,可極大滿足客戶多計(jì)算節(jié)點(diǎn)共享數(shù)據(jù)源的需求。
當(dāng)客戶創(chuàng)建集群或者計(jì)算節(jié)點(diǎn)時(shí),節(jié)點(diǎn)自動(dòng)掛載共享存儲(chǔ),支持在線擴(kuò)容,滿足客戶數(shù)據(jù)彈性存儲(chǔ)需求。同時(shí)提供FTP文件上傳下載功能,外網(wǎng)帶寬最高可達(dá)100M。同時(shí),EPC共享存儲(chǔ)支持SMB協(xié)議和NFS協(xié)議,可滿足不同客戶Windows和Linux系統(tǒng)的使用需求。
提升科研算力,具備五項(xiàng)優(yōu)勢(shì)
資源豐富,彈性擴(kuò)容
依托于UCloud公有云海量計(jì)算資源,可滿足客戶業(yè)務(wù)高峰時(shí)大量資源需求。
靈活部署
支持多種實(shí)例規(guī)格,滿足科學(xué)計(jì)算、基因測(cè)序、建模仿真等多種應(yīng)用類別。
提供資源管理、作業(yè)調(diào)度服務(wù)
提供自動(dòng)化部署slurm調(diào)度器的能力,一鍵部署集群,支持集群任務(wù)調(diào)度。
支持共享存儲(chǔ)
提供支持多點(diǎn)掛載的共享集群,創(chuàng)建時(shí)自動(dòng)掛載。
計(jì)費(fèi)方式靈活
支持包年包月、小時(shí)計(jì)費(fèi)多種計(jì)費(fèi)方式,客戶按需使用計(jì)算資源服務(wù),在滿足業(yè)務(wù)需求同時(shí),有效節(jié)約成本。
EPC助力多領(lǐng)域科研場(chǎng)景降本增效
生物信息領(lǐng)域
生物信息領(lǐng)域涵蓋基因測(cè)序、基因分型、精準(zhǔn)醫(yī)學(xué)、個(gè)性化治療等多種研究領(lǐng)域。上海某大學(xué)課題組在使用冷凍電鏡技術(shù)對(duì)病毒蛋白質(zhì)樣本成像和重建實(shí)驗(yàn)中,利用UCloud EPC服務(wù),通過RELION軟件的GPU加速功能,加速病毒蛋白質(zhì)的三維結(jié)構(gòu)的重建(對(duì)幾十萬張2D或3D投影圖片進(jìn)行分析、組裝和優(yōu)化)。
分子模擬領(lǐng)域
分子模擬領(lǐng)域研究光譜預(yù)測(cè)、電子密度分布等物質(zhì)表征模擬需求,也支持蛋白質(zhì)-藥物配體動(dòng)力學(xué)、近場(chǎng)動(dòng)力學(xué)、碳納米管束等計(jì)算高度密集的科學(xué)問題。浙江某大學(xué)采用UCloud EPC服務(wù),使用Gromacs軟件對(duì)膳食卵清蛋白與葉酸的相互作用機(jī)理進(jìn)行了研究,大幅提升研究效率。
人工智能領(lǐng)域
人工智能涵蓋深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí),通過算法模型訓(xùn)練,應(yīng)用于計(jì)算機(jī)視覺、自然語(yǔ)言處理、推薦引擎等場(chǎng)景。安徽某學(xué)院借助UCloud EPC服務(wù),研究基于PyTorch的深度學(xué)習(xí)模型,進(jìn)行心電公共數(shù)據(jù)端到端的分類,整體模型訓(xùn)練的效率得到極大的提升。