導(dǎo)語:市場上首個(gè) K8s 上的大數(shù)據(jù)平臺(tái),開源了!
智領(lǐng)云自主研發(fā)的首個(gè)完全基于Kubernetes的容器化大數(shù)據(jù)平臺(tái)
Kubernetes Data Platform (簡稱KDP)
開源啦!
開發(fā)者只要準(zhǔn)備好命令行工具,一鍵部署
Hadoop,Hive,Spark,Kafka, Flink, MinIO ...
就可以創(chuàng)建以前要花幾十萬甚至幾百萬才可以買到的大數(shù)據(jù)平臺(tái)
無需再花大量的時(shí)間和經(jīng)費(fèi)去做重復(fù)的研發(fā)
高度集成,單機(jī)即可體驗(yàn)大數(shù)據(jù)平臺(tái)
在高級(jí)安裝模式下
用戶可在現(xiàn)有的K8s集群上集成運(yùn)行大數(shù)據(jù)組件
不用額外單獨(dú)建設(shè)大數(shù)據(jù)集群
項(xiàng)目地址:
https://github.com/linktimecloud/kubernetes-data-platform
辛辛苦苦研究出來的成果,為什么要開源?
這波格局開大,老板有話說
問題1:我們?yōu)槭裁匆_源?
我們的產(chǎn)品一直是基于大數(shù)據(jù)開源生態(tài)體系建設(shè)的。之前就一直有開源回饋社區(qū)的計(jì)劃,但是因?yàn)橹癒ubernetes對(duì)于大數(shù)據(jù)組件的支持還不夠成熟,我們也一直在迭代與Kubernetes的適配。現(xiàn)在我們的企業(yè)版已經(jīng)在很多頭部客戶落地并且在生產(chǎn)環(huán)境下高效運(yùn)行,覺得這個(gè)版本已經(jīng)可以達(dá)到大部分生產(chǎn)級(jí)項(xiàng)目的需求,集成度以及可用性是能夠幫到有類似需求的用戶的,希望這次開源能夠降低在Kubernetes上集成大數(shù)據(jù)組件的門檻,讓更多Kuberenetes和big data社區(qū)的同行們可以使用。
問題2:開源版本的KDP,能干啥?
KDP可以很方便的在Kubenetes上安裝和管理常用的大數(shù)據(jù)組件,Hadoop,Hive,Spark,Kafka, Flink, MinIO 等等,不需要自己一個(gè)一個(gè)去適配,可以直接開始使用。然后KDP也提供集成的運(yùn)維管理界面,用戶可以從界面管理所有組件的安裝配置,運(yùn)行狀況,資源使用情況,修改配置。而且KDP會(huì)將一個(gè)大數(shù)據(jù)組件的所有負(fù)載(容器,pod)作為一個(gè)整體管理,用戶不需要在Kubernetes的控制平面上去管理單獨(dú)的負(fù)載。
問題3:最大的亮點(diǎn)是?
只要你已經(jīng)在使用Kubernetes,那么在現(xiàn)有集群上十幾分鐘就可以啟動(dòng)一個(gè)完整的大數(shù)據(jù)集群,馬上開始使用,極大的降低了大數(shù)據(jù)平臺(tái)的使用門檻。因?yàn)槲覀冞@個(gè)流程是高度集成的,整個(gè)安裝過程在一個(gè)單機(jī)環(huán)境下也都能啟動(dòng)(例如使用單機(jī)kind虛擬集群都可以),所以在測試和實(shí)驗(yàn)環(huán)境下都可以高效使用。當(dāng)然,啟動(dòng)之后Day 2的很多好處,例如資源的高效利用和集成的運(yùn)維管理,也是KDP提供的重要功能。
KDP,即在Kubernetes上使用原生的分布式功能搭建及管理大數(shù)據(jù)平臺(tái)。
將多套大數(shù)據(jù)組件集成在Kubernetes之上,同時(shí)提供一個(gè)整體的管理及運(yùn)維工具體系,形成一個(gè)完全基于Kubernetes的大數(shù)據(jù)平臺(tái)。企業(yè)級(jí)KDP更是支持在同一個(gè)Kubernetes集群中同時(shí)運(yùn)行多個(gè)大數(shù)據(jù)平臺(tái)以及多租戶管理的能力,充分發(fā)揮Kubernetes云原生體系的優(yōu)勢。
KDP,通過對(duì)開源大數(shù)據(jù)組件的擴(kuò)展和集成,實(shí)現(xiàn)了傳統(tǒng)大數(shù)據(jù)平臺(tái)到K8s大數(shù)據(jù)平臺(tái)的平穩(wěn)遷移。
作為市場上首個(gè)可完全在Kubernetes上部署的容器化云原生大數(shù)據(jù)平臺(tái),智領(lǐng)云自主研發(fā)的KDP,深度整合云原生架構(gòu)優(yōu)勢,將大數(shù)據(jù)組件、數(shù)據(jù)應(yīng)用及資源調(diào)度混排,納入Kubernetes管理體系,從而帶你真正玩轉(zhuǎn)云原生!
總體框架
簡單來講,KDP可以允許客戶在Kubernetes上運(yùn)行它所有的大數(shù)據(jù)組件,并把它們作為一個(gè)整體管理起來。
在Kubernetes上運(yùn)行大數(shù)據(jù)平臺(tái)有三個(gè)好處:
第一,更高效的大數(shù)據(jù)組件集成:KDP提供標(biāo)準(zhǔn)化自動(dòng)化的大數(shù)據(jù)組件部署和配置,極大地縮短了大數(shù)據(jù)項(xiàng)目開發(fā)和上線時(shí)間;
第二,更高效的大數(shù)據(jù)集群運(yùn)管:KDP通過大數(shù)據(jù)組件與K8s的集成,在K8s之上搭建了一個(gè)大數(shù)據(jù)組件管理抽象層,標(biāo)準(zhǔn)化大數(shù)據(jù)組件生命周期管理,并提供UI界面進(jìn)一步提升了部署、升級(jí)等操作的效率;
第三,更高的集群資源利用率:利用K8s的資源管理和配額機(jī)制,與其它系統(tǒng)共享K8s資源池,精細(xì)化資源管理,對(duì)比傳統(tǒng)大數(shù)據(jù)平臺(tái)約30%左右的資源利用率,KDP可大幅提升至60%以上。
社區(qū)
我們期待您的貢獻(xiàn)和建議!最簡單的貢獻(xiàn)方式是參與Github議題/討論的討論。 如果您有任何問題,請(qǐng)與我們聯(lián)系,我們將確保盡快為您解答。
微信群:添加小助手微信拉您進(jìn)入交流群
釘釘群:搜索公開群組號(hào) 82250000662
貢獻(xiàn)
參考開發(fā)者指南,了解如何開發(fā)及貢獻(xiàn) KDP。
https://linktimecloud.github.io/kubernetes-data-platform/docs/zh/developer-guide/developer-guide.html