飛象原創(chuàng)(魏德齡/文)剛剛過去的2024年,新變化與新技術(shù)時(shí)刻環(huán)繞在企業(yè)身邊,“降本增效”“出海創(chuàng)收”“高質(zhì)量發(fā)展”等成為企業(yè)在講述自身發(fā)展策略時(shí)的關(guān)鍵詞。與此同時(shí),o1與智能體又成為伴隨AI技術(shù)演進(jìn)時(shí),被業(yè)界所更多聊起的新話題。
如今,即便是體育比賽也開始更多講求高階數(shù)據(jù),對(duì)于企業(yè)而言,無論是發(fā)展變革,還是AI賦能,其背后都與企業(yè)對(duì)于數(shù)據(jù)資源的有效挖掘,存在著巨大關(guān)系。
發(fā)展變革與AI賦能的背后
告別粗放式發(fā)展的背后,重點(diǎn)在于企業(yè)正在從以往的“堆人與堆技術(shù)”轉(zhuǎn)變?yōu)閷?duì)于“降本增效”的關(guān)注,背后需要?jiǎng)?chuàng)新技術(shù)對(duì)企業(yè)實(shí)現(xiàn)更多助力。例如,對(duì)于中國(guó)的制造業(yè)企業(yè)而言,隨著智能化轉(zhuǎn)型,將朝著提升技術(shù)含量和附加值的方向發(fā)展,智能制造、自動(dòng)化、機(jī)器人技術(shù)等將成為重點(diǎn)。
從企業(yè)數(shù)據(jù)的發(fā)展過程中,將持續(xù)從生產(chǎn)數(shù)據(jù)向分析數(shù)據(jù)的過程推進(jìn)。當(dāng)數(shù)據(jù)在生產(chǎn)環(huán)節(jié)中誕生,便可能會(huì)在公有云和私有平臺(tái)上進(jìn)行分配,再傳送至不同的云上,最后以SaaS模式對(duì)客戶進(jìn)行服務(wù)分析?项loudera在近期的媒體溝通會(huì)上,結(jié)合當(dāng)下的市場(chǎng)情況給出了三個(gè)趨勢(shì)觀察結(jié)果。
當(dāng)數(shù)據(jù)變得越來越多,企業(yè)在數(shù)據(jù)管理中正面臨從傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)向數(shù)據(jù)湖倉(cāng)一體轉(zhuǎn)變的趨勢(shì)。以往分析任務(wù)可能依賴于報(bào)表系統(tǒng)和數(shù)據(jù)倉(cāng)庫(kù)。然而,隨著業(yè)務(wù)需求對(duì)數(shù)據(jù)實(shí)時(shí)性、完整性以及對(duì)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的支持提出更高要求,數(shù)據(jù)的重心逐漸向數(shù)據(jù)湖倉(cāng)一體傾斜。
另一個(gè)趨勢(shì)是了解數(shù)據(jù)資產(chǎn)需要數(shù)據(jù)網(wǎng)格或數(shù)據(jù)編織,作為企業(yè)數(shù)據(jù)治理的重要手段,通過整合多種數(shù)據(jù)格式和語言,為數(shù)據(jù)分析和對(duì)外服務(wù)提供支持。“在跨域數(shù)據(jù)中,數(shù)據(jù)網(wǎng)格和數(shù)據(jù)編織為企業(yè)提供了溝通與協(xié)作的新模式!盋loudera大中華區(qū)技術(shù)總監(jiān)劉隸放描述了企業(yè)數(shù)據(jù)管理的新方向。
例如,對(duì)于存在多個(gè)不同資方的企業(yè)而言,由于數(shù)據(jù)安全性和復(fù)雜的股權(quán)結(jié)構(gòu),數(shù)據(jù)的歸屬和跨域使用問題變得突出,數(shù)據(jù)網(wǎng)格理念尤其是在面對(duì)不同資方,以及解決跨部門、跨架構(gòu)的數(shù)據(jù)協(xié)作問題上,提供了“以數(shù)據(jù)為產(chǎn)品”的有效對(duì)話模式。
第三個(gè)趨勢(shì)在于人工智能應(yīng)用生命周期需要可信數(shù)據(jù)。企業(yè)成功應(yīng)用AI的關(guān)鍵在于從0到1的積累過程!捌髽I(yè)不要去羨慕市場(chǎng)上的生成式AI有多火,要先把馬步扎實(shí)。”劉隸放專門在媒體會(huì)上強(qiáng)調(diào)了企業(yè)數(shù)據(jù)資產(chǎn)文化積累的重要性。
例如,在大語言模型大熱之前,許多企業(yè)已具備成熟的數(shù)據(jù)資產(chǎn)和相關(guān)文化,如OCR系統(tǒng)、智能客服等。沒有這些基礎(chǔ),僅依賴現(xiàn)成模型難以實(shí)現(xiàn)真正的突破。在AI應(yīng)用中,數(shù)據(jù)不僅是支撐技術(shù)的基礎(chǔ),更是企業(yè)構(gòu)建獨(dú)特競(jìng)爭(zhēng)力的核心。結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的組織能力以及對(duì)數(shù)據(jù)資產(chǎn)的深度利用,決定了企業(yè)能否從AI中獲得實(shí)質(zhì)性價(jià)值。
Cloudera也正在順應(yīng)上述市場(chǎng)環(huán)境趨勢(shì)需求,為AI提供一個(gè)集中可信的數(shù)據(jù)中心,為模型和平臺(tái)的構(gòu)建提供堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。Cloudera不僅支持在公有云和私有平臺(tái)上的AI部署,還注重跨平臺(tái)能力,推動(dòng)現(xiàn)代化數(shù)據(jù)架構(gòu)的發(fā)展,實(shí)現(xiàn)數(shù)據(jù)和應(yīng)用的無縫連接。
務(wù)實(shí)AI策略與數(shù)據(jù)管理挑戰(zhàn)
面向2025年,Cloudera發(fā)布了五大科技趨勢(shì)預(yù)測(cè)。揭示了在未來一年生成式AI和AI Agent等創(chuàng)新技術(shù)的發(fā)展趨勢(shì)。其中包括生成式AI的應(yīng)用將趨向務(wù)實(shí),AI Agent將在商業(yè)決策中發(fā)揮重要作用。同時(shí),企業(yè)面臨著AI生成數(shù)據(jù)激增的挑戰(zhàn),亟需提升數(shù)據(jù)治理能力。企業(yè)需要強(qiáng)大的數(shù)據(jù)管理和多云策略來訪問、存儲(chǔ)和分析數(shù)據(jù),從而獲取數(shù)據(jù)的最大價(jià)值,充分發(fā)揮AI潛力。
首先便是企業(yè)對(duì)于AI的態(tài)度變化,預(yù)計(jì)生成式AI熱度將減退,企業(yè)會(huì)采取更務(wù)實(shí)的AI策略。Cloudera預(yù)測(cè),企業(yè)將不再相信生成式AI的大肆炒作,而是專注于制定與企業(yè)整體目標(biāo)一致的技術(shù)投資計(jì)劃。在很多企業(yè)內(nèi)部的生成式AI應(yīng)用過程中,初期通常從內(nèi)部知識(shí)庫(kù)問答系統(tǒng)入手。這種簡(jiǎn)單應(yīng)用易于實(shí)現(xiàn)且安全可控,可以通過開源模型和提示詞調(diào)整生成式AI結(jié)果。而一旦這一應(yīng)用進(jìn)行對(duì)外服務(wù)的話,就需要面臨更高的準(zhǔn)確性和可靠性要求,一直存在的致幻率問題將會(huì)嚴(yán)重影響客戶體驗(yàn)。
預(yù)計(jì)到2025年,企業(yè)將在生成式AI應(yīng)用上分化為兩大陣營(yíng)。一類是已成功應(yīng)用生成式AI的企業(yè),通過成熟應(yīng)用實(shí)現(xiàn)了顯著成效,背后的核心價(jià)值在于規(guī);闹R(shí)獲取和洞察生成,數(shù)據(jù)質(zhì)量是確保AI模型成功運(yùn)行的關(guān)鍵。而另一類企業(yè)由于缺乏足夠的數(shù)據(jù)儲(chǔ)備,難以從生成式AI中獲得相同效益。因此他們將更傾向于采用傳統(tǒng)AI或確定性機(jī)器學(xué)習(xí)模型,以提升效率和生產(chǎn)力。
第二個(gè)預(yù)測(cè)是AI Agent將重塑商業(yè)決策,2025年將會(huì)迎來一個(gè)井噴式發(fā)展。Agentic AI正在推動(dòng)創(chuàng)新浪潮,改變實(shí)時(shí)問題解決和決策過程。AI智能體高效優(yōu)化任務(wù),迅速應(yīng)對(duì)挑戰(zhàn),并實(shí)時(shí)靈活調(diào)整。這將促使企業(yè)構(gòu)建事件驅(qū)動(dòng)型架構(gòu),支持AI能夠及時(shí)響應(yīng)現(xiàn)實(shí)事件,從而徹底改變電信和物流等行業(yè)。
第三是“全天候”AI為數(shù)據(jù)管理帶來新挑戰(zhàn)。以某國(guó)內(nèi)制造業(yè)企業(yè)為例,該企業(yè)將電池信息的收集頻率從每小時(shí)一次提升到每幾分鐘一次,顯著增加了數(shù)據(jù)的實(shí)時(shí)性和精準(zhǔn)性。但數(shù)據(jù)量的爆發(fā)也帶來了存儲(chǔ)和分析方面的挑戰(zhàn),需要更高效、更廉價(jià)的存儲(chǔ)解決方案。企業(yè)面臨算法優(yōu)化和數(shù)據(jù)管理的多重挑戰(zhàn),需結(jié)合成本控制和技術(shù)提升來實(shí)現(xiàn)數(shù)據(jù)價(jià)值的最大化。
當(dāng)AI如同空氣無處不在,滲透至個(gè)人生活的方方面面。面對(duì)數(shù)量龐大且種類繁多的AI生成數(shù)據(jù),企業(yè)如何從中挖掘出有價(jià)值的信息,成為亟待解決的問題。企業(yè)努力從不斷增長(zhǎng)且種類繁多的AI生成數(shù)據(jù)中獲取洞察力,糟糕的數(shù)據(jù)管理可能會(huì)導(dǎo)致企業(yè)被信息流淹沒,難以有效地利用這些數(shù)據(jù)資源。為了充分釋放AI潛力,企業(yè)需要強(qiáng)大的數(shù)據(jù)管理和多云策略來訪問、存儲(chǔ)和分析數(shù)據(jù),無論數(shù)據(jù)是在本地、云中還是在邊緣,都能提煉獲取數(shù)據(jù)的最大價(jià)值。
這也引出了下一個(gè)預(yù)測(cè)內(nèi)容,當(dāng)企業(yè)在2025年致力于推動(dòng)生成式AI的全面生產(chǎn)和規(guī);渴,單純的混合云架構(gòu)已無法滿足企業(yè)需求。當(dāng)前企業(yè)的AI算法與分析算法需要能夠跨云訪問數(shù)據(jù),并同時(shí)追求經(jīng)濟(jì)性。由于數(shù)據(jù)在公有云和私有平臺(tái)間的傳輸價(jià)格非常昂貴,企業(yè)需要平衡分布算力和數(shù)據(jù),在利用這一環(huán)境來構(gòu)建AI算法。
德勤的研究指出,企業(yè)采用生成式AI的最大障礙是合規(guī)風(fēng)險(xiǎn)和治理問題。隨著企業(yè)開始在本地或公有云中運(yùn)行私有AI模型和應(yīng)用,混合數(shù)據(jù)管理平臺(tái)的需求日益增長(zhǎng)。這類平臺(tái)集成了本地與云數(shù)據(jù)源,因此具備更高的靈活性且支持更廣泛的數(shù)據(jù)訪問,在保障模型端點(diǎn)安全和治理的同時(shí),賦予企業(yè)更強(qiáng)的控制力。
最后一個(gè)預(yù)測(cè)是私有大語言模型(LLM)將逐漸取代公有大語言模型,成為企業(yè)優(yōu)選。“私有大語言模型將成為企業(yè)的優(yōu)選,從合規(guī)到隱私保護(hù),這是不可回避的趨勢(shì)!眲㈦`放點(diǎn)明未來企業(yè)的人工智能發(fā)展過程中,將會(huì)聚焦合規(guī)與隱私需求。
預(yù)計(jì)到2025年,企業(yè)將加快定制AI解決方案的步伐,包括AI聊天機(jī)器人、虛擬助手和專屬代理應(yīng)用等,以滿足特定行業(yè)或業(yè)務(wù)的需求。越來越多企業(yè)將采用企業(yè)級(jí)LLM,這將對(duì)GPU的高性能支持提出更高要求,以比傳統(tǒng)CPU更快的速度運(yùn)行,同時(shí)確保數(shù)據(jù)管理系統(tǒng)具有更高的安全性和隱私保護(hù)。RAG技術(shù)將得到更廣泛的應(yīng)用,將通用LLM轉(zhuǎn)化為行業(yè)或組織專屬的數(shù)據(jù)倉(cāng)庫(kù),從而為現(xiàn)場(chǎng)支持、人力資源和供應(yīng)鏈等領(lǐng)域的終端用戶提供更加精準(zhǔn)、可靠的數(shù)據(jù)支持。