4月25日消息,一份內(nèi)部備忘錄顯示,2022年夏末,Meta首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)召集公司高管團(tuán)隊(duì),分析公司計(jì)算能力長達(dá)五個(gè)小時(shí),特別是處理尖端人工智能的能力。
備忘錄指出,盡管Meta在人工智能研究方面進(jìn)行了高調(diào)的投資、并且公司越來越依賴人工智能來支持其增長,但在主要業(yè)務(wù)采用昂貴的人工智能優(yōu)化軟硬件系統(tǒng)上,這家社交媒體巨頭的速度比較緩慢,這妨礙了其在規(guī)模擴(kuò)張中跟上創(chuàng)新步伐的能力。如果要支持人工智能工作,Meta需要“從根本上改變我們的物理基礎(chǔ)設(shè)施設(shè)計(jì)、軟件系統(tǒng)以及提供穩(wěn)定平臺(tái)的方法”。
據(jù)公司披露,此次改組使Meta的資本支出每季度增加了約40億美元,幾乎是2021年的兩倍,并導(dǎo)致其暫;蛉∠嗽谒膫(gè)地點(diǎn)建立數(shù)據(jù)中心的計(jì)劃。
而Meta正面臨著嚴(yán)峻財(cái)務(wù)困境,自去年11月以來,該公司一直在進(jìn)行規(guī)?涨暗牟脝T。
與此同時(shí),去年11月ChatGPT橫空出世,引發(fā)了科技巨頭之間的競(jìng)爭(zhēng),它們紛紛發(fā)布生成式AI產(chǎn)品。而五位消息人士稱,生成式AI需要大量的計(jì)算能力,這加劇了Meta擴(kuò)容的緊迫性。
消息人士透露,Meta在人工智能上應(yīng)用GPU較為緩慢,是主要問題之一。GPU芯片非常適合人工智能處理,因?yàn)樗鼈兛梢酝瑫r(shí)執(zhí)行大量任務(wù),縮短了處理數(shù)十億條數(shù)據(jù)所需的時(shí)間。然而,GPU芯片價(jià)格較高,芯片制造商N(yùn)vidia控制著80%的市場(chǎng),并在相應(yīng)的軟件方面保持領(lǐng)先地位,消息人士稱。
直到去年,Meta主要使用大量普通CPU來運(yùn)行AI工作負(fù)載。CPU是計(jì)算機(jī)世界的主力芯片,雖然已經(jīng)稱霸數(shù)據(jù)中心幾十年,但其在人工智能工作方面表現(xiàn)不佳。
這導(dǎo)致競(jìng)爭(zhēng)對(duì)手在AI領(lǐng)域的發(fā)展超過了Meta。他們使用GPU芯片并擁有更好的AI軟件,因此能夠更快地開發(fā)新的AI產(chǎn)品和服務(wù)。
據(jù)兩位消息人士透露,Meta公司還開始使用自己內(nèi)部設(shè)計(jì)的定制芯片來訓(xùn)練AI。但到了2021年,這種雙管齊下的方法被證明比以GPU為核心構(gòu)建的方法更慢、效率更低效。GPU芯片在運(yùn)行不同類型的模型方面也比Meta的芯片更加靈活,這兩位消息人士說。
后來,隨著扎克伯格將公司轉(zhuǎn)向元宇宙,算力不足使得公司無法應(yīng)對(duì)威脅,包括TikTok的崛起和蘋果主導(dǎo)的廣告隱私變化。
這些問題引起了前Meta董事會(huì)成員彼得·蒂爾(Peter Thiel)的關(guān)注。2022年初,他辭去了職務(wù),沒有解釋原因。據(jù)兩位知情人士透露,在他離任前的一次董事會(huì)會(huì)議上,蒂爾指出扎克伯格和他的高管們過于專注于元宇宙的發(fā)展,而忽視了Meta的核心社交媒體業(yè)務(wù),這讓公司容易受到TikTok等競(jìng)爭(zhēng)對(duì)手的挑戰(zhàn)。
Meta曾計(jì)劃在2022年推出定制芯片,但后來放棄,轉(zhuǎn)而在同年訂購了數(shù)十億美元的Nvidia GPU芯片。此時(shí)Meta已經(jīng)落后于谷歌等同行,后者在2015年開始部署自己定制的GPU版本,稱為TPU。
Meta接下來開始重組人工智能部門,任命了兩位新的工程師領(lǐng)導(dǎo)。在這段時(shí)間內(nèi),數(shù)十位高管離開了Meta公司,幾乎全部更換了人工智能基礎(chǔ)設(shè)施領(lǐng)導(dǎo)層。
接下來,Meta公司開始改造其數(shù)據(jù)中心,以適應(yīng)引進(jìn)的GPU,這些芯片需要更多的功率和產(chǎn)生更多的熱量,必須緊密地聚集在一起,并在它們之間進(jìn)行專門的網(wǎng)絡(luò)連接。這項(xiàng)工作需要大量的網(wǎng)絡(luò)容量和新的液冷系統(tǒng)來管理集群的熱量,因此需要對(duì)它們進(jìn)行“完全重新設(shè)計(jì)”。
隨著工作的推進(jìn),Meta開始內(nèi)部計(jì)劃開發(fā)一款更為雄心勃勃的新型芯片,類似于GPU,既能訓(xùn)練人工智能模型,又能進(jìn)行推理。兩位消息人士透露,該項(xiàng)目將于2025年左右完成。
Meta的發(fā)言人Jon Carvill拒絕就芯片項(xiàng)目發(fā)表評(píng)論。
雖然Meta正在擴(kuò)大GPU規(guī)模,但微軟和谷歌等公司正在推廣商業(yè)生成式人工智能產(chǎn)品,而Meta在這方面沒有太多實(shí)質(zhì)性進(jìn)展。
Meta首席財(cái)務(wù)官在二月份承認(rèn),公司目前沒有將大部分計(jì)算能力用于生成式工作。她說:“基本上我們所有的人工智能能力都用于廣告、動(dòng)態(tài)消息和Reels。”Reels是Meta公司類似于TikTok的短視頻格式,廣受年輕用戶歡迎。
據(jù)四位消息人士透露,Meta公司直到ChatGPT在去年11月份推出后,才開始優(yōu)先考慮開發(fā)生成式人工智能產(chǎn)品。雖然公司的AI研究部門自2021年底以來一直在發(fā)布技術(shù)原型,但沒有專注于將其轉(zhuǎn)化為產(chǎn)品。然而,隨著投資者的興趣不斷高漲,扎克伯格在今年2月份宣布成立了一支新的高層次生成式人工智能團(tuán)隊(duì),他說這個(gè)團(tuán)隊(duì)將“加速”該公司在這一領(lǐng)域的工作。
首席技術(shù)官安德魯·博斯沃思也在本月表示,生成式人工智能是他和扎克伯格花費(fèi)最多時(shí)間的領(lǐng)域,并預(yù)測(cè)Meta公司將在今年推出新產(chǎn)品。
兩位熟悉新團(tuán)隊(duì)的人士表示,該團(tuán)隊(duì)的工作處于早期階段,主要是構(gòu)建基礎(chǔ)模型,這是一種核心程序,以后可以進(jìn)行微調(diào)和適應(yīng)不同的產(chǎn)品。
Meta公司發(fā)言人Carvill表示,該公司已經(jīng)在不同的團(tuán)隊(duì)上開發(fā)生成式人工智能產(chǎn)品超過一年了。他確認(rèn),在ChatGPT推出后的幾個(gè)月里,這項(xiàng)工作加速了。
(本文由AI翻譯,網(wǎng)易編輯負(fù)責(zé)校對(duì))