ICC訊 Meta首席執(zhí)行官M(fèi)ark Zuckerberg似乎將數(shù)據(jù)中心計算領(lǐng)域的信條定為“要么做大,要么回家”。但像Meta所期望的那樣做大,說起來容易做起來難。
在周一的一篇Facebook帖子中,Zuckerberg透露了一項新的“Meta Compute”計劃。他表示,公司將“在本十年內(nèi)建設(shè)數(shù)十吉瓦的規(guī)模,并隨著時間的推移達(dá)到數(shù)百吉瓦或更多”。這項計劃在規(guī)模上使OpenAI耗資約5000億美元的10吉瓦“星際之門”計劃相形見絀。
Meta Compute計劃將由Santosh Janardhan負(fù)責(zé)技術(shù)架構(gòu)和軟件方面,Daniel Gross則負(fù)責(zé)監(jiān)督長期容量戰(zhàn)略和供應(yīng)商關(guān)系。兩人將與Meta新聘請的總裁兼副董事長Dina Powell McCormick合作。Zuckerberg在帖子中表示,目標(biāo)是“與各國政府和主權(quán)實(shí)體達(dá)成協(xié)議,以建設(shè)、部署、投資和資助Meta的基礎(chǔ)設(shè)施”,并最終“為全球數(shù)十億人提供個人超級智能”。
說Meta的這一計劃雄心勃勃都算是輕描淡寫。AvidThink創(chuàng)始人兼負(fù)責(zé)人Roy Chua表示,該公告反映了“Meta在人工智能基礎(chǔ)設(shè)施領(lǐng)域引領(lǐng)潮流、并開發(fā)能夠作為服務(wù)和產(chǎn)品提供給他們龐大用戶群的AI超級智能的雄心。”這也突顯了該公司在芯片、數(shù)據(jù)中心、模型和應(yīng)用領(lǐng)域垂直整合的計劃。
電力從何而來?
然而,Meta Compute也面臨一些重大障礙。首先或許也是最首要的,是尋找可用電力。
Meta剛剛簽署了6.6吉瓦的核電協(xié)議,但這只是Zuckerberg所述計劃所需電力的一小部分。時間線也很重要。普遍公認(rèn),核電源至少還需要三到五年才能上線。而許多云計算公司正在追求的新型小型模塊化反應(yīng)堆設(shè)計,則需要更多時間來驗(yàn)證和推廣。這與Meta到2030年部署“數(shù)十吉瓦”的宏偉目標(biāo)并不相符。
誠然,天然氣發(fā)電正在迅速增加以彌補(bǔ)缺口。路透社7月報道稱,預(yù)計到2030年,美國將有約80吉瓦的燃?xì)獍l(fā)電上線。但目前,關(guān)鍵燃?xì)廨啓C(jī)以及電氣變壓器等配電基礎(chǔ)設(shè)施的交貨期長達(dá)數(shù)年。
此外,J. Gold Associates創(chuàng)始人兼負(fù)責(zé)人指出,Meta“正與超大規(guī)模云提供商和其他數(shù)據(jù)中心運(yùn)營商競爭,以確保滿足其巨大需求的電力供應(yīng)?!痹摴咀罱l(fā)布的研究發(fā)現(xiàn),一個運(yùn)行10萬個GPU的人工智能數(shù)據(jù)中心,一天消耗的電力相當(dāng)于15萬個普通家庭一年的用電量。
別忘了還要考慮普通民眾能源需求的變化?!半m然技術(shù)領(lǐng)域發(fā)展迅速,一個數(shù)據(jù)中心可以在兩到三年內(nèi)投入運(yùn)營,但更廣泛的能源系統(tǒng)需要更長的交付周期來規(guī)劃和建設(shè)基礎(chǔ)設(shè)施,這通常需要大量規(guī)劃、漫長的建設(shè)時間和高昂的前期投資,”國際能源署在最近的一份報告中寫道。
當(dāng)然,Meta在擴(kuò)張其足跡時可能會將目光投向美國以外,但國際能源署指出,中國和美國將出現(xiàn)最顯著的電力消費(fèi)增長——分別增長170%和130%,而歐洲(70%)和日本(80%)等地區(qū)則相對較低。
芯片從何而來?
接下來是它將從哪里獲得所需芯片來填滿數(shù)十吉瓦規(guī)模數(shù)據(jù)中心空間的問題。作為對比,“星際之門”第一個1吉瓦的站點(diǎn)預(yù)計將容納大約40萬個芯片。將這個數(shù)字乘以“數(shù)十吉瓦”,總量很快就會達(dá)到數(shù)百萬。
雖然Nvidia可能會參與其中,但Gold指出,據(jù)報道Meta一直在洽談從谷歌購買TPU,并有傳言稱正在考慮設(shè)計自己的芯片。但是,再加上芯片領(lǐng)域的激烈競爭,以及一點(diǎn)地緣政治不穩(wěn)定性(當(dāng)芯片主要在海外制造時,這一點(diǎn)非常重要),人們很容易預(yù)見到一個未來:Meta難以采購到支撐其人工智能雄心所需的處理器。
AI如何奏效?
即使Meta能夠獲得足夠的電力和處理器,關(guān)于它是否以及如何能讓AI對用戶產(chǎn)生價值,仍然存在疑問,特別是考慮到其Llama 4模型發(fā)布時出現(xiàn)的性能和其他問題。
“他們需要從Llama 4的挫折以及其失敗的元宇宙努力所造成的持續(xù)影響中恢復(fù)過來,”Chua說,并補(bǔ)充道市場尚未看到該公司下一代名為Avocado的模型的進(jìn)展。“此外,他們必須解決核心能力的貨幣化問題,而不僅僅是在WhatsApp和其他Meta產(chǎn)品中添加基本的聊天和圖像/視頻創(chuàng)建功能。”
在某種程度上,Meta在使用案例上的成功將取決于連接其用戶的網(wǎng)絡(luò)。正如Megaport首席執(zhí)行官M(fèi)ichael Reid指出的那樣,目前GPU和網(wǎng)絡(luò)性能之間存在一定的差距。
“如果GPU是大腦皮層,那么網(wǎng)絡(luò)就是神經(jīng)系統(tǒng),”Reid告訴Fierce?!爱?dāng)芯片處理速度是微秒級,而網(wǎng)絡(luò)卻需要毫秒級來傳輸數(shù)據(jù)時,你就得到了一個無法實(shí)時反應(yīng)的系統(tǒng)?!币虼耍辽俣唐趦?nèi)的一個關(guān)鍵瓶頸是Reid所說的“反射間隙”,這可能阻礙企業(yè)真正充分利用Meta計劃進(jìn)行的大規(guī)模投資。
作者:Diana Goovaerts,F(xiàn)ierce Network云計算、數(shù)據(jù)中心與人工智能執(zhí)行編輯
原文:The problem(s) with Meta Compute | https://www.fierce-network.com/cloud/problems-meta-compute