首頁(yè)IT—正文
如何提升智效同時(shí)解決能耗難題?AI迎來“大考”
2024年06月03日 11:10 來源:中青報(bào)·中青網(wǎng)

  1.05萬億千瓦時(shí)(kW·h)!

  這是國(guó)際能源署(International Energy Agency,以下簡(jiǎn)稱“IEA”)日前發(fā)布的《電力2024》報(bào)告中,對(duì)2026年全球數(shù)據(jù)中心的最高總用電量作出的預(yù)測(cè)。1千瓦時(shí)就是1度電,“超過1萬億度電”,根據(jù)報(bào)告的估算,這些電量大約是整個(gè)日本全年的用電量。

  數(shù)據(jù)中心、智算中心等算力基礎(chǔ)設(shè)施是人工智能(AI)的數(shù)據(jù)中樞和算力載體。隨著AI尤其是生成式人工智能(AIGC)和大模型技術(shù)的快速發(fā)展,算力需求激增,AI的能耗問題也越來越受到關(guān)注。在近段時(shí)間舉行的多場(chǎng)國(guó)際會(huì)議上,一些科技巨頭紛紛表達(dá)了對(duì)AI發(fā)展帶來的能耗問題的擔(dān)憂。

  如何在提升智效的同時(shí)解決能耗難題,對(duì)AI行業(yè)來說,是一場(chǎng)“大考”。

  AI在推理階段的耗能不容忽視

  討論AI耗能的問題,不可避免地要談到AI大語(yǔ)言模型(以下簡(jiǎn)稱“大模型”)。

  “生成式人工智能是當(dāng)前AI技術(shù)發(fā)展的重點(diǎn)!彬v訊研究院資深專家王鵬在接受中青報(bào)·中青網(wǎng)記者采訪時(shí)說。他表示,當(dāng)前,生成式人工智能技術(shù)的基礎(chǔ)就是以數(shù)據(jù)和算力堆疊為標(biāo)志的大模型,其訓(xùn)練和應(yīng)用需要大量的算力支持,“算力背后則是算力基礎(chǔ)設(shè)施耗電所帶來的巨大電能需求”。

  全國(guó)政協(xié)委員、中國(guó)科學(xué)院計(jì)算技術(shù)研究所研究員張?jiān)迫赋,大模型的參?shù)和數(shù)據(jù)規(guī)模越大,其智能效果就越好。在大模型中,“Scaling Laws”(規(guī)模效應(yīng))意味著當(dāng)參數(shù)和數(shù)據(jù)規(guī)模大到一定程度時(shí),大模型的智能表現(xiàn)將出現(xiàn)躍升,也就是“智能涌現(xiàn)”!澳壳拔覀冞沒看到‘智能涌現(xiàn)’的上限在哪。”

  “一般來說,參數(shù)量越大,大模型的算力消耗就越大,其消耗的電能就越多!蓖貔i表示,因?yàn)檫沒達(dá)到上限,以O(shè)penAI為代表的人工智能公司在“Scaling Laws”的驅(qū)使下,還在持續(xù)增加大模型的參數(shù)和數(shù)據(jù)規(guī)模,以求實(shí)現(xiàn)通用人工智能(AGI)的目標(biāo),造成短期內(nèi)算力需求和電能需求的巨大提升。

  “因?yàn)镚PT-3有1750億個(gè)參數(shù),訓(xùn)練用到了1024張英偉達(dá)A100芯片,所以業(yè)內(nèi)將其稱為‘千卡千參’!鄙虦萍贾悄墚a(chǎn)業(yè)研究院院長(zhǎng)田豐說,目前GPT-4、GPT-5等大模型都達(dá)到了“萬卡萬參”的規(guī)模,且訓(xùn)練模型所用芯片也從英偉達(dá)A100更新到英偉達(dá)H100、B200,“參數(shù)量的激增將導(dǎo)致能耗顯著增加”。

  除了模型訓(xùn)練以外,AI在推理階段的耗能也不容忽視!巴评砑创竽P晚憫(yīng)用戶需求的過程”,張?jiān)迫榻B,大模型單次響應(yīng)用戶需求的耗電量并不大,“但隨著用戶規(guī)模的增加,耗電量也將不斷累積并增大!

  近日,源自美國(guó)的一則“如果將10萬塊英偉達(dá)H00芯片部署在同一地區(qū)進(jìn)行模型訓(xùn)練,會(huì)導(dǎo)致電網(wǎng)崩潰”的新聞引起社會(huì)關(guān)注。

  多位專家在接受記者采訪時(shí)表示,AI導(dǎo)致電網(wǎng)崩潰的原因在于,大模型的訓(xùn)練是階段性的工作,所用到的算力要集中在一個(gè)數(shù)據(jù)中心里,在有限時(shí)空范圍內(nèi)進(jìn)行大模型訓(xùn)練,會(huì)給局部電網(wǎng)帶來非常大的用電負(fù)荷。

  “穩(wěn)定的電網(wǎng)系統(tǒng)中突然出現(xiàn)巨大負(fù)荷擾動(dòng),會(huì)對(duì)電網(wǎng)的穩(wěn)定和安全產(chǎn)生影響!睆?jiān)迫赋,隨著大模型參數(shù)和數(shù)據(jù)規(guī)模的進(jìn)一步增加,AI的能耗問題將越來越突出,尤其是對(duì)于電力供應(yīng)緊張的國(guó)家和地區(qū)。“長(zhǎng)遠(yuǎn)來看,AI推理過程的耗能將越來越大;短期內(nèi),大模型訓(xùn)練的能耗則是最大的AI能耗增量!

  在王鵬看來,與家庭用電量相比,AI的耗電量顯得很大,但其在社會(huì)總用電量中的占比依然很小,“還遠(yuǎn)沒有達(dá)到制造業(yè)用電的數(shù)量級(jí)”。

  解決方案:技術(shù)創(chuàng)新與新能源

  根據(jù)美國(guó)機(jī)構(gòu)Uptime Institute的預(yù)測(cè),到2025年,AI相關(guān)業(yè)務(wù)在全球數(shù)據(jù)中心用電量中的占比將從2%增加到10%;到2030年,智能計(jì)算的年耗電量將占全球發(fā)電總量的5%。

  “解決能耗問題,是AI技術(shù)發(fā)展的重要前提!碧镓S對(duì)記者說,雖然目前AI的能源消耗還不至于引起大范圍“電荒”,但隨著AI的大規(guī)模應(yīng)用,未來可能發(fā)生AI“缺電”的情況,需要尋找合適的解法,讓有限的電力能源可以容納更大的算力規(guī)模。

  通過研究和實(shí)踐,人們對(duì)AI的了解逐漸增強(qiáng),一系列解法隨之而來。從需求角度看,優(yōu)化大模型架構(gòu)、提升芯片效率和算力效率等,被認(rèn)為是降低AI能耗的有效途徑。

  張?jiān)迫硎,首先,可以設(shè)計(jì)AI模型訓(xùn)練的專用芯片,其效率相較GPU(圖形處理器,現(xiàn)常用于AI計(jì)算)提升了10倍以上;其次,可以優(yōu)化AI模型的參數(shù),很多小模型僅有幾十億的參數(shù)量,但已經(jīng)實(shí)現(xiàn)了和大模型一樣的效果;此外,還可以通過對(duì)推理過程進(jìn)行優(yōu)化壓縮,設(shè)計(jì)專用推理芯片,進(jìn)一步降低AI推理階段的能耗。

  “大模型變小模型,目前降低能耗效果最好!睆?jiān)迫晕④?月底發(fā)布的自研小尺寸AI模型Phi-3為例介紹。據(jù)了解,Phi-3模型目前有3個(gè)版本,其中Phi-3 mini是一個(gè)擁有38億參數(shù)的語(yǔ)言模型,可部署在手機(jī)上,根據(jù)實(shí)驗(yàn)和測(cè)試結(jié)果,其性能已經(jīng)可以與GPT-3.5等大模型相媲美。

  在能源供應(yīng)方面,訴諸多樣化的新能源供給、依靠國(guó)家進(jìn)行宏觀調(diào)控與規(guī)劃等舉措,將有助于解決AI能耗問題。天使投資人、資深人工智能專家郭濤對(duì)記者表示,當(dāng)前,新能源,包括太陽(yáng)能、風(fēng)能、水能等可再生能源,正逐漸成為數(shù)據(jù)中心的最佳能源選擇!叭绻麤]有足夠的可再生能源來滿足AI能耗的增長(zhǎng),可能會(huì)導(dǎo)致對(duì)化石燃料的依賴加劇,從而對(duì)環(huán)境造成負(fù)面影響。此外,數(shù)據(jù)中心還可以通過智能算法來優(yōu)化能源使用效率,實(shí)現(xiàn)AI與電網(wǎng)的協(xié)同發(fā)展。”

  不少人工智能公司已經(jīng)開始關(guān)注新能源。2021年,OpenAI首席執(zhí)行官山姆·奧爾特曼向核聚變初創(chuàng)公司Helion Energy投入3.75億美元;2024年3月,亞馬遜云服務(wù)公司(AWS)收購(gòu)美國(guó)賓夕法尼亞州一座數(shù)據(jù)中心園區(qū),據(jù)了解,該園區(qū)就是從鄰近的核電站獲取電力。

  “解決AI耗能問題涉及到算力、電力等多個(gè)系統(tǒng)的協(xié)調(diào)與配合!蓖貔i指出,一方面,要從AI本身去降低能耗,包括優(yōu)化算法、降低模型參數(shù)、提高計(jì)算性能等;另一方面,整個(gè)能源系統(tǒng)也要積極響應(yīng)AI的能耗需求。

  “源網(wǎng)荷儲(chǔ)”一體化考慮

  新能源或?qū)⒊蔀榻鉀QAI耗能問題的一把“鑰匙”,這正好與我國(guó)此前提出的“東數(shù)西算”工程相契合。

  國(guó)家能源局的數(shù)據(jù)顯示,2023年,我國(guó)可再生能源新增裝機(jī)3.05億千瓦,占全國(guó)新增發(fā)電裝機(jī)的82.7%,占全球新增裝機(jī)的一半;全國(guó)可再生能源發(fā)電量近3萬億千瓦時(shí),接近全社會(huì)用電量的1/3。目前,我國(guó)已建成全球規(guī)模最大的電力供應(yīng)系統(tǒng)和清潔發(fā)電體系,其中青海、內(nèi)蒙古、寧夏等西北部地區(qū)則是清潔能源的“富礦”。

  2021年,我國(guó)提出實(shí)施“東數(shù)西算”工程,引導(dǎo)數(shù)據(jù)中心向西部資源豐富地區(qū)聚集,推動(dòng)當(dāng)?shù)財(cái)?shù)據(jù)中心走向低碳、綠色、可持續(xù),同時(shí)滿足東部地區(qū)的算力需求。2022年2月,內(nèi)蒙古、貴州、甘肅等8地啟動(dòng)建設(shè)國(guó)家算力樞紐節(jié)點(diǎn),10個(gè)國(guó)家數(shù)據(jù)中心集群被寫入工程總體“規(guī)劃”,“‘東數(shù)西算’工程全面啟動(dòng)”。

  “大模型時(shí)代,‘東數(shù)西算’工程將對(duì)全國(guó)的電力需求和算力需求起到重要的宏觀調(diào)控作用!睆?jiān)迫A(yù)計(jì),未來將會(huì)有越來越多的大型算力中心或智算中心選址我國(guó)西部地區(qū),“東數(shù)西訓(xùn)”(即東部地區(qū)的AI大模型,在西部地區(qū)進(jìn)行訓(xùn)練——記者注)將成為AI與新能源協(xié)調(diào)發(fā)展的典型場(chǎng)景。但他強(qiáng)調(diào),推動(dòng)新能源更好地賦能AI發(fā)展,儲(chǔ)能是一個(gè)需要解決的問題。

  “大規(guī)模儲(chǔ)能的建設(shè)決定了新能源是否能更好地滿足算力需求。”田豐也同意張?jiān)迫挠^點(diǎn)。田豐指出,包括光電、風(fēng)電等在內(nèi)的新能源,具有間歇性發(fā)電的特點(diǎn),需要依靠?jī)?chǔ)能系統(tǒng)將多發(fā)的電及時(shí)存儲(chǔ)起來,削峰調(diào)谷,以保證電網(wǎng)的供需平衡。

  國(guó)家能源局的最新數(shù)據(jù)顯示,截至2024年一季度末,我國(guó)已建成投運(yùn)的新型儲(chǔ)能項(xiàng)目累計(jì)裝機(jī)規(guī)模達(dá)到3530萬千瓦,同比增長(zhǎng)超過210%,其中10萬千瓦以上的儲(chǔ)能電站超5成,呈現(xiàn)集中式、大型化的發(fā)展趨勢(shì)。

  在儲(chǔ)能的建設(shè)上,王鵬著重強(qiáng)調(diào)了新能源汽車的分布式儲(chǔ)能能力!半S著電池充放電次數(shù)和壽命不斷提高,數(shù)億輛電車?yán)梅骞入妰r(jià)差來儲(chǔ)能并反向回供電網(wǎng),基本可以實(shí)現(xiàn)零成本用車甚至盈利,同時(shí)也能解決電網(wǎng)的調(diào)峰問題!

  此外,王鵬還認(rèn)為要重新思考“數(shù)據(jù)網(wǎng)”和“電力網(wǎng)”的分布式聯(lián)動(dòng)與微觀布局協(xié)同。他指出,為滿足短期內(nèi)快速增長(zhǎng)的人工智能推理算力需求,除了在西部可再生能源豐富的地區(qū)布局大型算力中心,實(shí)現(xiàn)“東數(shù)西算”;也需要考慮在東部需求側(cè)的數(shù)據(jù)中心和算力中心附近,積極布局分布式可再生能源,如與城鄉(xiāng)建筑、農(nóng)業(yè)設(shè)施等結(jié)合的分布式BIPV(光伏建筑一體化)、光儲(chǔ)直柔一體化等!岸疫要‘源網(wǎng)荷儲(chǔ)’一體化考慮,盡可能通過微電網(wǎng)實(shí)現(xiàn)就地峰谷平衡,減少棄風(fēng)棄光!

  “這需要電價(jià)政策、基礎(chǔ)設(shè)施建設(shè)、政策支持和用戶行為等多方面的配合!痹谕貔i看來,整個(gè)算力網(wǎng)絡(luò)、輸電網(wǎng)絡(luò)、分布式能源網(wǎng)絡(luò),與車輛(充電)網(wǎng)絡(luò)的高度耦合,或許是解決我國(guó)未來AI能耗問題的關(guān)鍵。

  “在考慮投入和產(chǎn)出算總賬的情況下,AI實(shí)際上進(jìn)一步提高了社會(huì)的生產(chǎn)效率,降低了能耗!碧镓S認(rèn)為,AI作為新質(zhì)生產(chǎn)力正在賦能經(jīng)濟(jì)社會(huì)發(fā)展,如今的AI大模型已經(jīng)成為重要的基礎(chǔ)科研設(shè)施,其訓(xùn)練中的投入,最終將為全社會(huì)帶來新質(zhì)生產(chǎn)力的紅利。

  目前,在AI大模型的訓(xùn)練成本中,能源消耗成本的占比已經(jīng)超過一半。田豐說,從基礎(chǔ)科研的角度看,要繼續(xù)加大對(duì)AI技術(shù)的投資,“現(xiàn)在是奮起直追的時(shí)候,不應(yīng)該自束手腳”。具體到AI耗能方面,他建議,可以給予大模型訓(xùn)練一定的能源支持政策。

  中青報(bào)·中青網(wǎng)見習(xí)記者 賈驥業(yè) 記者 朱彩云 來源:中國(guó)青年報(bào)

編輯:孫婷婷