南方財經(jīng)全媒體記者 吳立洋 上海報道
近日,南方財經(jīng)全媒體記者注意到,國內(nèi)諸多主流公有云服務(wù)商,均出現(xiàn)一定程度云端GPU算力缺貨的情況。
(資料圖)
有下游GPU需求方向記者表示,近期受AI熱潮影響,GPU云服務(wù)市場確實存在短期內(nèi)供不應(yīng)求的情況。
GPU算力的相對短缺一方面源自上游供給的不足,2022年8月芯片設(shè)計公司英偉達宣稱,被美國政府要求限制向中國出口兩代旗艦GPU計算芯片A100和H100;另一方面,在由Chat GPT掀起的“全業(yè)大模型”AI熱潮下,應(yīng)用需求進一步擴張,缺乏GPU儲備的企業(yè)不得不轉(zhuǎn)向云端尋求算力支持。
面對市場供需差,服務(wù)商和應(yīng)用商都在尋求各自的解決方案。在供應(yīng)端,服務(wù)商們正想方設(shè)法優(yōu)化自身的供應(yīng)方案,4月14日,騰訊云正式發(fā)布面向大模型訓練的新一代HCC高性能計算集群,該集群搭載了英偉達H800GPU,后者是英偉達為應(yīng)對美國禁令為中國市場開發(fā)的H100特供版,華為等相關(guān)廠商也在積極探索算力并網(wǎng)等方面的優(yōu)化方案。
在需求端,人工智能公司、游戲公司等GPU需求大戶也在尋求最佳的算力購買方案,綜合考慮成本、穩(wěn)定性等因素選擇服務(wù)商或購置多路云服務(wù)。
GPU即圖形處理器,是專門為圖像和圖形相關(guān)運算工作的微處理器,由于擅長大規(guī)模并發(fā)計算,因此也被應(yīng)用于AI訓練等需要大規(guī)模并發(fā)計算場景。OpenAI的研究表明,2012至2018年6年間,在最大規(guī)模的人工智能模型訓練中所使用的計算量呈指數(shù)級增長。
但由于GPU產(chǎn)品售價高昂,且對相關(guān)算力需求往往以項目制方式進行,因而搭配自身算力資源或完全購買云服務(wù)商的GPU算力是很多中小規(guī)模應(yīng)用商的選擇。
目前,在AI帶來的算力需求下,相關(guān)云服務(wù)商的GPU供給存量正被快速消耗。
南方財經(jīng)全媒體記者查詢騰訊云官網(wǎng)發(fā)現(xiàn),提供英偉達A100 GPU的云產(chǎn)品已顯示售罄狀態(tài),包含其他區(qū)域在內(nèi),可提供相關(guān)服務(wù)的僅有英偉達P4、T4、V100等型號的GPU。
在京東云官網(wǎng),提供GPU云算力的華北-北京與華東-上海區(qū)域也同樣缺少A100 GPU服務(wù),但隨后京東云官方客服聯(lián)系南財記者表示,官網(wǎng)顯示只有P40型號的GPU,如果需要更高的算力配置,可以聯(lián)系運營人員提供定制化服務(wù)。
而在阿里云商店界面,仍有少量A100可供選購,但阿里云客服人員在與記者的交流中也坦言:官網(wǎng)只要顯示可購買,機房就可以足額進行虛擬化,但如果購買產(chǎn)品到期后沒有續(xù)費算力被釋放,也不能保證二次購買時有貨。
“能買到就說明還有貨。其他的就不方便透露了?!睂τ谀县斢浾哧P(guān)于阿里云GPU供給情況的問詢,阿里云相關(guān)負責人如此回應(yīng)道。
“從去年8月美國對中國實施A100與H100禁運后,GPU的供給就一直處于相對緊張的狀態(tài),價格也隨之水漲船高。”上海某互聯(lián)網(wǎng)公司云服務(wù)業(yè)務(wù)從業(yè)者向記者表示,在AI熱潮算力需求暴漲的背景下,無論是市場上流通的GPU還是云端算力,在短期內(nèi)都面臨一定的供不應(yīng)求境況。
供應(yīng)端的壓力首先來自于GPU成品的禁運封鎖。2022年8月31日,芯片設(shè)計公司英偉達宣稱,美國政府要求其限制向中國出口兩款旗艦GPU計算芯片A100和H100。但很快,英偉達就給出了特供中國市場的產(chǎn)品A800,在A100基礎(chǔ)上將GPU高速互聯(lián)總線帶寬從600GB/s降低至400GB/s,在不影響單卡性能的基礎(chǔ)上,限制了GPU大規(guī)模拓展互聯(lián)。
今年3月,英偉達宣布H100顯卡全面投產(chǎn),并針對AI市場推出了新的雙GPU產(chǎn)品H100 NVL,可提供高達188GB HBM3顯存,單卡顯存容量達94GB,適用于運行大型語言模型(LLM)。
此外,英偉達也同步宣布將基于H100為中國市場開發(fā)第二款特供版GPU H800,且H800在限制帶寬后依然符合美國政府的限制出口規(guī)定。彼時據(jù)媒體報道,阿里巴巴、騰訊、百度三家國內(nèi)廠商均已使用H800產(chǎn)品。
而在國內(nèi)自研GPU方面,由于被列入美國實體清單等因素影響,華為晟騰、寒武紀思元、壁仞科技BR100等GPU產(chǎn)品在設(shè)計和量產(chǎn)等方面仍多處受到掣肘。
“GPU一般都是數(shù)字芯片,制程相對先進,有賴于高速開關(guān)技術(shù),因而相較于其他產(chǎn)品的研發(fā)難度要更高。”無錫某半導(dǎo)體行業(yè)從業(yè)者向記者表示,相關(guān)數(shù)字芯片往往規(guī)模龐大,完全的正向設(shè)計很困難,目前部分公司的做法是購買相關(guān)電路模塊設(shè)計版權(quán)然后進行復(fù)制。但即便能夠購買到相關(guān)版權(quán),由于當前芯片設(shè)計往往采用了憶阻器的“黑盒子”技術(shù),進行高效復(fù)制同樣困難重重。
云端算力方面,在A100與H100被禁運后,很長一段時間內(nèi)大部分云服務(wù)商所能提供的云服務(wù)主要還是依賴此前儲備的GPU存量,雖然A800等特供版產(chǎn)品和國產(chǎn)GPU也能提供一定算力支撐,但數(shù)量和并網(wǎng)能力等方面的限制依然困擾著供需雙方。
而在本輪GPU供給短缺發(fā)生前,國內(nèi)廠商其實一直在進行算力“過冬”的準備。
“包括游戲公司在內(nèi),國內(nèi)大部分IT企業(yè)在美國禁令正式執(zhí)行前,都一直在購買GPU。”作為算力消耗大戶,上海某游戲公司相關(guān)負責人告訴記者,對于中小開發(fā)者而言,小體量的產(chǎn)品開發(fā)可能靠4090等消費級顯卡即可完成,少數(shù)需要使用A100以上級別的場景也并不難解決,因而受到相關(guān)供需關(guān)系變化影響相對有限。
某上市游戲公司技術(shù)負責人也向記者表示,由于企業(yè)自身是云服務(wù)商大客戶,合作關(guān)系相對穩(wěn)定,因而目前算力供給也并未受到過多波及。
但供需市場的變化也在促使相關(guān)廠商不斷調(diào)整算力支撐方案。上述上海游戲公司負責人向記者表示,公司早在數(shù)個月前就購入了A100的多路國內(nèi)云服務(wù),并用阿里、騰訊、華為、AWS、GCP等多家供應(yīng)商的云服務(wù),還在不久前加入了微軟Azure。
以近日風頭正盛的微軟Azure為例,據(jù)其官方發(fā)布的信息顯示,借助OpenAI的GPT大模型,微軟已經(jīng)能夠面向企業(yè)推出Azure OpenAI云服務(wù),幫助企業(yè)發(fā)掘大規(guī)模的AI與商業(yè)場景結(jié)合的潛力。而在Azure的官網(wǎng)界面,“將高級編碼和語言模型應(yīng)用于各種用例”被高調(diào)地放置于“精選”產(chǎn)品頁。
一位游戲AI創(chuàng)業(yè)企業(yè)負責人告訴記者,他們的公司正是在這兩個月從阿里云和AWS全量遷移到了Azure。
“他們給了很多優(yōu)惠,資源也很足。”該負責人坦言。
上述上海游戲企業(yè)負責人也表示,提供GPT的API接口是Azure的優(yōu)勢之一,但也存在并發(fā)能力差的問題,當前對于不同體量、不同算力需求的公司,GPU供給還未能收斂到特定標準化解決方案,這也正是很多企業(yè)在實際業(yè)務(wù)中采用不同供應(yīng)商并行策略的原因。
“因為不同供應(yīng)商提供的服務(wù)各有其擅長領(lǐng)域,且在市場競爭下,也給需求方留下充分的議價空間。”他進一步表示。
而在需求端不斷調(diào)整算力獲取方案的同時,國內(nèi)供給方也在積極進行著優(yōu)化與迭代。
4月11日,浙江移動宣布通過與華為合作,旗下算力網(wǎng)絡(luò)與杭州人工智能計算中心成功對接,實現(xiàn)了基于昇騰GPU的AI算力并網(wǎng),全面降低了模型訓練時間、推理時間和使用成本。
三天后,騰訊云正式發(fā)布新一代HCC高性能計算集群,搭載英偉達H800 GPU。據(jù)騰訊方面表示,騰訊云新一代集群的算力性能較前代提升高達3倍,是國內(nèi)性能最強的大模型計算集群。
阿里云CTO周靖人曾在公開發(fā)言中表示,GPU很重要但不是全部:“大模型的訓練往往需要幾千甚至上萬張GPU卡共同協(xié)作來完成,卡與卡之間的連接,機器與機器之間的連接,如何構(gòu)建一個高吞吐、低延遲的網(wǎng)絡(luò),以及高效的存儲,都是智算基礎(chǔ)設(shè)施的重要環(huán)節(jié)。如果沒有這些環(huán)節(jié),光有GPU的卡,就很難跑出規(guī)模超級大的模型?!?/p>
同樣是在最近,微軟開源了一個可在模型訓練中加入完整RLHF(人類反饋強化學習)流程的系統(tǒng)框架——DeepSpeed Chat,據(jù)介紹,該框架通過混合引擎,支持在2.1天內(nèi)訓練一個OPT-66B的模型,且成本僅為1620美元——該方式比現(xiàn)有系統(tǒng)快15倍以上,消耗的算力成本大幅下降。受該消息影響,當天股市數(shù)據(jù)中心板塊一度下挫2%左右。
“除了加快研發(fā)光刻機從芯片供給層面解決問題,從云服務(wù)供給優(yōu)化到需求端市場的自發(fā)調(diào)整,都在為應(yīng)對短期的算力供需問題進行探索與嘗試,這需要整個供應(yīng)量上下游的共同努力?!鄙鲜鰺o錫半導(dǎo)體行業(yè)從業(yè)者說。
關(guān)鍵詞:
AI算力中場戰(zhàn)事:云端GPU供需變局突顯,上下游優(yōu)化供給空間亟待釋放
每日快訊!《小美人魚》真人電影幕后特輯 王子愛麗兒吻戲挺多
沿海最委屈的985,在東北
訪牧戶、進企業(yè) 包頭邊境管理支隊開展全民國家安全教育日宣傳活動
紅樓夢中襲人接受了王夫人的任務(wù),為何后來抗命了?
鶴峰:田間地頭管護忙 孕育豐收新希望
第三屆消博會首個公眾開放日 約5萬觀眾進場
國產(chǎn)衛(wèi)浴龍頭加碼智能化,箭牌家居有望實現(xiàn)智能馬桶的“彎道超車” 環(huán)球快消息
全球要聞:悍馬H3真的是被通用不公正地干掉的4×4嗎
世界新消息丨男生生日禮物送什么好排行榜
【天天快播報】數(shù)控技術(shù)專業(yè)就業(yè)前景及薪酬_數(shù)控技術(shù)專業(yè)就業(yè)前景如何
黃金市場分析:似乎進入了大漲小回的交易節(jié)奏
與春天 “香”遇!北京香山公園進入山花觀賞期 天天最新
世界視點!巴西國家博物館將于明年6月對公眾重新開放
離石區(qū)昌寧社區(qū)黨建引領(lǐng)聚合力 義診惠民踐初心
基金早餐:4月13日基金凈值排名、加減倉及選基策略分享_當前速看
血虧!曼聯(lián)本場遭補時絕平+2人烏龍+2人傷退+1人停賽
焦點速讀:北苑社區(qū):周末公益小課堂 便民為民“零距離”
江蘇省興化市5人被終身禁止從事食品行業(yè)
東旭光電:尚未涉入光伏發(fā)電領(lǐng)域 觀天下
世界觀熱點:大悅城控股一季度新增1宗南京住宅地塊 成交價13.95億元
終于知道為什么美國近期把絕密文件泄露了_全球快播報
【天天報資訊】紫砂壺的泥料的制作 紫砂壺的泥料有哪些
世界消息!夫妻吵架丈夫高空拋狗傷及路人獲刑:拘役五個月,緩刑一年,并處罰金3000元
2023廣州星巢秘境音樂節(jié)什么時候開售?
敘利亞與突尼斯決定恢復(fù)外交關(guān)系
《許你春風野馬》收官 張穎穎演繹清醒打工人引網(wǎng)友共情 熱點聚焦
河南省專升本院校有哪些_專升本院校有哪些
不滿匈俄經(jīng)濟合作 美國制裁一名匈牙利銀行高官
廣州市區(qū)2小時直達香港機場!這個碼頭臨時對外開放→
宏景科技4月13日盤中漲幅達5%
【世界時快訊】《天外世界:太空人之選》發(fā)布更新?優(yōu)化卡頓現(xiàn)象
《煙雨江湖》西子君劍如何獲得 西子君劍獲得方法分享_天天關(guān)注
這就是信心|忙——物流加速跑-世界短訊
射手座今天運勢 射手座今年運勢 世界短訊
環(huán)球快資訊丨華中數(shù)控發(fā)布高端五軸數(shù)控系統(tǒng)產(chǎn)品
相關(guān)新聞