AI服務器嚴重缺貨造成價格上漲是為什么?AI服務器價格上漲給相關企業帶來困境AI 服務器價格上漲給相關企業帶來了成本壓力和出貨量下降的困境。一方面,對于AI服務器生產商來說,由于核心零部件GPU價格上漲和供應緊張,導致其生產成本增加和出貨量受限。另一方面,對于AI服務器使用者來說,例如云服務商和終端用戶,由于AI服務器價格上漲和供應不足,導致其使用成本增加和算力資源匱乏。

據行業媒體報道,“現在英偉達GPU嚴重缺貨,服務器廠商缺少核心零部件,一定程度上影響了相關企業的出貨量?!倍鵀榱藨獙υ黾拥挠唵瘟?,英偉達也向臺積電追加預訂1萬片先進封裝產能,以滿足AI頂級規格芯片的生產。但這些措施仍然難以解決短期內的供需矛盾。另外,在國內可用于訓練AI大模型的A100大約有4萬~5萬個,供應相當吃緊。一些云服務商已嚴格限制內部使用這些先進芯片,以將其保留至需要強力運算的任務。而對于終端用戶來說,在線租用云端AI服務器也變得更加昂貴和困難。
面對AI 服務器價格上漲和供應緊張的問題,業界正在尋求各種解決方案。其中主要有以下幾個方向:- 增加GPU產能:這是最直接也最困難的方案。由于全球芯片產業鏈的復雜性和脆弱性,在短期內很難實現大幅提升GPU產能。不過,在中長期來看,隨著臺積電、三星等芯片制造商擴大投資和產能,在國內也有多家企業在積極布局國產GPU芯片,在未來或許可以緩解GPU供應緊張的問題;- 優化AI模型:這是一個技術層面的方案。通過優化AI模型的結構、參數、算法等方式,可以降低模型對算力資源的消耗。例如,在NLP領域有一種叫做知識蒸餾的技術方法,可以將一個大型模型(教師模型)訓練出來的知識傳遞給一個小型模型(學生模型),使得小型模型可以在保持較高精度的同時減少運算量。
- 利用邊緣計算:這是一個架構層面的方案。通過利用邊緣計算技術,在離數據源更近、更分散、更靈活的邊緣節點上進行數據處理和分析,并將結果返回給云端或終端設備。這樣可以減少對云端中心化算力資源的依賴和消耗,并提高數據處理效率和安全性;- 探索新型硬件:這是一個創新層面的方案。通過探索新型硬件設備和技術來提升或替代傳統GPU芯片在人工智能領域中的作用。例如,有一種叫做神經網絡處理器(NPU)的專用芯片,可以針對神經網絡的特點進行優化設計,提高運算速度和效率;還有一種叫做光子計算的新興技術,可以利用光子代替電子進行數據傳輸和處理,實現超高速度和超低功耗的計算。
?