【2025年06月26日訊】(記者林燕綜合報導)美國媒體報導說,美國芯片出口管制措施已經阻礙了中國人工智能公司DeepSeek(深度求索)的新模型進程。
The Information週四(6月26日)引述知情人士的消息說,因為中國市場短缺英偉達(Nvidia)服務器芯片,這將限制中國雲服務商為DeepSeek新模型提供服務的速度和規模。
知情人士是向企業客戶提供DeepSeek模型的中國主要雲服務提供商的員工。他們表示,預計DeepSeek即將推出的大型語言模型R2在中國的普及速度和規模可能都不如其前身R1。
DeepSeek依靠英偉達的硬件和軟件進行訓練,並且在英偉達芯片上運行時性能最佳。知情人士還透露,雖然中國國內芯片公司——包括華為等提供了英偉達芯片的替代品,但DeepSeek的模型完全以英偉達硬件和軟件為基礎進行優化,因此換中國芯片來運行這些模型會更難管理,效率也會更低。
禁H20芯片出口 限制雲服務商為DeepSeek服務
中國雲計算公司的員工表示,如果R2模型的性能超越現有的開源模型,那麼對它的後續需求將使中國的雲服務提供商不堪重負,因為這些服務提供商已經在努力應對英偉達芯片短缺的問題。
他們表示,在目前使用R1模型的雲客戶中,大多數都使用英偉達的H20芯片運行模型。
儘管DeepSeek尚未確定何時發布R2,但雲計算公司員工透露,該公司一直在與一些中國雲計算公司保持密切溝通,為他們提供技術規範,以指導他們在服務器上託管和分發該模型。這些計劃包括為希望使用完整版R2的客戶準備足夠的H20芯片。
美國4月份的禁令粉碎了中國雲計算公司囤積更多H20芯片的希望。如果依賴中國現有的H20芯片庫存,這可能會限制企業使用R2的程度。
美國禁令凸顯中國仍然嚴重依賴美國技術的現實。H20芯片於2023年發布,是英偉達對美國收緊出口限制的回應,該限制實際上禁止英偉達向中國銷售其強大的Hopper系列圖形處理器芯片。隨後,英偉達訂製面向中國市場銷售的縮減版H20芯片。
中國雲計算公司之前因DeepSeek大量採購H20芯片
在R1發布之前,中國的一些雲計算公司和開發者一直迴避H20,因為其規格受限,不足以運行大型語言模型(LLM)。
但在R1發布後,情況發生了改變,幾乎所有中國企業——從雲計算公司和科技初創公司到國有企業和政府機構——都爭相使用R1。
為了滿足對R1的激增需求,包括字節跳動、阿里巴巴和騰訊控股在內的科技巨頭在2025年前三個月訂購了價值160億美元的H20芯片,相當於120萬片芯片。相比之下,據SemiAnalysis估計,英偉達2024年全年一共向中國發貨了100萬片H20芯片。
由於美國出口管制,這在今年早些時候R1需求激增時就已經對中國構成了芯片挑戰。為了彌補缺口,許多國內企業購買了英偉達專為電子遊戲設計的芯片,例如RTX 5090和RTX 4090,來驅動R1。這兩種芯片也被限制在中國銷售,但在黑市上比獲得Hopper芯片更容易買到。
DeepSeek仍在完善R2模型 傳梁文鋒對結果不滿意
據兩位知情人士透露,DeepSeek尚未確定R2模型的具體發布時間。DeepSeek的工程師在過去幾個月裡一直在緊張開發R2,但首席執行官梁文鋒對新模型的表現並不滿意。知情人士說,工程師們正在努力完善R2模型,直到梁批准發布。
今年1月,總部位於杭州的DeepSeek在科技界引起軒然大波,引發對美國高端芯片是否適用的質疑。該公司聲稱其R1推理模型與美國領先模型相當,而成本卻僅為後者的一小部分。
美國公司OpenAI指控DeepSeek在R1的訓練過程中使用了他們的AI模型。
美國國務院高級官員週一(23日)接受路透社專訪時透露,DeepSeek正在利用變通手段逃避美國出口管制,獲取美國製造的先進芯片。
該官員表示,DeepSeek手上有「大量」英偉達高端H100芯片。自2022年以來,美國全面禁止H100芯片出口到中國,因為美國擔心北京可能會利用這些芯片來提升軍事能力或在AI競賽中領先。
「DeepSeek試圖利用東南亞的空殼公司逃避出口管制,並且正在尋求進入東南亞的數據中心,以遠程訪問美國芯片。」官員說。
責任編輯:林妍#
Subscribe to Updates
Get the latest creative news from FooBar about art, design and business.
2025年2月21日,上海人工智能行業協會在上海舉辦的全球開發者大會上展示了DeepSeek的標誌。(Hector Retamal/AFP)
Previous Article北京發生車撞小學生慘案 11人死傷
Next Article 【翻牆必看】飛天茅台閃崩 批發價提前破1800元
Related Posts
Add A Comment