【2025年02月01日訊】(記者宋唐、易如採訪報導)最近,中國人工智能公司DeepSeek推出一款新的AI推理模型,衝擊了美國科技、金融及政策等多個領域,成為推動美中AI大戰的一個導火索。
中共官方炒作DeepSeek
1月20日,就在川普總統上任首日,中國人工智能公司DeepSeek發布了一款AI推理模型DeepSeek-R1,稱其功能媲美OpenAI,還使用更少算力更低成本。
同日,DeepSeek創始人梁文鋒成為唯一一位與李強會面的AI界領袖,中共央視《新聞聯播》給了他清晰的近景畫面。
去年在接受媒體的訪問時,梁文鋒稱他的核心團隊「沒有海歸人士,都是本地人才」,他還強調,中國的AI產業「不能永遠做跟隨者」。這種說法類似於官方宣傳的獨立自主敘事。
讓人們意想不到的是,在中國黃曆新年期間,兩年前還默默無聞的DeepSeek,突然成為一股攪動世界的力量,並登上了海內外的新聞頭條。
1月26日,該模型已經超越ChatGPT,成為蘋果應用商店排名第一的應用。同日,億萬富翁投資者馬克·安德森(Marc Andreessen)稱,R1模型為「人工智能的斯普特尼克時刻」。
圖為美國芯片公司英偉達(Nvidia)的產品示意圖。(Sam Yeh/AFP)
1月27日週一開盤,美國人工智能領軍企業遭遇慘重損失,微軟下跌4%,特斯拉下跌2%,英偉達跌近17%,市值蒸發近6000億美元,成為歷史上市值最大的單日跌幅。
目前,對於DeepSeek聲稱的一些說法,有不同的觀點。但DeepSeek不同之處在於,其背後有中共國家力量的推動。
台灣人工智慧實驗室(Taiwan AI Labs)創辦人杜奕瑾對表示,在AI領域不管是開源或閉源,過去這幾年來,每幾個月都有很大的更新。但DeepSeek特別之處在於,它不單單推出DeepSeek開源模型訊息。
杜奕瑾指出,DeepSeek很多訊息操作,(中共)官媒主導的成分非常高,在微博和臉書上,可以看到很多不是真正使用者的帳號非常活躍,內容主要是:DeepSeek模型推出後美國科技股大跌,美國AI的優勢沒有了。
「這種訊息非常多,而且是在美國股市盤前交易(Pre-Market)時操作的,造成盤前交易市場下跌,實際真的造成正常交易股票的下跌。」
Taiwan AI Labs創辦人杜奕瑾。資料照。(宋碧龍/)
杜奕瑾認為,如果說DeepSeek推出造成美國股票大跌,有點倒果為因。因為是大量訊息操作造成盤前交易下跌後,大家才去注意到DeepSeek,而不是相反。
杜奕瑾表示,這些虛假訊息,在油管或臉書上大量的短影音在講, DeepSeek模型的橫空出世,造成中美科技競爭。
他說,DeepSeek模型的確有獨到之處,但也不至於需要如此大肆渲染,這些短影音渲染帳號,很多都是用AI生成的農場帳號,平常也沒什麼訂戶。現在不斷放大美股下跌的信息。
「從我的角度,有點像把一個很簡單的開源成果,變成國家層級的科技競爭的訊息操作。」他說,這類似以前中國(中共)在國家主導的俄羅斯議題上面的炒作方式。網軍帳號配合官媒帳號,不斷地去做宣傳。很難讓人認為這不是一次有組織的宣傳,這背後有國家力量在推動。
杜奕瑾表示,它藉由的操作,展現的就是中國(中共)並不需要靠最高算力的晶片,也可以把模型做得很好。
DeepSeek低成本之謎
DeepSeek最讓外界關注的一點,是其所聲稱的低成本和低算力。
DeepSeek的原始報告顯示,DeepSeek-R1在預訓練階段,每兆個token上訓練DeepSeek-V3僅需要180K H800 GPU小時。假設H800 GPU的租賃價格為每GPU小時2美元,我們的總訓練成本僅為557.6萬美元。
業界人士認為,DeepSeek使用一種名為「專家混合」(mixture of experts)的技術,類似於將問題交給特定領域的專家,從而減輕了芯片同時處理所有任務的壓力。但這種技術本身並不新鮮。
杜奕瑾指出,傳統商業公司也採用「多專家模式」以降低大模型的成本,這非常普遍,也不算什麼創新,因為大部分AI新創公司比較沒有GPU資源。DeepSeek v3創新之處在於多頭、多精度的混合訓練,可以把模型訓練成本有效降低。
「但是DeepSeek並沒有說,原本的訓練資料是從哪裡來的,以及原本訓練的資料是用什麼樣方法去做訓練,這部分其實不是非常清楚。」
杜奕瑾說,如果下載DeepSeek的原始碼就可以看到,DeepSeek模型其實是利用OpenAI的all one模型的蒸餾技術,把大模型的知識提取出來之後,再交給小模型去做訓練。
「早期DeepSeek在剛發布的時候,你問DeepSeek是一個什麼樣的模型,它會回答說ChatGPT,就可以知道,它原始資料跟蒸餾對象應該就是ChatGPT。」
OpenAI在29日的一份聲明表示,正在審查有關DeepSeek可能「不當」使用其模型的輸出數據來開發其AI模型的報告。(Lionel Bonaventure/AFP via Getty Images)
OpenAI在29日的一份聲明表示,正在審查有關DeepSeek可能「不當」使用其模型的輸出數據來開發其AI模型的報告,這種方法被稱為「蒸餾」。「我們採取積極主動的對策來保護我們的技術,並將繼續與美國政府密切合作,以保護在這裡建造的最強大的模型。」OpenAI發言人說。
杜奕瑾表示,DeepSeek在使用OpenAI模型蒸餾方式的時候,提取很多相關資料做訓練。OpenAI的授權原本是不允許的,就把它的帳號關閉了。
杜奕瑾表示, OpenAI提供的模型蒸餾技術,也不是一個新的技術,大概是2015年就提出來了。OpenAI原本用意是all one模型跑起來成本非常高,提供模型蒸餾是為了讓小的模型跟大的模型去學習,跑起來成本會有效降低,而且近似於大模型某個特殊領域的跑分結果。
他舉例說,這有點類似以前要請一個非常有經驗、非常昂貴的作業員,現在作業員只要把標準的工作經驗寫下來,就可以找一個比較廉價的工讀生來取代。
杜奕瑾指出,是不是未來就不需要比較有經驗、比較高階的作業員,其實不盡然。實際上透過蒸餾的方式,去做到近似複雜模型的結果,並不代表這種訓練出來的模型,會比原本複雜的模型做得好。
「因為它的模型參數沒有那麼多,沒有那麼聰明、那麼有經驗,成果就會下降很多,這也非常常見。」
台灣工研院政策與區域研究組組長李冠樺(李冠樺)
台灣工研院政策與區域研究組組長李冠樺對表示,DeepSeek的低成本模式,事實上是因為利用了別人已經訓練好的模型,進行進一步的優化。這種低成本嚴格來說,其實是別人幫它分攤的。
「它事實上是站在別人的肩膀上再往上走,不應該把它跟OpenAI等同看待。它更像是在OpenAI基礎模型上面,做了一些更有針對性的優化。」
川普政府反應 美中AI大戰升溫
DeepSeek不斷激起了華爾街及科技界的震盪,也延及了新上任的川普政府。白宮是否會因此加碼,制定更嚴格的對華科技限制政策,成為一個焦點。
1月27日,川普總統表示,「中國公司發布DeepSeek人工智能, 應該給我們的行業敲響警鐘,我們需要集中精力進行競爭。」
川普表示,他認為低成本模式對人工智能整體而言是「非常積極的發展」,因為「你不必花費數十億美元,而是花費更少,但希望能找到相同的解決方案。」
1月27日,川普總統表示,「中國公司發布DeepSeek人工智能, 應該給我們的行業敲響警鐘,我們需要集中精力進行競爭。」 (Joe Raedle/Getty Images)
同日,眾議院中共特別委員會呼籲加強對DeepSeek人工智能基礎設施所依賴技術的出口管制。
1月28日,白宮新聞祕書卡羅琳·萊維特表示,美國官員正在調查中國人工智能應用程序DeepSeek對國家安全的影響。
1月29日,兩名美國國會議員呼籲川普政府考慮限制英偉達生產的H20人工智能芯片出口,因為中國人工智能公司DeepSeek依賴這些芯片。
同日,川普提名的商務部長盧特尼克(Howard Lutnick)在確認聽證會上對DeepSeek進行了猛烈抨擊,他說:「他們購買了大量Nvidia的芯片,並找到了繞過這些芯片的方法,從而推動了他們的DeepSeek模型。這種做法必須結束。」
據彭博社援引匿名消息人士稱,川普正考慮對英偉達向中國銷售半導體芯片,施加比拜登政府更嚴格的限制,以限制中國在人工智能方面的發展。
李冠樺表示,2023年華為釋放了7奈米的手機晶片,反而讓美國更了解原先的圍堵網中的一些漏洞,進一步把它圍堵起來。從這個角度來看,其實對他們一點好處都沒有。
「DeepSeek展現以後,美國也開始對它進行更進一步的檢視,對一家公司來講,都不是一個好事情。事情走到這一步,可能已經不是他們能夠控制的了。」
李冠樺表示,從硬體或算力的角度來看,美國絕對還是會持續地卡住中國獲得算力,包含調查DeepSeek是不是從非法管道獲得Nvidia晶片,國家力量是不是在後面幫助獲得一些算力。
「從另外一個角度來看,川普的警鐘,也包含對美國AI發展的警告,是不是太著重硬體或資本的投入,而忽略了應用商業應用的實現。」
有種說法認為,DeepSeek帶來的衝擊證明美國芯片管制的失敗。
但李冠樺認為,這不代表晶片禁令失效 ,而代表晶片禁令的確有它的效果。導致中共在AI的模型的訓練上面,必須要找很多的方法,去達到一樣的效果。
杜奕瑾表示,晶片禁令的確在AI訓練上面,會造成一些不方便。今天的禁令是有效的,但並不能完全阻止AI的發展。
「我感覺很多反應有點過頭了,造成很多不是資訊專業的評語參與其中,讓原本簡單的科技就變得很複雜。」他說。
「DeepSeek發布的技術,包含怎麼用強化學習去把模型做好,怎麼減少對晶片的依賴,同樣的方式美國公司實際上也可以利用。並不是說,因為有了比較不依賴晶片的DeepSeek模型,美國公司就沒有競爭力,也不會(造成)哪個美國公司成果受到威脅。」
美中AI大戰的未來
李冠樺表示,在最領先的一些AI技術的發展上,甚至軍事的AI,美中差距會拉大。但涉及到怎麼運用到商業,中方可能會有一些成果。
杜奕瑾表示,現在人工智能已經慢慢變成各個國家的國家級戰略,誰掌握到超強的人工智能,對一個國家跟整個產業,都是會有革命性的影響。
「美國過去在科技發展勝出,並不是純粹因為掌握晶片或掌握算力,主要還是掌握創新環境、人才環境、資本環境及軟體生態,讓好的人才願意加入,做出貢獻有該有的回報,才會讓美國人工智慧不斷在成長。」
他指出,現在的關稅壁壘、晶片壁壘、算力壁壘,未來如果競爭越高的話,就很有可能各國會趨於脫鉤。
「從2019年開始,就慢慢開始有分隊狀態,走美國供應鏈就不好走中國(中共)的,走中國(中共)就不好走美國的。往下來看的話,未來大國因為爭奪AI科技而造成的脫鉤,也是顯而易見的。在這種潮流之下,相關的立法會出台,造成彼此之間的壓力,慢慢形成分隊的狀況。」
責任編輯:林妍#
Subscribe to Updates
Get the latest creative news from FooBar about art, design and business.
What's Hot
Previous Article大陸法輪功新學員恭祝李洪志師父新年好
Next Article 【翻牆必看】傳中共備戰 為習設逃亡之地
Related Posts
Add A Comment