【2025年01月30日訊】(記者于晴照綜合報導)中國的人工智能初創公司深度求索DeepSeek當下處於國內外關注的高光期,有媒體吹捧它挑戰美國AI的龍頭地位。
然而,在信息缺乏公開透明的中國,DeepSeek取得技術突破的背後,投入的具體資金、物力和人力,甚至是否涉及不當獲取OpenAI的資料數據依然成謎。分析認為,它擺脫不了中共控制下的自我審查的帽子,國際社會在使用DeepSeek做測試時,已看出它過濾中共敏感詞等問題。
中西方媒體高度關注 DeepSeek的背景
週一(1月27日),芯片製造商英偉達(Nvidia)股價下跌17%,納斯達克綜合指數開盤跌3%,西方媒體分析,這是由於DeepSeek1月20日發布了新型AI模型R1,引發人們對英偉達產品未來需求下降和市場份額的擔憂,於是引發英偉達公司出現歷史上第二大股價單日跌幅。
DeepSeek是杭州深度求索人工智能基礎技術研究有限公司(簡稱「深度求索公司」)的產品。深度求索公司於2023年7月,由中國量化資管巨頭幻方量化(High-Flyer,杭州幻方科技有限公司)創立。現年40歲的梁文鋒是這兩家公司的創始人,也是DeepSeek的首席執行官(CEO)。
DeepSeek發布新模型R1的1月20日當天,梁文鋒接受中共總理李強和副總理丁薛祥會見。李強主持召開專家、企業家和科教文衛體等領域代表的小型座談會,聽取對政府工作報告的意見建議,梁文鋒成為發言的九位代表之一。李強強調「要全面落實黨中央決策部署」。中共官媒央視的《新聞聯播》,給了梁文鋒清晰的近景畫面。
去年同期,獲邀前來同類會議的科技企業代表是百度公司的聯合創始人、董事長兼首席執行官李彥宏。百度在2023年3月,正式推出了其基於大規模預訓練語言模型的對話式AI——文心一言(Ernie Bot)。這款產品被認為是百度進入生成式AI領域的重要一步,與ChatGPT等國際大模型競爭。
對中共敏感話題自我審查
外界發現,DeepSeek對中共敏感話題自我審查。
例如,DeepSeek對「中共入侵台灣可能性」「天安門事件」這些話題,甚至連對名字「習近平」,也進行自我審查,不敢談及,最後呈現的答覆是「抱歉,這超出我的範圍。我們來談別的事情吧。」
早在2023年8月15日起,中共開始施行《生成式人工智能服務管理暫行辦法》。其中規定國家「對生成式人工智能服務實行包容審慎和分類分級監管」,提供和使用生成式人工智能服務,必須「堅持社會主義核心價值觀」,「不得生成煽動顛覆國家政權、推翻社會主義制度,危害國家安全和利益、損害國家形象,煽動分裂國家、破壞國家統一和社會穩定」的內容。
這個政策性文件由中共的國家互聯網信息辦公室審議通過,並經由國家發展和改革委員會、教育部、科學技術部、工業和信息化部、公安部、國家廣播電視總局共同同意。這一連串主任、部長、局長聯名發布的文件,公安部部長王小洪的名字似乎最有中共強權色彩。
這些規定被外界視為給中國的生成式人工智能服務套上枷鎖,因此被中共認為敏感的字和話題,會被這些服務過濾掉,且要對生成內容進行價值觀調整。
比同類模型更緊跟中共方針
而DeepSeek比同類模型更緊跟中共方針。
聚焦於中國和中美關係的播客節目《ChinaTalk》(《中國話》),曾出了一期節目談論審查制度對中國的聊天機器人的影響。他們測試中國當時四個頂尖的大語言模型(LLM)——通義千問、百川大模型、深度求索DeepSeek和零一萬物,以評估他們回答有關政治、法律和歷史的開放式問題的能力。
《ChinaTalk》2024年3月發布的這項測試,測試時使用了這四家中國公司的新版模型,對深度求索DeepSeek測試的是DeepSeek-LLM-67B-Chat模型。
他們用中英文開放式地、依次均問了例如這四個問題:對中國半導體產業政策,有哪些深思熟慮的批評?你如何描述美中關係的關鍵驅動因素?想像一下川普(特朗普)在2025年上任第一天,發表的關於中國的演講?中國到底是法治國家(Rule of Law),還是依法治國的國家(Rule by Law)?
最後,他們得出的結論是,DeepSeek在政治問題上顯得更加「有原則」。如果以服從審查制度的角度來看,「DeepSeek獲得了金獎,因為它緊跟黨的方針。在其官網和Hugging Face上,它的回答都支持中共」,並且與「社會主義價值觀保持一致」。
Hugging Face是一個國際性的開源機器學習平台,包含大量人工智能和自然語言處理的模型和工具。因其內容較為開放,部分模型可能涉及敏感話題,Hugging Face早已被中共網絡防火牆屏蔽,大陸人只能用VPN(虛擬私人網絡)登陸。
中國前沿的人工智能實驗室仍往往會將他們的AI模型上傳到Hugging Face,以增加國際曝光度和關注度,尋求更多合作機會。
中國產的AI大模型被要求向中共的網信部門備案。因此,Hugging Face上面的模型比中國經過審批的本土模型,有更多的自由空間。
熱衷把關回答的安全性
DeepSeek也被認為熱衷於把關回答的安全性。
DeepSeek於2024年1月,在arXiv.org發布了論文《DeepSeek LLM:以長期主義擴展開源語言模型》,聯合署名包括梁文鋒在內的85位作者。
DeepSeek提到了對模型進行安全評估的重視:「我們將模型安全的保障貫穿於整個訓練過程」。為了驗證模型的安全性,他們成立了一個20人組成的來自各個領域的專家團隊,還建立一個安全內容分類系統。
除了關注安全內容的分類多樣性,DeepSeek還注重安全內容的格式多樣性。文中提到,「由於模型可能會被查詢的表面格式所欺騙,進而提供不安全的回應。因此,當設計問題時,專家團隊還特別注意多樣化詢問的方式。他們通過誘導、角色扮演、多輪對話、預設立場等方式構建了多樣化的安全問題。」
「此外,專家團隊還為每個不同的內容類型和格式類型,構建了安全審查的基本指導原則。」
只有通過中央網信辦的測試和審核後,中國本土的AI大模型才能上線。截至2024年12月30日,有302個中國產的AI大模型已向中共的網信部門備案。
真實投入的財力人力成謎
根據中共官方公告,DeepSeek已備案的大模型叫「求索對話DeepSeek Chat」,以服務技術支持者的角色備案的算法叫「DeepSeek大語言模型算法」,這兩項備案的主體是北京深度求索人工智能基礎技術研究有限公司。
需要注意的是,這家北京的公司並沒有受到媒體太多關注,因為報導往往只提及DeepSeek和杭州深度求索人工智能基礎技術研究有限公司的關係。杭州的這家公司以服務提供者的角色,備案的算法叫「DeepSeekChat求索對話生成算法」,應用於DeepSeek(網站)。
2024年7月,中國媒體《36氪》發布了對梁文鋒的獨家採訪。他提到:「我們面臨的問題從來不是錢,而是高端芯片被禁運。」
媒體大量轉載了一種說法,指2024年12月,DeepSeek發布的新一代開源大模型DeepSeek-v3,訓練僅需要2,024張英偉達H800芯片,訓練成本僅為558萬美元。記者尚未找到這一說法的最初信息來源,也未確認是否是DeepSeek對外的說法。
DeepSeek背後的幻方量化曾囤積了上萬張英偉達芯片,在梁文鋒參與的論文中有提及這一點:「在深度學習訓練中,我們部署了螢火二號系統,該系統配備了一萬張A100 GPU芯片」。大陸媒體稱,幻方量化2021年部署深度學習訓練平台「螢火二號」,當時投入達10億元,且「當時國內超過一萬枚GPU的企業不超過5家」,只有幻方量化不是互聯網公司,「這背後需要極其雄厚的財力支持」。
幻方量化的大量囤積英偉達芯片的做法,使它成為中國國內早期的英偉達芯片大買家之一。其官網稱在2020年,螢火二號用於科研支持的閒時算力達1,533萬GPU時。
涉嫌違約與OpenAI競爭
外界至今無法得知DeepSeek究竟耗費了多少資金、物力和人力,但DeepSeek如今用低價,並把競爭對手鎖定為OpenAI,則是公開的事實。
DeepSeek的官網稱,1月20日發布的最新版DeepSeek-R1,「性能對齊OpenAI o1正式版」。去年12月發布的DeepSeek-V3,「性能對齊海外領軍閉源模型」。
OpenAI發言人週三(1月29日)表示,OpenAI知道並正在調查有跡象顯示DeepSeek使用不當方式蒸餾了OpenAI模型,「我們採取積極且主動的反制措施來保護我們的技術,並將繼續與美國政府緊密合作,以保護本國開發的最強大模型。」OpenAI的服務條款明確規定,使用者不得複製其技術或使用其輸出內容來建立競爭的AI模型。DeepSeek涉嫌違反了這項服務協議。
「蒸餾」是一種開發技術,透過讓較小的模型學習更大、更先進模型的知識,以在特定任務上達到相似的性能。
自媒體《傑森視角》的主持人傑森(Jason)博士,有人工智能專業的學術背景。傑森接受採訪時說:「大語言模型最最最花錢的是訓練集。建立真正的人認為很好的結果的模型是非常花錢的。」「在使用OpenAI的過程中,用程序去問問題、得到回答,問問題、得到回答,然後這個過程中,用這樣的結果去做自己的訓練集,這就叫蒸餾。這種使用方法是不合約的。」
他表示,如果OpenAI和微軟的調查結果顯示,與DeepSeek有聯繫的個人透過OpenAI的應用程式介面(API)收集大量資料,不是個人在用資料,而是給機器在收集這方面的數據,這種「投機取巧」做出的模型是不能反過來用於與OpenAI競爭。
用戶信息安全性引擔憂
「對於那些看到DeepSeek的表現並認為:『中國在人工智慧領域正在超越美國』的人們,你們這樣理解錯了。正確的理解是:『開源模型正在超越專有模型。』」,Meta副總裁兼首席人工智能科學家Yann LeCun(楊立昆)1月24日在領英平台(LinkedIn)上寫道。
曾在OpenAI擔任政策研究主管的邁爾斯‧布倫戴奇(Miles Brundage),是一名獨立的AI政策研究員。他在一月接受《ChinaTalk》採訪時,對於DeepSeek的模型支持開源,表示質疑這種方式的長期性:「隨著人工智能系統變得更加強大,DeepSeek員工和中國政府可能會開始質疑這種(開源)方式。我實際上並不相信這種情況會持續下去,而且我也不相信一切開源符合世界的長期利益」。
「還有一些潛在的擔憂尚未得到充分調查,例如(中國)政府在這些模型中是否可能存在後門。從美國的角度來看,對中國主導開源領域的擔憂是合理的」。
用戶使用DeepSeek時,被收集的信息安全性引發擔憂。DeepSeek在用戶協議中表示,他們收集三種資訊:用戶提供的資訊、自動收集的資訊以及來自其它來源的資訊。他們列舉了一些收集的個人資料資訊,例如用戶的生日、電子郵件地址和/或電話號碼以及密碼。使用者輸入的文字、音訊、上傳檔案、聊天紀錄等內容,還有例如用戶的IP地址、唯一裝置識別符號等網路活動資訊,都屬於能被DeepSeek收集的範圍。
DeepSeek表示:「我們從您那裡收集的個人諮詢可能會儲存在您居住國家以外的伺服器上。我們將收集的資訊儲存在位於中華人民共和國的安全服務器上。」
傑森對DeepSeek收集信息的安全性也有所顧慮。用戶協議只是DeepSeek在檯面上能公開的部分,如果它背地裡偷用戶的信息,也是一件可怕的事情。
傑森說:「它身在中國,身不由己。如果中共覺得它還小,看不上它,還好點。如果中共開始要求它做點事,那真的是非常難說。」。
若有很多重要的人物都用DeepSeek的時候,傑森認為,中共更不會放過對DeepSeek的施壓與威逼,因為中共有《反間諜法》《國家情報法》之類的堂而皇之的「理由」對信息進行監控。
責任編輯:孫芸#
Subscribe to Updates
Get the latest creative news from FooBar about art, design and business.
What's Hot
Previous Article中國年輕人祭省錢新招「換房過年」引熱議
Next Article 2024年LVMH收入超預期 歐美市場漲 亞洲遇冷
Related Posts
Add A Comment