
15/08/2025
【自寫真實實務個案研討】「人工智慧發展已進入一個依賴巨型模型(Foundation Models)驅動新範式,而模型訓練能力直接決定一國或一企業在此領域核心競爭力。此能力高度依賴一個由硬體、軟體、演算法與人才構成複雜且高度整合生態系統。 DeepSeek 案例精準暴露,即便在硬體層面(如此處華為昇騰晶片)理論算力參數得以追近,但若缺乏一個成熟、穩定、高效能軟體堆疊(Software Stack)與開發者社群支持,硬體潛力便無法有效轉化為實際生產力。 NVIDIA 在此領域主導地位,其真正護城河並非僅是晶片本身,而是歷經超過十五年時間所精心構建 CUDA 平臺。此一生態系統包含無數經優化函式庫、編譯器、開發工具與數百萬開發者經驗積累,為 AI 研究與應用提供一個穩定且高效能開發環境。任何新進挑戰者,不僅需在晶片設計與製造上克服巨大障礙,更需從零開始複製或重新建立一個能與 CUDA 匹敵軟體生態,此任務難度與所需時間成本,遠超過硬體本身。中國在此領域推動技術自主策略,實質是一場在極度壓縮時間內,追趕數十年生態系統演化差距艱鉅工程。國家力量主導下資源挹注,或能在特定硬體指標上取得突破,但一個開放、協作、由全球開發者共同貢獻軟體生態,卻難以僅憑行政命令或短期鉅額投資催生。它需要時間積澱、社群信任與市場反覆驗證。 DeepSeek 延遲發布,是此宏大戰略在微觀層面所付出機會成本一個具體例證。在 AI 領域,時間即是市場,模型迭代速度決定一切。數個月延遲,足以讓一個領先者淪為追趕者。此事件亦折射出在國家戰略與企業商業利益間潛在衝突。對於 DeepSeek 此類處於高速成長期 AI 新創公司,其首要目標是利用全球最優質資源,以最快速度開發出性能最強大模型,佔領市場。然而,國家層級技術自主目標,卻要求其承擔試驗國產技術風險與效率損失。此種矛盾,將持續考驗中國科技產業發展路徑。未來數年,全球將密切觀察,此種由上而下產業政策,能否克服軟體生態系統巨大慣性,並在不犧牲頂尖企業創新動能前提下,建立一個真正具備全球競爭力獨立 AI 技術體系。
(壹) 人工智慧算力基礎設施核心競爭,已從單純硬體晶片性能比拚,深化為軟體與硬體高度協同生態系統完整性對決。 DeepSeek 採用華為昇騰晶片訓練模型失敗,其技術根源並非昇騰晶片單點算力不足,而是整個運算叢集在執行大規模、長週期訓練任務時,暴露出系統性穩定度與軟體成熟度短板。大型語言模型訓練,是一個涉及數千甚至數萬個加速器(Accelerators)協同工作複雜工程。在此過程中,不僅要求單一晶片性能卓越,更關鍵是晶片間互聯(Interconnect)頻寬與延遲、記憶體管理效率、以及能有效調度與管理整個叢集軟體層。 NVIDIA 解決方案優勢,體現於其 NVLink 與 InfiniBand 技術提供高速、低延遲晶片間通訊,更重要是 CUDA 軟體平臺提供一套完整工具鏈。此工具鏈涵蓋從底層驅動、編譯器、到 cuDNN (NVIDIA CUDA Deep Neural Network library), NCCL (NVIDIA Collective Communications Library) 等針對特定 AI 運算優化函式庫。開發者可在此成熟穩定環境中,專注於模型架構與演算法創新,無需耗費大量精力處理底層硬體適配與除錯問題。相較之下,華為 CANN (Compute Architecture for Neural Networks) 作為昇騰晶片對應軟體架構,儘管發展迅速,但其成熟度、函式庫豐富性、社群支援廣度,與 CUDA 相比仍有顯著差距。在 DeepSeek 案例中,訓練過程持續遭遇技術問題,很可能源於多種因素複合作用。例如,在進行大規模平行運算時,部分節點可能因軟體臭蟲(Bugs)或硬體不穩定而失效,容錯與恢復機制若不夠健全,將導致整個訓練任務中斷,前功盡棄。此外,編譯器對 PyTorch, TensorFlow 等主流 AI 框架支援與優化程度,亦直接影響模型訓練效率。若編譯器無法將高階模型程式碼完美轉譯為底層硬體指令,將導致算力資源巨大浪費。即使華為派遣專屬工程師團隊現場支援,仍無法完成一次成功訓練,此事實凸顯此類問題已非單純技術支援可以彌補,而是需要整個軟體生態系統長時間迭代演化與除錯才能解決。將昇騰晶片用於推理(Inference)階段,技術難度則顯著降低。推理任務通常是單次、小批量運算,對系統穩定性與大規模協同要求遠低於訓練,此權宜之計也反映出目前國產晶片在 AI 產業鏈中較為可行切入點。
(貳) 在全球人工智慧軍備競賽背景下,國家級產業政策與市場導向商業決策間張力,正對身處其中科技企業構成嚴峻戰略考驗。 DeepSeek 事件本質,是一場關於發展速度與技術主權優先序衝突。對於一家 AI 新創公司,其生命線在於創新速度與模型性能。資本市場對其估值,直接取決於其相較於 OpenAI, Google, Anthropic 等全球頂尖對手技術代差。在此情境下,選擇最成熟、最高效能 NVIDIA 晶片與 CUDA 生態系統進行模型訓練,是純粹商業理性必然結果。此選擇能最大程度縮短研發週期,降低失敗風險,確保模型性能達到業界頂尖水準,進而吸引客戶、人才與後續投資。然而,北京推動半導體自給自足戰略,為企業此類決策引入一個非市場變數。政府透過直接指導、採購傾斜、乃至對採購外國晶片設定行政障礙等方式,強力引導國內龍頭企業轉向採用國產替代方案。此政策目標,是從國家層面降低對外國關鍵技術依賴,建立一個完整自主 AI 產業鏈。對企業而言,響應此政策號召,雖可能獲得政府專案、補貼等短期利益,並符合政治正確性,卻必須承擔巨大商業風險。此風險體現為顯性與隱性成本。顯性成本包括為適配不成熟國產軟硬體平臺,而需投入額外工程師資源與時間進行大量測試、除錯與優化工作。 DeepSeek 案例中,即使有華為工程師團隊協助,仍無法解決問題,此投入已是沉沒成本。隱性成本則更為高昂,即是模型發布延遲所導致市場機會損失。在大型語言模型領域,技術窗口期極短,數個月差距足以決定市場格局。 DeepSeek R2 模型延期,使其在與其他中國競爭者如月之暗面 (Moonshot AI)、智譜 AI (Zhipu AI) 的競賽中,暫時處於不利位置。此困境迫使中國 AI 企業家必須在政治帳與經濟帳之間進行精巧平衡。完全忽視國家戰略可能導致失去政策支持,甚至面臨監管壓力。但完全犧牲商業效率去配合政策,又可能在殘酷市場競爭中被淘汰。因此,DeepSeek 最終採取訓練用 NVIDIA,推理用昇騰混合模式,可視為一種在此兩難困境下務實妥協。此模式既能確保核心訓練任務效率與成功率,又能在應用部署階段向政策目標靠攏,展示其支持國產技術姿態。
(參) 技術瓶頸與產業政策交互作用,正加速全球半導體供應鏈從過去效率優先全球化分工,轉向以陣營為界限垂直整合與區域化佈局。美國對中國先進 AI 晶片出口管制,是此輪全球供應鏈重構關鍵催化劑。此政策直接目標是延緩中國在大型模型訓練領域發展速度,間接結果則是強烈刺激中國傾全國之力,加速推動半導體全產業鏈自主化進程。 DeepSeek 嘗試使用昇騰晶片,正是此宏觀背景下一個微觀體現。儘管此次嘗試遭遇挫折,但它揭示一個長期趨勢:中國科技巨頭與新創,無論主動或被動,都將日益深度參與到國產晶片生態系統建設中。此過程將是一個充滿挑戰與反覆迭代螺旋式上升。初期,由於性能與穩定性差距,採用國產晶片企業可能需承受市場競爭力暫時下降代價。然而,正是此類龍頭企業大規模應用與反饋,才能為國產晶片及其軟體生態提供最寶貴真實世界測試場景,加速其成熟。華為工程師進駐 DeepSeek,此種晶片設計方與模型開發方緊密協作模式,未來將成為常態。此趨勢將對全球供應鏈產生深遠影響。首先,它將創造出兩個平行但日益隔離 AI 技術生態:一個圍繞 NVIDIA 與美國技術標準,另一個則以華為、寒武紀等中國企業為核心。短期內,後者性能與效率可能落後,但其龐大國內市場規模與國家級資源投入,使其具備長期追趕潛力。其次,此種分割將迫使全球供應鏈中其他參與者,如歐洲、日本、韓國等,重新評估自身定位與戰略。它們既要應對來自美國要求其限制對中國技術輸出壓力,又要考量失去中國龐大市場所帶來經濟後果。此將促使各國加大對自身半導體產業投資,以求在兩大陣營間保持一定技術自主性與戰略靈活性。最後,此將改變全球創新擴散模式。過去,基於開放標準與全球協作,一項技術突破能迅速在全球範圍內普及。未來,技術創新可能更多在各自陣營內部閉環演進,形成不同技術路徑。例如,在晶片架構、軟體介面、甚至模型演算法層面,都可能出現互不相容中國標準與國際標準。此種技術分裂,雖可能在短期內降低全球整體創新效率,但長期而言,兩大陣營間激烈競爭,亦可能催生出意想不到顛覆性技術突破。」