1
1
DeepSeek 突發史上最長當機 服務癱瘓逾 7 小時 新一代模型蓄勢待發?
文章索引: LLM DeepSeek Biztech IT要聞
官方狀態頁面確認,是次「重大事故」持續超過 7 小時,導致網頁版及 API 服務全面停擺。雖然目前已恢復運作,但官方對起因保持緘默,引發業界猜測這是否為下一代旗艦模型上線前的預兆。

自 DeepSeek R1 及 V3 模型於 2025 年初問世後,運作紀錄一直維持在 99% 以上。惟周一凌晨起,服務出現長達 7 小時 13 分鐘的中斷,直至當地時間上午 10 時 33 分才宣告修復,規模遠超以往 2 小時內的零星當機。

▪️開發者: 負責串接應用程式的 API 服務亦受波及。回顧 2025 年 1 月 DeepSeek 爆紅初期,API 曾出現連日故障,但近期表現一直相對穩定。
R2延遲推出 DeepSeek擬用華為晶片訓練AI失敗
文章索引: AI LLM DeepSeek Biztech IT要聞
DeepSeek 原定於今年 5 月推出新一代 AI 模型 R2,惟因未能成功以華為 Ascend 晶片完成訓練,導致項目延誤,突顯中國在高階晶片領域仍倚賴美國技術。

據知情人士透露,DeepSeek 在今年初推出 R1 模型後,獲官方鼓勵改用華為晶片取代美國 Nvidia 系統。惟在 R2 模型訓練過程中,Ascend 晶片出現穩定性問題及軟件支援不足,最終公司改以 Nvidia 晶片進行訓練,僅保留華為晶片作推理用途。

AI 模型訓練需大量數據學習,而推理則是模型完成訓練後,用於生成回應或預測的步驟。儘管華為曾派工程團隊駐場支援,DeepSeek 仍未能成功完成訓練。DeepSeek 的困境,反映中國晶片在處理關鍵任務方面仍落後美國,亦揭示北京推動科技自主的挑戰。
1
1