HKEPC Biz

熱門話題：

HKEPC Biz » 分類索引 » DEEPSEEK

文章索引： LLM DeepSeek Biztech IT要聞

官方狀態頁面確認，是次「重大事故」持續超過 7 小時，導致網頁版及 API 服務全面停擺。雖然目前已恢復運作，但官方對起因保持緘默，引發業界猜測這是否為下一代旗艦模型上線前的預兆。

自 DeepSeek R1 及 V3 模型於 2025 年初問世後，運作紀錄一直維持在 99% 以上。惟周一凌晨起，服務出現長達 7 小時 13 分鐘的中斷，直至當地時間上午 10 時 33 分才宣告修復，規模遠超以往 2 小時內的零星當機。

▪️開發者：負責串接應用程式的 API 服務亦受波及。回顧 2025 年 1 月 DeepSeek 爆紅初期，API 曾出現連日故障，但近期表現一直相對穩定。

文章索引： AI LLM DeepSeek Biztech IT要聞

DeepSeek 原定於今年 5 月推出新一代 AI 模型 R2，惟因未能成功以華為 Ascend 晶片完成訓練，導致項目延誤，突顯中國在高階晶片領域仍倚賴美國技術。

據知情人士透露，DeepSeek 在今年初推出 R1 模型後，獲官方鼓勵改用華為晶片取代美國 Nvidia 系統。惟在 R2 模型訓練過程中，Ascend 晶片出現穩定性問題及軟件支援不足，最終公司改以 Nvidia 晶片進行訓練，僅保留華為晶片作推理用途。

AI 模型訓練需大量數據學習，而推理則是模型完成訓練後，用於生成回應或預測的步驟。儘管華為曾派工程團隊駐場支援，DeepSeek 仍未能成功完成訓練。DeepSeek 的困境，反映中國晶片在處理關鍵任務方面仍落後美國，亦揭示北京推動科技自主的挑戰。