華為人工智慧新創公司 DeepSeek 最新發布了備受期待的 V4 大型語言模型預覽版,讓用戶可以測試其最新能力。此次發布的背景頗為可觀,它是在 DeepSeek 引爆全球科技市場的 R1 推理模型之後——該模型因其令人驚訝的性能與效率,卻據傳是以遠低於美國競爭對手的成本開發而成,睽違了全球技術產業已久。與其先前公開的 V3 模型一致,V4 依然是開源形式,意味著開發者可以自行下載、在本地運行及進行修改。
這家總部位於杭州的公司聲稱,V4 在國內競爭對手中表現強勁,尤其在基於智能體的任務處理、知識處理與推理能力方面表現突出。DeepSeek 還特別指出,V4 已針對 Anthropic 的 Claude Code 和 OpenClaw 等主流智能體工具進行了優化,模型本身也提供了根據大小需求的「Pro」和「Flash」兩個版本。
自 2023 年成立以來,DeepSeek 曾於去年底憑藉免費且開源的 V3 模型獲得關注,當時它宣稱其模型訓練使用了較低規格的晶片,成本遠低於 OpenAI 或 Google 等巨頭。隨後,在 2025 年一月,其發布的 R1 模型更是樹立了新的標竿,性能媲美甚至超越了許多全球領先的 LLM。這支全球競爭力強的開源模型的出現,引發了市場對人工智慧基礎設施支出規模的深層思考。
然而,市場的焦點也已轉向內捲化競爭。儘管 DeepSeek 此後釋出數代升級模型,但均未能達到 R1 的爆發力。如今,DeepSeek 面臨著中國 AI 市場蓬勃增長的激烈競爭,阿里巴巴和字節跳動等巨頭也都在今年發布新的模型,使這場技術較量愈發白熱化。
從專家角度看,DeepSeek V4 的發布,標誌著中國 AI 生態系從「展示性能」到「追求效率與落地」的成熟轉變。R1 的成功,根本上不是單純的參數堆砌,而是證明了「成本優化」與「特定任務調優」能擊敗傳統的巨頭敘事。V4 具備開源特性和針對主流智能體工具的深度優化,體現了中國廠商戰略轉向:不再只是追求絕對的頂尖跑分,而是要打造出真正能融入開發者工作流、易於在地化部署的「生產級」工具。這場圍繞「能用性」和「可及性」的競爭,預示著未來 AI 基礎設施的標準將不再是誰的算力最強,而是誰的模型最貼合企業實際的工作流程,特別是在智能體這一應用層級的實戰能力,這也加劇了國內科技巨頭間的「軍備競賽」,資金和人才的消耗速度只會越來越快。
原文網頁:China”s DeepSeek releases preview of long-awaited V4 model as AI race intensifies (by Dylan Butts)
發佈留言