OpenAI 釋出新AI模型:降低成本,挑戰Meta等強敵

OpenAI 近日釋出了兩款名為 gpt-oss-120b 和 gpt-oss-20b 的開放權重語言模型,這是自 2019 年推出 GPT-2 以來首次公開此類模型。與完全開源模型不同,開放權重模型僅公開模型的參數,而非完整的原始碼,但仍能提供透明度和客製化能力。此舉可視為 OpenAI 策略上的轉變,此前他們一直對核心技術保持較為封閉。

這次釋出並非毫無波瀾,OpenAI 多次延遲發布日期,主要原因是需要進行更全面的安全測試,以應對潛在的惡意使用風險。他們在模型預訓練階段就過濾掉了有害的化學、生物、輻射和核能相關數據,並模擬了惡意行為者可能進行的微調,以評估模型的安全性。初步測試結果顯示,惡意微調後的模型尚未達到 OpenAI 的安全標準。

值得注意的是,其他科技巨頭如 Meta、微軟支持的 Mistral AI,以及中國新創 DeepSeek 也都在近年來釋出了類似的開放權重模型,顯示出整個行業正在朝著更開放的方向發展。OpenAI 的加入,無疑將加速這一趨勢,並推動技術的進步。

這次釋出的模型與 Nvidia、AMD、Cerebras 和 Groq 等公司合作,確保其能在多種硬體平台上良好運行,這也反映了 OpenAI 希望其技術能夠更廣泛地應用。總體而言,OpenAI 的此項舉措,不僅降低了開發和研究的成本,也為 AI 技術的普及創造了更有利的條件。

我認為這份報告顯示 OpenAI 正在試圖在商業利益和技術開放之間取得平衡。一方面,他們仍然保留了核心技術的控制權,避免完全開源可能帶來的風險;另一方面,通過開放權重模型,他們可以吸引更多的開發者和研究人員參與,加速技術的創新和應用。延遲發布並進行嚴格的安全測試,也表明 OpenAI 對於 AI 潛在風險的重視。此外,中國公司 DeepSeek 的出現,也顯示出中國在 AI 領域的崛起,以及在全球 AI 競爭中的重要地位。

原文網頁:OpenAI releases lower-cost models to rival Meta, Mistral and DeepSeek (by Ashley Capoot)

Comments

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *