導讀:據媒體報道,AI教母李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的云計算費用訓練了一個名叫s1的人工智能推理模型。該模型在數...
據媒體報道,“AI教母”李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的云計算費用訓練了一個名叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSeek的R1等尖端推理模型類似。
s1誕生標志著高效AI模型訓練的新時代。研究人員表示,s1是通過蒸餾法由谷歌推理模型Gemini2.0FlashThinkingExperimental提煉出來的。這種方法的核心在于如何有效地傳遞知識,使得小模型不僅具備大模型的推理能力,而且在資源消耗上表現得極為優越。
李飛飛團隊的這一突破,不僅展現了技術的前瞻性,而且為更多科研機構和創業公司提供了借鑒的藍本。同時,s1所展現出價格優勢的背后,其實也反映了未來AI領域的一個重要趨勢:大模型的訓練和應用將愈發平民化。
此前DeepSeek發布一系列DeepSeek-R1模型,探索了將R1的推理能力蒸餾到更小模型中的潛力,通過知識蒸餾技術,成功將大模型的推理能力傳遞給小模型,實現了小模型在推理任務上的顯著提升,引領了小模型的發展方向。
下一篇:最后一頁