股票

DeepSeek問世、Meta半年前早知道?Meta技術長:後續值得觀察,但稱不上改變世界

撰文者:鉅亨網/編譯陳又嘉 更新時間:2025-02-07 瀏覽數:1,316

關鍵字:

AI 語言模型

圖片來源:達志影像
摘要
DeepSeek問世,造成了全市場投資人的恐慌!原因不外乎是該款AI模型用了最低成本,但功能卻媲美OpenAI。不過Meta卻對於DeepSeek的問是沒有感到吃驚,原來早再半年前他們就知道這項消息。

矽谷因DeepSeek掀起波瀾感到不安?Meta(美股代號:META)技術長Andrew Bosworth表示,早在6個月前,他就預測到了這類AI發展。

據外媒報導,Bosworth的Instagram追蹤者在週一(2月3日)詢問他對這家備受關注的中國AI實驗室的看法時,他表示,「這發展過程相當有趣。」


Bosworth在Instagram限時動態中說道,「其實我有封電子郵件,證明我在6個月前就預測這類技術會出現,只是不知道會是DeepSeek。」

「所以,對於我們這些身處業界的人來說,並不如外界的人想像得那麼驚訝。」

DeepSeek近期推出了其旗艦開源AI模型R1,該模型與OpenAI的o1模型相媲美,但據稱研發成本低得多。

Bosworth表示,「我們在DeepSeek正式發布前1個月就已經在關注它,後來它成了重大新聞。」「我認為這件事既重要,但又沒有外界渲染得那麼誇張。」

Meta 同樣採取開源策略,允許符合資格的研究人員存取其Llama AI模型的個別權重,即AI模型在訓練過程中學習到的數值參數。

Bosworth表示,DeepSeek的發布是1件「很重要的事,因為這代表開源創新的大幅進步。」他補充道,「他們在模型構建的記憶架構方面做出了一些偉大且新穎的工作,確實推進了推理模型的技術前沿,並且可能透過蒸餾(distilling)現有模型來取得進展。」

但他認為DeepSeek的發展「值得關注,但稱不上改變世界。」

在Meta最近的財報電話會議上,執行長祖克柏(Mark Zuckerberg)表示,DeepSeek確實有「一些創新的技術」,Meta「仍在消化」其影響。

祖克柏談到,「他們的技術有值得學習的地方,我們也希望能將其應用到我們的系統中,這就是這個領域的運作方式,無論這是1家中國競爭對手與否。」

儘管DeepSeek展現的成本效益,引發華爾街對科技巨頭在AI基礎建設及先進輝達 (美股代號:NVDA)晶片上的巨額投資產生質疑。祖克柏表示,Meta不太可能因此改變其AI投資策略,並預計長期內將在AI基礎設施上投入數千億美元。

祖克柏表示,「目前來說,對於這對我們基礎建設、資本支出等方面的影響,還很難有明確結論。」

Meta首席AI科學家Yann LeCun最近在Threads發文稱,DeepSeek的推出顯示「開源模型正在超越專有模型。」

另一方面,當被問及DeepSeek以及開源釋出AI模型權重與研究成果的做法時,OpenAI執行長Sam Altman表示,他正在考慮調整策略。

Altman表示,「是的,我們正在討論。」「我個人認為,在這方面我們站錯了歷史的一邊,必須想辦法制定不同的開源策略。但OpenAI內部並非所有人都認同這個觀點,而且這目前也不是我們的首要任務。」

本文經授權轉載自「鉅亨網」,原文:Meta技術長:六個月前就預測到DeepSeek的發展
臉書粉絲專頁,請按此

延伸閱讀
應對DeepSeek震撼,Google推出Gemini 2.0系列模型
DeepSeek衝擊科技股!從數字看DeepSeek對金融市場有何影響?
川普對台晶片課稅會怎樣?Verdict:美國晶片價格恐上漲近6成

  • «
  • 1
  • »

您可能有興趣的文章