股票

DeepSeek問世、Meta半年前早知道？Meta技術長：後續值得觀察，但稱不上改變世界

關鍵字：

圖片來源：達志影像

摘要

DeepSeek問世，造成了全市場投資人的恐慌！原因不外乎是該款AI模型用了最低成本，但功能卻媲美OpenAI。不過Meta卻對於DeepSeek的問是沒有感到吃驚，原來早再半年前他們就知道這項消息。

矽谷因DeepSeek掀起波瀾感到不安？Meta（美股代號：META）技術長Andrew Bosworth表示，早在6個月前，他就預測到了這類AI發展。

據外媒報導，Bosworth的Instagram追蹤者在週一（2月3日）詢問他對這家備受關注的中國AI實驗室的看法時，他表示，「這發展過程相當有趣。」

Bosworth在Instagram限時動態中說道，「其實我有封電子郵件，證明我在6個月前就預測這類技術會出現，只是不知道會是DeepSeek。」

「所以，對於我們這些身處業界的人來說，並不如外界的人想像得那麼驚訝。」

DeepSeek近期推出了其旗艦開源AI模型R1，該模型與OpenAI的o1模型相媲美，但據稱研發成本低得多。

Bosworth表示，「我們在DeepSeek正式發布前1個月就已經在關注它，後來它成了重大新聞。」「我認為這件事既重要，但又沒有外界渲染得那麼誇張。」

Meta 同樣採取開源策略，允許符合資格的研究人員存取其Llama AI模型的個別權重，即AI模型在訓練過程中學習到的數值參數。

Bosworth表示，DeepSeek的發布是1件「很重要的事，因為這代表開源創新的大幅進步。」他補充道，「他們在模型構建的記憶架構方面做出了一些偉大且新穎的工作，確實推進了推理模型的技術前沿，並且可能透過蒸餾（distilling）現有模型來取得進展。」

但他認為DeepSeek的發展「值得關注，但稱不上改變世界。」

在Meta最近的財報電話會議上，執行長祖克柏（Mark Zuckerberg）表示，DeepSeek確實有「一些創新的技術」，Meta「仍在消化」其影響。

祖克柏談到，「他們的技術有值得學習的地方，我們也希望能將其應用到我們的系統中，這就是這個領域的運作方式，無論這是1家中國競爭對手與否。」

儘管DeepSeek展現的成本效益，引發華爾街對科技巨頭在AI基礎建設及先進輝達（美股代號：NVDA）晶片上的巨額投資產生質疑。祖克柏表示，Meta不太可能因此改變其AI投資策略，並預計長期內將在AI基礎設施上投入數千億美元。

祖克柏表示，「目前來說，對於這對我們基礎建設、資本支出等方面的影響，還很難有明確結論。」

Meta首席AI科學家Yann LeCun最近在Threads發文稱，DeepSeek的推出顯示「開源模型正在超越專有模型。」

另一方面，當被問及DeepSeek以及開源釋出AI模型權重與研究成果的做法時，OpenAI執行長Sam Altman表示，他正在考慮調整策略。

Altman表示，「是的，我們正在討論。」「我個人認為，在這方面我們站錯了歷史的一邊，必須想辦法制定不同的開源策略。但OpenAI內部並非所有人都認同這個觀點，而且這目前也不是我們的首要任務。」

您可能有興趣的文章