【震撼美國科股市場】中國人工智能DeepSeek突然爆紅

因為DeepSeek的出現,作為OpenAI及其ChatGPT工具的競爭者,通過顯示以比美國競爭對手運用更少的運算資源,取得突破性的進展,美國科技股周一(1月27日)大幅下跌。

Wall Street

市場起起伏伏, 莫衷一是。 Source: AP

根據【澳洲金融評論】報道,總部位於加州的人工智能晶片製造商 Nvidia 股價暴跌18%,約$6000億美元,創下美國股市歷史上最大的一次跌幅。

由於Nvidia在納斯達克主要指數中佔重,跌幅波及整個市場。

根據《彭博社》的數據,周一Nvidia的拋售已經造成標準普爾500指數中市值基礎上排名前十,其中第八個單日最大跌幅。

DeepSeek上個月開始吸引更多AI業界的關注,當時發布了一個新的AI模型,聲稱其水平與美國公司如ChatGPT開發商OpenAI的類似模型相當,且更加具有成本效益。

這款聊天機器人今年在蘋果和谷歌的應用程式上架後,變得更廣泛使用。

DeepSeek採取不同的方法構建AI模型,結果令到營運成本顯示比美國的競爭對手便宜得多。

另一個可能促使其採取低成本方法的原因是,由於美國政府的限制,中國的電腦科學家長期以來一直需要解決可用計算機晶片數量的限制。 

周一DeepSeek成為蘋果App Store上下載量最多的免費應用程式,這一現象是由於外界對這款ChatGPT競爭對手的好奇心所推動的。

有關R1模型的討論
上周,一篇相關的後續研究論文發表,該論文介紹了另一款名為 R1 的 DeepSeek AI 模型,該模型顯示出先進的「推理」能力,例如重新思考解決數學問題的方法,而且比 OpenAI 推出的類似模型 o1 更加便宜。

這是目前DeepSeek AI模型中最引人討論的一個,因為聲稱其性能與OpenAI的o1模型相當,該模型於12月發布提供給ChatGPT用戶。

這與來自OpenAI、Google、Meta等公司的AI模型,有甚麼分別?

這個模型採用了不同種類的內部建構,需要較少的記憶體使用,從而大大降低了每次與聊天機器人系統互動或搜尋的運算成本。

研究人員讚揚其處理複雜推理功能方面的能力,特別是在數學和編程及程式設計的領域(Coding),似乎能以極少的運算能力產生與競爭對手相當的結果。

DeepSeek表示,開發這個模型只花了兩個月和不到$600萬美元(約$953萬澳元),即使外界認為可能低估了數字,不過仍遠低於矽谷科技公司開發AI所花費的數十億美元,並且其運營成本也較低。


China: ChatGPT Popular In China
China: ChatGPT Popular In China Source: AAP / Costfoto/Sipa USA
根維基百科,DeepSeek,中譯「深度求索」(全稱杭州深度求索人工智能基礎技術研究有限公司)2023年由一個大學初創團隊成立。是中國人工智能以及大型語言模型公司,其創始人和行政總裁為梁文鋒,專注於AI大模型的研究和開發。

【衛報】透露,在一次罕有的訪問中,梁文鋒表示:「多年來,中國公司習慣於讓其他人進行技術創新,而我們則專注於應用變現(Application monetisation),而這並非必然。」

他又說,在這個浪潮中,他們的出發點不是利用機會快速獲利,而是要達到技術再進一步發展,創造新領域(technical frontier),推動整個生態系統的發展,並且相信,隨著經濟發展,中國應該逐步成為貢獻者,而非搭便車。」
瀏覽更多最新時事資訊,請登上,或訂閱

SBS 中文堅守,以繁體中文及簡體中文提供公平、公正、準確的新聞報道及時事資訊。SBS 廣東話及 SBS 普通話均已為大眾服務超過 40 年。歡迎在每天早上 9 至 11 時透過收聽廣東話節目及在每天早上 7 至 9 時收聽普通話節目,或透過收聽直播、節目重溫及其他語音內容。

分享
Published 28 January 2025 10:51am
By Ida Cheung
Source: SBS

Share this with family and friends