自由講場

跳至

首頁
1

尾頁
   2


侯爵府

積分: 23258


1#
發表於 25-1-27 18:49 |只看該作者
本帖最後由 kwokdicken 於 25-1-27 18:53 編輯

DeepSeek R1橫空出世也重磅宣告隨着訓練/推理步入「高效強化訓練+AI推理算力大幅簡化」的新範式。
在上週,來自中國DeepSeek的AI工程師團隊所開創的DeepSeek R1大模型可謂霸榜美國熱搜,並且DeepSeek應用已登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越ChatGPT,堪稱屬於中國AI的「里程碑時刻」。

DeepSeek團隊證明,他們能夠在沒有世界最頂級的$英偉達 (NVDA.US)$高性能AI GPU提供強大AI算力的情況下,以極低成本加上性能普通的AI加速器訓練出推理能力一流的突破式開源AI大模型,這也意味着未來大模型訓練/推理比拼的不再是動輒千萬億美元的AI GPU算力戰,極有可能是人人都能參與的「頭腦風暴」。

DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比OpenAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。

展望未來AI算力前景,DeepSeek R1橫空出世也重磅宣告隨着訓練/推理步入「極致壓縮+高效強化訓練+AI推理算力大幅簡化」的低成本新範式,屬於AI ASIC的時代降臨。

據了解,UC伯克利、港科大、HuggingFace等頂級學術團隊與AI科技大拿們在上週紛紛成功復現DeepSeek,只用強化學習,沒有監督微調,30美元就能見證所謂的「啊哈時刻」,即Aha moment,也被稱作所訓練的AI大模型的「頓悟時刻」。全球AI大模型,或許正在進入下一分水嶺。

誠如圖靈獎得主Yann Lecun所言:「這一次,正是開源對閉源AI大模型的勝利!」DeepSeek火遍全球,一度讓DeepSeek應用界面閃崩,但問題在數分鐘內得到解決。中國AI界上一次出現宕機情況,還是月之暗面Kimi出圈之時。

爲何認定屬於AI ASIC的時代到來?DeepSeek大模型所彰顯的AI訓練端「極致工程+集中精度」的技術趨勢,確實讓AI ASIC相比於動輒購買成本高達數十億美元的英偉達AI GPU在GPU引以爲傲的AI訓練端更具算力系統可行性與競爭力。

在AI推理端,隨着未來生成式AI軟體以及AI代理等最前沿AI應用大規模普及,推理端算力需求將愈發龐大,疊加DeepSeek開創的範式大幅降低推理成本,AI ASIC在聚焦於高效且天量級神經網絡並行計算的AI推理領域無論性能和成本優勢,都比AI GPU要大得多。

DeepSeek R1重磅出爐之後,全球科技股投資者以及推崇AI的科技界粉絲們對於英偉達(NVDA.US)高性能AI GPU(Hopper架構與Blackwell架構GPU)的信仰可謂出現重大裂痕,令投資者們不禁懷疑:數百億美元支出規模,對於 $Meta Platforms (META.US)$ 、$微軟 (MSFT.US)$等AI大廠來說真的必要嗎? 大廠們聯手$博通 (AVGO.US)$/ $邁威爾科技 (MRVL.US)$ 推出自研AI ASIC(即定製化AI芯片)豈不是性價比高得多?雖然英偉達也表示未來將進軍AI ASIC領域,但目前尚未有任何佈局,且難以撼動深耕該領域多年的博通與Marvell的定製化AI芯片主導地位。

DeepSeek用開源方式證明:打造出堪比o1的大模型並不需要無腦堆積「英偉達AI GPU」

DeepSeek本次霸榜美國乃至全球社交媒體熱搜,起因在於1月20日其正式發佈推理大模型DeepSeek-R1,該大模型經多位科技界大拿在上週證實其在數學、編程和推理等關鍵領域的表現,能與OpenAI推出的號稱「人類史上最強推理模型」的o1「掰手腕」,但其總體API調用成本卻低了95%左右。

DeepSeek 的低成本+超高效+不輸於o1的大模型綜合性能,源於對大模型訓練流程的每個環節都施加了「極致工程」與「精細微調」,幅降低大模型訓練/推理成本。

比如,以極致工程爲導向的高效訓練與數據壓縮策略,通過多層注意力(MLA)——尤其對Query端進行低秩化,從而在訓練時減少激活內存負擔,還包括FP8 混合精度訓練、DualPipe 並行通信、專家門控(MoE)負載均衡等手段,讓 DeepSeek 在訓練階段將硬件資源利用率最大化,減少「不必要的算力浪費」,以及「強化學習(即RL)+蒸餾+專業數據優化」的創新型AI訓練舉措,無需依賴監督微調(SFT)或人工標註數據。


侯爵府

積分: 23258


2#
發表於 25-1-27 18:59 |只看該作者
簡單講,中國人用聰明智慧,晌美國霸權封殺下
開發出ai模型新架構同訓練方式

用600萬成本造出美國10億成本造出既模型相約既效能

而且開源分享技術
好多機構都用同樣方式,做出高性能模型
得到世界廣範既學術肯定


象牙宮

積分: 209552

2025勳章 2025勳章蛇年勳章 醒目開學勳章 大廚勳章


3#
發表於 25-1-27 19:03 |只看該作者

回覆樓主:

本帖最後由 大力大力 於 25-1-27 19:55 編輯

Deepseek 只需要2000粒英偉達GPU,便可做到老美AI 12,000粒 算力, 今晚美國納斯達克指數,定會大幅調整 ~

.
attach0/tmp/phpGabaUi


公爵府

積分: 27217


4#
發表於 25-1-27 19:05 |只看該作者
kwokdicken 發表於 25-1-27 18:59
簡單講,中國人用聰明智慧,晌美國霸權封殺下
開發出ai模型新架構同訓練方式

研發團隊中國百幾人對美國團隊1200人


子爵府

積分: 11752


5#
發表於 25-1-27 19:10 |只看該作者

回覆樓主:

中國真係好強


禁止訪問

積分: 572


6#
發表於 25-1-27 19:16 |只看該作者
提示: 作者被禁止或刪除 內容自動屏蔽


侯爵府

積分: 23258


7#
發表於 25-1-27 19:26 |只看該作者
美國佬又搵緊借口出手



DeepSeek傳擁有5萬個輝達被禁晶片 恐引發美國調查

據《CNBC》報導,Scale AI 執行長 Alexandr Wang 表示,過去十年來,美國可能在人工智慧競賽中一直領先中國,但在聖誕節那天,一切都改變了。

Scale AI 為 OpenAI、Google(GOOGL-US) 等主要人工智慧公司提供訓練資料。Wang 表示,DeepSeek 的 AI 大模型性能與美國頂尖模型相當,並認為這可能「改變一切」。他指出,過去十年美國可能在 AI 競賽中領先中國,但 DeepSeek 的出現可能打破這種局面。

Wang 認為,DeepSeek 可能擁有大量被禁止出口到中國的輝達 (NVDA-US) H100 GPU,並呼籲美國政府對此進行調查和管制。他表示, DeepSeek 的晶片數量可能超出外界預期,這直接挑戰了美國的出口管制政策。

Wang 表示,通用人工智慧 (AGI) 是個熱門話題,大概需要兩到四年的時間才能達到。

為了應對中國在 AI 領域的崛起,美國開始加大對國內 AI 基礎設施的投資。川普總統宣布與 OpenAI、Oracle(ORCL-US) 和 SoftBank 合作,共同投資數千億美元於美國 AI 基礎設施建設,此計畫名為「星際之門」。此外,馬斯克的 xAI 也在擴展其超級電腦,以訓練其 Grok AI 模型。

在此之前,美國商務部工業和安全域 (BIS) 修訂了《出口管制條例》,將包括智譜在內的中國實體列入實體清單。此舉旨在限制中國 AI 公司的發展,尤其是那些需要大量算力來訓練大模型的公司。

圖靈獎得主、Meta AI 首席科學家楊立昆認為,DeepSeek 的成功並非代表中國在 AI 方面超越美國,而是開源模型正在超越專有模型。這顯示美國對於 AI 技術發展路線的思考正在發生轉變。

OpenAI 財務長 Sarah Friar 認為,中美之間的 AI 競爭是真實存在的,雙方都在大力投資此領域。這表示美國的 AI 業界已經明確意識到來自中國的競爭壓力。


子爵府

積分: 14455


8#
發表於 25-1-27 19:42 |只看該作者
本帖最後由 Pa123 於 25-1-27 19:47 編輯

傳聞咁多卡當初唔係為造AGI,係先搞量化交易,阿爺指導下產生副業而搞出黎,不過天才專家創始人梁文鋒當初已是有抱負遠見的,係一代偉人,祖籍廣東吳川。


男爵府

積分: 5247


9#
發表於 25-1-27 19:46 |只看該作者

回覆樓主:

美國啲人人工太貴,求其一個ai engineer都200萬年薪。中國大把聰明人而且都唔使咁貴。

首頁
1

尾頁

跳至
你需要登錄後才可以回帖 登入 | 註冊