成视频免费在线看_成人免费视频网址_奇米第四影视_欧美日本不卡视频_91精品国产自产在线观看_国产一区无

DeepSeek開源第四彈“教”優(yōu)化,梁文鋒參與研發(fā)
來源:第一財經(jīng)作者:劉曉潔2025-02-27 15:42

通過這些分享可以清晰了解DeepSeek是如何最大限度利用GPU能力的。

2月27日,DeepSeek開源周(OpenSourceWeek)第四彈來了,DeepSeek在X上宣布這次開源的是三項優(yōu)化并行策略,并在Github上詳細(xì)展開了DeepSeek-V3和R1模型背后的并行計算優(yōu)化技術(shù),通過這些闡述可以清晰了解團(tuán)隊是如何精細(xì)地優(yōu)化計算和通信,最大限度利用GPU能力的。

這三項優(yōu)化并行策略其中包括DualPipe,這是一種用于V3/R1模型訓(xùn)練中計算與通信重疊的雙向流水線并行算法,這種算法能夠完全重疊前向和后向計算通信階段,與傳統(tǒng)方法相比減少了“流水線氣泡”(設(shè)備在某些時刻的空閑等待)。 在DualPipe的開發(fā)團(tuán)隊署名中,包括創(chuàng)始人梁文鋒。

優(yōu)化并行策略第二項是EPLB(Expert Parallelism Load Balancer,專家并行負(fù)載均衡器),它針對V3/R1模型,解決MoE(混合專家)模型在分布式訓(xùn)練和推理中的負(fù)載不平衡問題。

當(dāng)使用專家并行(EP)時,不同的專家被分配到不同的GPU。由于不同專家的負(fù)載可能會根據(jù)當(dāng)前的工作負(fù)載而變化,因此保持不同GPU的負(fù)載平衡非常重要。DeepSeek曾在V3論文中提到,團(tuán)隊采用冗余專家策略來重復(fù)重載專家,他們創(chuàng)新地將重復(fù)的專家打包到GPU上,以確保不同GPU之間的負(fù)載平衡。

在第三部分, DeepSeek直接分享了來自訓(xùn)練和推理框架的性能分析數(shù)據(jù),以幫助社區(qū)更好地了解通信計算重疊策略和低級實現(xiàn)細(xì)節(jié)。這些數(shù)據(jù)是用PyTorch Profiler采集的,下載后可以直接在 Chrome或 Edge 瀏覽器中打開,進(jìn)行可視化分析,DeepSeek還模擬了絕對平衡的MoE 路由策略用于性能分析。

DeepSeek這四天的發(fā)布都與Infra層的算法有關(guān),分享團(tuán)隊最大限度利用GPU能力的技術(shù)細(xì)節(jié)。大模型生態(tài)社區(qū)OpenCSG(開放傳神)創(chuàng)始人陳冉此前對第一財經(jīng)舉例表示,“相當(dāng)于以前DeepSeek是直接給一輛車,告訴大家這輛車?yán)m(xù)航900公里,但是現(xiàn)在DeepSeek在深挖,用什么方式能夠開到900公里。”DeepSeek的模型為什么能夠?qū)崿F(xiàn)較好的效果,對應(yīng)有一些算法和相應(yīng)的框架,而這些“腳手架”的開源有利于之后的生態(tài)搭建。

陳冉判斷,DeepSeek的代碼開源或許會影響一批做AI Infra層的從業(yè)者,“AI Infra層的人要找新的方向。”但他同時表示,這種開源是一把雙刃劍,如果能將DeepSeek開源的內(nèi)容用好可能也會得利,“用不好就被沖擊”。

此前三日,DeepSeek陸續(xù)開源了讓大模型在GPU上跑得更快的MLA解碼核FlashMLA,用于MoE模型訓(xùn)練和推理的DeepEP通信庫,以及可支持MoE的FP8 GEMM代碼庫DeepGEMM。

從GitHub上獲得的星標(biāo)來看,這些項目頗受歡迎,截至發(fā)稿,F(xiàn)lashMLA已在GitHub獲得超過1萬星標(biāo),DeepEP的星標(biāo)已有6000,DeepGEMM目前超過3700,最新發(fā)布的DualPipe星標(biāo)超過700。

就在昨日,DeepSeek還在海內(nèi)外同時宣布了API 錯峰優(yōu)惠,自2月26日起,北京時間每日00:30至08:30的夜間空閑時段,API 調(diào)用價格大幅下調(diào):DeepSeek-V3 降至原價的 50%,DeepSeek-R1 更低至 25%。DeepSeek鼓勵用戶充分利用這一時段,享受更經(jīng)濟(jì)更流暢的服務(wù)體驗。

另外,也有消息稱,DeepSeek正尋求鞏固自身優(yōu)勢,盡早推出R2模型,消息提到DeepSeek原本計劃在5月初發(fā)布R2模型,目前會加快這一速度。DeepSeek目前并未對此回應(yīng)。

此前DeepSeek在R1論文中提到,R1 的性能將在下一個版本得到改善,因為相關(guān)的RL(強(qiáng)化學(xué)習(xí))訓(xùn)練數(shù)據(jù)還很少。隨著RL數(shù)據(jù)的增加,模型解決復(fù)雜推理任務(wù)的能力持續(xù)穩(wěn)定提升,且會自然涌現(xiàn)出一些復(fù)雜行為能力。

業(yè)界認(rèn)為,DeepSeek-R2的發(fā)布可能是AI行業(yè)的一個關(guān)鍵節(jié)點。

責(zé)任編輯: 鄧衛(wèi)平
聲明:證券時報力求信息真實、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風(fēng)險自擔(dān)
下載“證券時報”官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機(jī)會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達(dá)個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    主站蜘蛛池模板: 99不卡| 国产一区二区在线观 | 久久婷婷国产综合国色天香 | 国产在线精品一区二区不卡麻豆 | 国产在线一二三区 | 欧美性猛xxxxx | 免费无码国产国模线观看 | 亚欧日韩在线 | 欧美久久久久久久久久久 | 99高清免费国产自产拍 | 国产成人亚洲综合色影视 | 亚洲精品午夜福利在线看 | 亚洲一品道 | 高潮好爽视频在线观看 | 99国产精品白浆无码流出 | 在野外被三个男人躁爽白浆视频 | 久久亚洲一区二区三区四区 | 午夜性刺激免费看视频 | aa爱做片免费 | 粉嫩绯色av一区二区在线观看 | 人妻被按摩到潮喷中文字幕 | 国产99精品在线 | av无码理论片在线观看免费网站 | 成人免费福利网站 | 国产精品主播一区二区三区 | 精品国产综合久久 | 亚洲国产欧美久久 | 久久久久久久久亚洲精品 | 成人在线手机视频 | 国产精品一区二区三区在线播放 | 国产免费av吧 | 日韩不卡中文字幕 | 精品视频一区二区三区 | 高清无码中文字幕在线观看视频 | 丁香激情综合久久伊人久久 | 国产精品情侣高潮呻吟 | 国产成人精品在线观看 | 一区二区三区日 | 亚洲性色成人av | 曰韩亚洲av人人夜夜澡人人爽 | 国产午夜免费看黄片 |