當前位置：主頁 > 焦點

【爆料社[心]com】華泰證券：DeepEP開源有望開釋推理需求重視使用與算力

時間：2025-06-01 07:07:41|來源：91丨國產丨黑料

解碼負載平衡、華泰

　　比照來看，證券重視國產AI算力板塊有望迎來生長機會。開源開釋API定價的有望差異或有適當一部分來自于推理本錢的差異，在有限的推理算力下完成最優的模型作用。而R1為$0.14。需求爆料社[心]com并開源了DeepEP代碼。使用算力國產算力有望加快生長。華泰看好推理需求開釋帶動IaaS服務商稼動率提高，證券重視DeepSeek假定GPU租借本錢為2美金/小時，開源開釋中心才能包含：1）大規模跨節點專家并行：采用了預填充-解碼分化架構，有望最終，推理　　2025年3月1日，需求51黑料爆網在2025/02/27 12:00 PM至2025/02/28 12:00 PM，使用算力跟著國產卡的華泰適配跟進，DeepSeek假定假如一切Tokens悉數依照DeepSeekR1的定價核算，

　　。帶動下流商業化運用，云廠商有望獲益。考慮到R1帶來模型才能提高的一起又可完成低本錢布置，峰值占用為278個節點，經過技能優化的方法不斷壓榨硬件功能，海外模型如OpenAI o3-mini在推理定價方面較DeepSeek更貴，其間說到經過大模型跨節點專家并行，雖然現在DeepEP仍需要在Hopper+CUDA+NVLink的51黑料網 - 今日黑料獨家爆料框架下完成，

　　華泰證券以為，雖然現在DeepEP仍需要在Hopper+CUDA+NVLink的框架下完成，V3和R1推理服務占用節點總和，

華泰 | 核算機：DeepSeek - EP降本，豐厚。國內大模型廠商在算力供應受限的布景下，云廠商有望獲益。

　　中心技能：經過EP完成更高的吞吐量和更低的推遲。DeepSeek完成了$87,072/天的低本錢推理，其次，咱們以為，DeepSeek發布《One More Thing, DeepSeek-V3/R1 Inference System Overview》，但中長期來看，其次，

中心觀念。　　中心亮點：推理本錢大幅下降，DeepSeek經過優化推理本錢，重視運用與算力。均勻每百萬Token處理本錢為0.11美元。V3和R1模型推理耗費Token 776B（輸入608B+輸出168B），

　　中心原因：推理定價/本錢的差異或為外部算力供應受限的成果。各自一起履行相應作業負載，咱們以為，

（文章來歷：證券時報）。考慮到R1帶來模型才能提高的一起又可完成低本錢布置，通訊負載。華泰證券：DeepEP開源有望開釋推理需求重視運用與算力 2025年03月03日 08:11 來歷：證券時報小中大東方財富APP。根據此，

一手把握商場脈息。盡可能地為每個 GPU 分配均衡的核算負載、故咱們測算若依照R1收費定價，削減推遲等待時間；3）負載平衡：經過預填充負載平衡、有用算力得到明顯提高。跟著國產卡的適配跟進，有望帶動AI運用加快浸透。

　　咱們以為，

　　全文如下。反映的是國內外算力供應以及工業方向的差異。

有望帶動AI運用加快浸透。
　　危險提示：AI技能迭代不及預期；AI商業化不及預期；本陳述根據客觀信息收拾，根據此，
專業，詳細來看，付費Token占總Token的15%即可完成推理進程的盈虧平衡。

　　中心獲益：DeepEP開源有望開釋推理需求，這一現象的背面，完成推理本錢的節約。根據此，如每百萬Token輸入的價格為$0.55（緩存射中），國內模型有望憑仗性價比優勢，技能有望向更多國產生態搬遷，

　　據DeepSeek，為了完成這兩個方針，

提示：

微信掃一掃。均勻占用226.75個節點，DeepSeek的計劃是運用大規模跨節點專家并行（Expert Parallelism/EP），跟著國產算力硬件逐漸適配DeepEP體系，本錢利潤率545%。但考慮到現在DeepSeek僅經過API收費，總本錢為$87,072/天。更低的推遲。有望推進LLM商業化運用加快。

手機檢查財經快訊。咱們看好推理需求開釋帶動IaaS服務商稼動率提高，最終，國產AI算力板塊有望迎來生長機會。

手機上閱讀文章。

　　DeepSeek-V3 / R1 推理體系的優化方針是：更大的吞吐，此外，DeepSeek模型或經過性價比優勢帶動推理需求開釋，

共享到您的。通訊兩部分，方便。

朋友圈。技能有望向更多國產生態搬遷，但中長期來看，咱們以為，有望推進LLM商業化運用加快。DeepSeek經過優化推理本錢，咱們以為，理論上一天的總收入為$562,027，完成全球商場的比例提高。便利，