切换到宽版
开启辅助访问
登录
立即注册
搜索
搜索
搜索
首页
Portal
论坛
同城
人才网
工具
菲龙网工具
个人中心
关于我们
每日签到
本地新闻
时事评论
华人世界
中国新闻
新闻视频
国际新闻
娱乐新闻
科技新闻
菲龙广场
房产网
菲龙速聘
二手交易
便民电话
美食餐厅
旅游签证
物流速运
商品买卖
二手车市场
严选
话费充值
便民电话
贺词页面
瀑布流页
汇率查询
APP下载
每日签到
我的任务
道具商店
每日签到
我的任务
道具商店
更改用户名
关于菲龙网
About US
联系菲龙网
活动回顾
加入我们
本版
用户
菲龙网
»
论坛
›
新闻频道
›
科技新闻
›
DeepSeek首次披露:理论成本利润率545%!
菲龙网编辑部7
有 744 人收听 TA
151008
主题
151025
回复
177247
积分
收听TA
发消息
加好友
本文来自
科技新闻
订阅
|
收藏
(
2953
)
菲龙网编辑部7发布过的帖子
0/75
AI抢饭碗的时代要来了?一大型银行未来三年内预计裁员4000人
0/68
金价暴跌!有投资者囤10公斤黄金被套牢
0/74
逾700亿元险资投向股权领域,未来上升空间还有多大?
0/67
接入DeepSeek!险企“狂飙”
0/73
中兴通讯:2025年度拟使用不超300亿元自有资金进行委托理财
0/78
评评“理”第 26期:连续两年浮亏、近3个月却收益亮眼,一产品卖出4万多笔登上邮储银行APP热销榜丨银行热销理财产品测评系列
0/65
债市下跌冲击,6-12个月期限纯固收产品近1年平均收益率跌破3%丨机警理财日报
0/66
75亿国资入局! 这家新银行将如何搅动农村金融市场?
0/71
中央一号文件首提“农业新质生产力” 多家银行加码涉农贷款
查看TA的全部帖子>>
DeepSeek首次披露:理论成本利润率545%!
时间:2025-3-3 09:36
0
117
|
复制链接
|
互动交流
显示全部楼层
阅读模式
直达楼层
马上注册,结交更多好友
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
DeepSeek开源周收官,DeepSeek以最后一弹,再次在AI江湖激起了层层涟漪。
3月1日,DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘密。
最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,假定GPU租赁成本为2美元/小时,总成本为87072美元/天;如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。
最大程度优化推理系统,理论成本利润率高达545%
据文章介绍,DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。为了实现这两个目标,DeepSeek使用了大规模跨节点专家并行(Expert Parallelism / EP)的方法,并通过一系列技术策略,最大程度地优化了大模型推理系统,实现了惊人的性能和效率。
具体而言,在更大的吞吐的方面,大规模跨节点专家并行能够使得batch size(批尺寸)大大增加,从而提高GPU矩阵乘法的效率,提高吞吐。
batch size在深度学习中是一个非常重要的超参数,指模型在训练过程中每次使用的数据量大小。它决定了每次模型更新时使用的训练样本数量,调整batch size可以影响模型的训练速度、内存消耗以及模型权重的更新方式。
在更低的延迟方面,大规模跨节点专家并行使得专家分散在不同的GPU上,每个GPU只需要计算很少的专家(因此更少的访存需求),从而降低延迟。
但是,由于大规模跨节点专家并行会大幅增加系统的复杂性,带来了跨节点通信、多节点数据并行、负载均衡等挑战,因此DeepSeek在文章中也重点论述了使用大规模跨节点专家并行增大batch size的同时,如何隐藏传输的耗时,如何进行负载均衡。
具体来看,DeepSeek团队主要通过规模化跨节点专家并行、双批次重叠策略、最优负载均衡等方式,最大化资源利用率,保证高性能和稳定性。
值得注意的是,文章还披露了DeepSeek的理论成本和利润率等关键信息。据介绍,DeepSeek V3 和R1的所有服务均使用英伟达的H800 GPU,由于白天的服务负荷高,晚上的服务负荷低,DeepSeek实现了一套机制,在白天负荷高的时候,用所有节点部署推理服务。晚上负荷低的时候,减少推理节点,以用来做研究和训练。
通过时间上的成本控制,DeepSeek表示DeepSeek V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租赁成本为2美元/小时,总成本为87072美元/天;如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。
不过,DeepSeek也强调,实际上的收入或许并没有那么多,因为V3的定价相较于R1要更低,另外夜间还会有折扣。记者注意到,2月26日,DeepSeek在其API开放平台发布错峰优惠活动通知。根据通知,北京时间每日00:30-08:30为错峰时段,API调用价格大幅下调,其中DeepSeek-V3降至原价的50%,DeepSeek-R1降至25%。DeepSeek鼓励用户在该时段调用,享受更经济更流畅的服务体验。
根据模型价格细节,在标准时段(北京时间08:30-00:30),V3和R1的百万tokens输入(缓存命中)价格分别为0.5元和1元,百万tokens输出分别为8元和16元,R1均为V3的两倍。而在优惠时段(北京时间00:30-08:30),V3和R1的百万tokens输入(缓存命中)则均降为0.25元,百万tokens输出均降为4元。
开源周告一段落,更多惊喜或许还在路上
随着最后一枚“重磅炸弹”的发布,DeepSeek的开源周活动正式告一段落。
在过去的一周里,DeepSeek每天开源一个代码库,堪称公开了一个“技术全家桶”。业内人士分析,这一系列的技术组件看似独立,实则共同构建成了一套精密协同的系统,让DeepSeek在有限算力之下最大程度地“榨干”了GPU,实现了训练推理效率的大幅提升。
记者注意到,在DeepSeek今天发布“最后一弹”的帖子下,不少国外网友表达了赞叹。例如,一名网友表示,到第七天,DeepSeek或许还会发布AGI(通用人工智能,人工智能的最高目标);另外一名网友表示,“这就是为了正确的理由做正确的事情,你们绝对是传奇,鞠躬致敬”;还有网友猜测,DeepSeek愿意公布这些信息,说明他们实际上已经达到了领先的水平,实际的技术能力可能更高。
不仅如此,还有网友将DeepSeek与OpenAI进行对比,表示:“‘成本利润率545%’,等一下,所以你是说我被OpenAI抢劫了?”
与DeepSeek的开源、免费相比,OpenAI的模型收费一直十分昂贵。就在2月28日,OpenAI正式发布最新模型GPT-4.5研究预览版,这是一款号称“情商最高”的通用大语言模型。然而,其高达每100万tokens输入75美元的API调用价格,相比GPT-4o的2.5美元暴涨了30倍,相比DeepSeek的正常价格,GPT-4.5输入价格更是达到了惊人的280倍。
事实上,GPT-4.5发布后,许多网友已在评论区吐槽定价太贵。而OpenAI的CEO山姆·奥特曼也承认,GPT-4.5是一个“庞大且昂贵的模型”。“我们原本非常希望同时向Plus和Pro用户推出它,但随着我们的规模发展壮大,我们已经耗尽了GPU资源。我们将在下周增加数万块GPU,然后将其推出给Plus层级的用户。”奥特曼在其个人社交平台上表示。
作为大模型领域的“鲶鱼”,DeepSeek如同一名初出茅庐、聪明而锐气的年轻人,持续地给行业的老玩家及巨头们带来压力。最近,据外媒透露,DeepSeek正在加速研发DeepSeek-R2推理模型,这一模型原计划今年5月发布,但或许会提前,新模型有望可以生成更好的代码,并且使用英语之外的语言进行推理。
从V3到R1,再到即将面世的R2,外界对DeepSeek充满了期待,DeepSeek也以持续的技术突破惊艳世界。开源周虽然暂时结束了,但更多的惊喜,或许还在路上。
责编:万健祎
校对:李凌锋
版权声明
" Type="normal"@@-->
证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关行为主体法律责任的权利。
转载与合作可联系证券时报小助理,微信ID:SecuritiesTimes" Type="normal"@@-->
END
" Type="normal"@@-->
回复
举报
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
点我进行验证
本版积分规则
发表回复
回帖后跳转到最后一页
关闭
站长推荐
/1
【点击免费下载】菲龙网移动APP客户端
【点击免费下载】菲龙网移动APP客户端,新闻/娱乐/生活资讯生活通,带你了解菲律宾多一点!
查看 »
扫码添加微信客服
快速回复
返回列表
返回顶部