- DeepSeek系列模型因其行业领先的模型能力和显著降低的成本而受到广泛关注,特别是DeepSeek-R1的API服务价格较OpenAI-o1下降96%。
- DeepSeekV3通过动态调整专家负载和FP8混合精度训练,显著降低了训练成本,成为高效的替代方案。
- R1和R1-zero模型通过大规模强化学习训练,展现出强大的推理能力,尤其是R1-zero省略了监督微调,减少了人工干预,适合难以获取标注数据的领域。
核心要点2
投资报告核心要点总结: 1. DeepSeek系列模型的成功引发了投资方向的变化,其在多个测试中表现出色,模型能力媲美OpenAI的o1,并且其代码开源。
2. DeepSeek-R1的API服务输出定价显著低于OpenAI-o1,成本下降至16元/1MTokens,未来DeepSeek-V3的定价更低,活动期间仅为2元/1MTokens。
3. DeepSeek系列的技术突破包括DeepSeekV3和DeepSeekR1/R1-zero模型,前者在传统专家混合模型上实现了低训练成本,并通过动态调整专家负载和FP8混合精度训练框架解决了负载均衡问题。
4. DeepSeekV3的训练成本仅为557.6万美元,远低于OpenAI的GPT-4训练成本。
5. DeepSeekR1/R1-zero通过大规模强化学习训练展现出强大的推理能力,其中R1-zero完全依赖强化学习,省略了监督微调,适用于缺乏高质量标注数据的领域。
6. 风险提示包括人形机器人技术及成本进展不及预期、需求不足以及电动化设备受限于电池成本和补能便捷性等问题。
投资标的及推荐理由投资标的:DeepSeek系列模型(DeepSeek-V3、DeepSeek-R1/R1-zero) 推荐理由: 1. 行业领先的模型能力:DeepSeek系列在多个测试中展现出媲美OpenAI的模型能力,说明其技术水平处于行业前列。
2. 成本大幅下降:DeepSeek-R1的API服务输出定价为16元/1MTokens,相较于OpenAI下降96%。
未来DeepSeek-V3的API服务输出订单价格进一步降低,活动优惠期内仅为2元/1MTokens,显示出其在成本控制上的优势。
3. 技术突破:DeepSeek-V3在传统专家混合模型上改进,解决了负载均衡问题,并通过FP8混合精度训练框架降低了训练成本,训练成本仅为557.6万美元,远低于OpenAI的GPT-4训练成本。
4. 强大的推理能力:DeepSeek-R1/R1-zero通过大规模强化学习训练,展现出强大的推理能力,尤其是R1-zero省略了有监督微调,减少了人工干预,适应于难以获取高质量标注数据的领域。
5. 潜在的市场需求:随着AI技术的不断发展和应用,DeepSeek系列模型在各个行业的应用前景广阔。
风险提示: 1. 人形机器人技术进展可能不及预期。
2. 市场需求可能低于预期。
3. 电动化设备的渗透率受限于电池成本和补能便利性。