- DeepSeek-V3和DeepSeek-R1的发布显著提升了国产大模型的性能和推理能力,有望加速AI行业的商业化落地进程。
- 通过算法和工程创新,DeepSeek-V3在推理效率和成本上取得了显著提升,吸引了大量用户,验证了市场对大模型能力提升的敏感度。
- 投资者可关注基础设施供应商及积极探索AI应用的相关公司,尽管存在产品迭代和市场风险。
核心要点2
DeepSeek于2024年12月底发布了自研的DeepSeek-V3模型,参数达到671B,经过14.8T token的预训练,性能超越了多个开源模型,并与GPT-4o和Claude-3.5-Sonnet不相上下。
随后在2025年1月底推出的DeepSeek-R1,采用强化学习技术,显著提升了推理能力,尤其在数学、代码和自然语言推理等任务上表现优异。
DeepSeek-V3的推理效率提升了三倍,生成吐字速度从20TPS提高至60TPS,用户体验更加流畅。
同时,成本大幅降低,DeepSeek-V3和R1在Web和APP端可免费试用,API服务定价也进行了调整,进一步促进了大模型产品的商业化落地。
DeepSeek应用的日活跃用户在发布后迅速增长,验证了市场对大模型能力提升及成本下降的敏感度。
投资建议集中在基础设施供应商、已发布通用大模型的公司及具备AI应用落地场景的相关企业上。
同时,需注意大模型产品迭代、科技摩擦及商业化落地不及预期的风险。
投资标的及推荐理由投资标的及推荐理由: 1. 基础设施供应商: - 中科曙光 - 浪潮信息 推荐理由:随着DeepSeek-V3及R1的推出,国产大模型信心提升,基础设施供应商将受益于AI行业的发展和基础设施的需求增加。
2. 已发布通用大模型或积极探索AI行业应用落地的公司: - 科大讯飞 - 昆仑万维 - 三六零 - 拓尔思 推荐理由:这些公司在AI领域已有布局,随着大模型的商业化进程加速,它们有望在市场中获得更大的份额。
3. 具备AI应用落地场景的相关标的: - 金山办公 - 福昕软件 推荐理由:这类公司具备实际的应用场景,能够直接受益于AI技术的进步和市场需求的增长。
总体来看,DeepSeek-V3及R1的推出验证了大模型的发展趋势,并有望促进其商业化落地进程,相关企业因此将迎来发展机遇。