- DeepSeek-R1系列模型通过强化学习和知识蒸馏技术,在推理能力上与OpenAI-o1相当,且API定价显著低于同类产品,具有高性价比。
- DeepSeek-R1-Zero实现了无监督强化学习的突破,展示了大模型的潜力,而R1-Distill系列则通过蒸馏提升小模型的推理能力。
- 投资建议关注基础设施公司和全球模型厂商的创新进展,同时需警惕技术迭代和商业化落地的风险。
核心要点2
DeepSeek于1月20日发布了DeepSeek-R1系列模型,包括R1-Zero、R1和R1-Distill,推理能力与OpenAI的o1-1217相当,但API服务定价显著低于OpenAI。
R1-Zero通过完全依赖强化学习训练,首次实现了无监督学习的大语言模型,展示了强化学习在模型推理能力提升方面的潜力。
R1系列通过多阶段训练进一步优化了推理能力,并且知识蒸馏技术使得小模型在推理能力上显著提升,证明了大模型的知识可以有效传递给小模型。
DeepSeek-R1的API定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,具备高性价比,促进开发者快速迭代模型功能。
DeepSeek在大模型和小模型的创新上均展示了新的发展方向。
投资建议关注基础设施领域的公司,如英伟达、海光信息等,同时关注全球模型厂商和学界的创新进展。
风险提示包括技术迭代、商业化落地、政策支持和全球经济风险等方面。
投资标的及推荐理由投资标的包括:英伟达、海光信息、寒武纪、协创数据、英维克、中科曙光、浪潮信息、润泽科技、欧陆通、曙光数创、申菱环境、东阳光等。
推荐理由: 1. DeepSeek-R1模型的推出显示了在大语言模型领域的技术突破,尤其是无监督或弱监督学习方法在提升模型推理能力方面的潜力,这对基础设施领域的公司构成了良好的市场机会。
2. DeepSeek-R1的高性价比API定价将吸引更多开发者使用,从而加速模型的功能迭代,推动相关公司的商业化进程。
3. 强化学习与知识蒸馏的结合为大模型和小模型的发展提供了新的方向,增强了相关公司的技术创新能力和市场竞争力。
4. 持续关注全球各大模型厂商和学界的创新进展,有助于把握行业动态和投资机会。
风险提示包括技术迭代、商业化落地、政策支持以及全球宏观经济等方面的不确定性。