- 本文提出了一种风险厌恶型强化学习算法,结合贝叶斯神经网络和Dirichlet分布策略,旨在优化投资组合分配。
- 该框架通过引入KL散度作为正则化项,并利用VaR作为风险度量,确保在不确定环境中做出稳健决策。
- 实验结果显示,该算法在相同测试条件下表现优于其他强化学习模型,且盈利能力更强。
推荐您下载慧博智能策略终端,还能查看更多相关研报和第一手的投资资讯,同时提供各种相关数据和盈利预测,可多角度观测,多维度帮您做出正确的投资决策。