模型回测
对 4000 多只股票的样本外预测,展示真实的预测能力
策略表现
前20名股票筛选策略的模拟收益,每期重新平衡
累计收益(权益曲线)
按策略划分的周期收益
多头与空头投资组合回报
策略回撤
表现统计
| 指标 | 值 | 描述 |
|---|---|---|
| 预测总数 | 加载中... | 测试期间个股预测数量 |
| 独特股票代码数 | 加载中... | 有预测的不同股票数量 |
| 斯皮尔曼IC | 加载中... | 预测收益与实际收益之间的等级相关性(信息系数) |
| 平均绝对误差 | 加载中... | 平均预测误差幅度 |
| 方向准确度 | 加载中... | 方向正确的预测比例(上涨/下跌) |
| 前 20 多空策略收益 | 加载中... | 做多前 20 做空后 20 个预测的每期累计收益 |
| 前 20 纯多头策略收益 | 加载中... | 做多前 20 个预测的每期累计收益 |
| 测试期开始 | 加载中... | 测试集中的首个预测日期 |
| 测试期结束 | 加载中... | 测试集中的最后一个预测日期 |
方法论
样本外测试
此回测展示的是模型在训练期间从未见过的数据上做出的预测。模型在 2022 年 9 月之前的数据上训练,这些预测来自 2024 年 1 月之后——确保训练数据和测试数据完全分离。
在开发过程中,我们将历史数据分为训练集、验证集和测试集,并设置适当的禁区期以防止任何数据泄露。验证集用于调整超参数并选择最佳模型配置,而不触及测试集。一旦通过验证确定了最优参数,最终生产模型将在所有可用数据的完整历史上训练。这确保了模型始终是最新的并保持顶级性能。
预测周期
在 1 个月和 3 个月前瞻收益之间切换。1 个月预测预测未来 30 天的股票收益,而 3 个月预测则预测未来 90 天的收益。两者都展示了模型识别跑赢市场机会的能力。
解读图表
每个点代表一次预测。X 轴显示模型的预测值,Y 轴显示实际结果。绿色回归线显示预测与结果之间的实际关系——正斜率表明具有预测能力。
关键统计数据
斯皮尔曼 IC(信息系数)衡量预测收益排名与实际收益排名的匹配程度。方向准确率显示模型正确预测股票上涨或下跌的频率。数值越高表明预测性能越好。
复制此策略
上述策略表现可以使用我们的平台复制。以下是具体方法:
- 选择您的预测周期: 根据您的投资期限选择 1 个月或 3 个月的预测。
- 构建您的多头投资组合: 选择预测收益最高的前 20 只股票。这些是您的“买入”仓位,每只占投资组合的 5%。
- 构建您的空头投资组合(可选): 选择预测收益最低的后 20 只股票。这些是您多空策略中的“卖空”仓位。
- 定期再平衡: 对于 1 个月预测,每月再平衡。对于 3 个月预测,每季度再平衡。这确保您的投资组合始终持有最有前景的股票。
快速链接:
查看顶级预测(多头) — 发现最佳买入机会
查看底部预测(空头) — 发现潜在的卖空候选股
投资组合优化器 — 根据您的选择创建多元化、风险优化的投资组合
理解量化金融:入门指南
机器学习与金融的交叉领域是现代量化研究中最具挑战性的领域之一。以下我们提供算法交易系统理论基础的简要概述。
金融机器学习
预测难题
与传统机器学习应用不同,金融市场具有几个独特特征,使得预测异常困难:
- 低信噪比: 资产收益主要包含噪音,预测信号通常只能解释不到5%的方差。在实践中,5-10%的斯皮尔曼 IC 已被认为是优秀的。
- 非平稳性: 市场动态随时间演变。在一个时期成立的关系可能在另一个时期逆转,这需要自适应模型和仔细的验证。
- 对抗性: 市场具有竞争性——盈利信号吸引资本直至被套利消除。这种“阿尔法衰减”意味着模型需要持续的研究和改进。
金融中的交叉验证
标准的 k 折交叉验证不适用于时间序列数据,因为存在时间依赖性。我们采用:
- 清除式交叉验证: 消除训练-测试边界附近的样本,以防止重叠预测周期造成的信息泄露。
- 禁区期: 在训练和测试期间之间添加缓冲区,通常等于预测周期的长度。
- 组合清除式交叉验证: 在保持时间完整性的同时测试多个训练/测试组合,提供稳健的样本外估计。
特征工程
原始价格数据必须转换为平稳的、具有预测性的特征。常见的转换包括收益率(算术和对数)、z分数、百分位排名和技术指标。特征缩放和标准化的选择对模型性能有显著影响。
金融风险管理
基本风险指标
专业的投资组合管理需要严谨的风险量化:
- 波动率(σ): 收益的标准差,日度数据通常通过乘以√252进行年化。衡量总风险,但不区分上行和下行风险。
- 最大回撤: 投资组合价值从峰值到谷底的最大跌幅。对于理解最坏情况和投资者心理至关重要——50%的回撤需要100%的收益才能恢复。
- 风险价值(VaR): 在给定时间范围内以指定置信水平(如 95% VaR)预期的最大损失。广泛使用但因未能捕捉尾部风险而受到批评。
- 条件风险价值(预期损失): 在损失超过VaR的情况下的预期损失。通过量化尾部事件的严重性来解决VaR的局限性。
夏普比率
定义为 (Rp - Rf) / σp,夏普比率衡量风险调整后的收益——每单位波动率的超额收益。夏普比率高于 1.0 通常被认为是良好的,高于 2.0 则是优秀的。但要谨慎:夏普比率可能因流动性不足、杠杆或样本期短而被人为抬高。
系统性风险与特质风险
总风险分解为市场风险(β × 市场运动)和公司特有风险。资本资产定价模型(CAPM)认为只有系统性风险会获得补偿,因为特质风险可以通过分散投资消除。现代因子模型将其扩展到多个风险因子(规模、价值、动量、质量)。
投资组合构建
现代投资组合理论
哈里·马科维茨的开创性工作(1952年)确立了投资组合风险并非单个资产风险的简单加权平均——相关性很重要。两个不完全相关(ρ < 1)的资产组合可以产生比任一单一资产风险更低的投资组合。
有效前沿
对于任何给定的收益目标,都存在一个方差最小的投资组合。所有这些投资组合的集合形成了有效前沿——理性投资者只应持有该前沿上的投资组合。前沿下方的点是次优的(相同风险,更低收益),而前沿上方的点是不可能实现的。
优化挑战
均值-方差优化对输入估计值一直非常敏感:
- 估计误差: 预期收益很难准确估计。输入中的小误差可能导致最优投资组合大相径庭。
- 集中度风险: 无约束优化常常产生极端仓位。实际应用中会施加仓位限制和行业约束。
- 正则化: 收缩估计、Black-Litterman 和稳健优化等技术有助于稳定投资组合权重。
等权重与优化
1/N(等权重)投资组合由于估计误差的存在,在样本外常常优于优化投资组合。我们的回测使用等权重 5% 作为稳健的基准。对于增强型投资组合,我们的优化器应用约束和正则化来提高实际性能。
股票多空策略
市场中性
美元中性的多空投资组合(多头和空头敞口相等)净市场敞口为零。这在对冲市场风险的同时分离出股票选择的“阿尔法”。该策略在多头仓位跑赢空头仓位时获利,与市场方向无关。
收益来源
多空策略收益分解为:
- 做多阿尔法: 多头仓位相对于市场的超额表现。
- 做空阿尔法: 空头仓位相对于市场的负超额表现(空头下跌时我们获利)。
- 做空返佣: 卖空所得资金产生的利息(实践中会被借贷成本减少)。
实际考量因素
实际实施涉及交易成本(佣金、买卖价差)、市场影响(价格向不利方向变动)、卖空约束(券源要求、借贷成本)和容量限制。这些摩擦成本会降低理论回测的实际收益。
再平衡频率
更频繁的再平衡可以更快捕捉阿尔法,但会产生更高的交易成本。最佳频率是在信号衰减和交易成本之间取得平衡。对于收益预测,每月或每季度再平衡通常提供有利的权衡。
因子投资
什么是因子?
因子是解释某些股票为何长期跑赢其他股票的系统性收益来源。与基于个股分析的选股不同,因子投资的目标是一组证券共同具有的广泛、持久的特征。学术研究已识别出许多因子,但只有少数因子在不同市场和时间段表现出稳健性。
经典因子
- 市场因子(β): 对整体股票市场的曝露。这是CAPM模型的原始因子——贝塔较高的股票与市场的联动性更强,历史上可获得更高收益(但风险也更高)。
- 规模因子(SMB): 小盘股往往跑赢大盘股。Fama和French(1993)记录了这种“小减大”溢价,尽管近几十年来已有所减弱。
- 价值因子(HML): 低市净率股票长期跑赢成长股。这种“高减低”因子反映了买入低估资产、卖出高估资产的策略。
- 动量因子(UMD): 过去3-12个月表现良好的股票往往会继续跑赢。Jegadeesh和Titman(1993)记录了这种跨市场的“上减下”效应。
- 质量因子(QMJ): 高盈利能力、稳定收益和低杠杆的公司表现更优。Asness等人(2019)正式定义了这种“优质减劣质”因子。
- 低波动性: 矛盾的是,低风险股票通常提供比高风险股票更高的风险调整后收益,这与CAPM的基本预测相矛盾。
因子模型
多因子模型将收益分解为系统性组成部分:
- Fama-French三因子模型: 市场 + 规模 + 价值。解释约~90%的分散化投资组合收益。
- Carhart四因子模型: 在Fama-French模型基础上增加动量因子。
- Fama-French五因子模型: 增加盈利能力和投资因子,但动量因子仍然具有显著性。
因子择时与因子暴露
静态因子曝露(始终偏向价值、动量等)历史上对耐心的投资者有所回报。因子择时——动态调整因子权重——要困难得多。因子可能连续数年表现不佳才会回归,而择时信号也以不可靠著称。大多数专业人士建议采用分散化、一致性的因子曝露,而非战术性配置。
机器学习与因子
我们的预测模型通过其特征隐式捕捉因子曝露。通过学习基本面数据、价格动量和市场状况的模式,模型识别出可能跑赢的股票——以数据驱动的方式有效结合多个因子。这种方法可以发现传统线性模型所遗漏的非线性因子交互作用。
重要声明
过往业绩不代表未来表现。此处显示的回测结果基于历史数据,可能无法预示未来表现。股票市场投资涉及风险,包括本金的潜在损失。所示预测仅供参考,不应被视为财务建议。在做出投资决策之前,请始终咨询合格的财务顾问。