商品基本面量化择时:择时多因子体系 东证衍生品研究院 谢圣 2020年11月 目录 1、基本面量化择时体系 2、单指标择时的方法 3、指标筛选结果 4、多指标组合:预测综合法 5、多指标组合:信息综合法 6、商品多品种回测结果 1、基本面量化择时体系 2019-08-16 2019-07-26 2019-07-05 2019-06-14 (2)量化CTA:高频量价信号为主,日内持仓,较少依赖基本面数据。 2019-05-24 • 2019-04-30 (1)基本面CTA:缺乏量化体系。 2019-04-12 • 2019-03-22 量价数据VS基本面数据 2019-03-01 • 2019-02-01 量化策略分类:多因子策略、择时策略、期权策略 2019-01-11 • 2018-12-21 2018-11-30 2018-11-09 2018-10-19 2018-09-21 2018-08-31 2018-08-10 2018-07-20 2018-06-29 2018-06-08 五亿私募CTA指数累计收益率 2018-05-18 ⼗亿私募对冲指数累计收益率 2018-04-27 CTA趋势精选指数累计收益率 2018-04-04 百亿私募混合指数累计收益率 2018-03-16 2018-02-23 2018-02-02 2018-01-12 2017-12-22 2017-12-01 2017-11-10 2017-10-20 2017-09-22 2017-09-01 2017-08-11 2017-07-21 2017-06-30 2017-06-09 2017-05-19 2017-04-28 2017-04-07 2017-03-17 2017-02-24 2017-02-03 2017-01-13 2016-12-23 2016-12-02 2016-11-11 2016-10-21 2016-09-23 2016-09-02 2016-08-12 2016-07-22 2016-07-01 2016-06-08 2016-05-20 2016-04-29 2016-04-08 2016-03-18 2016-02-26 2016-01-29 2016-01-08 1.1、基本面分析与基本面量化 CTA指数历史表现 ⼆⼗亿私募股票指数累计收益率 40% 30% 20% 10% 0% -10% 基本面量化择时的难点 • (1)如何利用指标进行预测? • (2)如何从众多指标中筛选有效的预测指标? • (3)指标预测权重的动态变化? 方法论问题:预测综合法VS信息综合法 指标Vector _ markett ¾¾¾ ® 价格涨跌Vector _ asset t+1 预测 é Macrot ù ê Industry ú t ê ú ê Fundamentalt ú ê ú Alternativet ú Vector _ markett = êê ú Stockt ê ú ê Futuret ú êOption ú t ê ú êë...... úû 商品价格涨跌的原因 什么决定了商品价格的涨跌? • (1)估值 估值如何衡量:基差、库存、季节同比等(难以精确) 估值决定了商品价格涨跌的空间 • (2)驱动因子 商品价格涨跌的驱动因子:去库、产业链上下游、需求、供给冲击等(反映在基本面数据上) 驱动因子决定了商品价格涨跌的方向 理想的交易品种: (1)低估值+驱动因子强看多(预测波动率高) (2)高估值+驱动因子强看空(预测波动率高) • (3)预测波动率 预测商品价格未来一段时间的波动率,以此预测商品涨跌的幅度 用于不同品种的仓位配置 1.2、 量化择时方法体系——择时多因子 基本面量化择时体系 • 1、单择时因子挖掘:择时因子的批量挖掘,从原始数据到生成择时因子,数据处理、形式变换、周期变换; • 1.1 特征变换:确定数据的何种形式有预测效力,如绝对值、平均值、环比、同比等。 • 1.2 周期变换:确定择时因子的最优预测周期,比如有的因子时序滞后。 • 2、动态筛选:系统化检验单因子的择时效果,有效的单因子进入择时因子池; • 2.1 预测法:根据预测值生成择时信号,回测择时表现。 • 2.2 分组法:根据历史分组生成择时信号,回测择时表现。 • 3、多择时因子组合优化:从因子池挑选有效的因子,对多择时因子降维预测形成最终的综合多空信号; • 3.1 预测综合法:打分法,信号打分综合。 • 3.2 信息综合法:降维预测方法,因子降维形成综合预测。 择时因子批量挖掘流程 主要内容 核⼼⽅法 流程1 基本面数据清洗、规整 -- 流程2 数据构建指标 Rank IC确定指标最优周期 流程3 指标⽣成择时信号 回归法、分组法 流程4 择时信号评价 多空回测业绩评价 1.2、基本面量化择时体系 • 数据处理方法: • (1)指标频率调整:统一成高频; • (2)指标更新延迟调整:滞后一期; • (3)季节性调整:不季调VS季调; • (4)异常值处理:最新值替代; 基本面高频数据 焦炭期现货价格及价差 焦煤期现货价格及价差 焦煤内外价差 焦炭港口库存 进口炼焦煤港口库存 国内样本炼焦煤矿库存 国内调查钢厂焦炭库存 国内调查钢厂焦炭库存可用天数 国内调查钢厂、焦化厂炼焦煤库存 焦化企业产能利用率及库存 焦炭期货持仓头寸 焦煤期货持仓头寸 钢厂高炉生产及盈利情况 铁矿石期现货价格及价差 1.2、基本面量化择时体系 • 指标构建方法: • (1)指标形式:反映哪些层面的信息。 • (2)时序周期:择时指标的周期nn、有效预测周期mm。 原值 : data t -nn +1 ì ï index ( t - nn, t ) = í 差值 : data t - data t -nn ï变化率 : ( data /data ) - 1 t t - nn î return ( t , t + mm) = pricet +mm / pricet - 1 ( nn,mm ) = arg (Max ( RankIC ({index (t - nn, t )},{return (t, t + mm )}) ) nn,mm ) 2、单指标择时的方法 2.1、回归法 • 预测:本文采用Kostakis et al.(2014)的预测回归方法IVX在时间序列上进行预测。 • (1)OLS回归中残差序列相关以及自相关性都会增加估计偏差; • (2)非平稳性:非平稳序列容易产生虚假回归; • (3)内生性:指标与收益率相关; • (4)长期预测:IVX可对未来mm期进行长期预测。 yt = a + b xt -1 + ut xt = q + r xt -1 + vt ( u t , vt ) T ! i.i.dN ( 0, S ) s uv æ 1 + 3r ö æ 1 ö ˆ E bOLS - bOLS = - 2 ç ÷ + Oç 2 ÷ sv è T ø èT ø ( ) Rt,t + mm = a + b xt -1 + ut Rt,t + mm = Rt,t +1 +Rt +1,t + 2 +! +Rt + mm -1,t + mm 2.1、回归法 • 生成择时信号: • (1)IVX向前预测; • (2)根据预测值判断多空。 ŷt +1 = aˆ IVX + bˆIVX xt ì 1,i f yˆ t +1 > max y ï signalt = í0, i f yˆ t +1 Î [ min y, max y ] ï -1,i f yˆ < min y t +1 î 2.2、分组法 • 类似portfolio sort test,等分3组检验均值差异。 • (1)非参数方法不依赖过多假设; • (2)两组数据的独立样本t检验来检验分组后收益率的均值是否存在显著差异; • (3)显著性水平5%,对应的t统计值临界值为1.65,若样本t统计量绝对值高于临界值,认为该指标显著。 t= (F - F ) - (µ 1 3 ( n1 - 1) S 1 - µ3 ) + ( n3 - 1) S æ 1 1 ö ç + ÷ n1 + n3 - 2 è n1 n3 ø 2 1 2 3 H 0:µ1 = µ3 ~t ( n1 + n3 - 2 ) 2.2、分组法 • 生成信号: • (1)根据历史样本分组情况来识别指标对未来收益的影响; • (2)根据指标当前所处分组情况生成多空判断。 ì 1,i f x t > x Q1 ïï signalt = í0, i f x t Î éë x Q1 , x Q 2 ùû ï ïî -1,i f x t < x Q 2 3、指标筛选结果 3.1、回归法筛选结果 • 回归法单指标择时效果检验的流程。 • (1)Step 1:针对某一特定指标,利用较长历史数据确定指标构建的方式,形成预测指标值index(t-nn, t) 以及被预测值return(t, t+mm)。 • (2)Step 2:进行滚动窗口IVX回归(这里取窗口长度N=300),检验回归结果是否显著,如果回归结果 显著,利用指标t期当前值进行向前一步预测,根据预测值来形成多空信号。 (3)Step 3:利用单指标形成的多空信号进行进行简单的多空回测,评价该单指标形成多空信号的效果。 P值 多空信号 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 19/06 19/04 19/02 18/12 18/10 18/08 18/06 18/04 18/02 17/12 17/10 17/08 17/06 17/04 17/02 16/12 16/10 16/08 16/06 16/04 16/02 15/12 15/10 15/08 15/06 15/04 15/02 14/12 14/10 14/08 14/06 14/04 14/02 13/12 13/10 13/08 13/06 13/04 13/02 -1.0 12/12 • 3.1、回归法筛选结果 • 回归法筛选指标 指标 指标 形式 mm nn 交易 交易 年化 年化 年化 最⼤ 卡尔 胜率 盈亏 平均 全样 ⽅向 回归 类型 次数 收益 波动 夏普 回撤 玛比 比 持仓 本量 准确 显著 率 率 比率 率 天数 率 率 D1_3 abs 10 20 all 38 26% 27% 0.9 -38% 0.7 50% 1.9 30 1898 58% 72% W1_5 abs 5 1 long 14 21% 23% 0.9 -38% 0.6 71% 6.4 36 1968 55% 43% W2_7 abs 40 30 long 23 29% 25% 1.1 -33% 0.9 74% 1.7 17 1371 61% 67% W3_1 abs 15 1 long 14 38% 34% 1.1 -31% 1.2 64% 3.1 39 1068 55% 93% W3_1 abs 15 1 all 22 38% 38% 1 -31% 1.2 45% 3.8 33 1068 55% 93% W8_4 diff 15 15 all 21 44% 32% 1.3 -20% 2.2 57% 2.3 20 728 56% 97% D6_1 diff 10 10 long 42 29% 26% 1.1 -30% 1 55% 1.8 13 1410 60% 65% D6_1 diff 10 10 all 66 32% 30% 1.1 -30% 1.1 52% 1.9 11 1410 60% 65% D6_2 diff 10 10 long 33 33% 26% 1.2 -31% 1 61% 1.9 16 1410 61% 64% D6_2 diff 10 10 all 58 37% 30% 1.3 -31% 1.2 52% 2.4 13 1410 61% 64% 3.2、分组法筛选结果 • 分组法单指标择时效果检验的流程。 • (1)Step 1:针对某一特定指标,利用较长历史数据确定指标构建的方式,形成预测指标值index(t-nn, t) 以及被预测值return(t, t+mm)。 • (2)Step 2:进行滚动窗口分组(窗口长度N=300),这里对指标值进行三等分分组,根据指标逻辑对 当前指标数据处于哪一组来生成多空信号,若处于中间一组则多空信号为0,检验滚动分组的结果进行t检 验,如果t统计量绝对值高于1.65则判定该指标结果显著。 (3)Step 3:利用单指标形成的多空信号进行进行简单的多空回测,评价该单指标形成多空信号的效果。 多空信号 1 0.5 0 -0.5 19/07 19/06 19/05 19/04 19/03 19/02 19/01 18/12 18/11 18/10 18/09 18/08 18/07 18/06 -1 18/05 • 3.2、分组法筛选结果 • 分组法筛选指标 指标 指标 形式 mm nn t值 回测 交易 类型 交易 次数 年化 收益 率 年化 波动 率 年化 夏普 比率 最⼤ 回撤 卡尔 玛比 率 胜率 盈亏 比 平均 持仓 天数 总样 本量 D2_3 abs 40 10 10.2 all 15 38% 22% 1.7 -18% 2.1 67% 1.7 15 306 W1_5 abs 5 1 -5.7 long 15 15% 16% 0.9 -28% 0.5 67% 2 29 1668 W1_5 abs 5 1 -5.7 all 33 25% 27% 0.9 -37% 0.7 64% 1.6 40 1668 W3_1 diff 20 15 3.1 long 16 19% 23% 0.8 -20% 0.9 69% 1.3 17 753 W8_4 diff 15 15 5.7 long 15 34% 23% 1.5 -19% 1.8 80% 1.5 12 428 W8_4 diff 15 15 5.7 all 25 50% 29% 1.7 -19% 2.7 76% 1.2 12 428 W8_6 abs 10 1 5.4 all 15 42% 27% 1.5 -13% 3.2 87% 4.5 20 443 W8_6 diff 20 15 7.9 all 20 23% 26% 0.8 -21% 1.1 55% 1.8 14 428 W9_4 diff 20 30 7.1 long 29 17% 16% 1 -15% 1.1 72% 2.6 21 1687 4、多指标组合:预测综合法 4.1、显著择时指标的特征 ⽅法 指标 指标形 式 mm nn 交易 类型 交易 次数 总收 益率 年化 收益 率 年化 波动 率 年化 夏普 比率 最⼤ 回撤 卡尔 玛比 率 胜率 盈亏 比 平均 持仓 天数 全样 本量 回归法 D1_3 abs 10 20 long 21 234% 17% 24% 0.7 -28% 0.6 50% 1.9 30 1898 分组法 D1_3 abs 10 20 all 67 117% 13% 30% 0.4 -48% 0.3 54% 1.3 17 1898 回归法 W1_5 abs 5 1 long 14 262% 18% 23% 0.8 -38% 0.5 71% 6.4 36 1968 分组法 W1_5 abs 5 1 all 33 341% 25% 27% 0.9 -37% 0.7 64% 1.6 40 1968 回归法 W2_7 abs 40 30 long 23 193% 22% 25% 0.9 -33% 0.7 74% 1.7 17 1371 分组法 W2_7 abs 40 30 all 13 128% 21% 40% 0.5 -72% 0.3 54% 2.2 68 1371 回归法 W3_1 abs 15 1 long 14 169% 26% 34% 0.8 -31% 0.8 64% 3.1 39 1068 分组法 W3_1 abs 15 1 long 8 80% 21% 15% 1.4 -15% 1.4 63% 3.2 19 1068 回归法 W6_1 abs 40 1 all 34 198% 15% 29% 0.5 -50% 0.3 65% 1.4 41 1968 分组法 W6_1 abs 40 1 all 32 220% 19% 30% 0.6 -41% 0.5 63% 1.4 37 1968 回归法 W8_4 diff 15 15 all 21 86% 24% 32% 0.7 -20% 1.2 57% 2.3 20 728 分组法 W8_4 diff 15 15 all 25 100% 50% 29% 1.7 -19% 2.7 76% 1.2 12 728 4.1、显著择时指标的特征 ⽅法 指标 指标 形式 mm nn 回归法 D6_1 diff 10 回归法 D6_1 diff 回归法 D6_2 回归法 卡尔 玛比 率 1 胜率 盈 亏 比 55% 1.8 平均 持仓 天数 13 全样 本量 -30% 1.1 52% 1.9 11 1410 1.2 -31% 1 61% 1.9 16 1410 30% 1.3 -31% 1.2 52% 2.4 13 1410 38% 22% 1.7 -18% 2.1 67% 1.7 15 306 15 42% 27% 1.5 -13% 3.2 87% 4.5 20 443 all 20 23% 26% 0.8 -21% 1.1 55% 1.8 14 428 long 29 17% 16% 1 -15% 1.1 72% 2.6 21 1687 交易 次数 10 回测 交易 类型 long 42 年化 收益 率 29% 年化 波动 率 26% 10 10 diff 10 D6_2 diff 分组法 D2_3 分组法 年化 最⼤ 夏普 回撤 比率 1.1 -30% all 66 32% 30% 1.1 10 long 33 33% 26% 10 10 all 58 37% abs 40 10 all 15 W8_6 abs 10 1 all 分组法 W8_6 diff 20 15 分组法 W9_4 diff 20 30 1410 4.2、回归法与分组法对比 回归法VS分组法: (1)本质都是利用相关(Relevance); (2)回归法利用线性相关(Linear Correlation); (3)分组法利用秩相关(Rank Correlation)。 ⽅法 依赖假设 线性关系 逻辑 回归法 IVX预测回归 IVX⽅法假设 是 时间序列预测 分组法 独立样本t检验 收益率正态分布 否 分类器 19/06 19/04 19/02 18/12 18/10 18/08 18/06 18/04 18/02 17/12 17/10 17/08 17/06 17/04 17/02 16/12 16/10 16/08 16/06 16/04 16/02 15/12 15/10 15/08 15/06 15/04 15/02 14/12 14/10 14/08 14/06 14/04 14/02 13/12 13/10 13/08 13/06 13/04 13/02 12/12 12/10 12/08 12/06 12/04 12/02 11/12 11/10 11/08 11/06 焦炭期货历史行情 重点考察2017年以后的择时效果: (1)2016年前单边市,即使是用动量指标也有较好择时效果; (2)2017年开始多空切换频繁,择时效果更具说服力。 3000 2500 2000 1500 1000 500 0 4.3、等权平均组合多指标 多空指数 2000 历史业绩表现(当期指标值): 基本面数据构建指标的择时能 力显著,在不考虑数据公布滞 后的情况下,策略胜率高达 60%,盈亏比2.76,年化夏 普比率1.95,抓住了历史上大 多数趋势性行情。 1500 1000 500 交易类 交易次 型 数 19/07 19/05 19/03 19/01 18/11 18/09 18/07 18/05 18/03 18/01 17/11 17/09 17/07 17/05 17/03 17/01 16/11 16/09 16/07 16/05 16/03 16/01 15/11 15/09 15/07 15/05 15/03 15/01 14/11 14/09 14/07 14/05 14/03 14/01 13/11 13/09 13/07 13/05 13/03 13/01 12/11 12/09 0 盈利次 数 亏损次 数 总收益率 年化收 益率 年化波 动率 年化夏 普比率 最⼤回撤 卡尔玛 比率 胜率 盈亏比 平均持 仓天数 long 45 32 12 954.46% 42.37% 23.15% 1.81 -31.49% 1.35 71.11% 2.49 15.53 short 49 28 21 158.44% 15.30% 19.17% 0.78 -30.95% 0.49 57.14% 2.16 15.88 all 89 54 34 1848.21% 56.10% 28.53% 1.95 -31.49% 1.78 60.67% 2.76 16.22 19/07 19/04 19/01 18/10 18/07 18/04 18/01 17/10 17/07 17/04 17/01 16/10 16/07 16/04 16/01 多空指数 15/10 15/07 15/04 15/01 14/10 14/07 100 14/04 300 14/01 500 13/10 600 13/07 800 13/04 1000 13/01 1100 12/10 19/06 19/03 18/12 18/09 18/06 18/03 17/12 17/09 17/06 17/03 16/12 16/09 16/06 16/03 15/12 15/09 15/06 15/03 14/12 14/09 14/06 14/03 13/12 13/09 13/06 13/03 12/12 12/09 4.3、等权平均组合多指标 滞后一期的表现: 2012年9月以来年化收益36.89%,年化波动率29.72%,最大回撤-36.21%,年化夏普比率1.23,卡尔玛 比率1.02,胜率49.44%,盈亏比2.21,平均持仓周期16.22个交易日,策略总体风险收益指标优于朝阳 永续CTA趋势精选指数,择时表现优异。 2.00E+07 每次盈亏 900 1.50E+07 1.00E+07 700 5.00E+06 400 0.00E+00 -5.00E+06 200 -1.00E+07 0 -1.50E+07 4.3、等权平均组合多指标 等权平均组合滞后一期的表现: (1)总体择时表现较好; (2)典型的趋势跟踪策略特征; (3)问题在于回撤较大。 交易 类型 交易 次数 盈利 次数 亏损 次数 总收益率 年化收益 率 年化波 动率 年化夏 普比率 最⼤回撤 卡尔 玛比 率 胜率 盈亏 比 平均 持仓 天数 long 45 22 22 448.86% 29.09% 24.23% 1.18 -30.01% 0.97 48.89% 2.96 15.53 short 49 21 28 42.44% 5.45% 17.60% 0.29 -34.35% 0.16 42.86% 1.91 15.88 all 89 44 45 711.61% 36.89% 29.72% 1.23 -36.21% 1.02 49.44% 2.21 16.22 4.4、风险平价组合多指标 风险平价组合滞后一期的表现: (1)风险平价效果并不如等权组合好; (2)正确的方法在于加大高波动率指标的权重,并用止盈止损等方式控制回撤。 交易 类型 交易 次数 盈利 次数 亏损次 数 总收益 率 年化收 益率 年化波 动率 年化夏 普比率 最⼤回 撤 卡尔玛 比率 胜率 盈亏比 平均持 仓天数 long 41 19 21 248.17% 20.57% 25.83% 0.78 -34.54% 0.60 46.34% 2.81 20.34 short 42 24 18 99.94% 10.95% 19.23% 0.55 -34.98% 0.31 57.14% 1.30 21.81 all 69 38 31 691.70% 36.38% 31.48% 1.14 -37.97% 0.96 55.07% 1.76 24.16 5、多指标组合:信息综合法 5.1 量化择时方法体系 5.1 量化择时方法体系 • 一、单择时因子挖掘:择时因子的批量挖掘,从原始数据到生成择时因子,数据处理、形式变换、周期变换; • 1.1 形式变换:确定数据的何种形式有预测效力,如绝对值、平均值、环比、同比等 • 1.2 周期变换:确定择时因子的最优预测周期 • 二、单择时因子有效性检验:系统化检验单因子的择时效果,有效的单因子进入择时因子池; • 2.1 预测法:根据预测值生成择时信号,回测择时表现 • 2.2 分组法:根据历史分组生成择时信号,回测择时表现 • 三、多择时因子组合优化:从因子池挑选有效的因子,对多择时因子降维预测形成最终的综合多空信号; • 3.1 预测综合法:打分法,信号打分综合 • 3.2 信息综合法:降维预测方法,因子降维形成综合预测 5.2、充分降维预测SF yt +1 = h (f1¢ ft ,!, fL¢ ft , e t +1 ) X it = bi¢ ft + uit,1 £ i £ p Y:资产的收益率 X:可观测到的数据(Observable Data) F:不可观测的因子(Latent Factor) X是我们从数据中挖掘到的择时指标(相关性高、低) F是资产收益率的真实驱动因子 目的:找到每一期对资产收益率真实的、影响最大的驱动因子,形成对未来收益率的 预测 5.2、充分降维预测SF yt +1 = h (f1¢ ft ,!, fL¢ ft , e t +1 ) X it = bi¢ ft + uit,1 £ i £ p 类似“深度学习”的四层结构,充分预测变量是估计得到的 5.2、充分降维预测SF SF降维预测的流程 Step 1:首先利用单指标择时的方法,系统筛选对价格有预测能力的择时因子,并剔除一些预测能力过弱的择时 因子(只是为了减少计算量),得到预测因子矩阵X(N*P维),这里的P一般而言较大(P超过10),需要进行 降维; Step 2:针对P维的择时因子X(N*P维矩阵)以及收益率Y(N*1维矩阵),选取N(取N=300)个交易日的动 态历史窗口,利用Sufficient Forecast降维,取特征值显著不为0的K个特征向量构成充分预测指数(SFI); Step 3:利用Y对SFI进行IVX多元回归,但会严格剔除回归不显著(单变量检验显著性低于5%)的单变量(结果 是剩下的维数K较小,最大也没超过9),仅利用显著的SFI变量做IVX多元回归,利用估计的回归系数向前一步预 测收益率,利用预测收益率的正负判断多空,生成择时多空信号; Step 4:利用择时多空信号进行历史多空回测,评估降维生成SFI指标的预测效果。 焦炭基本面因子降维预测 指标 指标形 式 mm nn 回测交 易类型 交易次 数 年化收 益率 年化波 动率 年化夏 普比率 最⼤回 撤 卡尔玛 比率 胜率 盈亏比 平均持 仓天数 总样本 量 D1_3 abs 20 15 all 35 27% 29% 0.9 -37% 0.7 60% 1.4 36 1923 D4_9 ma 20 30 all 11 27% 32% 0.8 -33% 0.8 64% 1.9 53 1142 D5_9 diff 20 1 all 79 18% 18% 1.0 -22% 0.8 58% 1.2 3 1141 D6_1 diff 20 10 all 58 21% 27% 0.8 -31% 0.7 60% 1.1 12 1430 D6_2 diff 20 10 all 69 26% 27% 0.9 -31% 0.8 57% 1.3 11 1430 W1_5 ma 20 1 all 35 27% 23% 1.2 -33% 0.8 69% 3.3 30 1988 W2_7 abs 20 15 all 18 26% 28% 0.9 -36% 0.7 61% 1.6 31 1406 W3_1 abs 20 1 all 17 37% 39% 0.9 -38% 1.0 41% 7.3 44 1088 W8_4 diff 20 15 all 17 35% 33% 1.1 -31% 1.1 71% 1.6 25 748 W8_5 abs 20 1 all 17 19% 28% 0.7 -24% 0.8 47% 3.0 22 763 W9_2 diff 20 15 all 42 14% 22% 0.6 -48% 0.3 48% 1.9 18 1712 W9_3 abs 20 30 all 25 17% 25% 0.7 -35% 0.5 56% 1.4 26 1506 W9_4 abs 20 30 all 38 19% 24% 0.8 -46% 0.4 61% 1.0 30 2045 W9_5 ma 20 1 all 14 21% 27% 0.8 -37% 0.6 50% 2.1 72 1727 焦炭基本面择时因子降维效果 SIR降维的第1维SDR SIR降维的第3维SDR SIR降维的第2维SDR SIR降维的第4维SDR 40 19/09 19/08 19/07 19/06 19/05 19/04 19/03 19/02 19/01 18/12 18/11 18/10 18/09 18/08 18/07 18/06 18/05 18/04 18/03 18/02 18/01 17/12 17/11 17/10 17/09 信号 17/08 17/07 17/06 17/05 17/04 17/03 17/02 17/01 16/12 16/11 16/10 16/09 16/08 16/07 16/06 16/05 16/04 16/03 16/02 16/01 15/12 15/11 15/10 15/09 15/08 15/07 15/06 15/05 15/04 15/03 15/02 15/01 择时信号与净值 净值 7 6 5 4 3 2 1 -10% 多因子组合优化:降维预测方法 交易类 交易次 总收益 年化收 年化波 年化夏 最⼤回 卡尔玛 型 数 率 益率 动率 普比率 撤 比率 胜率 long 187 325.2% 37.1% 23.9% 1.53 -33.9% 1.09 55.6% 1.33 3.40 short 180 123.3% 19.1% 20.4% 0.92 -22.8% 0.84 52.8% 1.34 3.58 all 259 538.4% 49.7% 26.9% 1.83 -33.9% 1.47 57.9% 1.22 3.79 41 盈亏比 平均持 仓天数 5.3、焦炭基本面因子降维预测:信号优化 主要改进: (1)降维预测后,基本面信号更加灵敏,信号胜率更高。 (2)叠加量价信号,降低了回撤,提高了胜率。 未来改进: (1)量价信号优化; (2)叠加震荡过滤器; (3)止盈止损。 交易 类型 交易 次数 总收 益率 年化 收益 率 年化 波动 率 年化 夏普 比率 最⼤ 回撤 卡尔 玛比 率 交易 胜率 盈亏 比 平均 持仓 天数 long 27 1147% 57.96% 20.14% 2.86 -15.19% 3.82 74.07% 3.86 18.6 short 28 317% 29.54% 18.18% 1.60 -26.03% 1.14 82.14% 2.46 17.8 all 55 4862% 102.86% 26.91% 3.81 -16.88% 6.09 78.18% 3.83 18.1 43 20/09 20/06 20/03 19/12 19/09 19/06 19/03 18/12 18/09 18/06 18/03 17/12 17/09 17/06 17/03 16/12 16/09 16/06 16/03 15/12 15/09 15/06 15/03 焦炭基本面量化策略净值 50 40 30 20 10 0 20/10 20/09 20/08 多空信号 20/07 20/06 20/05 20/04 20/03 20/02 20/01 2020年择时信号的表现 净值 2 1.8 1.6 1.4 1.2 1 -10% 5.4、讨论:趋势的True Beta (1)真实的True Beta 真正的Beta很难去刻画,资产价格的涨跌受多方面因素的影响。维度之高甚至已有数据都难以覆盖。 我们只能尽量从一些维度去找有高相关性的择时因子。 (2)寻找True Beta 我们认为有效的寻找True Beta方式是从多个不同的维度去交叉验证,比如多个维度的基本面指标覆盖 供需、产业链上下游,比如本文“基本面”+“量价”共同识别趋势。 (3)择时应用中的难点 (a)基本面预期数据:基本面分析师对基本面数据的“一致预期”可能差异巨大。 (b)部分基本面数据难以获得:比如一些需求端数据。 (c)预测价格的跳跃:一些基本面shock带来的价格jump难以用结构化的方法预测。 对比:择时多因子VS横截面多因子 • 择时多因子体系的优势: • (1)逐一寻找单个品种的异质性因子(不同品种驱动因素不一,完全依赖common factor利用信息较 少); • (2)纯粹聚焦在时间序列上的预测性:基于最新的基本面指标值预测未来收益(横截面多因子隐含假设 过去表现好的因子未来也会好,但本质需要“因子择时”)。 • (3)框架的完整性:里面可以融合非线性预测因子、长短周期预测因子、不同形式的预测因子等等,框 架兼容性更强。 • (4)更接近本质:预测收益率的数值排序,可用于大类资产配置,超配强烈看多、看空的品种(如商品 组合、50指数增强); 总结 基本面量化择时: (1)基本面数据可用于中长期择时,且择时表现优异。 (2)即使是简单的线性预测,依然能取得较好的效果。 (3)多维度择时指标的组合:解决“降维”问题可以进一步改进择时表现。 降维有两个作用:(1)实现了因子空间的变换;(2)将主要信息集中到少数变量 中,提升了预测效率。 (4)“基本面”+“量价”共同判断提高胜率。 6、商品多品种回测结果 基本面量化覆盖品种 ⿊⾊ 焦炭、铁矿⽯、螺纹钢、HC、JM、SM 有⾊ 铜、铝、镍、锌、铅 能化 原油、FU、RU、LPG、ZC、L、PP、MA、PTA、EG、EB、 BU、PF、UR 油脂 棕榈油、⾖油 非⾦属建材 农产品 玻璃、PVC ⽟米、白糖、棉花、⾖⼀、苹果、鸡蛋 6.1、黑色 6.2、有色 6.3、能化 6.4、油脂 6.5、非金属建材 6.6、农产品 THANKS