第六章 主动管理基本定律

第六章 主动管理基本定律

2018-05-24
| 量化投资 | | 投资 , 主动管理 , 残差 , 信息率 , 头寸 | Comment 评论

基本定律

主动管理基本定律是信息率的一种近似表达。

这条定律基于投资策略的两条基本属性:

1)投资策略的广度 \(\mathrm{BR}\) ):策略每年对超常收益率作出的独立预测的数目。

2)投资经理的信息系数 \(\mathrm{IC}\) ):每个预测与实现结果之间的相关系数,表征投资经理的能力。简化假设:所有预测的 \(\mathrm{IC}\) 都是相同的。

主动管理基本定律

\[ \mathrm{IR} = \mathrm{IC} \ \sqrt{\mathrm{BR}} \]

此定律的近似条件:忽略我的预测在降低风险方面的作用, \(\mathrm{IC}\) 越小,主动管理基本定律的正确性越高。

根据基本定律以及第5章的最优残差风险水平与信息率之间的关系,最优残差风险可重新表述成:

\[ \omega^*=\frac{\mathrm{IC} \ \sqrt{\mathrm{BR}}}{2 \lambda_R} \]

这意味着:能力越高可以采用更激进的策略(因为成功概率更大);广度越高也可以适当增加激进水平(因为有更多机会去分散风险)。

投资经理所能创造的最大附加值也可表述为:

\[ \mathrm{VA}^* = \frac{\mathrm{IC}^2 \ \mathrm{BR}}{4 \lambda_R} \]

主动管理基本定律说明的真谛:需要在增加投资测的广度 \(\mathrm{BR}\) (覆盖更多的股票或缩短预测时间)和提高能力 \(\mathrm{IC}\) 之间进行权衡。战略上,这种权衡很快速简单;但具体精确估计广度 \(\mathrm{BR}\) 是困难的,因为广度定义要求各个预测之间是独立的。

基本定律的应用

■■老板

轮盘赌:18个红格,18个黑格,1个绿格,赌徒只能压黑或压红。

从■■视角看:1)如果赌徒压错则赢;2)赌徒下注后,■■作为对手方下同等注;3)■■赢,额外获得赌徒所下的注(100%收益率);如果■■输,将所下注赔给赌徒(-100%收益率)。

■■单局赢率 \(\dfrac{19}{37}\) ,单局盈利能力 \(\mathrm{IC}=\dfrac{1}{37}\)

进而可算出:■■单局预期收益率 \(f=\mathrm{E}\{r\}=2.7027\%\) ;■■单局收益率标准差 \(\sigma=\sqrt{\mathrm{E}\{(r-f)^2\}}=99.9634\%\)

假设■■每年的赌局数为 \(\mathrm{BR}=1000000\) 。■■年预期收益率依然是 \(f\) ,但年收益率标准差为 \(\dfrac{\sigma}{\sqrt{\mathrm{BR}}}\) 。进而可算出年信息率为:

\[ \mathrm{IR}=\dfrac{f}{\sigma_{年}}=\sqrt{\mathrm{BR}} \ \dfrac{f}{\sigma}=27.037 \]

而通过基本定律算出的结果:

\[ \mathrm{IR} = \mathrm{IC} \ \sqrt{\mathrm{BR}}=27.027 \]

■■老板秒杀一切投资经理。

残差收益率的半年预测

考虑每次预测的股票数 \(N=200\) ,那么 \(\mathrm{BR}=2 N\) ,并假设:

1)不同股票残差收益率相互独立;

2)股票预期残差收益率为零;

3)每只股票半年残差收益率的标准差都为 \(\sigma=17.32\%\)

根据这三个假设,不妨将每只股票的残差收益率分解为M个独立变量之和:

\[ \theta_i=\sum_{j=1}^M{\theta_{i,j}} \]

其中, \(\theta_{i,j}\) 以相等概率取值 \(1\%\) \(-1\%\) ,于是每个独立变量都具有零均值和 \(1\%\) 标准差。

每支股票的残差收益率 \(\theta_i\) 的标准差为: \(\sigma=\sqrt{M}/100\) ,意味着独立变量数应该是 \(M=(100 \ \sigma)^2=300\)

进而可算出残差收益率与每个独立变量的相关系数(即,信息系数)为 \(\mathrm{IC}=\dfrac{\mathrm{Cov}\{\theta_i,\theta_{i,j}\}}{\mathrm{Var}\{\theta_i\}\mathrm{Var}\{\theta_{ij}\}}=\dfrac{0.01}{\sigma}=0.0577\)

根据基本定律可以算出信息率 \(\mathrm{IR}=\mathrm{IC} \ \sqrt{2 N}=1.154\)

实现这个信息率的一种策略方案:假设业绩基准组合是这200只股票的等权组合,每半年的预测结果:100只股票预期残差收益率为 \(1\%\) ,另100只股票预期收益率 \(-1\%\) 。那么等权买入正预期的股票,卖出负预期的股票。这种方案下,每半年,预期主动收益率为 \(0.5\ (1\%)+(-0.5)\ (-1\%)=1\%\) ,主动标准差为 \(\dfrac{\sigma}{\sqrt{N}}=1.2247\%\) ,进而算出信息率 \(\mathrm{IR}=\dfrac{1\%}{1.2247\%}=0.8165\) ,转换成年化信息率 \(\sqrt{2}\ 0.8165=1.1547\) 。略高于基本定律的计算值。

市场方向的季度预测

用变量 \(x(t)=\pm1\) 表示市场方向, \(y(t)=\pm1\) 则表示预测值, \(x\) \(y\) 都具有零均值和单位标准差。如果考虑市场的N次预测( \(t=1,\dots,N\) ),那么信息系数 \(\mathrm{IC}\) 的计算公式为:

\[ \mathrm{IC}=\mathrm{Cov}\{x,y\}=\mathrm{E}\{x y\}=\frac{1}{N} \sum_t^N{x(t) y(t)} \]

如果 \(N\) 次预测中, \(N_1\) 次正确( \(x=y\) ), \(N-N_1\) 次错误( \(x=-y\) ),那么信息率 \(\mathrm{IC}\) 为:

\[ \mathrm{IC}=\frac{1}{N} (N_1-(N-N_1) )=2 \ \frac{N_1}{N}-1 \]

前面曾看到0.0577的信息系数可产生高于1.0的信息率,而这里可看到为了达到0.0577的信息率,我们只需要在 \(52.885\%\) 的时间里正确地预测出市场方向(这个要求不高)。

信息率的平方可加性

信息率的平方可加性将在基本定律的推导中附带证明,和基本定律一样,也是近似成立的。

书中分别给出了四种情况:1)不同广度;2)不同信息系数;3)国际化投资组合;4)不同投资经理。

假设

基本定律告诉我们:要想获得最高附加值,就要做的频繁(高广度 \(\mathrm{BR}\) )并且做的出色(高能力 \(\mathrm{IC}\) )。和其它理论一样,主动管理基本定律也是基于一些不太实际的假设。

假设1(完美胜任假设):投资经理能够精确衡量自己的能力(计算信息的价值)并以最优的方式利用这种能力。

假设2:各个预测之间应该是独立的。

预测之间(信息源之间)的相关性会降低你的整体能力。如果用表示两个相同能力 \(\mathrm{IC}\) 信息源之间的相关系数 \(\gamma\) ,那么合并信息源的能力 \(\mathrm{IC}_{合并}\) 将是:

\[ \mathrm{IC}_{合并}=\mathrm{IC} \ \sqrt{ \frac{2}{1+\gamma}} \]

如果两个信息源不相关,那么 \(\mathrm{IC}_{合并}^2=2 \ \mathrm{IC}^2\)

假设3 \(\mathrm{BR}\) 个主动赌注中的每一个都具有相同的能力。

信息模型

以业绩基准为基础的超额收益率分解:

\[ \begin{aligned} & \boldsymbol{r}=\boldsymbol{\beta} \ r_B + \boldsymbol{\theta} \\ \quad \\ 其中, & \boldsymbol{\beta}=(\beta_1,\dots,\beta_N)^T \quad 资产相对业绩基准B的贝塔列向量 \\ & \boldsymbol{\theta}=(\theta_1,\dots,\theta_N)^T \quad 残差收益率列向量 \\ & r_B \quad 业绩基准的超额收益率 \end{aligned} \]

进而一步对残差收益率 \(\boldsymbol{\theta}\) 进行建模:

\[ \begin{aligned} & \boldsymbol{\theta}=\boldsymbol{A} \boldsymbol{x} \\ \quad \\ 其中, & \boldsymbol{x}=(x_1,\dots,x_N)^T \quad \mathrm{E}\{\boldsymbol{x}\}=\boldsymbol{0}_{N \times 1},\mathrm{Var}\{\boldsymbol{x}\}=\boldsymbol{I}_{N \times N} \\ & \boldsymbol{A}=(A_{i,j})_{N \times N} \quad \boldsymbol{r}的残差协方差矩阵的平方根矩阵 \\ & \mathrm{Var}\{\boldsymbol{\theta}\}=\boldsymbol{A}\boldsymbol{A}^T \end{aligned} \]

关于矩阵 \(\boldsymbol{A}\) ,有:

1) \(\boldsymbol{V}=\sigma_B^2 \ \boldsymbol{\beta} \ \boldsymbol{\beta}^T+\boldsymbol{A} \boldsymbol{A}^T\)

2) \(\boldsymbol{A}^T \boldsymbol{h}_B=0\) ,所以矩阵 \(\boldsymbol{A}\) 的秩为 \(N-1\)

3)当残差收益率之间互不相关时, \(\boldsymbol{A}\) 恰好是以残差风险为对角线元素的对角矩阵。

在更一般的情况下, \(\boldsymbol{A}\) 是从一组不相关的基础变量到相互关联的残差收益率变量的线性变换矩阵。

假如我们的信息以信号列向量 \(\boldsymbol{z}=(z_1,\dots,z_{\mathrm{BR}})^T\) 的形式到达。不失一般性,假设信号 \(\boldsymbol{z}\) 服从零均值、1标准差的联合正态分布,于是可将写成:

\[ \begin{aligned} & \boldsymbol{z}=\boldsymbol{E} \ \boldsymbol{y} \\ \quad \\ 其中, & \boldsymbol{y}=(y_1,\dots,y_{\mathrm{BR}})^T \quad \mathrm{E}\{\boldsymbol{y}\}=\boldsymbol{0}_{\mathrm{BR} \times 1},\mathrm{Var}\{\boldsymbol{y}\}=\boldsymbol{I}_{\mathrm{BR} \times \mathrm{BR}} \\ & \boldsymbol{E}=(E_{i,j})_{\mathrm{BR} \times \mathrm{BR}} \quad \boldsymbol{z}的协方差矩阵的平方根矩阵且可逆 \\ & \mathrm{Var}\{\boldsymbol{z}\}=\boldsymbol{E}\boldsymbol{E}^T \end{aligned} \]

\[ \begin{aligned} \boldsymbol{Q}&=\mathrm{Cov}\{\boldsymbol{\theta},\boldsymbol{z}\}=(\mathrm{Cov}\{\theta_i,z_j\})_{N \times \mathrm{BR}} \\ \boldsymbol{P}&=\mathrm{Corr}\{\boldsymbol{x},\boldsymbol{y}\}=(\mathrm{Corr}\{x_i,y_j\})_{N \times \mathrm{BR}}=\left(\dfrac{\mathrm{Cov}\{x_i,y_j\}}{\mathrm{Std}\{x_i\} \mathrm{Std}\{y_j\}}\right)_{N \times \mathrm{BR}} \\ &=(\mathrm{Cov}\{x_i,y_j\})_{N \times \mathrm{BR}}=\mathrm{Cov}\{\boldsymbol{x},\boldsymbol{y}\} \end{aligned} \]

于是有 \(\boldsymbol{Q}=\boldsymbol{A} \boldsymbol{P} \boldsymbol{E}^T\)

已知 \(\boldsymbol{z}\) 信号的情况下,残差收益率 \(\boldsymbol{\theta}\) 的条件均值列向量和条件协方差矩阵:

\[ \begin{aligned} \mathrm{E}\{\boldsymbol{\theta} | \boldsymbol{z}\}= \boldsymbol{A} \boldsymbol{P} \boldsymbol{E}^{-1} \boldsymbol{z} \overset{\Delta}{=} \boldsymbol{\alpha}(\boldsymbol{z})\\ \mathrm{Var}\{\boldsymbol{\theta} | \boldsymbol{z}\}=\boldsymbol{A}(\boldsymbol{I}-\boldsymbol{P}\boldsymbol{P}^T)\boldsymbol{A}^T\overset{\Delta}{=}\boldsymbol{G} \end{aligned} \]

【提示】1) \(\boldsymbol{\theta} = \boldsymbol{A} \boldsymbol{x} \sim \boldsymbol{A} \boldsymbol{P} \boldsymbol{y}=\boldsymbol{A} \boldsymbol{P} \boldsymbol{E}^{-1} \boldsymbol{z}\) ;2) \(\mathrm{E}\{\boldsymbol{A}\boldsymbol{x}|\boldsymbol{z}\}=\boldsymbol{A} \mathrm{E}\{\boldsymbol{x}|\boldsymbol{z}\}\) ;3) \(\mathrm{Var}\{\boldsymbol{\theta} | \boldsymbol{z}\}=\mathrm{E}\{(\boldsymbol{\theta}-\mathrm{E}\{\boldsymbol{\theta}|\boldsymbol{z}\})(\boldsymbol{\theta}-\mathrm{E}\{\boldsymbol{\theta}|\boldsymbol{z}\})^T\}\) .

注意:

1) \(\boldsymbol{\alpha}(\boldsymbol{z})\) 的无条件期望值为零;

2) \(\boldsymbol{\alpha}(\boldsymbol{z})\) 的无条件方差为 \(\mathrm{Var}\{\boldsymbol{\alpha}(\boldsymbol{z})\}=\boldsymbol{A}\boldsymbol{P}\boldsymbol{P}^T\boldsymbol{A}^T\)

3)残差收益率的条件协方差矩阵 \(\mathrm{Var}\{\boldsymbol{\theta} | \boldsymbol{z}\}\) 不依赖于 \(\boldsymbol{z}\)

目标

我们的目标是:给定信号 \(\boldsymbol{z}\) 的前提下,最大化附加值(忽略业绩基准择时),即求解如下优化问题(最优残差头寸 \(\boldsymbol{h}^*\) ):

\[ \begin{aligned} \mathrm{VA}(\boldsymbol{z}) =& \underset{\boldsymbol{h}=\boldsymbol{h}^*}{\max} \left\{\boldsymbol{h}^T \boldsymbol{\alpha}(\boldsymbol{z})-\lambda \boldsymbol{h}^T \boldsymbol{G} \boldsymbol{h} \right\} \\ s.t. & \boldsymbol{\beta}^T h =0 \end{aligned} \]

最优主动头寸

通过拉格朗日乘子法,容易求出最优残差头寸 \(\boldsymbol{h}^*\)

\[ \begin{aligned} \boldsymbol{h}^* &= \dfrac{1}{2\lambda} \left( \boldsymbol{G}^{-1} \boldsymbol{\alpha}(\boldsymbol{z})-\phi \ \boldsymbol{G}^{-1} \boldsymbol{\beta} \right) \\ \phi &= \dfrac{\boldsymbol{\beta}^T \boldsymbol{G}^{-1}\boldsymbol{\alpha}(\boldsymbol{z})}{\boldsymbol{\beta}^T \boldsymbol{G}^{-1}\boldsymbol{\beta}} \end{aligned} \]

信息率的严格计算

最优组合的阿尔法:

\[ \boldsymbol{h}^{*T}(\boldsymbol{z})\ \boldsymbol{\alpha}(\boldsymbol{z}) = \frac{1}{2\lambda}\left(\boldsymbol{\alpha}^T(\boldsymbol{z}) \boldsymbol{G}^{-1}\boldsymbol{\alpha}(\boldsymbol{z})-\frac{\left( \boldsymbol{\beta}^T \boldsymbol{G}^{-1}\boldsymbol{\alpha}(\boldsymbol{z}) \right)^2}{\boldsymbol{\beta}^T\boldsymbol{G}^{-1}\boldsymbol{\beta}} \right) \]

最优组合的残差方差:

\[ \boldsymbol{h}^{*T}(\boldsymbol{z})\ \boldsymbol{G}\ \boldsymbol{h}^{*}(\boldsymbol{z}) = \frac{1}{4 \lambda^2}\left(\boldsymbol{\alpha}^T(\boldsymbol{z}) \boldsymbol{G}^{-1}\boldsymbol{\alpha}(\boldsymbol{z})-\frac{\left( \boldsymbol{\beta}^T \boldsymbol{G}^{-1}\boldsymbol{\alpha}(\boldsymbol{z}) \right)^2}{\boldsymbol{\beta}^T\boldsymbol{G}^{-1}\boldsymbol{\beta}} \right) \]

于是信息率的平方:

\[ \begin{aligned} &\mathrm{IR}^2(\boldsymbol{z}) &=& \boldsymbol{\alpha}^T(\boldsymbol{z}) \boldsymbol{G}^{-1}\boldsymbol{\alpha}(\boldsymbol{z})-\dfrac{\left( \boldsymbol{\beta}^T \boldsymbol{G}^{-1}\boldsymbol{\alpha}(\boldsymbol{z}) \right)^2}{\boldsymbol{\beta}^T\boldsymbol{G}^{-1}\boldsymbol{\beta}} \\ & &=& \boldsymbol{y}^T \boldsymbol{P}^T \boldsymbol{D} \boldsymbol{P} \boldsymbol{y} - \dfrac{\boldsymbol{\beta}^T \left(\boldsymbol{A}^{-1}\right)^T \boldsymbol{D} \boldsymbol{P}\ \boldsymbol{y}\ \boldsymbol{y}^T \boldsymbol{P}^T \boldsymbol{D} \boldsymbol{A}^{-1}\boldsymbol{\beta}}{\boldsymbol{\beta}^T \left(\boldsymbol{A}^{-1}\right)^T \boldsymbol{D} \boldsymbol{A}^{-1}\boldsymbol{\beta}} \\ 其中,& \quad \quad \boldsymbol{D} &=& \left(\boldsymbol{I} - \boldsymbol{P} \boldsymbol{P}^T \right)^{-1} \\ & \quad \quad \boldsymbol{y} &=& \boldsymbol{E}^{-1} \boldsymbol{z} , \quad 相互独立的标准随机变量列向量 \end{aligned} \]

有了 \(\boldsymbol{z}\) 已知条件的信息率,进而可求出信息率平方的无条件期望值:

\[ \mathrm{IR}^2 = \mathrm{E}\{\mathrm{IR}^2(\boldsymbol{z})\} = \mathrm{Tr}\{\boldsymbol{P}^T \boldsymbol{D} \boldsymbol{P}\} - \dfrac{\boldsymbol{\beta}^T \left(\boldsymbol{A}^{-1}\right)^T \boldsymbol{D} \boldsymbol{D} \boldsymbol{A}^{-1}\boldsymbol{\beta}}{\boldsymbol{\beta}^T \left(\boldsymbol{A}^{-1}\right)^T \boldsymbol{D} \boldsymbol{A}^{-1}\boldsymbol{\beta}} + 1 \]

信息率的近似计算

首先将 \(\boldsymbol{D}\) 展开:

\[ \boldsymbol{D}=\left(\boldsymbol{I}-\boldsymbol{P}\boldsymbol{P}^T \right)^{-1}=\boldsymbol{I}+\left(\boldsymbol{P}\boldsymbol{P}^T\right)+\left(\boldsymbol{P}\boldsymbol{P}^T\boldsymbol{P}\boldsymbol{P}^T\right)+\left(\boldsymbol{P}\boldsymbol{P}^T\boldsymbol{P}\boldsymbol{P}^T\boldsymbol{P}\boldsymbol{P}^T\right)+\dots \]

进而有:

\[ \begin{aligned} \boldsymbol{P}^T \boldsymbol{D} \boldsymbol{P} &= \left(\boldsymbol{P}^T \boldsymbol{P}\right) + \left(\boldsymbol{P}^T \boldsymbol{P} \boldsymbol{P}^T \boldsymbol{P}\right) + \dots \\ \boldsymbol{D} \boldsymbol{D} &=\boldsymbol{I}+2 \left(\boldsymbol{P}\boldsymbol{P}^T\right)+3 \left(\boldsymbol{P}\boldsymbol{P}^T\boldsymbol{P}\boldsymbol{P}^T\right)+4 \left(\boldsymbol{P}\boldsymbol{P}^T\boldsymbol{P}\boldsymbol{P}^T\boldsymbol{P}\boldsymbol{P}^T\right)+\dots \end{aligned} \]

投资中遇到的相关系数通常非常接近零(最乐观也不超过 \(0.1\) ),所以:

\[ \begin{aligned} \boldsymbol{P}^T \boldsymbol{D} \boldsymbol{P} \approx \boldsymbol{P}^T \boldsymbol{P} \\ \boldsymbol{D} \boldsymbol{D} \approx \boldsymbol{D} \end{aligned} \]

这种近似意味着:忽略已知信息 \(z\) 对方差的降低。进而有信息率的近似计算:

\[ \mathrm{IR}^2 \approx \mathrm{Tr}\{\boldsymbol{P}^T \boldsymbol{P}\}=\sum_{i,j}{\rho_{i,j}^2} \]

\(\xi_j^2=\sum_i^N{\rho_{i,j}^2}\) ,于是有(同时展示了基本定律的可加性):

\[ \mathrm{IR}^2=\sum_j^{\mathrm{BR}}{\xi_j^2} \]

根据假设,所有信号都具有相同的价值,即:

\[ \xi_j^2=\rho^2=\mathrm{IC}^2 \]

最后就得到主动管理基本定律:

\[ \mathrm{IR}^2=\mathrm{BR}\ \mathrm{IC}^2 \]

其它

1)主动管理基本定律并非大数定律的投资学版本

证明过程表明,基本定律近似成立源自独立信息源和驱动残差收益率的独立变量之间相关系数很小;而大数定律近似成立,则源于大样本数。

类似的部分:更高的广度可充分分散残差风险;而大样本量可充分分散样本误差。

2)根据模拟阿尔法信号产生的最优组合和后验信息率与基本定律给出的预测值在统计上无法区分。

3)基本定律鼓励基金经理采用兼收并蓄的投资风格。