留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

基于非凸惩罚函数的高维协方差矩阵的建模

上一篇

下一篇

杨小卜. 基于非凸惩罚函数的高维协方差矩阵的建模[J]. 西南师范大学学报(自然科学版), 2023, 48(4): 13-22. doi: 10.13718/j.cnki.xsxb.2023.04.002
引用本文: 杨小卜. 基于非凸惩罚函数的高维协方差矩阵的建模[J]. 西南师范大学学报(自然科学版), 2023, 48(4): 13-22. doi: 10.13718/j.cnki.xsxb.2023.04.002
YANG Xiaobo. Modeling of High-dimensional Covariance Matrix Based on Non-convex Penalty Function[J]. Journal of Southwest China Normal University(Natural Science Edition), 2023, 48(4): 13-22. doi: 10.13718/j.cnki.xsxb.2023.04.002
Citation: YANG Xiaobo. Modeling of High-dimensional Covariance Matrix Based on Non-convex Penalty Function[J]. Journal of Southwest China Normal University(Natural Science Edition), 2023, 48(4): 13-22. doi: 10.13718/j.cnki.xsxb.2023.04.002

基于非凸惩罚函数的高维协方差矩阵的建模

  • 基金项目: 国家自然科学基金项目(71961013);甘肃省自然科学基金项目(20JR5RA204)
详细信息
    作者简介:

    杨小卜,硕士研究生,主要从事复杂数据的研究 .

  • 中图分类号: O212

Modeling of High-dimensional Covariance Matrix Based on Non-convex Penalty Function

  • 摘要: 近年来,随着金融数据爆炸式的增长与数据存储能力的提高,高维与高频金融数据的建模以及其在投资组合中的应用引起了人们广泛的关注. 本文聚焦于高维协方差矩阵的建模问题. 首先,基于VAR-LASSO模型引入SCAD惩罚函数与MCP惩罚函数替换LASSO惩罚函数,分别提出了VAR-SCAD模型与VAR-MCP模型. 其次,在理论层面证明了VAR-SCAD模型与VAR-MCP模型参数的Oracle性质,弥补了VAR-LASSO模型参数不满足Oracle性质这一缺点,提高了模型的估计精确性. 最后,通过实际频率为5分钟的高频股票数据,构建已实现协方差矩阵与投资组合进行实证分析. 通过实证分析可以发现,VAR-SCAD模型与VAR-MCP模型在测试精确性方面的表现要优于VAR-LASSO模型,VAR-SCAD模型与VAR-MCP模型构建的投资组合的收益率高于VAR-LASSO模型构建的投资组合,其中VAR-MCP模型构建的投资组合的收益率最高.
  • 加载中
  • 图 1  3种模型在不同h下的误差光滑曲线图

    图 2  3种模型在不同h下的小提琴图

    图 3  18种股票的相关性图

    表 1  3种模型的测试误差比较

    模型 h F AMaxE AMedE
    VAR-LASSO 1 26.925 0 0.958 6 0.016 9
    VAR-SCAD 27.036 8 0.952 3 0.016 8
    VAR-MCP 26.663 7 0.944 2 0.016 5
    VAR-LASSO 5 29.577 9 1.0249 0.005 5
    VAR-SCAD 29.599 3 0.963 3 0.002 3
    VAR-MCP 29.572 0 0.956 0 0.001 5
    VAR-LASSO 10 29.070 3 1.158 9 0.021 9
    VAR-SCAD 28.997 0 1.149 9 0.021 0
    VAR-MCP 28.754 7 1.146 3 0.020 5
    VAR-LASSO 20 27.992 8 1.056 7 0.016 0
    VAR-SCAD 27.503 8 1.041 3 0.013 9
    VAR-MCP 27.383 7 1.034 1 0.013 4
    下载: 导出CSV

    表 2  3种模型的投资组合的夏普比率

    VAR-LASSO VAR-SCAD VAR-MCP
    h=1 0.101 010 1 0.101 010 0 0.101 698 3
    h=10 0.101 003 9 0.101 037 2 0.102 079 6
    下载: 导出CSV
  • [1] ROTHMAN A J, LEVINA E, ZHU J. Generalized Thresholding of Large Covariance Matrices[J]. Journal of the American Statistical Association, 2009, 104(485): 177-186. doi: 10.1198/jasa.2009.0101
    [2] CAI T, LIU W D. Adaptive Thresholding for Sparse Covariance Matrix Estimation[J]. Journal of the American Statistical Association, 2011, 106(494): 672-684. doi: 10.1198/jasa.2011.tm10560
    [3] FAN J, FAN Y, LV J. High Dimensional Covariance Matrix Estimation Using a Factor Model[J]. Journal of Econometrics, 2008, 147(1): 186-197. doi: 10.1016/j.jeconom.2008.09.017
    [4] 陈钊, 范剑青, 王丹. 高维因子模型及其在统计机器学习中的应用[J]. 中国科学(数学), 2020, 50(4): 447-490. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JAXK202004001.htm
    [5] BOLLERSLEV T, ENGLE R F, WOOLDRIDGE J M. A Capital Asset Pricing Model with Time-Varying Covariances[J]. Journal of Political Economy, 1988, 96(1): 116-131. doi: 10.1086/261527
    [6] GOLOSNOY V, GRIBISCH B, LIESENFELD R. The Conditional Autoregressive Wishart Model for Multivariate Stock Market Volatility[J]. Journal of Econometrics, 2012, 167(1): 211-223. doi: 10.1016/j.jeconom.2011.11.004
    [7] CANDILA V. Multivariate Analysis of Cryptocurrencies[J]. Econometrics, 2021, 9(3): 28-28. doi: 10.3390/econometrics9030028
    [8] 周亮. 基于DCC-GARCH模型的协方差矩阵预测[J]. 统计与决策, 2021, 37(20): 35-38. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-TJJC202120008.htm
    [9] FLEMING J, KIRBY C, OSTDIEK B. The Economic Value of Volatility Timing Using "Realized" Volatility[J]. Journal of Financial Economics, 2003, 67(3): 473-509. doi: 10.1016/S0304-405X(02)00259-3
    [10] CALLOT L A F, KOCK A B, MEDEIROS M C. Modeling and Forecasting Large Realized Covariance Matrices and Portfolio Choice[J]. Journal of Applied Econometrics, 2017, 32(1): 140-158. doi: 10.1002/jae.2512
    [11] HAUTSCH N, KYJ L M, HAUTSCH N. A Blocking and Regularization Approach to High Dimensional Realized Covariance Estimation[J]. Journal of Applied Econometrics, 2012, 27(4): 625-645. doi: 10.1002/jae.1218
    [12] LUNDE A, SHEPHARD N, SHEPPARD K. Econometric Analysis of Vast Covariance Matrices Using Composite Realized Kernels and Their Application to Portfolio Choice[J]. Journal of Business & Economic Statistics, 2016, 34(4): 504-518.
    [13] TIBSHIRANI R. Regression Shrinkage and Selection Via the Lasso[J]. Journal of the Royal Statistical Society(Series B), 1996, 58(1): 267-288.
    [14] FAN J Q, LI R Z. Variable Selection Via Nonconcave Penalized Likelihood and Its Oracle Properties[J]. Journal of the American Statistical Association, 2001, 96(456): 1348-1360. doi: 10.1198/016214501753382273
    [15] ZHANG C H. Nearly Unbiased Variable Selection Under Minimax Concave Penalty[J]. The Annals of statistics, 2010, 38(2): 894-942.
    [16] 吴炜明, 王延新. 基于L曲线方法的Lasso正则化参数选择[J]. 西南师范大学学报(自然科学版), 2022, 47(1): 36-42. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xsxb.2022.01.006
    [17] BROCKWELL P J, DAVIS R A. Time Series: Theory and Methods[M]. New York: Springer-Verlag, 2015.
    [18] CALLOT L A F, KOCK A B. Oracle Efficient Estimation and Forecasting with the Adaptive Lasso and the Adaptive Group Lasso in Vector Autoregressions[J]. Essays in Nonlinear Time Series Econometrics, 2014, 2014: 238-268.
    [19] ZOU H, ZHANG H H. On the Adaptive Elastic-net with a Diverging Number of Parameters[J]. Annals of Statistics, 2009, 37(4): 1733-1751.
  • 加载中
图( 3) 表( 2)
计量
  • 文章访问数:  5246
  • HTML全文浏览数:  5246
  • PDF下载数:  250
  • 施引文献:  0
出版历程
  • 收稿日期:  2022-09-07
  • 刊出日期:  2023-04-20

基于非凸惩罚函数的高维协方差矩阵的建模

    作者简介: 杨小卜,硕士研究生,主要从事复杂数据的研究
  • 兰州财经大学 统计学院,兰州 730030
基金项目:  国家自然科学基金项目(71961013);甘肃省自然科学基金项目(20JR5RA204)

摘要: 近年来,随着金融数据爆炸式的增长与数据存储能力的提高,高维与高频金融数据的建模以及其在投资组合中的应用引起了人们广泛的关注. 本文聚焦于高维协方差矩阵的建模问题. 首先,基于VAR-LASSO模型引入SCAD惩罚函数与MCP惩罚函数替换LASSO惩罚函数,分别提出了VAR-SCAD模型与VAR-MCP模型. 其次,在理论层面证明了VAR-SCAD模型与VAR-MCP模型参数的Oracle性质,弥补了VAR-LASSO模型参数不满足Oracle性质这一缺点,提高了模型的估计精确性. 最后,通过实际频率为5分钟的高频股票数据,构建已实现协方差矩阵与投资组合进行实证分析. 通过实证分析可以发现,VAR-SCAD模型与VAR-MCP模型在测试精确性方面的表现要优于VAR-LASSO模型,VAR-SCAD模型与VAR-MCP模型构建的投资组合的收益率高于VAR-LASSO模型构建的投资组合,其中VAR-MCP模型构建的投资组合的收益率最高.

English Abstract

  • 随着信息技术的发展与数据可获取性的提高,金融资产的维度也随即呈现出爆炸增长的趋势. 金融资产维度的增加会给资产协方差矩阵的估计带来困难,甚至会导致病态协方差矩阵的产生. 而资产协方差矩阵又是投资组合理论的基础,其估计的精确与否最终会直接干扰与影响投资组合模型.

    为了对高维协方差矩阵进行精准的估计,学者们进行了许多相关的研究,主要的思想是对矩阵进行稀疏与降维处理. 如文献[1-2]通过引入不同的门限函数把总体协方差矩阵的一些非对角线元素替换为0,在保留对角线元素的基础上来避免维数诅咒. 文献[3-4]使用因子模型来降低数据维度,提升其估计效率. 上述2类方法虽然可以提升协方差矩阵的估计精确性,但没有从时间变化的角度去分析与研究协方差矩阵,没有将不同时间段的协方差矩阵看成是一组时间序列,也没有考虑因时间变化而产生的信息对于协方差矩阵估计的影响.

    文献[5]发现协方差矩阵随着时间的推移有着较强的自回归结构,并且发现预期收益与这一变化密切相关. 随着这一发现,学者们开始将时间序列的估计方法运用于协方差矩阵的估计中,如文献[6]提出的条件自回归威沙特(CAW)模型、文献[7]提出的结合DCC框架的双不对称GARCH-MIDAS模型、文献[8]提出的DCC-GARCH模型. 但上述模型所估计的协方差矩阵维度较低,没有考虑高维的情况. 此外,高频数据也逐渐成为近些年来的研究热点. 文献[9]的研究表明低频协方差矩阵转化为高频协方差矩阵的经济价值是巨大的,但是文中也只是讨论了低维资产配置的问题. 文献[10]提出了基于高频数据的高维协方差矩阵估计模型——VAR-LASSO模型,该模型在VAR模型的基础上,引入LASSO惩罚函数,对待估向量的参数进行稀疏处理,来提高模型估计的精确性. 通过实证分析发现,该模型的估计精确性明显优于传统的DCC模型与EWMA模型. 虽然VAR-LASSO模型可以估计高维协方差矩阵,但由于LASSO惩罚函数不满足Oracle性质,当面对较大的真实未知参数时,会产生较大的估计误差,导致参数估计为有偏估计.

    因此,本文拟借鉴文献[10]提出的VAR-LASSO方法,尝试对高维已实现协方差矩阵进行建模. 为了克服LASSO惩罚函数不满足Oracle性质的缺陷,将满足Oracle性质的SCAD惩罚函数与MCP惩罚函数引入VAR模型中,提出VAR-SCAD模型与VAR-MCP模型,并证明两种模型估计参数的Oracle性质. 最后用实际高频股票数据对高维已实现协方差矩阵进行建模,使用文献[11]提出的特征值替换方法来确保预测协方差矩阵的正定性,并对模型构建最小方差投资组合模型,探究其在实际投资组合中的应用.

  • 对于任意向量$\boldsymbol{x} \in \mathbb{R}^p$$\|\boldsymbol{x}\|=\sqrt{\sum\limits_{i=1}^p x_i^2}$$\|\boldsymbol{x}\|_{\iota_1}=\sum\limits_{i=1}^p\left|x_i\right|$分别表示向量xl2范数与l1范数. $\mathscr{A}=\left\{i: \boldsymbol{\beta}_i^* \neq \bf{0}\right\}$表示所有非零βi*i的集合,$|\mathscr{A}|$称为其基数.

  • 与传统的低频数据相比,高频数据会包含更为细致与丰富的数据信息,其估计值也更接近真实的协方差矩阵. 本文采用文献[12]提出的方法来构造已实现协方差矩阵(RCOV,简记为R). 假设一个投资组合具有n维资产,则其已实现协方差矩阵构造为

    已实现协方差矩阵的结构与一般的协方差矩阵相类似,其对角线元素为方差项,非对角线元素为协方差项. Rijt的具体构造方法可以参见文献[12],后文中记RtΣtRCOV.

  • ΣtRCOV表示t时刻n维资产的已实现协方差矩阵,定义yt=vech(ΣtRCOV)为矩阵拉直算子,返回一个长度为$k=\frac{n(n+1)}{2}$的向量,其元素为ΣtRCOV的上三角或下三角元素,ΣtRCOV的自回归模型为

    其中Φi*为一个k×k维的参数矩阵,εt~N(0,Σ)且相互独立,p表示VAR模型的滞后阶数.

    观察(1)式可以发现,自回归模型中的待估参数的个数kn2的速度增加,会产生大量的待估参数,导致最小二乘估计惩罚函数的精确度大幅度下降. 为了解决这一问题,文献[11]使用文献[13]提出的LASSO惩罚函数来提升估计的精确度. 为了方便模型的估计与计算,在使用LASSO惩罚函数之前,可以先对模型进行如下的改写:

    Zt=(yt-1T, …, yt-pT)Tkp×1维的解释变量所组成的向量,Z =(ZT,…,Z1)TT×kp维的协变量矩阵. yi=(yTi,…,y1,i)T(i=1,…,k)为第i个观测变量的T×1维向量,εi=(εTi,…,ε1,i)T是对应的误差向量. 定义y =(y1T,…,ykT)Tε =(ε1T,…,εkT)T,设$\boldsymbol{X}=\boldsymbol{I}_N \otimes \boldsymbol{Z}$,则(1)式可以改写为

    变换模型之后,引入LASSO惩罚函数,该惩罚函数不但可以将不重要的参数压缩为0,同时还可以同步进行特征选择,实现数据的降维. 文献[10]中模型(1)的参数β*通过最小化

    进行估计.

  • 为了改进LASSO惩罚函数不满足Oracle性质的缺点,本文使用满足无偏性的MCP惩罚函数与SCAD惩罚函数来对VAR-LASSO模型进行改进.

  • 文献[14]基于LASSO惩罚函数不满足Oracle性质提出了如下的SCAD惩罚函数:

    其中a>2,λT≥0. 为了更进一步了解其惩罚的背后含义,可以对(4)式求导,得

    可以发现,当|βi|≤λT时,SCAD惩罚函数与LASSO惩罚函数拥有相同的惩罚力度,但是随着|βi|的增加,SCAD惩罚函数的惩罚力度会逐渐降低,当|βi|>T时,惩罚力度降为0,这保证了较大的| β |不会被过度地惩罚,确保了较大参数估计的无偏性.

    文献[15]提出的MCP惩罚函数也同样满足Oracle性质,且在处理特征之间有很高相关性数据时,表现要比SCAD惩罚函数更好. MCP惩罚函数的惩罚项为

    其中a>1,λT≥0.

    MCP惩罚函数与SCAD惩罚函数的惩罚逻辑类似,随着|βi|的增加,惩罚力度会逐渐地降低到0.

  • 在VAR-LASSO模型的基础上,将(3)式中的λTβil1项代换为(4)式,则VAR-SCAD模型的参数可通过如下函数估计:

    将(6)式代换为(3)式中的λTβil1项,可以得出VAR-MCP模型的参数估计函数为

    在(8)式与(9)式中,还有未知的参数a需要进行估计. 不同参数a的取值会直接影响(8)式与(9)式的估计性能. 对于(8)式中的参数a,文献[14]通过蒙特卡洛模拟得出a的最优值约等于3. 7,(9)式的a在实际的使用中通常默认为3. 通常使用CV法、L曲线法[16]、AIC信息准则等方法对λT进行估计,本文使用CV法进行估计.

  • 为了后续估计参数Oracle性质的证明,先给出如下4个正则条件:

    1) εi,1具有有限四阶矩,i=1,…,k

    2) $\boldsymbol{C}=E\left(\frac{1}{T} \boldsymbol{Z}^{\mathrm{T}} \boldsymbol{Z}\right)$是正定矩阵;

    3) 当T→∞时,$\sqrt{T} \lambda_T \rightarrow \infty$λT→0;

    4) 当T→∞时,$\frac{2 \boldsymbol{x}_i^{\mathrm{T}} \boldsymbol{\varepsilon}}{\sqrt{T}}$$\frac{2 \boldsymbol{x}_i^{\mathrm{T}} \boldsymbol{X}}{T}$均有界.

    定理1  在条件1)-4)成立的情况下,当T→∞时,VAR-SCAD模型的估计参数满足如下性质:

    (ⅰ) $P\left(\hat{\boldsymbol{\beta}}_{\mathscr{A}c}=\bf{0}\right) \rightarrow 1$

    (ⅱ) $\sqrt{T}\left(\hat{\boldsymbol{\beta}}_\mathscr{A}-\boldsymbol{\beta}_\mathscr{A}^*\right) \underset{d}{\rightarrow} N\left(\boldsymbol{0},\left[\left(\boldsymbol{I}_k \otimes \boldsymbol{C}\right)_\mathscr{A}\right]^{-1}[\mathit{\pmb{\Sigma}} \otimes \boldsymbol{C}]_\mathscr{A}\left[\left(\boldsymbol{I}_k \otimes \boldsymbol{C}\right)_\mathscr{A}\right]^{-1}\right)$.

      令$\boldsymbol{\beta}=\boldsymbol{\beta}^*+\frac{\boldsymbol{\mu}}{\sqrt{T}}$$\boldsymbol{\mu}=\left(\mu_1, \cdots, \mu_{k^2 p}\right)^{\mathrm{T}}$,则(9)式可以改写为

    $\widehat{\boldsymbol{\mu}}=\arg \min L(\boldsymbol{\mu})$,则可得$\hat{\boldsymbol{\beta}}=\boldsymbol{\beta}^*+\frac{\hat{\boldsymbol{\mu}}}{\sqrt{T}}$.

    定义

    由文献[17]中的定理11.2.1与文献[18]中第十章的定理1可得

    $\mathscr{T}=T \sum\limits_{i=1}^{k^2 p}\left(p_{\lambda, a}\left(\left|\beta_i^*+\frac{\mu_i}{\sqrt{T}}\right|\right)^{\mathrm{SCAD}}-p_{\lambda, a}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}}\right)$. 当T→∞时,对T使用中值定理,可得

    $\sum\limits_{i=1}^{k^2 p} \mathscr{T}_i=\sum\limits_{i=1}^{k^2 p} p_{\lambda, a}^{\prime}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}} \operatorname{sgn}\left(\beta_i^*\right) \mu_i$,展开$p_{\lambda, a}^{\prime}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}}$,则可得

    $\left|\beta_i^*\right| \geqslant a \lambda_T$时,$p_{\lambda, a}^{\prime}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}}=0$,则$\mathscr{T}_i=0$.

    $\lambda_T \leqslant\left|\beta_i^*\right|<a \lambda_T$时,由于λT→0,有$\left|\beta_i^*\right| \rightarrow 0$. 得出$p_{\lambda, a}^{\prime}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}}=0$,则$\mathscr{T}_i=0$.

    $0<\left|\beta_i^*\right| \leqslant \lambda_T$μi≠0时,$p_{\lambda, a}^{\prime}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}}=\operatorname{sgn}\left(\beta_i\right) \lambda_T$. 结合假设2)可得$\mathscr{T}_i=\infty$.

    $0<\left|\beta_i^*\right| \leqslant \lambda_T$μi=0时,可得$\mathscr{T}_i=0$.

    综上所述,由Slutsky定理可得

    由于VT(μ)是一个凸函数,且V(μ)有唯一最小值点$\left(\boldsymbol{I}_k \otimes \boldsymbol{C}\right)^{-1} \boldsymbol{w}$,可得

    又因为$\widehat{\boldsymbol{\beta}}=\boldsymbol{\beta}^*+\frac{\hat{\boldsymbol{\mu}}}{\sqrt{T}}$,可得$\hat{\boldsymbol{\mu}}=\sqrt{T}\left(\hat{\boldsymbol{\beta}}-\boldsymbol{\beta}^*\right) \in O_p(1)$,则

    定理1(ⅱ)得证,下面证明定理1(ⅰ).

    假定对于$i \in \mathscr{A}^c, \hat {\beta_i} \neq 0$,由(9)式可得

    $\left|\hat{\beta}_i\right| \geqslant a \lambda_T$时,$p_{\lambda, a}^{\prime}\left(\left|\hat{\beta}_i\right|\right)^{\mathrm{SCAD}}=0$,则

    由假设4)可得

    $0<\left|\hat{\beta}_i\right| \leqslant \lambda_T$时,$p_{\lambda, a}^{\prime}\left(\left|\hat{\beta}_i\right|\right)^{\mathrm{SCAD}}=\operatorname{sgn}\left(\widehat{\beta}_i\right) \lambda_T$,则

    $\lambda_T \leqslant\left|\hat{\beta}_i\right|<a \lambda_T$时,有

    综上所述,可以得

    定理2  在条件1)-4)成立的情况下,当T→∞时,VAR-MCP模型的估计参数满足如下性质:

    (ⅰ) $P\left(\widehat{\boldsymbol{\beta}}_{\mathscr{A} c}=\bf{0}\right) \rightarrow 1$

    (ⅱ) $\sqrt{T}\left(\hat{\boldsymbol{\beta}}_\mathscr{A}-\boldsymbol{\beta}_\mathscr{A}^*\right) \underset{d}{\rightarrow} N\left(\boldsymbol{0}, \left[\left(\boldsymbol{I}_k \otimes \boldsymbol{C}\right)_\mathscr{A}\right]^{-1}[\mathit{\pmb{\Sigma}} \otimes \boldsymbol{C}]_\mathscr{A} \left[\left(\boldsymbol{I}_k \otimes \boldsymbol{C}\right)_\mathscr{A}\right]^{-1}\right)$.

    定理2的证明过程与定理1类似,区别在于两种模型的惩罚项,结合定理1的证明过程可得证定理2.

  • 选取标普500指数中的18只成分股进行实证分析研究. 为了使选取的股票具有一定的波动性,同时没有明显的牛熊趋势,选取区间为2011年6月1日到2013年6月3日,共有504个股票交易日. 使用上文提到的RCOV方法,在股票交易时间内,每5分钟获得一次对数交易价格,并构建已实现协方差矩阵,一共可以得到504个已实现协方差矩阵. 并对504个已实现协方差矩阵进行数据清洗. 具体方法如下:对任意的一个已实现协方差矩阵,如果其中某一个元素的值大于其本身所在矩阵所有元素均值的正负3倍,则对该元素与该元素所在矩阵进行标记;如果某一已实现协方差矩阵有30%以上的元素被标记,则删除这个被标记的矩阵,用其相邻5个未被标记的矩阵的均值来代替这个被标记矩阵. 条件1)中$\mathit{\pmb{\varepsilon}}=\mathit{\pmb{y}}-\widehat{\mathit{\pmb{y}}}$,因为使用股票收盘价数据,所以模型误差项不会出现无穷的情况,结合后文的表 1也可以得到这样的结果,从而具有有限四阶矩. 对于条件2),因为选用实际的股票数据不会有任意两种股票的收益率在504个交易日内完全一样,这导致股票之间的协变量是非线性相关的,从而使得矩阵ZTZ中没有共线的行与列,所以C正定.

  • $\hat{\boldsymbol{e}}_{T+h}=\operatorname{vech}\left(\hat{\boldsymbol{\mathit{\pmb{\Sigma}}}}_{T+h}-\boldsymbol{\mathit{\pmb{\Sigma}}}_{T+h}\right)$$\hat{\boldsymbol{\mathit{\pmb{\Sigma}}}}_{T+h}^v$$\hat{\boldsymbol{e}}_{T+h}$按行组成的矩阵,其中h≥1为向后预测的区间长度,在实证分析中将h分别设置为1,5,10,20,以研究h对模型测试精度的影响. T1T2分别为测试开始与结束的时间. 在对比3种模型的测试精度时,采用l2测试误差(l2)、平均最大绝对误差(AMaxE)、F范数(F)与平均测试误差中位数(AMedE)这4种指标.

    上述4种指标越小,代表模型的估计精确度越高,l2测试误差对比如图 1图 2所示.

    将清洗后的数据划分为训练集与测试集两个部分,其中训练集404天,测试集100天. 在VAR模型的拟合中,默认VAR模型的滞后阶数为1.

    观察表 1可得,VAR-LASSO模型在h=1,5的情况下,F范数(F)分别为26.925 0,29.577 9,而VAR-SCAD模型仅为27.036 8,29.599 3,VAR-LASSO模型的表现要优于VAR-SCAD模型. 但在平均最大绝对误差(AMaxE)与平均测试误差中位数(AMedE)这两项指标上,VAR-LASSO模型均最大,表现逊色于VAR-MCP模型与VAR-SCAD模型. 当h=10,20时,VAR-LASSO模型的F范数(F)分别为29.070 3与27.992 8,拥有3种模型中最差的测试精度. 虽然VAR-SCAD模型在h=1,5时,从指标F范数(F)来看,VAR-SCAD模型的优势相较于VAR-LASSO模型不明显,但是h=10,20时,从表 1的3种指标来看,VAR-SCAD模型的测试精确度仅次于VAR-MCP模型. 无论h取何值,VAR-MCP模型均拥有最优的估计精确性,3种评价指标均最小.

    更为直观的信息可以从图 1图 2中获得. 观察图 1可以发现,当h=1时,3种模型的测试误差差异不大,VAR-LASSO模型与VAR-SCAD模型在前期的测试误差几乎重合,VAR-MCP模型的测试误差与其误差曲线都明显较低,在测试的后期,3种模型的测试误差十分贴近,3条线几乎重合. h=5,10时,3种模型的测试误差光滑曲线走势相同,在测试前期,VAR-MCP模型与VAR-SCAD模型的测试误差点与其误差曲线较低,但当T=50时,VAR-LASSO模型的表现反而会优于VAR-MCP模型与VAR-SCAD模型. 当h=20时,可以明显看出VAR-MCP模型与VAR-SCAD模型的测试误差要小于VAR-LASSO模型. 不同h情况下的3种模型的测试误差光滑曲线走势大致相同,都是在测试前期误差较大,测试中期误差会逐渐减小,到了测试后期,误差又会慢慢增大.

    图 2是小提琴图,图形内部是一个箱线图,箱线图外部颜色的宽度代表着数值分布的密集程度. 由图 2可知,相较于VAR-LASSO模型,VAR-MCP模型的异常值较小且集中. VAR-SCAD模型在h=1,5时,异常值的大小与分布与VAR-LASSO模型类似,而当h=10,20时,VAR-SCAD模型的异常值的大小与分布和VAR-MCP模型类似. 同时也可以发现,当h=20时,VAR-LASSO模型的上四分位数偏大,说明VAR-LASSO模型较大测试误差值的数量要多于VAR-SCAD模型与VAR-MCP模型. VAR-SCAD模型与VAR-MCP模型的小提琴图的底部相较于VAR-LASSO模型来说更为圆润与宽大,表明这两种模型的测试误差分布相对集中,模型也更为稳健.

    综上所述,相较于VAR-LASSO模型,VAR-SCAD模型与VAR-MCP模型的测试精确性有着明显的提升,VAR-SCAD模型与VAR-MCP模型的稳健性也要优于VAR-LASSO模型. VAR-SCAD模型在h较大的情况下表现较好,VAR-MCP模型全局表现最优.

  • 文献[19]研究指出,在变量具有相关性的情况下,SCAD惩罚函数的表现会不如LASSO惩罚函数,下面从股票相关性角度分析VAR-SCAD模型表现不佳的原因.

    图 3中间为股票名,上三角单元格饼图的填充程度代表相关系数的大小,下三角单元格为相关系数热力图. 18支股票的最低相关度为0.16,51%的股票之间的相关性要高于0.5,这导致VAR-SCAD模型的参数虽然具有Oracle性质,但测试精确性在h较小的情况下不如VAR-LASSO模型,更不如可以较好处理相关性数据的VAR-MCP模型,这也与文献[19]的研究结果保持一致.

  • 采用上文18种股票的已实现协方差矩阵构建均值—方差投资组合模型. 选取100个已实现协方差矩阵进行投资组合模型的模拟研究,在投资组合分析中,将h分别设置为1与10.

    假定股票交易中没有手续费的产生,无风险收益为0. 投资组合模型的表达式为

    其中1为元素均为1的向量,q是投资组合所需的预期回报率,wt+1是投资组合中股票的权重,$\hat{\boldsymbol{\mu}}_{t+1}$为资产的期望收益率向量,其值通过50天移动平均取得.

    基于VAR模型的3种模型在估计过程中都没有考虑到$\hat{\mathit{\pmb{\Sigma}}}_T$矩阵的正定性,会导致投资组合模型求解中出现病态协方差矩阵,干扰最优权重wt+1的求解. 为了确保$\hat{\mathit{\pmb{\Sigma}}}_T$的正定性,需要对$\hat{\mathit{\pmb{\Sigma}}}_T$采用文献[11]提出的特征值替换方法对特征值λ≤0的矩阵进行正定化处理. 首先对$\hat{\mathit{\pmb{\Sigma}}}_T$进行谱分解:$\hat{\mathit{\pmb{\Sigma}}}_T=\hat{\boldsymbol{V}}_T^{\mathrm{T}} \hat{\mathit{\pmb{\Lambda}}}_T \hat{\boldsymbol{V}}_T$,其中$\hat {\mathit{\pmb{\Lambda}}_T}$为对角线元素为特征值的对角矩阵,$\hat{\lambda}_{i T}$为其对角线元素. 最后设$\hat{\lambda}_{m T}=\min \left\{\hat{\lambda}_{i T} \mid \hat{\lambda}_{i T}>0\right\}$λmT$\hat {\mathit{\pmb{\Lambda}}_T}$中最小的非负特征值. 对于满足$\hat{\lambda}_{i T}<\lambda_{m T}$的特征值,均用λmT代替,特征值替换后的对角矩阵用$\stackrel{\vee}{\mathit{\pmb{\Lambda}}}$表示,则正定处理后的协方差矩阵$\hat{\mathit{\pmb{\Sigma}}}_T$记为$\stackrel{\vee}{\mathit{\pmb{\Sigma}}_T}=\hat{\boldsymbol{V}}_T^{\mathrm{T}} \stackrel{\vee}{\mathit{\pmb{\Lambda}}_T} \hat{\boldsymbol{V}}_T$.

    为了对比3种模型构建的投资组合模型的绩效,选用夏普比率(SP)这一指标对投资组合模型进行评价. 夏普比率表示单位风险所带来的收益,夏普比率值越大表示投资组合的收益越好.

    通过表 2可以发现,在各种情况之下,VAR-MCP模型构建的投资组合均拥有最大的夏普比率. 在h=1时,VAR-LASSO模型构建的投资组合的夏普比率为0. 101 010 1,仅略大于VAR-SCAD模型构建的投资组合的夏普比率. 当h=10时,VAR-SCAD模型构建的投资组合的夏普比率为0. 101 037 2,略小于VAR-MCP模型构建的投资组合的夏普比率0. 102 079 6,此时VAR-LASSO模型构建的投资组合的表现最差,拥有最小的夏普比率0. 101 003 9.

  • 随着信息技术的发展与数据可获取性的提高,金融数据的维度与频率都呈现出快速增长的趋势. 基于高频金融数据,本文在VAR-LASSO模型的基础上,将非凸惩罚函数即MCP惩罚函数与SCAD惩罚函数引入VAR-LASSO模型,得到了新的VAR-SCAD模型与VAR-MCP模型,并证明了VAR-SCAD模型与VAR-MCP模型估计参数的Oracle性质. 使用VAR-SCAD模型与VAR-MCP模型对高维已实现协方差矩阵进行建模,通过高频股票数据的实证研究,发现将SCAD惩罚函数与MCP惩罚函数引入VAR模型后,较好地克服了LASSO惩罚函数面对较大真实未知参数会产生较大估计误差的缺点,VAR-MCP模型在不同h的情况下均拥有最小的测试误差. VAR-SCAD模型在h较大的情况下表现优于VAR-LASSO模型,但在h较小的情况下,因为股票数据之间的高相关性,VAR-SCAD模型的表现不如VAR-LASSO模型.

    最后通过构建均值—方差投资组合模型可以发现,VAR-MCP模型构建的投资组合可以为投资人带来最高的经济收益. VAR-SCAD模型构造的投资组合在h较大的情况下,表现仅次于VAR-MCP模型构造的投资组合.

参考文献 (19)

目录

/

返回文章
返回