基于非凸惩罚函数的高维协方差矩阵的建模

杨小卜

doi:10.13718/j.cnki.xsxb.2023.04.002

基于非凸惩罚函数的高维协方差矩阵的建模

杨小卜

兰州财经大学统计学院，兰州 730030

基金项目: 国家自然科学基金项目(71961013);甘肃省自然科学基金项目(20JR5RA204)

详细信息

作者简介:
杨小卜，硕士研究生，主要从事复杂数据的研究 .

中图分类号: O212

Modeling of High-dimensional Covariance Matrix Based on Non-convex Penalty Function

YANG Xiaobo

School of Statistics, Lanzhou University of Finance and Economics, Lanzhou 730030, China

摘要: 近年来，随着金融数据爆炸式的增长与数据存储能力的提高，高维与高频金融数据的建模以及其在投资组合中的应用引起了人们广泛的关注. 本文聚焦于高维协方差矩阵的建模问题. 首先，基于VAR-LASSO模型引入SCAD惩罚函数与MCP惩罚函数替换LASSO惩罚函数，分别提出了VAR-SCAD模型与VAR-MCP模型. 其次，在理论层面证明了VAR-SCAD模型与VAR-MCP模型参数的Oracle性质，弥补了VAR-LASSO模型参数不满足Oracle性质这一缺点，提高了模型的估计精确性. 最后，通过实际频率为5分钟的高频股票数据，构建已实现协方差矩阵与投资组合进行实证分析. 通过实证分析可以发现，VAR-SCAD模型与VAR-MCP模型在测试精确性方面的表现要优于VAR-LASSO模型，VAR-SCAD模型与VAR-MCP模型构建的投资组合的收益率高于VAR-LASSO模型构建的投资组合，其中VAR-MCP模型构建的投资组合的收益率最高.
- 高频数据 /
- 高维已实现协方差矩阵 /
- VAR-SCAD模型 /
- VAR-MCP模型
Abstract: In recent years, with the explosive growth of financial data and the improvement of data storage capacity, the modeling of high-dimensional and high-frequency financial data and its application in investment portfolios have attracted a lot of attention. This paper focuses on the modeling problem of high-dimensional covariance matrix. Firstly, this paper introduces the SCAD penalty function and MCP penalty function to replace the LASSO penalty function based on the VAR-LASSO model, and proposes the VAR-SCAD model and the VAR-MCP model, respectively. Secondly, the Oracle property of the parameters of the VAR-SCAD model and VAR-MCP model is proved at the theoretical level to compensate for the shortcoming that the parameters of the VAR-LASSO model do not satisfy the Oracle property and to improve the estimation accuracy of the models. Finally, the realized covariance matrix is constructed from the actual frequency of 5-minute high-frequency stock data and the portfolio is analyzed empirically. The empirical analysis reveals that the VAR-SCAD model and the VAR-MCP model perform better than the VAR-LASSO model in terms of test accuracy, and the returns of the portfolios constructed by the VAR-SCAD model and the VAR-MCP model are higher than those of the portfolios constructed by the VAR-LASSO model, with the returns of the portfolios constructed by the VAR-MCP model highest.
- high-frequency data /
- high-dimensional realized covariance matrix /
- VAR-SCAD model /
- VAR-MCP model .

图 1 3种模型在不同h下的误差光滑曲线图

下载: 全尺寸图片幻灯片

图 2 3种模型在不同h下的小提琴图

下载: 全尺寸图片幻灯片

图 3 18种股票的相关性图

下载: 全尺寸图片幻灯片

表 1 3种模型的测试误差比较

模型	h	F	AMaxE	AMedE
VAR-LASSO	1	26.925 0	0.958 6	0.016 9
VAR-SCAD		27.036 8	0.952 3	0.016 8
VAR-MCP		26.663 7	0.944 2	0.016 5

VAR-LASSO	5	29.577 9	1.0249	0.005 5
VAR-SCAD		29.599 3	0.963 3	0.002 3
VAR-MCP		29.572 0	0.956 0	0.001 5

VAR-LASSO	10	29.070 3	1.158 9	0.021 9
VAR-SCAD		28.997 0	1.149 9	0.021 0
VAR-MCP		28.754 7	1.146 3	0.020 5

VAR-LASSO	20	27.992 8	1.056 7	0.016 0
VAR-SCAD		27.503 8	1.041 3	0.013 9
VAR-MCP		27.383 7	1.034 1	0.013 4

下载: 导出CSV

表 2 3种模型的投资组合的夏普比率

	VAR-LASSO	VAR-SCAD	VAR-MCP
h=1	0.101 010 1	0.101 010 0	0.101 698 3
h=10	0.101 003 9	0.101 037 2	0.102 079 6

下载: 导出CSV

[1]	ROTHMAN A J, LEVINA E, ZHU J. Generalized Thresholding of Large Covariance Matrices[J]. Journal of the American Statistical Association, 2009, 104(485): 177-186. doi: 10.1198/jasa.2009.0101
[2]	CAI T, LIU W D. Adaptive Thresholding for Sparse Covariance Matrix Estimation[J]. Journal of the American Statistical Association, 2011, 106(494): 672-684. doi: 10.1198/jasa.2011.tm10560
[3]	FAN J, FAN Y, LV J. High Dimensional Covariance Matrix Estimation Using a Factor Model[J]. Journal of Econometrics, 2008, 147(1): 186-197. doi: 10.1016/j.jeconom.2008.09.017
[4]	陈钊, 范剑青, 王丹. 高维因子模型及其在统计机器学习中的应用[J]. 中国科学(数学), 2020, 50(4): 447-490. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JAXK202004001.htm
[5]	BOLLERSLEV T, ENGLE R F, WOOLDRIDGE J M. A Capital Asset Pricing Model with Time-Varying Covariances[J]. Journal of Political Economy, 1988, 96(1): 116-131. doi: 10.1086/261527
[6]	GOLOSNOY V, GRIBISCH B, LIESENFELD R. The Conditional Autoregressive Wishart Model for Multivariate Stock Market Volatility[J]. Journal of Econometrics, 2012, 167(1): 211-223. doi: 10.1016/j.jeconom.2011.11.004
[7]	CANDILA V. Multivariate Analysis of Cryptocurrencies[J]. Econometrics, 2021, 9(3): 28-28. doi: 10.3390/econometrics9030028
[8]	周亮. 基于DCC-GARCH模型的协方差矩阵预测[J]. 统计与决策, 2021, 37(20): 35-38. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-TJJC202120008.htm
[9]	FLEMING J, KIRBY C, OSTDIEK B. The Economic Value of Volatility Timing Using "Realized" Volatility[J]. Journal of Financial Economics, 2003, 67(3): 473-509. doi: 10.1016/S0304-405X(02)00259-3
[10]	CALLOT L A F, KOCK A B, MEDEIROS M C. Modeling and Forecasting Large Realized Covariance Matrices and Portfolio Choice[J]. Journal of Applied Econometrics, 2017, 32(1): 140-158. doi: 10.1002/jae.2512
[11]	HAUTSCH N, KYJ L M, HAUTSCH N. A Blocking and Regularization Approach to High Dimensional Realized Covariance Estimation[J]. Journal of Applied Econometrics, 2012, 27(4): 625-645. doi: 10.1002/jae.1218
[12]	LUNDE A, SHEPHARD N, SHEPPARD K. Econometric Analysis of Vast Covariance Matrices Using Composite Realized Kernels and Their Application to Portfolio Choice[J]. Journal of Business & Economic Statistics, 2016, 34(4): 504-518.
[13]	TIBSHIRANI R. Regression Shrinkage and Selection Via the Lasso[J]. Journal of the Royal Statistical Society(Series B), 1996, 58(1): 267-288.
[14]	FAN J Q, LI R Z. Variable Selection Via Nonconcave Penalized Likelihood and Its Oracle Properties[J]. Journal of the American Statistical Association, 2001, 96(456): 1348-1360. doi: 10.1198/016214501753382273
[15]	ZHANG C H. Nearly Unbiased Variable Selection Under Minimax Concave Penalty[J]. The Annals of statistics, 2010, 38(2): 894-942.
[16]	吴炜明, 王延新. 基于L曲线方法的Lasso正则化参数选择[J]. 西南师范大学学报(自然科学版), 2022, 47(1): 36-42. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xsxb.2022.01.006
[17]	BROCKWELL P J, DAVIS R A. Time Series: Theory and Methods[M]. New York: Springer-Verlag, 2015.
[18]	CALLOT L A F, KOCK A B. Oracle Efficient Estimation and Forecasting with the Adaptive Lasso and the Adaptive Group Lasso in Vector Autoregressions[J]. Essays in Nonlinear Time Series Econometrics, 2014, 2014: 238-268.
[19]	ZOU H, ZHANG H H. On the Adaptive Elastic-net with a Diverging Number of Parameters[J]. Annals of Statistics, 2009, 37(4): 1733-1751.

图( 3) 表( 2)

计量

文章访问数: 5246
HTML全文浏览数: 5246
PDF下载数: 250
施引文献: 0

全文HTML

随着信息技术的发展与数据可获取性的提高，金融资产的维度也随即呈现出爆炸增长的趋势. 金融资产维度的增加会给资产协方差矩阵的估计带来困难，甚至会导致病态协方差矩阵的产生. 而资产协方差矩阵又是投资组合理论的基础，其估计的精确与否最终会直接干扰与影响投资组合模型.

为了对高维协方差矩阵进行精准的估计，学者们进行了许多相关的研究，主要的思想是对矩阵进行稀疏与降维处理. 如文献[1-2]通过引入不同的门限函数把总体协方差矩阵的一些非对角线元素替换为0，在保留对角线元素的基础上来避免维数诅咒. 文献[3-4]使用因子模型来降低数据维度，提升其估计效率. 上述2类方法虽然可以提升协方差矩阵的估计精确性，但没有从时间变化的角度去分析与研究协方差矩阵，没有将不同时间段的协方差矩阵看成是一组时间序列，也没有考虑因时间变化而产生的信息对于协方差矩阵估计的影响.

文献[5]发现协方差矩阵随着时间的推移有着较强的自回归结构，并且发现预期收益与这一变化密切相关. 随着这一发现，学者们开始将时间序列的估计方法运用于协方差矩阵的估计中，如文献[6]提出的条件自回归威沙特(CAW)模型、文献[7]提出的结合DCC框架的双不对称GARCH-MIDAS模型、文献[8]提出的DCC-GARCH模型. 但上述模型所估计的协方差矩阵维度较低，没有考虑高维的情况. 此外，高频数据也逐渐成为近些年来的研究热点. 文献[9]的研究表明低频协方差矩阵转化为高频协方差矩阵的经济价值是巨大的，但是文中也只是讨论了低维资产配置的问题. 文献[10]提出了基于高频数据的高维协方差矩阵估计模型——VAR-LASSO模型，该模型在VAR模型的基础上，引入LASSO惩罚函数，对待估向量的参数进行稀疏处理，来提高模型估计的精确性. 通过实证分析发现，该模型的估计精确性明显优于传统的DCC模型与EWMA模型. 虽然VAR-LASSO模型可以估计高维协方差矩阵，但由于LASSO惩罚函数不满足Oracle性质，当面对较大的真实未知参数时，会产生较大的估计误差，导致参数估计为有偏估计.

因此，本文拟借鉴文献[10]提出的VAR-LASSO方法，尝试对高维已实现协方差矩阵进行建模. 为了克服LASSO惩罚函数不满足Oracle性质的缺陷，将满足Oracle性质的SCAD惩罚函数与MCP惩罚函数引入VAR模型中，提出VAR-SCAD模型与VAR-MCP模型，并证明两种模型估计参数的Oracle性质. 最后用实际高频股票数据对高维已实现协方差矩阵进行建模，使用文献[11]提出的特征值替换方法来确保预测协方差矩阵的正定性，并对模型构建最小方差投资组合模型，探究其在实际投资组合中的应用.

1. 模型构建

1.1. 符号

对于任意向量$\boldsymbol{x} \in \mathbb{R}^p$，$\|\boldsymbol{x}\|=\sqrt{\sum\limits_{i=1}^p x_i^2}$和$\|\boldsymbol{x}\|_{\iota_1}=\sum\limits_{i=1}^p\left|x_i\right|$分别表示向量x的l₂范数与l₁范数. $\mathscr{A}=\left\{i: \boldsymbol{\beta}_i^* \neq \bf{0}\right\}$表示所有非零β_i^*的i的集合，$|\mathscr{A}|$称为其基数.

1.2. 已实现协方差矩阵

与传统的低频数据相比，高频数据会包含更为细致与丰富的数据信息，其估计值也更接近真实的协方差矩阵. 本文采用文献[12]提出的方法来构造已实现协方差矩阵(RCOV，简记为R). 假设一个投资组合具有n维资产，则其已实现协方差矩阵构造为

已实现协方差矩阵的结构与一般的协方差矩阵相类似，其对角线元素为方差项，非对角线元素为协方差项. R_ijt的具体构造方法可以参见文献[12]，后文中记R_t为Σ_t^RCOV.

1.3. VAR-LASSO模型的构建

设Σ_t^RCOV表示t时刻n维资产的已实现协方差矩阵，定义y_t=vech(Σ_t^RCOV)为矩阵拉直算子，返回一个长度为$k=\frac{n(n+1)}{2}$的向量，其元素为Σ_t^RCOV的上三角或下三角元素，Σ_t^RCOV的自回归模型为

其中Φ_i^*为一个k×k维的参数矩阵，ε_t~N(0，Σ)且相互独立，p表示VAR模型的滞后阶数.

观察(1)式可以发现，自回归模型中的待估参数的个数k以n²的速度增加，会产生大量的待估参数，导致最小二乘估计惩罚函数的精确度大幅度下降. 为了解决这一问题，文献[11]使用文献[13]提出的LASSO惩罚函数来提升估计的精确度. 为了方便模型的估计与计算，在使用LASSO惩罚函数之前，可以先对模型进行如下的改写：

令Z_t=(y_t-1^T, …, y_t-p^T)^T为kp×1维的解释变量所组成的向量，Z =(Z_T，…，Z₁)^T为T×kp维的协变量矩阵. y_i=(y_T，i，…，y_1，i)^T(i=1，…，k)为第i个观测变量的T×1维向量，ε_i=(ε_T，i，…，ε_1，i)^T是对应的误差向量. 定义y =(y₁^T，…，y_k^T)^T，ε =(ε₁^T，…，ε_k^T)^T，设$\boldsymbol{X}=\boldsymbol{I}_N \otimes \boldsymbol{Z}$，则(1)式可以改写为

变换模型之后，引入LASSO惩罚函数，该惩罚函数不但可以将不重要的参数压缩为0，同时还可以同步进行特征选择，实现数据的降维. 文献[10]中模型(1)的参数β^*通过最小化

进行估计.

1.4. 新模型的提出

为了改进LASSO惩罚函数不满足Oracle性质的缺点，本文使用满足无偏性的MCP惩罚函数与SCAD惩罚函数来对VAR-LASSO模型进行改进.

1.4.1. SCAD惩罚函数与MCP惩罚函数

文献[14]基于LASSO惩罚函数不满足Oracle性质提出了如下的SCAD惩罚函数：

其中a>2，λ_T≥0. 为了更进一步了解其惩罚的背后含义，可以对(4)式求导，得

可以发现，当|β_i|≤λ_T时，SCAD惩罚函数与LASSO惩罚函数拥有相同的惩罚力度，但是随着|β_i|的增加，SCAD惩罚函数的惩罚力度会逐渐降低，当|β_i|>aλ_T时，惩罚力度降为0，这保证了较大的| β |不会被过度地惩罚，确保了较大参数估计的无偏性.

文献[15]提出的MCP惩罚函数也同样满足Oracle性质，且在处理特征之间有很高相关性数据时，表现要比SCAD惩罚函数更好. MCP惩罚函数的惩罚项为

其中a>1，λ_T≥0.

MCP惩罚函数与SCAD惩罚函数的惩罚逻辑类似，随着|β_i|的增加，惩罚力度会逐渐地降低到0.

1.4.2. VAR-SCAD模型与VAR-MCP模型

在VAR-LASSO模型的基础上，将(3)式中的λ_T‖β_i‖_l₁项代换为(4)式，则VAR-SCAD模型的参数可通过如下函数估计：

将(6)式代换为(3)式中的λ_T‖β_i‖_l₁项，可以得出VAR-MCP模型的参数估计函数为

在(8)式与(9)式中，还有未知的参数a需要进行估计. 不同参数a的取值会直接影响(8)式与(9)式的估计性能. 对于(8)式中的参数a，文献[14]通过蒙特卡洛模拟得出a的最优值约等于3. 7，(9)式的a在实际的使用中通常默认为3. 通常使用CV法、L曲线法^[16]、AIC信息准则等方法对λ_T进行估计，本文使用CV法进行估计.

1.4.3. VAR-SCAD模型与VAR-MCP模型估计参数的Oracle性质

为了后续估计参数Oracle性质的证明，先给出如下4个正则条件：

1) ε_i，1具有有限四阶矩，i=1，…，k；

2) $\boldsymbol{C}=E\left(\frac{1}{T} \boldsymbol{Z}^{\mathrm{T}} \boldsymbol{Z}\right)$是正定矩阵；

3) 当T→∞时，$\sqrt{T} \lambda_T \rightarrow \infty$且λ_T→0；

4) 当T→∞时，$\frac{2 \boldsymbol{x}_i^{\mathrm{T}} \boldsymbol{\varepsilon}}{\sqrt{T}}$与$\frac{2 \boldsymbol{x}_i^{\mathrm{T}} \boldsymbol{X}}{T}$均有界.

定理1  在条件1)-4)成立的情况下，当T→∞时，VAR-SCAD模型的估计参数满足如下性质：

(ⅰ) $P\left(\hat{\boldsymbol{\beta}}_{\mathscr{A}c}=\bf{0}\right) \rightarrow 1$；

(ⅱ) $\sqrt{T}\left(\hat{\boldsymbol{\beta}}_\mathscr{A}-\boldsymbol{\beta}_\mathscr{A}^*\right) \underset{d}{\rightarrow} N\left(\boldsymbol{0},\left[\left(\boldsymbol{I}_k \otimes \boldsymbol{C}\right)_\mathscr{A}\right]^{-1}[\mathit{\pmb{\Sigma}} \otimes \boldsymbol{C}]_\mathscr{A}\left[\left(\boldsymbol{I}_k \otimes \boldsymbol{C}\right)_\mathscr{A}\right]^{-1}\right)$.

证  令$\boldsymbol{\beta}=\boldsymbol{\beta}^*+\frac{\boldsymbol{\mu}}{\sqrt{T}}$且$\boldsymbol{\mu}=\left(\mu_1, \cdots, \mu_{k^2 p}\right)^{\mathrm{T}}$，则(9)式可以改写为

设$\widehat{\boldsymbol{\mu}}=\arg \min L(\boldsymbol{\mu})$，则可得$\hat{\boldsymbol{\beta}}=\boldsymbol{\beta}^*+\frac{\hat{\boldsymbol{\mu}}}{\sqrt{T}}$.

定义

由文献[17]中的定理11.2.1与文献[18]中第十章的定理1可得

则

记$\mathscr{T}=T \sum\limits_{i=1}^{k^2 p}\left(p_{\lambda, a}\left(\left|\beta_i^*+\frac{\mu_i}{\sqrt{T}}\right|\right)^{\mathrm{SCAD}}-p_{\lambda, a}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}}\right)$. 当T→∞时，对T使用中值定理，可得

令$\sum\limits_{i=1}^{k^2 p} \mathscr{T}_i=\sum\limits_{i=1}^{k^2 p} p_{\lambda, a}^{\prime}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}} \operatorname{sgn}\left(\beta_i^*\right) \mu_i$，展开$p_{\lambda, a}^{\prime}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}}$，则可得

当$\left|\beta_i^*\right| \geqslant a \lambda_T$时，$p_{\lambda, a}^{\prime}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}}=0$，则$\mathscr{T}_i=0$.

当$\lambda_T \leqslant\left|\beta_i^*\right|<a \lambda_T$时，由于λ_T→0，有$\left|\beta_i^*\right| \rightarrow 0$. 得出$p_{\lambda, a}^{\prime}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}}=0$，则$\mathscr{T}_i=0$.

当$0<\left|\beta_i^*\right| \leqslant \lambda_T$且μ_i≠0时，$p_{\lambda, a}^{\prime}\left(\left|\beta_i^*\right|\right)^{\mathrm{SCAD}}=\operatorname{sgn}\left(\beta_i\right) \lambda_T$. 结合假设2)可得$\mathscr{T}_i=\infty$.

当$0<\left|\beta_i^*\right| \leqslant \lambda_T$且μ_i=0时，可得$\mathscr{T}_i=0$.

综上所述，由Slutsky定理可得

由于V_T(μ)是一个凸函数，且V(μ)有唯一最小值点$\left(\boldsymbol{I}_k \otimes \boldsymbol{C}\right)^{-1} \boldsymbol{w}$，可得

又因为$\widehat{\boldsymbol{\beta}}=\boldsymbol{\beta}^*+\frac{\hat{\boldsymbol{\mu}}}{\sqrt{T}}$，可得$\hat{\boldsymbol{\mu}}=\sqrt{T}\left(\hat{\boldsymbol{\beta}}-\boldsymbol{\beta}^*\right) \in O_p(1)$，则

定理1(ⅱ)得证，下面证明定理1(ⅰ).

假定对于$i \in \mathscr{A}^c, \hat {\beta_i} \neq 0$，由(9)式可得

当$\left|\hat{\beta}_i\right| \geqslant a \lambda_T$时，$p_{\lambda, a}^{\prime}\left(\left|\hat{\beta}_i\right|\right)^{\mathrm{SCAD}}=0$，则

由假设4)可得

当$0<\left|\hat{\beta}_i\right| \leqslant \lambda_T$时，$p_{\lambda, a}^{\prime}\left(\left|\hat{\beta}_i\right|\right)^{\mathrm{SCAD}}=\operatorname{sgn}\left(\widehat{\beta}_i\right) \lambda_T$，则

当$\lambda_T \leqslant\left|\hat{\beta}_i\right|<a \lambda_T$时，有

综上所述，可以得

定理2  在条件1)-4)成立的情况下，当T→∞时，VAR-MCP模型的估计参数满足如下性质：

(ⅰ) $P\left(\widehat{\boldsymbol{\beta}}_{\mathscr{A} c}=\bf{0}\right) \rightarrow 1$；

(ⅱ) $\sqrt{T}\left(\hat{\boldsymbol{\beta}}_\mathscr{A}-\boldsymbol{\beta}_\mathscr{A}^*\right) \underset{d}{\rightarrow} N\left(\boldsymbol{0}, \left[\left(\boldsymbol{I}_k \otimes \boldsymbol{C}\right)_\mathscr{A}\right]^{-1}[\mathit{\pmb{\Sigma}} \otimes \boldsymbol{C}]_\mathscr{A} \left[\left(\boldsymbol{I}_k \otimes \boldsymbol{C}\right)_\mathscr{A}\right]^{-1}\right)$.

定理2的证明过程与定理1类似，区别在于两种模型的惩罚项，结合定理1的证明过程可得证定理2.

3. 投资组合中的应用

采用上文18种股票的已实现协方差矩阵构建均值—方差投资组合模型. 选取100个已实现协方差矩阵进行投资组合模型的模拟研究，在投资组合分析中，将h分别设置为1与10.

假定股票交易中没有手续费的产生，无风险收益为0. 投资组合模型的表达式为

其中1为元素均为1的向量，q是投资组合所需的预期回报率，w_t+1是投资组合中股票的权重，$\hat{\boldsymbol{\mu}}_{t+1}$为资产的期望收益率向量，其值通过50天移动平均取得.

基于VAR模型的3种模型在估计过程中都没有考虑到$\hat{\mathit{\pmb{\Sigma}}}_T$矩阵的正定性，会导致投资组合模型求解中出现病态协方差矩阵，干扰最优权重w_t+1的求解. 为了确保$\hat{\mathit{\pmb{\Sigma}}}_T$的正定性，需要对$\hat{\mathit{\pmb{\Sigma}}}_T$采用文献[11]提出的特征值替换方法对特征值λ≤0的矩阵进行正定化处理. 首先对$\hat{\mathit{\pmb{\Sigma}}}_T$进行谱分解：$\hat{\mathit{\pmb{\Sigma}}}_T=\hat{\boldsymbol{V}}_T^{\mathrm{T}} \hat{\mathit{\pmb{\Lambda}}}_T \hat{\boldsymbol{V}}_T$，其中$\hat {\mathit{\pmb{\Lambda}}_T}$为对角线元素为特征值的对角矩阵，$\hat{\lambda}_{i T}$为其对角线元素. 最后设$\hat{\lambda}_{m T}=\min \left\{\hat{\lambda}_{i T} \mid \hat{\lambda}_{i T}>0\right\}$，λ_mT是$\hat {\mathit{\pmb{\Lambda}}_T}$中最小的非负特征值. 对于满足$\hat{\lambda}_{i T}<\lambda_{m T}$的特征值，均用λ_mT代替，特征值替换后的对角矩阵用$\stackrel{\vee}{\mathit{\pmb{\Lambda}}}$表示，则正定处理后的协方差矩阵$\hat{\mathit{\pmb{\Sigma}}}_T$记为$\stackrel{\vee}{\mathit{\pmb{\Sigma}}_T}=\hat{\boldsymbol{V}}_T^{\mathrm{T}} \stackrel{\vee}{\mathit{\pmb{\Lambda}}_T} \hat{\boldsymbol{V}}_T$.

为了对比3种模型构建的投资组合模型的绩效，选用夏普比率(SP)这一指标对投资组合模型进行评价. 夏普比率表示单位风险所带来的收益，夏普比率值越大表示投资组合的收益越好.

通过表 2可以发现，在各种情况之下，VAR-MCP模型构建的投资组合均拥有最大的夏普比率. 在h=1时，VAR-LASSO模型构建的投资组合的夏普比率为0. 101 010 1，仅略大于VAR-SCAD模型构建的投资组合的夏普比率. 当h=10时，VAR-SCAD模型构建的投资组合的夏普比率为0. 101 037 2，略小于VAR-MCP模型构建的投资组合的夏普比率0. 102 079 6，此时VAR-LASSO模型构建的投资组合的表现最差，拥有最小的夏普比率0. 101 003 9.

4. 结论

随着信息技术的发展与数据可获取性的提高，金融数据的维度与频率都呈现出快速增长的趋势. 基于高频金融数据，本文在VAR-LASSO模型的基础上，将非凸惩罚函数即MCP惩罚函数与SCAD惩罚函数引入VAR-LASSO模型，得到了新的VAR-SCAD模型与VAR-MCP模型，并证明了VAR-SCAD模型与VAR-MCP模型估计参数的Oracle性质. 使用VAR-SCAD模型与VAR-MCP模型对高维已实现协方差矩阵进行建模，通过高频股票数据的实证研究，发现将SCAD惩罚函数与MCP惩罚函数引入VAR模型后，较好地克服了LASSO惩罚函数面对较大真实未知参数会产生较大估计误差的缺点，VAR-MCP模型在不同h的情况下均拥有最小的测试误差. VAR-SCAD模型在h较大的情况下表现优于VAR-LASSO模型，但在h较小的情况下，因为股票数据之间的高相关性，VAR-SCAD模型的表现不如VAR-LASSO模型.

最后通过构建均值—方差投资组合模型可以发现，VAR-MCP模型构建的投资组合可以为投资人带来最高的经济收益. VAR-SCAD模型构造的投资组合在h较大的情况下，表现仅次于VAR-MCP模型构造的投资组合.

参考文献 (19)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于非凸惩罚函数的高维协方差矩阵的建模

兰州财经大学统计学院，兰州 730030

作者简介:
杨小卜，硕士研究生，主要从事复杂数据的研究 .

Modeling of High-dimensional Covariance Matrix Based on Non-convex Penalty Function

School of Statistics, Lanzhou University of Finance and Economics, Lanzhou 730030, China

计量

基于非凸惩罚函数的高维协方差矩阵的建模

作者简介: 杨小卜，硕士研究生，主要从事复杂数据的研究
兰州财经大学统计学院，兰州 730030

English Abstract

Modeling of High-dimensional Covariance Matrix Based on Non-convex Penalty Function

全文HTML

1.1. 符号

1.2. 已实现协方差矩阵

1.3. VAR-LASSO模型的构建

1.4. 新模型的提出

1.4.1. SCAD惩罚函数与MCP惩罚函数

1.4.2. VAR-SCAD模型与VAR-MCP模型

1.4.3. VAR-SCAD模型与VAR-MCP模型估计参数的Oracle性质

2.1. 数据来源与清洗

2.2. 测试误差

2.3. VAR-SCAD模型表现分析

目录

留言板

基于非凸惩罚函数的高维协方差矩阵的建模

兰州财经大学 统计学院，兰州 730030

作者简介: 杨小卜，硕士研究生，主要从事复杂数据的研究 .

Modeling of High-dimensional Covariance Matrix Based on Non-convex Penalty Function

School of Statistics, Lanzhou University of Finance and Economics, Lanzhou 730030, China

计量

出版历程

基于非凸惩罚函数的高维协方差矩阵的建模

作者简介: 杨小卜，硕士研究生，主要从事复杂数据的研究 兰州财经大学 统计学院，兰州 730030

English Abstract

Modeling of High-dimensional Covariance Matrix Based on Non-convex Penalty Function

全文HTML

1.1. 符号

1.2. 已实现协方差矩阵

1.3. VAR-LASSO模型的构建

1.4. 新模型的提出

1.4.1. SCAD惩罚函数与MCP惩罚函数

1.4.2. VAR-SCAD模型与VAR-MCP模型

1.4.3. VAR-SCAD模型与VAR-MCP模型估计参数的Oracle性质

2.1. 数据来源与清洗

2.2. 测试误差

2.3. VAR-SCAD模型表现分析

目录

兰州财经大学统计学院，兰州 730030

作者简介:
杨小卜，硕士研究生，主要从事复杂数据的研究 .

作者简介: 杨小卜，硕士研究生，主要从事复杂数据的研究
兰州财经大学统计学院，兰州 730030