留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

修正的扩展林德利—威布尔分布

上一篇

下一篇

张泓, 李婷婷. 修正的扩展林德利—威布尔分布[J]. 西南师范大学学报(自然科学版), 2020, 45(5): 17-23. doi: 10.13718/j.cnki.xsxb.2020.05.004
引用本文: 张泓, 李婷婷. 修正的扩展林德利—威布尔分布[J]. 西南师范大学学报(自然科学版), 2020, 45(5): 17-23. doi: 10.13718/j.cnki.xsxb.2020.05.004
Hong ZHANG, Ting-ting LI. Modified Slashed Lindley-Weibull Distribution[J]. Journal of Southwest China Normal University(Natural Science Edition), 2020, 45(5): 17-23. doi: 10.13718/j.cnki.xsxb.2020.05.004
Citation: Hong ZHANG, Ting-ting LI. Modified Slashed Lindley-Weibull Distribution[J]. Journal of Southwest China Normal University(Natural Science Edition), 2020, 45(5): 17-23. doi: 10.13718/j.cnki.xsxb.2020.05.004

修正的扩展林德利—威布尔分布

  • 基金项目: 国家自然科学基金项目(11701469)
详细信息
    作者简介:

    张泓(1994-), 女, 硕士研究生, 主要从事极值统计分析的研究 .

    通讯作者: 李婷婷, 博士, 副教授
  • 中图分类号: O211.4

Modified Slashed Lindley-Weibull Distribution

  • 摘要: 介绍了一个新的分布——修正的扩展林德利-威布尔分布,该分布表示为相互独立的林德利-威布尔分布和指数分布幂的商.研究了该分布的概率密度函数、风险函数和矩,并使用最大似然法估计出分布中的参数值,最终利用实际数据验证了该分布对具有过度峰度的正数据建模的有效性.
  • 加载中
  • 图 1  MSLW(λ, a, θ, q)分布的概率密度函数

    图 2  MSLW $(\lambda, \alpha, \theta, q)$分布的可靠性(顶部)和风险率(底部)函数

    图 3  SLW分布(下网格)和MSLW分布(上网格)的偏度和峰度系数

    图 4  β-血浆的箱线图

    图 5  4个模型的直方密度图

    图 6  4个模型的Q-Q图

    表 1  描述性统计分析

    n $ {\bar{x}}$ s2 βs βk
    314 190.50 33 481 3.55 19.94
    下载: 导出CSV

    表 2  4个模型的最大似然估计

    估计值 MSLW MSL SLW LW
    $\overset{\wedge }{\mathop{\lambda }}\, $ 133.306 1 - 134.191 1 1.162 9
    $\overset{\wedge }{\mathop{\alpha }}\, $ 2.495 3 0.015 2.250 8 0.942 4
    $ \overset{\wedge }{\mathop{\theta }}\, $ - - - 0.016 7
    $ \overset{\wedge }{\mathop{q}}\, $ 2.306 8 4.053 1.855 9 -
    对数似然函数值 -1 907.13 -1 919.40 -1 908.71 -1 930.75
    下载: 导出CSV

    表 3  4个模型的AIC,BIC,K-S统计量及P值

    MSLW MSL SLW LW
    AIC 3 820.26 3 842.80 3 823.42 3 867.50
    BIC 3 831.51 3 850.30 3 834.67 3 878.75
    K-S统计量 0.054 0.105 0.057 0.080
    P值 0.747 0.062 0.681 0.272
    下载: 导出CSV
  • [1] doi: http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=116dace232e0c8ea03cea5f5f32ddb81 MARSHALL A W, OLKIN I.A New Method for Adding a Parameter to a Family of Distributions with Application to the Exponential and Weibull Families[J]. Biometrika, 1997, 84(3):641-652.
    [2] SHAW W T, BUCKLEY I R C.The Alchemy of Probability Distributions: Beyond Gram-Charlier Expansions, and a Skew-Kurtotic-Normal Distribution from a Rank Transmutation Map[EB/OL]. (2009-01-05)[2019-07-05]. https://arxiv.org/abs/0901.0434.
    [3] doi: http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=59e0089993cc2149b32e0d68d7f65ff5 ZOGRAFOS K, BALAKRISHNAN N. On Families of Beta- and Generalized Gamma-Generated Distributions and Associated Inference[J]. Statistical Methodology, 2009, 6(4):344-362.
    [4] CAKMAKYAPAN S, OZEL G.The Lindley Family of Distributions:Properties and Applications[J]. Hacettepe Journal of Mathematics and Statistics, 2016, 46(116):1-11. doi: 10.15672/HJMS.201611615850
    [5] LINDLEY D V.Fiducial Distributions and Bayes' Theorem[J]. Journal of the Royal Statistical Society Series B (Methodological), 1958, 20(1):102-107. doi: 10.1111/j.2517-6161.1958.tb00278.x
    [6] GHITANY M E, ATIEH B, NADARAJAH S.Lindley Distribution and Its Application[J]. Mathematics and Computers in Simulation, 2008, 78(4):493-506. doi: 10.1016/j.matcom.2007.06.007
    [7] JIMMY R, YURI A I, PEDRO J, HÉCTOR W G.The Sslash Lindley-Weibull Distribution[J]. Methodology and Computing in Applied Probability, 2019, 21(1):235-251. doi: 10.1007/s11009-018-9651-2
    [8] JUAN M A, YURI A I, HÉCTOR W G, et al.Modified Slashed Generalized Exponential Distribution[DB/OL]. (2019-04-26)[2019-07-05]. https://doi.org/10.1080/03610926.2019.1604959.
    [9] JIMMY R, HÉCTOR W G, HELENO B[J]. Modified Slash Distribution.Statistics, 2013, 47(5):929-941. doi: 10.1080/02331888.2012.694441
    [10] YURI A I, NABOR O C, HELENO B, et al.Modified Slashed-Rayleigh Distribution[J]. Communication in Statistics-Theory and Methods, 2017, 47(13):3220-3233.
    [11] BHATI D, MALIK M A, VAMAN H J.Lindley-Exponential Distribution:Properties and Applications[J]. Metron, 2015, 73(3):335-357. doi: 10.1007/s40300-015-0060-9
  • 加载中
图( 6) 表( 3)
计量
  • 文章访问数:  1021
  • HTML全文浏览数:  1021
  • PDF下载数:  106
  • 施引文献:  0
出版历程
  • 收稿日期:  2019-08-14
  • 刊出日期:  2020-05-20

修正的扩展林德利—威布尔分布

    通讯作者: 李婷婷, 博士, 副教授
    作者简介: 张泓(1994-), 女, 硕士研究生, 主要从事极值统计分析的研究
  • 西南大学 数学与统计学院, 重庆 400715
基金项目:  国家自然科学基金项目(11701469)

摘要: 介绍了一个新的分布——修正的扩展林德利-威布尔分布,该分布表示为相互独立的林德利-威布尔分布和指数分布幂的商.研究了该分布的概率密度函数、风险函数和矩,并使用最大似然法估计出分布中的参数值,最终利用实际数据验证了该分布对具有过度峰度的正数据建模的有效性.

English Abstract

  • 在生存分析、环境科学分析、可靠性分析以及寿命测试分析中,数据通常呈现尖峰厚尾的特征,常见的伽马分布、对数正态分布、逆高斯分布和威布尔分布等对此类带有异常值的数据建模效果并不理想.针对这类问题,文献[1-3]通过添加新参数对一些常见的分布进行扩展得到一类新分布族,这类新分布族在建模上具有更好的灵活性.其中文献[4-6]使用这种扩展方法,基于林德利分布提出林德利一般分布(LG).本文对林德利—威布尔分布(LW)进行修正.LW分布使用威布尔分布作为基线概率密度函数,通过增加额外参数,提高林德利分布的适用性和灵活性.然而,LW分布的厚尾特征并不明显,不能对具有高峰度和异常观测值的数据集进行很好地拟合,为了解决这个问题,文献[7]引入含四参数的扩展林德利—威布尔分布(SLW),SLW分布具有比LW分布更宽的峰度范围,适用于具有非典型观测值的数据集.在这个基础上,本文提出了SLW分布的修正形式,即修正的扩展林德利—威布尔分布(MSLW).文献[8-10]指出,类似修正扩展分布更容易修改一些常见的分布,使其具有更高的峰度.因此MSLW与SLW分布相比具有更重的尾部,能更好地拟合带有异常观测值的数据,可以作为SLW分布的替代模型.

  • 若随机变量X服从修正的扩展林德利—威布尔分布,记为X~MSLW(λαθq),具体表达式为

    其中:Z~LW(λαθ)和U~exp(2)独立,λ>0是尺度参数,α>0和θ>0是形状参数,q>0是峰度参数.

  • 命题1  假设X~MSLW(λαθq),则X的概率密度函数表示为

    其中λ>0是尺度参数,α>0和θ>0是形状参数,q >0是峰度参数,且有

      根据随机表达式(1)和雅可比行列式的方法,计算X的概率密度函数如下:首先做一个变量替换,令$X = Z{U^{ - \frac{1}{q}}} $以及T=U,则有$ Z = X{T^{\frac{1}{q}}}$U=T,变换的雅可比行列式表示为

    因此,(XT)的联合概率密度函数为

    最后利用$u=\frac{x t^{\frac{1}{q}}}{\lambda} $,就得到X最终的概率密度函数.

    尺度参数λ,形状参数αθ,峰度参数q对MSLW分布的概率密度函数的影响如图 1所示,呈现单峰或非增形状.

    假设X~MSLW(λαθq),那么由MSLW分布的概率密度函数的具体表达式,可以推导以下性质:

    1) $\mathop {\lim }\limits_{q \to \infty } {f_X}(x;\lambda , \alpha , \theta , q) = \frac{{\alpha {\theta ^2}}}{{\lambda (\theta + 1)}}{\left( {\frac{x}{\lambda }} \right)^{\alpha - 1}}\left[ {1 + {{\left( {\frac{x}{\lambda }} \right)}^\alpha }} \right]\exp \left( { - \theta {{\left( {\frac{x}{\lambda }} \right)}^\alpha }} \right) $.

    2) $ \mathop {\lim }\limits_{q \to \infty } {f_X}(x ; \lambda, 1, \theta, q)=\frac{\theta^{2}}{\lambda(\theta+1)}\left(1+\frac{x}{\lambda}\right) \exp \left(\frac{-\theta x}{\lambda}\right)$.

    3) $ F_{X}(x ; \lambda, \alpha, \theta, q)=\frac{2 \alpha \theta^{2} q \lambda^{q}}{\theta+1} \int_{0}^{x} v^{-(q+1)} J_{X}(v ; \lambda, \alpha, \theta, q) \mathrm{d} v$.

    注1    (ⅰ)当q=1时,称X服从典型的修正的扩展林德利—威布尔分布,表示为X=ZU-1,记为X~CMSLW(λαθ),并且其概率密度函数为

    其中λ>0是尺度参数,α>0和θ>0是形状参数,JX由(3)式给出.

    (ⅱ)由性质1)可知,当$ q \to \infty $时,MSLW分布收敛到一般的LW分布[4];性质2)可知,当$ q \to \infty $α=1时,MSLW分布收敛到林德利指数分布[11].

  • 可靠性函数和风险率(失效率)函数是两项重要的可靠性指标.其中可靠性函数RT(t)表示一个项目在某个时间t内未发生故障的概率,定义为RT(t)=1-FT(t).MSLW分布的可靠性函数由下式给出

    假定某事件的存活时间达到时刻t,那么该事件的风险率函数$ h_{T}(t)=\frac{f_{T}(t)}{1-F_{T}(t)}$可以粗略地解释为在超过时刻t瞬时死亡的条件概率.MSLW分布的风险率函数如下

    其中JX由(3)给出.不同的参数λαθq的取值下,MSLW分布的可靠性函数和风险率函数如图 2所示.由图 2可知,不同的参数取值下,MSLW分布的两种可靠性指标函数表现出多种图形形状,这说明了新的分布MSLW的灵活性.

  • 引理1   设Z服从LW(λαθ)分布,则有

    其中$ \varGamma\left(\frac{r}{\alpha}\right)$,表示为伽马函数,见文献[7].

    命题2   设X服从MSLW(λαθq)分布,那么,对于r=1,2,…,以及q>rXr阶矩如下

    其中$ d(r)=\left(\alpha+\frac{r}{\theta+1}\right) \varGamma\left(\frac{r}{\alpha}\right) \varGamma\left(\frac{q-r}{q}\right)$.

      由(1)可知,ZU是相互独立的两个随机变量,所以就有

    其中$ \mathbb{E}\left(U^{-\frac{r}{q}}\right)$经计算为$ 2^{\frac{r}{q}} \varGamma\left(\frac{q-r}{q}\right), q>r $$ \mathbb{E}\left(Y^{r}\right)$由(6)式给出.

    推论1   若X~MSLW(λαθq),则有

    1) $ \mu_{1} =\mathbb{E}(X)=\frac{2^{\frac{1}{q}} \lambda}{\alpha^{2} \theta^{\frac{1}{\alpha}}} d(1) $

    2) $ \mu_{2} =\mathbb{E}\left(X^{2}\right)=\frac{2^{\frac{2}{q}} 2 \lambda^{2}}{\alpha^{2} \theta^{\frac{2}{\alpha}}} d(2), q>2 $

    3) $\mu_{3} =\mathbb{E}\left(X^{3}\right)=\frac{2^{\frac{3}{q}} 3 \lambda^{3}}{\alpha^{2} \theta^{\frac{3}{\alpha}}} d(3), q>3 $

    4) $\mu_{4} =\mathbb{E}\left(X^{4}\right)=\frac{2^{\frac{4}{q}} 4 \lambda^{4}}{\alpha^{2} \theta^{\frac{1}{\alpha}}} d(4), q>4 $

    注2   偏度和峰度系数由下面两个式子给出

    由推论1可知,MSLW分布的偏度和峰度系数值独立于尺度参数λ.

    图 3表示形状参数α=0.3的MSLW分布和SLW分布的偏度和峰度系数,由图 3可知MSLW分布的两个系数值均大于SLW分布,可用于拟合具有异常观测值数据的分布.

  • 本节阐述MSLW分布参数估计的最大似然(ML)方法.若X1X2,…,Xn是来自服从MSLW(λαθq)分布,容量为n的随机样本.假设参数未知,其中$x_{1}, x_{2}, \cdots, x_{n} $表示观察值,则对数似然函数为

    其中$ c(\lambda , \alpha , \theta , q)=n\log \left( \frac{2\alpha q}{\theta +1} \right)+2n\log (\theta )+nq\log (\lambda ), {{J}_{X}}(x)={{J}_{X}}(x;\lambda , \alpha , \theta , q)$由(3)式定义.在实际中,为了得到参数的ML估计,本文选用数值方法求解优化问题

    其中l(λαθq)由(9)式给出.本文使用R软件中optim函数,应用L-BFGS-B算法来求解(10).文献[7]指出,两个形状参数αθ的存在导致参数可识别性的问题,但如果只有一个形状参数,这个问题就会消失.因此,出于实际目的,在实证分析中,本文使用具有唯一形状参数的MSLW模型版本,即假定α=θ.

  • 本节比较4种分布MSLW,MSL,SLW和LW对具有较高峰度的实际数据集建模的有效性.数据来源于http://lib.stat.cmu.edu/datasets/Plasma_Retinol,该数据表明人体中一些微量营养素的血浆浓度存在很大差异,可能会增加某些癌症发生的风险,其包含了14个变量,每个变量下有314个观测值,本文选择其中第13个变量β-血浆进行分析.

    表 1是对β-血浆数据进行描述性统计分析的一个总结,其中n表示样本容量,$ {\bar{x}}$为样本均值,S2为样本方差,βsβk分别表示样本的偏度和峰度系数,揭示了数据具有较高的峰度,也可以更直观地在箱线图(图 4)中看出.

    表 2分别给出了4个模型MSLW,MSL,SLW和LW的参数的最大似然估计以及相应的最大对数似然函数值,表明MSLW模型对应的对数似然函数值最大.

    为了比较分布的拟合效果,本文考虑Akaike信息准则(AIC)和Bayesian信息准则(BIC).它们分别表示为

    其中:k为分布参数个数,n为样本容量,log lik为对数似然函数的最大值.表 3显示了每个模型对应的AIC和BIC值,以及应用拟合优度Kolmogorov-Smirnov进行检验得到的Kolmogorov-Smirnov统计量(K-S统计量)和检验的P值.可以看出,基于AIC,BIC,K-S统计量和P值,MSLW模型比另外3个模型的拟合效果更好.除此之外,可以更直观地在图 5(a)发现,对于真实数据,MSLW拟合程度更优.图 5(b)直方图尾部的放大图揭示了MSLW分布对具有较高峰度的数据集适用性更强.图 6分别描述了MSLW,MSL,SLW和LW同原始数据的Q-Q图,也同样表明MSLW模型在该数据集上具有更好的拟合效果.

  • 引入了LW分布的一个新的扩展形式,新分布表示为LW分布和指数分布的幂这两个独立随机变量的比值,称为修正的扩展林德利—威布尔分布(MSLW).该分布扩大了峰度范围,可用于模拟具有过度峰度和异常观测值的正数据集,实证分析验证了该分布的可行性.

参考文献 (11)

目录

/

返回文章
返回