-
实用回归分析是一门应用性很强的专业基础课程,它的先修课程有高等代数、数学分析、概率论与数理统计等专业基础课,是统计学中的一个非常重要的分支,已广泛应用于社会经济、自然科学、管理科学等领域.通过实用回归分析课程的学习,学生能够建立统计模型从而研究变量间相互关系的密切程度、结构状态以及模型预测.本课程的教学目标是培养学生运用回归分析方法以及结合相关统计软件解决实际问题的能力,使学生能够理解和掌握回归分析的基本内容,包括线性回归模型、回归诊断、变量选择、岭回归、Logistic回归等[1].鉴于回归分析是统计学科的一个有特色的分支,其思想方法别具一格,所研究的问题别开生面,解题技巧多种多样,因此在讲授本课程时必须强调概念的直观意义和各种统计模型的运用背景,注重模型化思想方法和回归分析思想方法的训练,使学生了解背景、透晰概念、知道原理、掌握方法和明确作用.
本文从实用回归分析课程教学的现状出发,结合笔者近几年的实际教学经验,提出在实用回归分析课程中如何运用研究型教学方式激发学生的学习兴趣,并引导、启发和培养学生的创新思维和实践能力.
全文HTML
-
根据笔者的实际教学经验,发现实用回归分析课程在教学过程中存在以下问题:
-
在实用回归分析课程教学中,教师采取传统讲授式的教学方法,只注重基本概念、性质和公式的讲解,不重视应用能力、创新思维的培养.这种“满堂灌”的教学方式,使得课堂完全变成了定义、公式和定理的堆砌,很难激发学生的学习兴趣[2].在目前的教学模式下,教师让学生参与到课堂中的机会少,很难做到让学生自主学习,从而很难培养学生解决实际问题的能力,造成了学生在实践中遇到实际问题束手无策,无法运用回归分析理论解决实际问题.显然这种讲授式的教学方式已不能达到这门课的教学要求.
-
目前很多学生在实用回归分析课程学习结束后,只是死记硬背地记住了一些计算公式和分析理论,并没有完全掌握回归分析的统计原理,从而拿到具体数据后不知如何去构建相应的回归模型,更不知道如何解释建模结果.出现这一现象的主要原因在于学生不能灵活运用所学理论知识并用于指导实践,即没有较强的实践应用能力.
因此,在实用回归分析教学中必须转变教学思想,更新教育观念.而研究型教学是一种以培养学生的创新精神和实践能力为特征的新型课程教学,其强调学生的主体性,调动学生学习的兴趣.研究型教学既能发挥教师的主导作用,又能发挥学生的主体作用;既能培养学生的学习兴趣,激发学生思维,又能培养学生分析问题和解决问题的能力.研究型教学具有开放性、综合性和实践性的特征.在研究型教学过程中,学生不是传统意义上的教学对象,而是积极参与教学活动过程的主体;不是传统教学中知识的被动接受者,而是知识的主动建构者[2-5].
1.1. 教学模式过于老旧、缺少研究型教学和开放性练习
1.2. 理论知识和实践应用并未完全融合
-
本课程面向的是大学高年级统计学专业的学生(以西南大学为例,此课程开设在大三年级上学期),在此之前学生已经完成了数学分析、高等代数、概率论、数理统计等专业基础课程的学习,具备良好的基础知识.此外,大学生正处于身心发展的重要时期,他们在学习上比较主动,他们渴望探究新知,化知识为能力.同时,大学生经过多年的数学思维训练,已经具备了一定的自主学习的能力[6-7].
-
实用回归分析是统计学专业的一门重要的学科基础课,其内容包括线性回归、回归诊断、变量选择、非线性回归、含定性变量的回归等.熟悉回归分析的基本理论,掌握回归分析建模的一般流程是这门课的主要教学任务.在实用回归分析课程中,教师不仅需要讲授回归分析的理论知识,而且还需指导学生进行上机实验操作,把所学知识应用于实践.在理论教学部分,教师可根据研究型教学的要求重新制定课程的教学目标,以问题驱动式的教学方法引导学生思考问题,并在老师的帮助下分析、解决问题,最终达到学生获取知识、提高能力的目的[3-5].对教学内容进行了大胆取舍,有效整合,精心选取了一些具有典型性、综合性和一定趣味性的研究问题,让学生熟练掌握回归分析的理论知识.在上机实验教学中,学生已经掌握了相应的理论基础知识,因此可引导学生自主学习并鼓励他们自主编程,从而提升他们实践操作的能力.学生通过对实际问题的探索研究,教师适当引导,不仅可以提高他们回归建模的能力,而且能够让他们认识到学习回归分析的理论知识有助于指导上机实践操作,从而纠正在大多数学生印象中“理论知识多余”的错误认识.通过研究型教学既能完成课堂教学工作,又能激发学生学习这门课程的浓厚兴趣,以及提高学生解决实际问题的能力.因此,实用回归分析这门课程适合研究型教学.
2.1. 大学生具备的知识结构适合研究型教学
2.2. 课程特点适合研究型教学
-
在西南大学本科教学中,本课程采用的教材是由何晓群、闵素芹主编的《实用回归分析》(第二版)[8],笔者以第四章多元线性回归中回归方程的显著性F检验与回归系数的显著性t检验和第八章中多重共线性问题为例,探讨研究型教学在实用回归分析课程中的应用[8].
-
多元线性回归模型的一般形式为
其中y是响应变量(因变量),x1,x2,…,xp是p个可以精确测量并可控制的自变量,β0,β1,β2,…,βp是p+1个未知参数,ε是随机误差[8-9].
在多元线性回归模型中,根据最小二乘方法得到回归系数的估计后,一个自然的问题就是所建立的经验回归方程是否真正描述了y与x1,x2,…,xp之间的统计规律?自变量x1,x2,…,xp中哪些变量对响应变量y有显著影响?因为在建模之初,我们并不知道哪些自变量对响应变量y有显著影响,只是根据定性分析将这些变量引入到模型中.因此为了回答这些问题,还需要运用统计方法对回归方程和回归系数进行显著性检验.回归方程的显著性F检验与回归系数的显著性t检验是实用回归分析课程中两个非常重要的知识点.传统的教学中,老师直接给出这两个检验的概念以及检验过程,最后通过一些实例分析验证检验过程.在整个教学过程中,基本是老师在讲台上向学生灌输这些知识.然而研究型教学是以学生为中心,在教师的帮助指导下按照科学研究的模式来分析、解决这些问题,最终达到学生获取知识的一种教学过程.下面笔者将以研究型教学的方式来讲解这两个知识点.
首先,请同学们先自学多元线性回归方程的显著性F检验与回归系数的显著性t检验,这样学生就可以带着问题去学习,激发他们学习的热情,然后分组讨论并形成结论,同时请小组代表起来说出他们组的讨论结果.根据学生代表的发言,老师归纳出回归方程的显著性F检验是指在给定的显著性水平下,自变量x1,x2,…,xp整体对响应变量是否具有显著的线性影响.那么怎样去判定全体自变量x1,x2,…,xp对响应变量y是否有显著的线性影响呢?应该采用什么统计方法呢?根据所学的数理统计知识,绝大部分学生都能回答出采用假设检验的方法,进而引导他们回顾假设检验的基本步骤.接下来教师可以采用问题驱动的教学模式逐步引导学生主动学习回归方程的显著性F检验的有关内容,从而达到学生能够完全参与课堂教学的目的.
在多元线性回归模型中,自变量x1,x2,…,xp整体对响应变量有显著的线性影响并不能说明每个自变量对响应变量都有显著的线性影响.因此,还需要研究每个自变量对响应变量是否有显著的线性影响.此时教师可进一步提问,能否采用假设检验的方法解决这一问题呢?若是,怎样去构造检验统计量,确定其分布以及构造否定域呢?接下来教师围绕刚才的问题,引导学生提出原假设与备择假设,构造检验统计量以及确定检验的否定域,从而实现以探究式的方式学习回归系数的显著性t检验,达到事半功倍的学习效果.
这两个知识点体现了这门课实践性很强的特点,在以理论教学为主的前提下,还应与实践教学和案例教学结合.
-
为了引入多重共线性的概念,教师可先让学生回顾最小二乘估计是怎样得到的.在多元线性回归模型中,根据最小二乘原理可知未知参数向量β=(β0,β1,…,βp)T需要满足如下正则方程
其中X=(1,xi1,xi2,…,xip)i=1n是由样本自变量构成的n×(p+1)维设计矩阵,Y=(y1,y2,…,yn)T是由样本响应变量构成的n维列向量.讲到这里,可以给同学们提一个问题:如何得到β的估计呢?同学们回答,根据线性代数的知识可知,左右两边同时乘以(XTX)-1,可得最小二乘估计量
(1) 式和(2)式需要满足什么条件吗?同学们说,由线性代数的知识可知(XTX)-1必须存在,即XTX是一个非奇异矩阵(|XTX|≠0).老师进一步追问,XTX在什么条件下才可逆呢?学生会说由线性代数的知识可知XTX为满秩矩阵,即r(XTX)=p+1.再根据此矩阵的特点和秩的性质可知r(X)=p+1.因此,学生们自己总结出多元线性回归模型中要求X列满秩的假定,即r(X)=p+1,表明设计矩阵X中的自变量列之间线性无关[8-9].讲到这里,可以给同学们提另一个问题:在实际问题中X都满足列满秩吗?如果不满足将会带来什么问题呢?显然这个问题是为后面的多重共线性概念的引入埋下一个伏笔.很自然地就引导同学们带着问题听课,从而提高学习的兴趣和效果.
再次回到r(X)=p+1,即要求X中的列向量之间线性无关.根据线性代数的知识可知,如果存在不全为0的p+1个数c0,c1,c2,…,cp,使得
则自变量x1,x2,…,xp之间线性相关,即存在完全多重共线性.然而在实际问题中很少存在完全多重共线性问题,但是(3)式近似成立的情况还是常见的,即存在不全为0的p+1个数c0,c1,c2,…,cp,使得
当自变量x1,x2,…,xp满足(4)式时,称x1,x2,…,xp之间存在多重共线性,也称为复共线性[8-9].讲到这里,老师可以举一个生活中的例子,让同学们明白出现多重共线性现象是有实际背景的.比如在农业研究中考虑哪些因素会影响玉米的产量,常见的因素包括化肥施用量x1、灌溉量x2和投入的农业资金x3.从表面上看,3个因素都是影响玉米产量的重要因素,但是仔细分析会发现x3和x1,x2有较强的内在相关性.这是因为在农业发展中,大部分的农业资金x3都是用于购买化肥(x1)和开发水利(x2)[8-9].在讲解多重共线性的概念时,教师根据以前所学的旧知来引入新知,使得学生能够完全自主地去理解和分析问题,达到研究型教学的效果,同时也能提高学生的学习效率.
接下来,教师再次提问,在现实生活中若自变量之间存在多重共线性问题,它会对回归模型产生什么影响呢?为了让同学们彻底明白多重共线性会带来什么问题,教师可通过下面这个二元线性回归的例子加以分析和讲解.
案例1 考虑y对两个自变量x1,x2的线性回归,此时假定y与x1,x2已经中心化,自然经验回归方程的截距项为0,即
$\widehat y = {\widehat \beta _1}{x_1} + {\widehat \beta _2}{x_2}$ [8-9].若x1,x2存在多重共线性问题,即x1与x2之间存在较强的相关性,它会如何影响最小二乘估计量?分析:根据前面所学最小二乘估计量的性质可知其协方差阵为
其中
令
则根据简单相关系数的定义可知,x1与x2之间的相关系数为
${r_{12}} = \frac{{{L_{12}}}}{{\sqrt {{L_{11}}{L_{22}}} }}$ .进一步根据高等代数中矩阵乘法知识可知再利用伴随矩阵方法可计算XTX的逆为
因此可得
在实际教学中,以上的计算完全可以由学生自主推导完成,因为推导过程只涉及到已经学习过的高等代数知识,教师只需稍加引导起到抛砖引玉的作用即可.在计算出Var(
${\widehat \beta _1}$ )和Var(${\widehat \beta _2}$ )后,教师可向同学们提问,相关系数r12如何影响最小二乘估计量的方差?并随机抽同学起来回答,提高教学过程中学生的参与程度.最后老师根据同学们的发言归纳出x1与x2的相关性增强,${\widehat \beta _1}$ 和${\widehat \beta _2}$ 的方差将逐渐增大的结论.特别地,当|r12|=1时,方差将变为无穷大,即x1与x2的线性相关程度越高,建立的回归模型越不稳定.尽管通过上面的理论推导可看出多重共线性会增加最小二乘估计量的方差,但是很难看清其相关性的增强,Var(
${\widehat \beta _1}$ )和Var(${\widehat \beta _2}$ )的增大速度.针对此问题,教师可以利用R统计软件编写小程序,通过随机模拟的方式将结果直观地展示给同学们看,有助于他们深刻地认识此问题[11].具体地,假定模拟数据来源于如下二元线性回归模型其中:β1=0.5,β2=-0.5;εi服从N(0,22);xi=(xi1,xi2)T服从二元正态分布且均值为0方差为1;x1,x2的相关系数r12从0到1变化.随机模拟5 000次,所得参数估计值和方差的平均值见表 1.
x1与x2的相关系数r12刻画的是自变量之间的共线性程度. r12的绝对值越小,说明自变量x1与x2之间越不可能存在共线性;r12的绝对值越大,说明自变量x1与x2之间越可能存在共线性,特别地,r12=0代表x1与x2没有线性相关性,r12=±1代表x1与x2完全线性相关,即存在完全多重共线性.由表 1可知,当x1与x2的相关系数r12从0到0.99变化时,最小二乘估计值与真实的参数值很接近.表明存在多重共线性问题时最小二乘估计仍然是无偏估计,但其方差明显随着r12的增大而增大.而且不难发现,r12越靠近1,最小二乘估计的方差增长越快.因此,根据表 1同学们能够很快总结出当自变量之间存在多重共线性问题时,回归系数的估计值方差增大,从而导致回归系数的置信区间变宽,估计的精确性大幅度降低,以及影响回归模型的应用价值等结论.
3.1. 回归方程的显著性F检验与回归系数的显著性t检验
3.2. 多重共线性的概念及其对回归模型的影响
-
在研究型教学理念的指导下,针对该课程的特点,成绩的考核也不再僵化于“期末一考定全局”的传统考核方式.学期成绩的考核方式可以多元化,以期末考试与形成性评价相结合.其中:期末考试主要考查学生对回归分析的基本理论和基本方法的理解掌握程度;形成性评价包括课堂表现、平时作业的完成情况、平时的上机实践情况和期中考查,期中考查不仅包括传统的期中考试,还可以通过设计研究型课题的方式进行.教师根据教学内容,设计几个难度相当的研究型课题,指导学生阅读相关资料与收集数据,鼓励学生利用统计软件自主编程建立回归模型,并对数据分析结果做出合理的实际意义解释,从而提高学生的实践应用能力.课题可以以论文或者报告的形式完成.这样的期中考查既考查了学生的知识储备,也考查了学生解决实际问题的能力.最终的学期成绩应该是形成性评价得分和期末考试成绩的加权平均.为了评价实用回归分析课程实施研究型教学的效果,通过对学生的心得体会和期末统考数据进行分析,完成对研究型教学的效果和学生成绩的定量分析.
-
实用回归分析课程有很强的理论性与实践性,要求教师具有过硬的专业技术知识,具备较强的实践能力以及扎实的理论功底.为了培养大数据时代的接班人,在大力推动实践教学发展的同时,不应忽视理论教学的重要性,应将实践教学和理论教学深度融合[12].笔者结合本校统计学专业实用回归分析课程的教学实践,分析了传统教学中存在的问题,并举例分析了研究型教学在该门课程中的具体应用,倡导教师引导学生主动参与的教学模式,进而提升教学质量水平,以期取得较好的教学效果.