在线学习数据与学生学习成绩的相关性分析——以大学概率论课程为例

熊思灿; 农莹

doi:10.13718/j.cnki.xsxb.2021.11.011

在线学习数据与学生学习成绩的相关性分析——以大学概率论课程为例

熊思灿¹,
农莹²

1.
东华理工大学理学院，南昌 330013

2.
华中师范大学教育学院，武汉 430079

基金项目: 东华理工大学博士启动基金研究项目(DHBK2018052)；江西省基础教育研究课题(SZUDHZH2019-1133)

详细信息

作者简介:
熊思灿，博士，副教授，主要从事教育统计学方向研究 .

中图分类号: G40-057

On Correlation Analysis Between Online Learning Data and Students' Academic Performance——With the University Probability Theory Course as an Example

XIONG Sican¹,
NONG Ying²

1.
School of Science, East China University of Technology, Nanchang 330013, China

2.
School of Education, Central China Normal University, Wuhan 430079, China

摘要: 选取概率论课程195名学习者不同时段的在线学习数据和期末成绩数据进行研究，并运用相关分析法、回归分析法以及因子分析法综合考察在线学习数据与期末成绩之间的相关关系. 研究结果表明，不同时段的在线学习数据均与期末考试成绩呈非常显著的正相关关系. 在线学习数据可被分为反映“知识输入”“知识输出”和“互动交流”的3个类别. 这3个类别的典型代表变量分别是在线学习访问数、在线考试成绩和讨论数. 通过这3个典型变量建立的回归模型能较好地反映期末成绩的变化情况，并进行学业预警.
- 在线学习数据 /
- 相关性分析 /
- 回归分析 /
- 因子分析 /
- 学业预警
Abstract: Based on the online learning scores at different periods and final grades of 195 learners from the Probability Theory, the correlation between the online learning scores and final grades was comprehensively analyzed through correlation analysis, regression analysis, and factor analysis. The results show that the correlation between the online learning scores at different periods and the final grades are significantly positive. The online learning scores could be divided into three categories reflecting "knowledge input", "knowledge output", and "interactive communication". The typical representative variables of these three categories are the visits, online test scores, and the number of discussions. The regression models established by these three typical variables can better reflect the changes in final grades and provide academic warning.
- online learning scores /
- correlation analysis /
- regression analysis /
- factor analysis /
- academic warning .

图 1 旋转后空间中的成分图

下载: 全尺寸图片幻灯片

图 2 各期综合成绩和预测成绩分别与期末成绩的皮尔逊相关系数折线图

下载: 全尺寸图片幻灯片

表 1 在线学习成绩与期末成绩的皮尔逊相关系数及检验P值

在线成绩类别	相关系数	P值
考试满分率	0.58	＜0.001^***
讨论满分率	0.50	＜0.001^***
访问数满分率	0.50	＜0.001^***
课程互动满分率	0.50	＜0.001^***
签到满分率	0.47	＜0.001^***
作业满分率	0.47	＜0.001^***
视频观看个数比	0.47	＜0.001^***
任务点完成率	0.47	＜0.001^***
课程积分比	0.45	＜0.001^***
视频观看时长比	0.29	＜0.001^***
注：^***P≤0.001.

下载: 导出CSV

表 2 不同等级同学的在线学习成绩均值及均值比较的方差分析结果和Eta相关系数

在线成绩类别	不同等级同学的在线学习成绩均值				均值比较的方差分析		Eta相关系数
在线成绩类别	优秀	良好	及格	不及格	F值	P值	Eta相关系数
考试满分率	0.716	0.657	0.450	0.262	31.906	＜0.001^***	0.578
讨论满分率	0.890	0.876	0.816	0.615	21.422	＜0.001^***	0.502
访问数满分率	0.601	0.503	0.364	0.286	21.265	＜0.001^***	0.5
课程互动满分率	0.898	0.858	0.614	0.462	20.196	＜0.001^***	0.491
签到满分率	0.772	0.802	0.439	0.316	17.067	＜0.001^***	0.46
作业满分率	0.861	0.874	0.628	0.542	15.950	＜0.001^***	0.448
视频观看个数比	0.942	0.906	0.787	0.689	15.904	＜0.001^***	0.447
任务点完成率	0.9859	0.9875	0.9647	0.9456	15.389	＜0.001^***	0.441
课程积分比	0.833	0.772	0.680	0.618	14.019	＜0.001^***	0.425
视频观看时长比	0.522	0.508	0.311	0.290	5.425	0.001^***	0.28
注：^***P≤0.001.

下载: 导出CSV

表 3 期末成绩对在线学习成绩的逐步回归最终模型及参数估计

自变量	未标准化回归系数	标准误	t值	P值	共线性容差	方差膨胀因子
(截距)	42.131	2.517	16.739	＜0.001^***
考试满分率	19.026	4.727	4.025	＜0.001^***	0.513	1.949
访问数满分率	20.800	5.057	4.113	＜0.001^***	0.744	1.344
讨论满分率	10.887	3.814	2.854	0.005^**	0.587	1.704
注：^*P≤0.001；^P≤0.01.

下载: 导出CSV

表 4 期末成绩对最后一期预测成绩的回归模型及参数估计

自变量	未标准化回归系数	标准误	t值	P值
(截距)	16.483	12.855	1.282	0.204
最后一期预测成绩	0.857	0.174	4.917	＜0.001^***
注：^***P≤0.001.

下载: 导出CSV

[1]	杨现民, 唐斯斯, 李冀红. 发展教育大数据: 内涵、价值和挑战[J]. 现代远程教育研究, 2016(1): 50-61. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XDYC201601008.htm
[2]	李新, 杨现民. 教育数据思维的内涵、构成与培养路径[J]. 现代远程教育研究, 2019, 31(6): 61-67. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XDYC201906007.htm
[3]	尹忠根, 杨宗友, 李采丰. 基于"互联网+"的大学体育课内外健康数据一体化实践研究[J]. 西南师范大学学报(自然科学版), 2020, 45(4): 108-114. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xsxb.2020.04.019
[4]	张媛媛, 李爽. MOOC课程资源访问模式与学习绩效的关系研究[J]. 中国远程教育, 2019(6): 22-32, 93. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DDJY201906005.htm
[5]	李艳红, 徐敏. 学习风格偏好影响移动学习态度和行为的实证研究——以"文学批评"课程为例[J]. 电化教育研究, 2019, 40(2): 45-53. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DHJY201902009.htm
[6]	姚洁, 王伟力. 微信雨课堂混合学习模式应用于高校教学的实证研究[J]. 高教探索, 2017(9): 50-54. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-GJTA201709010.htm
[7]	胡勇. 在线学习过程中的社会临场感与不同网络学习效果之间的关系初探[J]. 电化教育研究, 2013, 34(2): 47-51. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-DHJY201302012.htm

图( 2) 表( 4)

计量

文章访问数: 2395
HTML全文浏览数: 2395
PDF下载数: 126
施引文献: 0

全文HTML

为响应教育部2018年4月下发的《教育信息化2.0行动计划》的号召，我们从2018年秋季开始，对“概率论”课程进行了移动教学改革. 将线下教学资源整合形成线上学习资源，借助于超星网络课程平台进行课程建设和管理，通过超星学习通APP开展线下为主、线上为辅的移动教学. 通过两轮的教学实践，该课程平台积累了同学们大量的在线学习数据. 如何对这些数据进行分析并挖掘其中蕴含的教育规律，成为了摆在我们面前的重要任务.

在线学习数据属于教育数据的一种，而教育数据又是大数据的一个子集，是一座可无限开采的“金矿”^[1]. 教育数据的思维和处理能力也是教师数据素养和核心能力之一^[2]. 国内已有不少学者基于教育数据开展了相关研究^[3]. 在在线学习行为对期末成绩的解释率方面，文献[4]从访问动机、资源类型、行为投入特征等三个方面进行了探讨，获得了12个反映在线学习的行为变量，这些变量对期末成绩的累计解释率为65.7%. 文献[5]则以文学批评课程为例，并从学习风格偏好的角度探讨了在线学习行为对学生期末成绩的间接影响情况. 文献[6]也以“雨课堂”的在线学习数据为协变量，进行了期末成绩的单向协方差分析，结果表明“雨课堂”对教学和学习十分有帮助. 文献[7]也以远程教育和网络教育应用课程为例，分析了学生在线学习数据，如学习满意度等，与期末成绩的相关关系.

纵观已有研究，尽管存在着在线学习数据与期末成绩的相关性研究. 但是在线学习数据往往只有一个学期的数据，且样本量相对较少，统计效力不足. 此外，现有研究往往针对的是学期末的在线学习数据的总结性分析，较少有研究对不同时段的在线学习数据进行过程性分析. 本研究将解答以下3个问题：①在线学习数据是如何影响期末成绩的？②在线学习数据可分为哪些大类？③利用过程性在线学习数据如何进行学业预警？

1. 研究设计

1.1. 研究对象和变量选取

本研究选取概率论课程的在线学习数据为例进行研究. 概率论课程是我校数学与应用数学专业和统计学专业的专业基础课，在大学二年级上学期开设. 课程总时数为48学时，每周安排4学时，共12周约100天左右. 本研究数据采集自两个学期，其中：2018-2019学年第1学期共2个教学班，分别由2017级数学与应用数学专业42人，以及2017级统计学专业73人组成；2019-2020学年第1学期1个教学班，由2018级统计学专业80人组成. 样本总容量为195人.

概率论课程依托超星网络课程平台运行，内容涵盖五章27小节的核心内容和拓展阅读以及章节测验等补充内容. 教师通过超星学习通APP的各种控件，组织学生进行线下为主、线上为辅的移动教学. 同时，课程平台记录下同学们的全程在线学习数据，包括课程积分、视频观看个数、视频观看时长、讨论得分、作业得分、在线考试得分、访问次数、签到次数、课程互动得分和任务点完成个数等共10项在线学习成绩. 由于本研究横跨2个学期，涉及3个教学班，为保证数据的一致性和可比性，我们对前述10项在线学习成绩做归一化处理. 处理方法是将每位学习者的前述10项在线学习成绩除以该学习者所处学期和所在教学班的最高成绩，得到每位学习者的各项在线学习成绩相对于该学习者所处学期和所在教学班的最高成绩的满分率. 这10项满分率被选作本研究的自变量.

1.2. 数据采集和方法概述

数据采集分过程性数据和期末数据两部分. 过程性数据采集仅在2019-2020学年第1学期教学过程中进行，采集时间一般是在距课程开课后，每隔15天左右进行. 期末数据是在所有教学活动(含成绩报送等环节)结束后约1个星期内进行. 过程性数据采集主要是前述10项在线学习成绩，而期末数据采集除了前述10项在线学习数据外，还采集了每位学习者的期末考试成绩. 其中，期末考试成绩被选作本研究的因变量.

本研究中，在线学习成绩与期末成绩的相关性分析主要采用皮尔逊相关分析，不同等级(即期末考试成绩分段，见后文详述)同学的在线学习成绩之间的差异性比较采用方差分析法，在线学习成绩对期末成绩的影响主要采用多元线性回归中的逐步回归法，而在线学习成绩分类则通过因子分析法得出. 所有分析均在SPSS 25.0中完成.

3. 结论与建议

我们以大学概率论课程为例，对在线学习数据如何影响学生学习成绩进行了深入研究，得到如下结论，并据此提出了相关建议.

1) 在线学习成绩与期末成绩呈显著正相关.

在线学习成绩与期末成绩之间普遍存在显著的正相关关系. 其中，相关系数大于0.5的有在线考试满分率、讨论满分率、访问数满分率和课程互动满分率. 这几个指标均能较好地反映学生的在线学习积极性和在线学习水平. 此外，随着学生期末成绩等级的下滑，几乎所有在线学习成绩项均呈下滑趋势，仅有视频观看个数比、任务点完成率和签到满分率几个指标在期末成绩为“良好”等级时达最高值点. 这表明，期末考试处于“良好”等级的同学，平时会十分关注动动手指就能完成的，比如签到这样的任务. 但是，处于“良好”等级的同学在其他项目，比如作业满分率、在线考试满分率等方面，却明显低于期末成绩处于“优秀”等级同学的相应成绩. 即“优秀”的同学之所以优秀，除了做好诸如“签到”等易于完成的任务外，平时还花了很多精力在衡量知识转化的“作业”“考试”等方面. 此外，我们还可以得到，期末考试“不及格”的同学在平时各项成绩排名中都靠后. 如何让这部分同学也积极提高学习成绩，是值得我们深思的又一个课题.

2) 在线学习成绩可归并为反映“知识输入”“知识输出”和“互动交流”的3个类别.

因子分析表明，同学们的在线学习成绩可归并为反映“知识输入”“知识输出”和“互动交流”的3个类别. 其中，反映“知识输入”的有视频观看个数比、视频观看时长比、任务点完成率等；反映“知识输出”的有作业满分率、访问满分率等；而反映“互动交流”的则有课程互动满分率、课程积分比、讨论满分率等. 这3个类别的显著代表变量分别是访问满分率、在线考试满分率和讨论满分率. 因此，为使学习者获得较好的学习成绩，教师应重点关注课程访问热度、课程讨论频率和在线考试成绩这3项指标，学习者也应尽力提升自己在这3项指标上的成绩.

3) 阶段性在线学习数据与期末成绩呈显著正相关关系且具有学业预警功能.

课程学习进行过程中的阶段性在线学习数据与期末成绩呈显著正相关关系，且相关系数随着学习时长的推进呈上升趋势. 选取最后一期在线学习数据，代入回归方程(1)得期末成绩的预测值. 对于预测值低于50.778分的学习者，教师可以提前进行干预，以防学生出现不及格现象. 从而实现阶段性在线学习数据的学业预警功能.

教师作为信息化教学的组织者、主导者和具体实施者，应主动关注、收集、整理和分析相关教育数据，让经验以数据为支撑，让教学通过规律来指导，实现国家提出的发展和提高本科教育质量的宏伟目标.

参考文献 (7)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

在线学习数据与学生学习成绩的相关性分析——以大学概率论课程为例

1.
东华理工大学理学院，南昌 330013

2.
华中师范大学教育学院，武汉 430079

作者简介:
熊思灿，博士，副教授，主要从事教育统计学方向研究 .

On Correlation Analysis Between Online Learning Data and Students' Academic Performance——With the University Probability Theory Course as an Example

1.
School of Science, East China University of Technology, Nanchang 330013, China

2.
School of Education, Central China Normal University, Wuhan 430079, China

计量

在线学习数据与学生学习成绩的相关性分析——以大学概率论课程为例

作者简介: 熊思灿，博士，副教授，主要从事教育统计学方向研究
1. 东华理工大学理学院，南昌 330013

2. 华中师范大学教育学院，武汉 430079

English Abstract

On Correlation Analysis Between Online Learning Data and Students' Academic Performance——With the University Probability Theory Course as an Example

全文HTML

1.1. 研究对象和变量选取

1.2. 数据采集和方法概述

2.1. 相关性分析及差异性检验

2.2. 回归分析及因子分析

2.3. 过程性在线学习成绩分析与学业预警

目录

留言板

在线学习数据与学生学习成绩的相关性分析——以大学概率论课程为例

1. 东华理工大学 理学院，南昌 330013 2. 华中师范大学 教育学院，武汉 430079

作者简介: 熊思灿，博士，副教授，主要从事教育统计学方向研究 .

On Correlation Analysis Between Online Learning Data and Students' Academic Performance——With the University Probability Theory Course as an Example

1. School of Science, East China University of Technology, Nanchang 330013, China 2. School of Education, Central China Normal University, Wuhan 430079, China

计量

出版历程

在线学习数据与学生学习成绩的相关性分析——以大学概率论课程为例

作者简介: 熊思灿，博士，副教授，主要从事教育统计学方向研究 1. 东华理工大学 理学院，南昌 330013 2. 华中师范大学 教育学院，武汉 430079

English Abstract

On Correlation Analysis Between Online Learning Data and Students' Academic Performance——With the University Probability Theory Course as an Example

全文HTML

1.1. 研究对象和变量选取

1.2. 数据采集和方法概述

2.1. 相关性分析及差异性检验

2.2. 回归分析及因子分析

2.3. 过程性在线学习成绩分析与学业预警

目录

1.
东华理工大学理学院，南昌 330013

2.
华中师范大学教育学院，武汉 430079

作者简介:
熊思灿，博士，副教授，主要从事教育统计学方向研究 .

1.
School of Science, East China University of Technology, Nanchang 330013, China

2.
School of Education, Central China Normal University, Wuhan 430079, China

作者简介: 熊思灿，博士，副教授，主要从事教育统计学方向研究
1. 东华理工大学理学院，南昌 330013

2. 华中师范大学教育学院，武汉 430079