基于熵值模型的高校贫困生认定系统研究

吉朝明; 王华; 宋铁成

doi:10.13718/j.cnki.xsxb.2021.04.020

基于熵值模型的高校贫困生认定系统研究

1.
四川交通职业技术学院信息工程系，成都 611130

2.
重庆邮电大学通信与信息工程学院，重庆 400065

基金项目: 国家自然科学基金资助项目(61702065)、四川省教育信息化应用与发展研究中心项目(JYXX18-030)、四川交通职业技术学院科研基金项目(2019-120-07)

详细信息

作者简介:
吉朝明，硕士，讲师、工程师，主要从事软件技术、网络安全等方面的研究 .

中图分类号: TP311

Research of an Identification System for Poverty-Stricken College Students Based on the Entropy Model

1.
Department of Information Engineering, Sichuan Vocational and Technical College of Communications, Chengdu 611130, China

2.
Department of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China

摘要: 为客观量化认定高校贫困生的贫困状态，本文利用校园卡消费数据和学生基本信息，构建了学生消费恩格尔系数、月均食堂消费水平、早餐月均消费额校均比、中餐月均消费额校均比、晚餐月均消费额校均比、食堂就餐率、助学贷款总额、勤工助学次数等8项贫困生评定指标，根据熵值法客观确定指标权重并计算出学生贫困指数. 最后，结合高校贫困生认定的实际情况，采用熵值模型分析与人工审核相结合的方式进行系统设计. 测试表明，该系统能帮助高校有效解决长期以来贫困生认定工作难量化、不客观的问题.
- 贫困生认定 /
- 指标体系 /
- 熵值模型 /
- 认定系统 /
- 研究与设计
Abstract: To objectively quantify the poverty status of poverty-stricken college students, this paper constructsan index system containing 8 indicators to assess poverty-stricken students based on the campus card consumption data and basic student information. These indicators include the Engel coefficient of student consumption, the average monthly canteen consumption level, the average monthly breakfast/lunch/dinner consumption ratio between one person and all students, dining room rate, total student loan, and work-study times. The entropy value model is used to determine the weights of the indicators and calculatethe student poverty index. Finally, considering the reality of identifying poverty-stricken college students, a systematic research and design is carried out by combining the entropy model analysis and manual audits. The results of a test show that our system can efficiently address the difficulties of identifying poverty-stricken students which have long plagued the colleges.
- identification of poverty-stricken college students /
- index system /
- entropy model /
- identification system /
- research and design .

图 1 系统结构图

下载: 全尺寸图片幻灯片

图 2 系统功能结构图

下载: 全尺寸图片幻灯片

图 3 系统主要业务表设计图

下载: 全尺寸图片幻灯片

图 4 贫困生评定分析结果示例图

下载: 全尺寸图片幻灯片

表 1 贫困生认定指标体系

指标体系	指标说明	权重
恩格尔系数(X₁)	三餐消费在整体消费中的占比(%)	W₁
月均食堂消费水平(X₂)	月均食堂消费额/全校学生月食堂均消费额	W₂
早餐月均消费额校均比(X₃)	(总早餐消费金额/早餐消费次数)/(全校平均早餐消费额)	W₃
中餐月均消费额校均比(X₄)	(总中餐消费金额/中餐消费次数)/(全校平均中餐消费额)	W₄
晚餐月均消费额校均比(X₅)	(总晚餐消费金额/晚餐消费次数)/(全校平均晚餐消费额)	W₅
食堂就餐率(X₆)	该生食堂就餐率	W₆
助学贷款总额(X₇)	年均助学贷款金额	W₇
勤工助学次数(X₈)	勤工助学累计次数	W₈

下载: 导出CSV

表 2 测试结果分析表

验证指标	实际名单人数	与实际名单相符的人数	准确率
贫困生总数	422	367	86.97%
特别贫困	84	69	82.14%
普通贫困	127	107	84.25%
一般贫困	211	191	90.52%

下载: 导出CSV

[1]	肖凤翔, 俸晓玲. 高校贫困生精准资助的宗旨、原则和策略[J]. 现代教育管理, 2020(3): 117-122. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-LNGD202003018.htm
[2]	饶亮. 改进的Apriori算法在贫困生助学系统中的应用[D]. 哈尔滨: 哈尔滨工程大学, 2011.
[3]	王泽原, 赵丽, 胡俊. 大数据环境下利用随机森林算法和决策树的贫困生认定方法[J]. 湘潭大学学报(自然科学版), 2018, 40(6): 115-120. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XYDZ201806015.htm
[4]	柴政, 屈莉莉, 彭贵宾. 高校贫困生精准资助的神经网络模型[J]. 数学的实践与认识, 2018, 48(16): 85-91. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-SSJS201816011.htm
[5]	陆桂明, 张源, 周志敏. 基于机器学习的贫困生分类预测研究[J]. 计算机应用与软件, 2019, 36(1): 316-319. doi: 10.3969/j.issn.1000-386x.2019.01.055
[6]	程茜宇. 基于深度神经网络的高校贫困生精准识别研究[D]. 南昌: 江西财经大学, 2019.
[7]	何功炳. 基于校园卡消费数据挖掘的高校贫困生认定方法研究[D]. 合肥: 安徽大学, 2019.
[8]	柴政, 屈莉莉, 彭贵宾. 借鉴恩格尔定律测度高校贫困生精准资助指数[J]. 教育现代化, 2018, 5(6): 186-188, 199. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JYXD201806069.htm
[9]	廖文婷, 何多兴, 唐傲, 等. 基于改进熵值法的土地储备融资风险评价——以重庆市江北区为例[J]. 西南师范大学学报(自然科学版), 2016, 41(8): 95-100. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XNZK201608016.htm
[10]	YIN L K, DENG Y. Toward Uncertainty of Weighted Networks: an Entropy-Based Model[J]. Physica A: Statistical Mechanics and its Applications, 2018, 508: 176-186. doi: 10.1016/j.physa.2018.05.067
[11]	张茜茜, 廖和平, 杨伟, 等. 基于熵权TOPSIS模型的乡村土地利用转型评价研究——以重庆市渝北区为例[J]. 西南大学学报(自然科学版), 2018, 40(10): 135-144. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-XNND201810023.htm
[12]	doi: http://ieeexplore.ieee.org/document/8412659/ ONAL E, SEKER S. Entropy Model for Optimal Coordination in High-Voltage Dielectric Systems[J]. IET Generation, Transmission & Distribution, 2018, 12(13): 3130-3135.
[13]	doi: http://www.sciencedirect.com/science/article/pii/S0925753518319209 WU D M, LI Z L. Work Safety Success Theory Based on Dynamic Safety Entropy Model[J]. Safety Science, 2019, 113: 438-444.
[14]	李法平, 王成良. Redis可扩展与高效复制方案的设计与实现[J]. 西南师范大学学报(自然科学版), 2018, 43(3): 83-90. doi: http://xbgjxt.swu.edu.cn/article/doi/10.13718/j.cnki.xsxb.2018.03.013
[15]	胡鑫, 姚宇, 徐英杰. 基于ElasticSearch的TEE病例库检索系统设计与实现[J]. 计算机应用, 2018, 38(S1): 91-94. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-JSJY2018S1022.htm

图( 4) 表( 2)

计量

文章访问数: 827
HTML全文浏览数: 827
PDF下载数: 85
施引文献: 0

全文HTML

随着我国经济社会和高等教育的发展，国家高度重视对贫困生的资助，但如何提升资助育人成效，对贫困生进行精准识别和对贫困度进行客观计算，成为长期以来高校贫困生认定工作中的热点和难点问题，较大程度地影响了贫困生资助的公平性和公正性^[1].

随着校园卡建设向服务深化、技术融合、平台互连的方向发展，校园卡承载了金融消费和身份识别两大主要功能，被广泛应用于食堂、校园超市、图书借阅、考勤等校园业务场景中，方便了学生的日常生活；校园卡的数据也成为了获取学生生活和经济情况的有效途径. 目前利用校园卡数据进行分析和数据挖掘处理，客观评定学生的经济状况，已经有一些初步研究. 比如，饶亮^[2]以校园一卡通数据为研究对象，运用改进了的Apriori方法挖掘困难学生群体一卡通中各项数据的关联规则，发现其中的相关性和潜在规律. 文献[3]基于学生基本信息、校园卡消费信息等数据，运用随机森林算法和决策树进行贫困生的判别. 柴政等人^[4]通过分析学生校园一卡通的消费记录，然后利用基于神经网络的数据挖掘方法进行贫困生的识别. 陆桂明等人^[5]基于学生的校园卡消费数据，结合学生的消费和生活规律，运用机器学习中XGBoost(eXtreme Gradient Boosting)模型和主成分分析法、过采样算法，对高校贫困生进行预测. 程茜宇^[6]利用校园一卡通数据，以深度学习方法为技术依托，构建精准识别模型进行高校贫困生的识别. 何功炳^[7]基于改进的主成分分析法对一卡通消费数据进行简约处理，再利用GBDT(Gradient Boosting Decision Tree)算法实现贫困判定模型的训练以及贫困生的预测.

这些研究主要集中在理论研究上，能运用于实际工作中的方法和系统较少. 鉴于此，本文在已有研究成果的基础上，利用校园一卡通消费数据和学生基本信息，构建贫困生认定指标体系，建立基于熵值法的客观数据模型，计算学生的贫困指数，客观地识别出贫困生，并通过Java EE技术实现相应的管理平台并运用于实际工作中.

1. 关键技术研究

熵值法通过信息熵来计算指标权重，被广泛应用于分析评价领域中，能较科学地考虑数据之间的相关关系和变异程度，从而弥补了不精准的主观赋权模式的不足. 基于熵值模型的贫困生认定系统的研究主要包含2个关键问题，一是如何利用校园卡的消费数据和学生的基本信息来科学地构建贫困生认定指标体系；二是如何确定所构建的指标体系的权重.

1.1. 贫困生认定指标体系的构建

指标体系的构建是贫困生认定模型中极为重要的一步，而指标设计是否合理将对认定结果起决定性作用. 一般情况下，通过人工经验进行贫困生认定指标体系的构建. 本文采用人工经验与文献分析相结合的方式构建指标体系，根据校园卡消费数据和学生基本信息，构建出学生消费恩格尔系数、月均食堂消费水平、早餐月均消费额校均比、中餐月均消费额校均比、晚餐月均消费额校均比、食堂就餐率、助学贷款总额、勤工助学次数等8项贫困生评定的指标，具体指标及其说明如表 1所示. 其中，恩格尔系数表示学生食堂消费占个人消费支出总额的比重. 依据恩格尔定律公式^[6]，本文恩格尔系数可表示为

其中，食堂消费支出是指学生利用校园卡在学校各食堂进行餐饮消费的支出；校园购物消费是指学生利用校园卡在学校商贸超市等进行购物的消费支出.

1.2. 确定指标权重

传统的指标赋权方法如专家评判法、层次分析法等具有很大的主观性和盲目性，而熵值法是一种客观的赋权方法^[8]，能够克服主观赋权的不足. 其原理是利用信息熵的特性，依据指标变异性的大小来确定指标的客观权重^[9]. 一般情况下，若某个指标的信息熵E_j越小，表明该指标的变异性越大，其涵盖的信息量就越多，在综合评价中起到的作用就越大，因此其权重就越大；反之，如果某个指标的信息熵E_j越大，表明该指标的变异性越小，其涵盖的信息量就越少，在综合评价中起到的作用就越小，因此其权重就越小^[10]. 计算步骤为：

1) 构建矩阵. 根据设计的指标，取各指标的数据值，构建矩阵R

式(1)中，m是指标个数，n是对象个数，r_ij为指标i在区域j上的值^[11]. 本文依据设计出的指标，将校园卡消费的原始数据经过预处理后得到贫困生指标数据，从而构建出以上矩阵.

2) 数据标准化处理. 由于各指标之间计量单位等属性差异很大，因此需要对数据采取标准化处理，用min-max标准化法对得到的指标数据进行线性变换^[12]，得到标准化后的数据C_ij，其取值范围为[0, 1]，计算公式为

式(2)、(3)中，max(r_ij)、min(r_ij)分别为某指标所在行中的最大、最小值. 式(2)适用于正向指标，式(3)适用于逆向指标.

3) 计算贡献度. 将数据矩阵R经过标准化处理后，建立新数据矩阵P，然后确定各指标的贡献度P_ij^[13]，$ \boldsymbol{P}_{i j}=\frac{\boldsymbol{P}_{i j}}{\sum\limits_{j=1}^{n} \boldsymbol{P}_{i j}}$.

4) 计算各指标的信息熵. 根据公式(4)计算各个指标的信息熵E_j，

式(4)中，$K=\frac{1}{\ln n}, \boldsymbol{P}_{i j} $为贡献度.

5) 计算指标权重. 在上述计算中，若$ {\mathit{\boldsymbol{P}}_{ij}} = 0,\mathop {\lim }\limits_{{p_{ij}} \to 0} {\mathit{\boldsymbol{P}}_{ij}} = 0$，在确定各指标的信息熵值后，根据下述公式来计算指标的权重：

其中，1-E_i表示第i项指标的差异系数，差异系数越大，指标就越重要.

1.3. 贫困指数的计算

贫困指数是用以衡量一个学生贫困程度的指数，用PM表示，其取值范围在0~1之间，数值越大贫困程度越高. 依据本文构建的贫困因子及其权重，学生贫困指数的计算逻辑表示为：

其中，当0≤X₇≤5000时，Y₇=(X₇*W₇)/5000；当X₇＞5000时，Y₇=W₇；当0≤X₈≤3时，Y₈=(X₈*W₈)/3；当X₈＞3时，Y₈=W₈. PM代表贫困生的贫困指数，将贫困指数排序，根据从高到低的原则可以得出学生的贫困程度.

4. 结论

为实现高校对贫困生的精准资助，提高资助育人成效，解决贫困生认定工作中难量化、不客观的问题，本文利用校园卡消费数据、学生基本信息数据，结合恩格尔定律，设计了学生消费恩格尔系数、月均食堂消费水平、早餐月均消费额校均比、中餐月均消费额校均比、晚餐月均消费额校均比、食堂就餐率、助学贷款总额、勤工助学次数等8项贫困生认定指标，并运用熵值法计算各指标的权重，客观计算出学生的贫困指数，确定贫困等级. 最后，通过Java EE技术实现了相应的系统，经过测试系统可以很好地运用于实际工作中，能帮助学校解决贫困生评定过程中存在的难量化、不客观等问题. 未来，将研究利用学生的移动支付和网络支付等途径的消费数据，使数据更加完整，涵盖的范围更加广泛，系统识别的准确性也将进一步得到提高.

参考文献 (15)

姓名
	姓名不能为空！
邮箱
	邮箱不能为空！非法的邮箱地址。
手机号码
	电话不能为空！请输入有效手机号!
标题
	标题不能为空！
留言内容
	内容不能为空！
验证码
	验证码不能为空！验证码错误！

留言板

基于熵值模型的高校贫困生认定系统研究

1.
四川交通职业技术学院信息工程系，成都 611130

2.
重庆邮电大学通信与信息工程学院，重庆 400065

作者简介:
吉朝明，硕士，讲师、工程师，主要从事软件技术、网络安全等方面的研究 .

Research of an Identification System for Poverty-Stricken College Students Based on the Entropy Model

1.
Department of Information Engineering, Sichuan Vocational and Technical College of Communications, Chengdu 611130, China

2.
Department of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China

计量

基于熵值模型的高校贫困生认定系统研究

作者简介: 吉朝明，硕士，讲师、工程师，主要从事软件技术、网络安全等方面的研究
1. 四川交通职业技术学院信息工程系，成都 611130

2. 重庆邮电大学通信与信息工程学院，重庆 400065

English Abstract

Research of an Identification System for Poverty-Stricken College Students Based on the Entropy Model

全文HTML

1.1. 贫困生认定指标体系的构建

1.2. 确定指标权重

1.3. 贫困指数的计算

2.1. 系统架构设计

2.2. 系统功能设计

2.3. 数据库设计

3.1. 系统实现

3.2. 结果分析

目录

留言板

基于熵值模型的高校贫困生认定系统研究

1. 四川交通职业技术学院 信息工程系，成都 611130 2. 重庆邮电大学 通信与信息工程学院，重庆 400065

作者简介: 吉朝明，硕士，讲师、工程师，主要从事软件技术、网络安全等方面的研究 .

Research of an Identification System for Poverty-Stricken College Students Based on the Entropy Model

1. Department of Information Engineering, Sichuan Vocational and Technical College of Communications, Chengdu 611130, China 2. Department of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China

计量

出版历程

基于熵值模型的高校贫困生认定系统研究

作者简介: 吉朝明，硕士，讲师、工程师，主要从事软件技术、网络安全等方面的研究 1. 四川交通职业技术学院 信息工程系，成都 611130 2. 重庆邮电大学 通信与信息工程学院，重庆 400065

English Abstract

Research of an Identification System for Poverty-Stricken College Students Based on the Entropy Model

全文HTML

1.1. 贫困生认定指标体系的构建

1.2. 确定指标权重

1.3. 贫困指数的计算

2.1. 系统架构设计

2.2. 系统功能设计

2.3. 数据库设计

3.1. 系统实现

3.2. 结果分析

目录

1.
四川交通职业技术学院信息工程系，成都 611130

2.
重庆邮电大学通信与信息工程学院，重庆 400065

作者简介:
吉朝明，硕士，讲师、工程师，主要从事软件技术、网络安全等方面的研究 .

1.
Department of Information Engineering, Sichuan Vocational and Technical College of Communications, Chengdu 611130, China

2.
Department of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China

作者简介: 吉朝明，硕士，讲师、工程师，主要从事软件技术、网络安全等方面的研究
1. 四川交通职业技术学院信息工程系，成都 611130

2. 重庆邮电大学通信与信息工程学院，重庆 400065