数据挖掘在高校学生成绩预警中的应用研究

数据挖掘在高校学生成绩预警中的应用研究

ID:26837076

大小:52.50 KB

页数:5页

时间:2018-11-29

数据挖掘在高校学生成绩预警中的应用研究_第1页
数据挖掘在高校学生成绩预警中的应用研究_第2页
数据挖掘在高校学生成绩预警中的应用研究_第3页
数据挖掘在高校学生成绩预警中的应用研究_第4页
数据挖掘在高校学生成绩预警中的应用研究_第5页
资源描述:

《数据挖掘在高校学生成绩预警中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据挖掘在高校学生成绩预警中的应用研究摘要:随着高校教务系统数据库中大量数据的积累,教师却难以从中获取有价值的信息。针对此现状,利用数据挖掘中的Apriori算法,挖掘出频繁项集的特点,通过Apriori算法对学生成绩进行分析处理,预设支持度与置信度找出数据库中具有联系和不同可信度的课程成绩作为关联规则,将关联规则用于学生成绩预警,对处于危险区的学生提前作出预警通知。中国8/vie  关键词:数据挖掘;关联规则;Apriori算法;学生成绩;预警  中图分类号:TP391文献标识码:A:1009-3044(2017)04-0204-03  伴随着信息时代的飞速发展,数据

2、大量积累,数据挖掘应运而生,并得到了广泛关注。数据挖掘技术之所以能取得极大的关注,主要是可以处理的大量数据,将这些数据转换成有用的信息和知识。随着高校的不断扩招,各校的生源量明显增多,但就特别容易出现学生层次不均、成绩参差不齐的现象。目前大部分高校教务处都是利用教务管理系统对学生的信息及成绩进行管理,但都存在没有对学生的数据进行统计和分析的问题。本文将通过导出学生的专业主干课程的成绩,并对其进行统计和分析,对部分不及格课程门数较多,即将面临毕不了业或拿不到学位证的学生提出预警,对他们的学习过程进行监督。众所周知,同一专业不同的课程之间必然存在着一定的联系,本文通过利用数

3、据挖掘技术对学生成绩进行统计、处理和全面的分析,挖掘出学生在各个课程成绩之间存在的内在联系,找出其中的关系,全面掌握学生的学习情况,从而对这些成绩不及格门数较多的学生提出预警,在今后的学习中,辅导员可根据分析结果加强对这些学生的学习过程的监督和管理,提升学生的及格率,更进一步的保证学校的毕业率。  1关联规则算法:Apriori算法  1.1关联规则  设[II1,I2,…Im]为项的集合,与任务相关的数据[D]是数据库事务的集合,其中每个任务T是项的集合,其中每个任务T是项的集合,使得[T?TID]为每个事务的标识符。设[A]是一个项集,事务T包含[A]当且仅当[A?

4、T]。关联规则形如[如A?B的蕴涵式],其中[A?I,B?I],并且满足[A?B=?]。规则[A?B]在事务集[D]中成立,具有支持度[s],其中[s]是[D]中事务包含[A?B](即集合[A和B]的并或者[A和B]二者)的百分比,即是概率[P(A?B)],规则[A?B]在事务集[D]中具有置信度,其中[c是D]中包含[A]的事务,同时也包含[B]的百分比。这是条件概率。即[supportA?B=P(A∪B)]  [confidenceA?B=P(B

5、A)]  同时满足最小支持度阈值([min_sup])和最小置信阈值[(min_conf)]的规则称作强规则【5】。  

6、1.2Apriori算法  Apriori算法发现关联规则挖掘过程分解步骤:  1)通过采用迭代的方法检索出事务数据库中所有频繁项集。即找出事务�稻菘�D中所有大于等于指定最小支持度阈值的项目集。  2)利用频繁项目集挖掘出满足用户需要的强关联规则。即找出支持度和置信度大于等用户给定的支持度和置信度阈值的关联规则。  寻找频繁项集是挖掘关联的最核心的一步,对挖掘关联规则的总体性能起到了决定性的作用。第二步是在第一步找到的频繁项集的基础上列出所有可能的关联规则,同时,找出满足支持度和置信度要求的强关联规则即可【5】。  2Apriori算法在学生成绩分析中的应用  2.1

7、数据预处理  以某大学2013级计算机科学与技术专业学生的专业课程成绩为例,如表1所示,从教务管理系统中导出该班级的成绩,利用关联规则算法挖掘课程和学生成绩之间关系。原始数据表分学年进行存储,其中包括本学年的班级所有学生的专业必修课和专业选修课的成绩。  2.1.1课程选择  相比而言,学生公选课程范围比较广,甚至会出现一个班级只有一名学生选择同一门课程的现象,即仅有一个事务包含此项目,不满足关联规则的最小支持度的要求。根据2013级计算机专业的成绩单显示,同班学生选择同一门公选课的较少,所以公选课的成绩不作为数据来源,不对此进行分析。因此,数据库的数据包含学生的专业必

8、修课成绩和专业选修课成绩。  2.1.2成绩离散化处理  学生的原始成绩由百分制或等级制表现出来的,我们需要将这些成绩进行统一化处理,将成绩分为4个类别。百分制成绩划分如下:成绩大于或等于90分,等级为1;成绩大于等于80且小于90分,等级为2;成绩大于等于60且小于80分的等级为3;成绩小于60,成绩等级为4。根据本专业的人才培养方案,选取15门课程进行研究,分别对这些课程用字母A~O进行标识。  2.2数据处理  2.2.1数据转化  根据成绩等级划分规则和课程标识码,将该班级学生的课程成绩做成事务表,转化后的数据如表2所示。  2.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。