探索性数据分析期末论文

探索性数据分析期末论文

ID:40280662

大小:66.34 KB

页数:4页

时间:2019-07-30

探索性数据分析期末论文_第1页
探索性数据分析期末论文_第2页
探索性数据分析期末论文_第3页
探索性数据分析期末论文_第4页
资源描述:

《探索性数据分析期末论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、探索性数据分析方法在成绩分析中的应用摘要:英语、物理、高数、线代、概率论基础、概率论与数理统计等高校公共基础课程旨在帮助学生建立科学的知识结构,培养学生基本的思维能力、分析解决问题的能力和英语运用能力,为后期专业课程的学习奠定基础,因此这类课程的教学质量与教学效果具有尤为重要的意义。本文利用探索性数据分析方法对某高校2002—2009级学生公共基础课程的考试成绩进行了统计分析(采用SPSS软件),以期通过成绩状况探讨此类课程的教学效果及其影响因素,并提出此类课程教学改革的建议关键词:成绩分析:探索性数据分析:教学评估1研究

2、背景课程考试是高校评估学生学习成绩检验教师教学效果的主要形式,充分发挥考试的测量、诊断、反馈、激励作用是高校提高教学质量的重要环节.教育部在2005年1号文件中再一次强调“高等学校要努力探索和建立本校教学质量保证与监控机制”对于高校教学质量监控机制中不可或缺的试卷分析丁作应该引起高度重视。英语、物理、高数、线代、概率论基础、概率论与数理统计等是学校公共基础课程,旨在帮助学生建立科学的知识结构,培养学生基本的思维能力、分析解决问题的能力和英语运用能力,为后期专业课程的学习奠定基础.因此加强这类课程的试卷分析质量.提高教学质量

3、与教学效果具有尤为重要的意义。2探索性数据分析自17世纪中叶统计学开始萌芽,直至上世纪三、四十年代其完整体系的建立,为了追求“不确定性的数量度量”,学者们不得不迁就于“正态分布”模型,而不太顾及数据的实际情况。伴随着数理统计学者的数学和概率论水平的提高,导致了数理统计研究论文的高度数学化,表现为大量论文所讲的理论莫测高深.而所提供的有用方法则极少在此背景下,探索性数据分析(exploratorydataanalysis.以下简称EDA)于上世纪六十年代被提出.并得到了越来越多的学者关注与研究。具体而言.EDA是对调查、观察

4、所得到的一些原始数据,在不做先验假定或做出尽量少的先验假定下进行处理,通过作图、制表等直观形式和方程拟合、计算特征量等数学手段,探索数据结构和规律的一种数据分析方法。当我们对数据中的信息没有足够的认识,不知道应该采用哪种传统统计方法进行分析时.探索性数据分析就会非常有效。EDA的出现主要是在对数据进行初步分析时,此时因为对数据的基本特点还没有认识,所以往往还无法进行常规的统计分析。这时候,如果分析者先对数据进行探索性分析,辨析数据的模式与特点,并把它们有效发掘出来,就能够帮助我们选择和调整合适的分析模型,并揭示数据相对于常

5、见模型的种种偏离。在此基础上再采用传统统计分析技术,如区间估计和假设检验.就可以更加科学有效地评估所观察到的模式或效应。值得一提的是,正因为EDA更强调直观及图形显示.所以它采用了很多创新的可视化技术.而随着科技的发展.尤其是现代家庭电脑的普及。目前这些可视化技术已经有了很好的实现载体,例如数学软件MATLAB、SPSS等。即使不具备统计学基础的分析者也能在数学软件的帮助下.轻松地进行数据拟合以及探寻残差的规律,获得意想不到的发现,为后续的研究分析启发思路、指明方向。由此可见.将EDA引入到试卷分析中有很大的必要,并且必将

6、有力推进相关的研究工作。下通过具体的案例分析,展示EDA应用于试卷分析的基本步骤及一些相关结论。3实证分析在此对某高校2002—2009级学生公共基础课程的考试成绩进行分析。3.1描述性统计分析首先我们对样本进行描述性统计分析。由表1可以看出,从2002—2009各年级六门课程成绩的总体情况来看,六门课程的平均分在65—80分之学质量在稳步提升。从标准差来看,这几级学生除了英语之外,其他各科成绩的标准差都较大。说明物理和数学的考试成绩分化现象比较严重,这也表明物理和数学的学习对学生个人素质要求较高,更加需要教师和学生的密切

7、配合。从学习态度间波动,而从2006级到2009级来看,六门课程平均的角度分析,说明学生普遍对英语比较重视,而对出现了成绩的稳步上升,表明该校近几年来的教其他各科则不够重视。表12002—2009各年级基础课程成绩的描述性统计3.2探索性数据分析再简单的一批数。也有某些特征不容易由直接观察数据看出来。用合适的图示方法,比如直方图、茎叶图等,把这些数组织起来,从而帮助我们认识数据的各种特征。这种基本的探索性技术是最容易掌握也是最广泛使用的。利用直方图我们可以很方便的看出一批数据接近对称的程度、有多大的展布、数据间是否有间隙、

8、有无极端值等。以2008—2009学年第一学期物理成绩的频率分布直方图为例。由下图可以看出,样本分布的对称性不太好,不太符合正态分布(图1中黑色曲线是拟合的正态分布的概率密度曲线),不过确定结论需要进一步检验。继续观察发现。数据在6O和80附近有跳跃,并且在60附近有间断。为何会出现此种现象呢?深入思考

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。