概率论与数理统计复习

概率论与数理统计复习

ID:14625367

大小:128.00 KB

页数:3页

时间:2018-07-29

概率论与数理统计复习_第1页
概率论与数理统计复习_第2页
概率论与数理统计复习_第3页
资源描述:

《概率论与数理统计复习》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、概率论与数理统计期末复习1、数据的分类2、抽样误差:并非错误的“误差”即便不同的样本会产生不同的答案,大部分答案仍都位于总体中的真正比例的某一变化范围内。一般来说,正常值应在峰值的+或-3个百分点的位置。(抽样误差等于加或减三个百分点)(±3%)。抽样误差的大小依赖于得到样本的方式和样本中包含的观测的个数。样本越大,误差越小。如果样本等于整个总体,则样本比例就等于总体比例。抽样误差告诉我们,样本离总体的实际值可能有多远。3、变量分类:变量是指一个可以取两个或更多个可能值的特征、特质或属性。通常研究者在项目开始时,就要确定他们感兴趣的变量及其取值范围。经验变量:与我们所熟悉的日常生

2、活有关的变量,处理的对象是我们周围可观测到的物质世界中的事物。理论变量:用数学方法推导的变量。4、正态分布图的定义:统计理论中广泛应用的一种特别的单峰、对称的理论分布。标准正态分布:钟形曲线(特征:对称性:中点两边曲线下的面积相等)标准正态分布:一个具有0均值和1的标准差的正态变量所具有的分布叫做标准正态分布。5、统计推断:是用来从样本数据中得到关于总体参数值的结论。它由两部分组成:估计和假设检验。6、总体相对样本的定义:一个总体包含所有要研究的个体。样本是总体的一个被选中的部分。所有我们感兴趣的个体组成了总体。7、随机抽样的定义:按照随机的原则,即保证总体中每个个体都有同等机会

3、被抽中的原则抽取样本的方法。随机样本指一个合适的、能够被推广应用于更大的总体的统计样本。简单随机样本:当一个总体中的名字或电话号码被“放进一个帽子里”,搅拌均匀,并随机抽取,其结果就是一个简单随机样本。8、均值的意义及其特征:意义:将所有观察值相加的和除以观察值的个数而得的一个变量值。均值可以被看作是数据集的重心,一般用于寻找度量变量数据集的中心值。均值是一种最常用的平均数。优点:对变量的每一个观察值都加以利用。比起众数与中位数来,它会获得更多的信息。缺点:因为均值使用了数据集中的每一个具体观察值,所以计算有点麻烦。均值对极端值很敏感。因此如果由于观测误差而产生的极端值会使结果不

4、好。9、概率的定义:0到1之间的一个数,它告诉我们一个事件发生的经常程度。很长的时期内事件发生次数的比例。10、方差及其定义:观测值与均值之间变差平方的平均值,用变量本身单位的平方来衡量;标准差的平方,是测量变化程度的一种准则。11、分类变量的定义和类别:定义:是指它的任两个观测值或者相同,或者不同。观测值不能够被排序,一个观测值并不比另一个多什么。类别:表示分类变量的主要的图是圆饼图和条形图。圆饼图:优势:显示每一组的相对大小,可以在一个圆饼图中画出几个不同的组并进行比较。劣势:不适合表示每一组中有多少个观测数。条形图:优势:易于显示变量每一个取值中的观测数。劣势:不适合显示总

5、的观测数。12、统计学的定义:一组由(1)收集数据(2)分析数据(3)由数据得出结论而组成的概念、原则和方法。统计数字又叫数据,Statistics的一个简单意思是指数值数据。13、数据分析的内容:数据分析:通过图表和计算来简化数据。通常包含下列三种活动中的一种或多种:1、为数据作一个图。2、为数据制一个表。3、从数据中计算一些东西。14、度量变量:定义:根据它确定一个观测值是否和另一个不同。还可以确定一个观测值比另外一个观测值多(还是少)一些,以及多多少(还是少多少)。像高度、收入、年龄这样可被测量的变量。度量变量:点图和直方图。点线图、盒形图、茎叶图和直方图可以用来显示单个度

6、量变量。经常用来画两个变量的图是散点图和时间序列图。条形图和时间序列图可以表示多个变量。点线图:优点:可以直接告诉我们,观测的分布怎样根据变量的曲直变化。简化了数据,却没有损失信息。缺点:无法进行多观测值比较。盒形图:优点:分析来自若干组的数据时尤为管用。缺点:丢失了最初的数据,且无法恢复。茎叶图:优点:显示了具体的数据。缺点:对于数值变化范围较小的数据集就不是很有用了。直方图:优点:可以简化大量观测数据。缺点:无法保持观测的原始值。15、中位数的定义:把观测值分成同等数目的两组数,一半观察值小于等于这个数,而另一半大于等于这个数。16、置信区间:有希望可能包含总体参数的区间。区

7、间估计:又称置信区间,是用来估计参数的取值范围的。1)找一个样本统计量如均值或者比例;2)从数据中计算出抽样误差;3)用样本统计量加、减抽样误差就得到了估计区间的两个端点。由此得到置信区间(使95%包含了总体百分点的真值)例题:样本均值为10,方差为2,样本大小11(自由度10),90%的概率系数为1.37218,请计算其置信区间范围。10±1.37218√2/√11置信水平对置信区间的影响:常用为95%的置信水平,或90%的置信水平。差异的置信区间:1)两个比例之间的差异。随着

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。