第02讲 用样本估计总体 -【考点通关】2021-2022学年高一数学下学期考点精讲+精练(人教A版2019必修第二册)(解析版)

3.0 cande 2025-05-10 40 4 1.51MB 36 页 3知币
侵权投诉
2讲 用样本估计总体
知识点 1 频率分布表与频率分布直方图
1、频率与频数
将一批数据按要求分为若干个小组,各个小组内数据的个数,叫做该组的频数;每组数据的频数除以
全体数据的个数的商,叫做该组数据的频率. 频率反映各个小组数据在样本量中所占比例的大小.
2、样本的频率分布及频率分布表
根据随机抽取的样本量的大小,分别计算某一事件出现的频率,这些频率的分布规(取值状况),就
叫做样本的频率分布.为了能直观的显示样本的频率分布情况,通常将样本量、样本中出现该事件的频数以
及计算所得的相应频率列在一张表中,这张表叫做频率分布表. 分组、频数、频率是频率分布表中最基本
也是必要的三列.在实际操作中,每组的频数是通过类似统计选票时的“唱票”的方式进行统计的,所以通
常频率分布表中还会有“频数累计”一列.
注:①对频率分布表的理解:频率分布表给出了各个区间的频数和频率。由此可以估计这组数的分布情况
样本频率分布是总体分布的一种近似情况.
②样本的抽取必须是随机的:用样本频率分布来估计总体分布时,要使样本很好地反映总体的特征,必须
随机抽取样本. 如果随机抽取另外一个样本量相同的样本,所形成的样本频率分布一般会与前一个样本频
率分布有所不同,但是他们都可以近似的估计总体的分布.
3、频率分布直方图
来,.
组,纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,画成小长方形,这
样得到的直方图就是频率分布直方图.
①绘制频率分布直方图的步骤
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数
越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个
数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.
注:①频数分布直方图的纵坐标是频数,每一组数对应的矩形的高度与频数成正比;频率分布直方图
的纵坐标是,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,所
有矩形的面积之和为 1.
②样本组数、组距与分点的确定:
1)对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少都会影响我们了解数据的
分布情况. 数据分组的组数与样本量有关,一般样本量越大,所分组数越多,当样本量不超过 100 时,按照
数据的多少,通常分成 5~12 组,且根据组数=极差/组距来大致确定组数
2)为了实际操作方便,组距的选择应结合极差尽量“取整”,例如极差约1,组距可以选0.1
的整数倍,比如以 0.1 0.2 为组距;极差约为 10,组距可以选1的整数倍,比如以 12为组距;极差
约为 100,组距可以选10 的整数倍,比如以 10 20 为组.如果极差不利于分组,不能被组距整除,可
以适当增加极差,如在左右两端各增加适当范围,并尽量使两端增加量相同
3)分点的确定:若数据为整数,则分点数据减去 0.5;若数据是小数点后有一位数字的数,则分点
数据减去 0.05,以此类推. 分组时,通常对组内数值所在的区间取左闭右开区间,最后一组取闭区间.
知识点 2 统计图表
条形图、折线图及扇形图
(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一
定的数量,根据每个样(某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形
照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.
优点:条形统计图不但可以直观的反映数据分布的大致情况,还可以清晰地表示出各个区间的具体数
目,易于比较数据间的差别.
缺点:会损失数据的部分信息,且不能明确显示部分与整体的关系.
(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,
据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样
本数据的情况,这样的一种表示和分析数据的统计图称为折线图.
优点:折线统计图不但可以表示数量的多少,还可以通过折线的起伏清楚直观地表示数量的增减
情况.
缺点:折线统计图不能直观反映数据的分布情况,且不适合总体分布较多的情况
(3)形图:用一表示总体中各形分别表总体中的不同部分,每个形的大小反映所表示
部分占总体的分比的大小,这样的一种表示和分析数据的统计图称为形图.
优点:形统计图可以很清楚的表示各部分与总体间的关系,即扇形统计图能清楚地表示出各部分
在总体中所占的分比
缺点:会损失数据的部分信息,且不能明确显示部分与整体的关系.
知识点 3 百分位数
(1)一组数据的第 p分位数是这样一个值,使得这组数据中少有 p%的数据小于等于这个值,
少有(100p)%的数据大于等于这个值.
(2)计算一组个数据第 p分位数的步骤
1步,按小到大排列原始数据.
2步,计算
i n × p %.
3步,
i
不是整数大于
i
的比整数
j
p
分位数为
j
数据;若
i
是整数,
p
分位数为第
i
与第 ( i 1) 数据的平均数.
(3)分位数
把所有数值由小到大排列并分成于三个分点位的数值就是分位数.
中第 25 位数也称为第分位下四分位数等,第 75 分位数也称为第三位数
分位数等.
知识点 4 总体集中趋势的估计
1数、中位数、平均数的理解
(1)一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的数.
注:如果有几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数
据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.
(2)果一组数个数,且按到大排列后为 x1x2x2n1xn1
为这组数的中位数
如果一组数有数个数,且按照小到大排列后为 x1x2x2n称为这组数的中位数.
(3)如果给定的一组数是 x1x2xn这组数的平均数为(x1x2+…+xn)
数、中位数、平均数都是画“中”的量,不同角度画了一组数据的趋势
2众数、中位数、平均数的比较
称 优点 缺点
①体现了样本数据的最大中点;
易计算
它只能表达样本数据中很少的一部
分信息;
无法客观地反映总体的特征
①不(即排序靠
前或靠后的数据)影响
易计算,便用中间数据的信
对极值不敏感
较好,是反映数据趋势
量.一般情况,可以反映出多的
关于样本数据全体的信息
任何一个数据的改变都会平均
改变.数据越“离群”,对平均
影响越大
知识点 5 总体离散程度的估计
1、方差、标差的定
一组数据 x1x2xn,用表示这组数据的这组数据的方差为
第02讲 用样本估计总体 -【考点通关】2021-2022学年高一数学下学期考点精讲+精练(人教A版2019必修第二册)(解析版).docx

共36页,预览5页

还剩页未读, 继续阅读

作者:cande 分类:高中 价格:3知币 属性:36 页 大小:1.51MB 格式:DOCX 时间:2025-05-10

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 36
客服
关注