第02讲 用样本估计总体 -【考点通关】2021-2022学年高一数学下学期考点精讲+精练(人教A版2019必修第二册)(解析版)
第2讲 用样本估计总体
知识点 1 频率分布表与频率分布直方图
1、频率与频数
将一批数据按要求分为若干个小组,各个小组内数据的个数,叫做该组的频数;每组数据的频数除以
全体数据的个数的商,叫做该组数据的频率. 频率反映各个小组数据在样本量中所占比例的大小.
2、样本的频率分布及频率分布表
根据随机抽取的样本量的大小,分别计算某一事件出现的频率,这些频率的分布规律 (取值状况),就
叫做样本的频率分布.为了能直观的显示样本的频率分布情况,通常将样本量、样本中出现该事件的频数以
及计算所得的相应频率列在一张表中,这张表叫做频率分布表. 分组、频数、频率是频率分布表中最基本
也是必要的三列.在实际操作中,每组的频数是通过类似统计选票时的“唱票”的方式进行统计的,所以通
常频率分布表中还会有“频数累计”一列.
注:①对频率分布表的理解:频率分布表给出了各个区间的频数和频率。由此可以估计这组数的分布情况,
样本频率分布是总体分布的一种近似情况.
②样本的抽取必须是随机的:用样本频率分布来估计总体分布时,要使样本很好地反映总体的特征,必须
随机抽取样本. 如果随机抽取另外一个样本量相同的样本,所形成的样本频率分布一般会与前一个样本频
率分布有所不同,但是他们都可以近似的估计总体的分布.
3、频率分布直方图
为了将频率分布表中的结果直观形象地表现出来,常画出频率分布直方图 . 画图时应以横轴表示分
组,纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,画成小长方形,这
样得到的直方图就是频率分布直方图.
①绘制频率分布直方图的步骤
(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.
(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据
越多,分组越多.
(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.
(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个
数.
(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.
注:①频数分布直方图的纵坐标是频数,每一组数对应的矩形的高度与频数成正比;频率分布直方图
的纵坐标是,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,所
有矩形的面积之和为 1.
②样本组数、组距与分点的确定:
(1)对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少都会影响我们了解数据的
分布情况. 数据分组的组数与样本量有关,一般样本量越大,所分组数越多,当样本量不超过 100 时,按照
数据的多少,通常分成 5~12 组,且根据组数=极差/组距来大致确定组数
(2)为了实际操作方便,组距的选择应结合极差尽量“取整”,例如极差约为 1,组距可以选择 0.1
的整数倍,比如以 0.1 或0.2 为组距;极差约为 10,组距可以选择 1的整数倍,比如以 1或2为组距;极差
约为 100,组距可以选择 10 的整数倍,比如以 10 或20 为组距.如果极差不利于分组,不能被组距整除,可
以适当增加极差,如在左右两端各增加适当范围,并尽量使两端增加量相同
(3)分点的确定:若数据为整数,则分点数据减去 0.5;若数据是小数点后有一位数字的数,则分点
数据减去 0.05,以此类推. 分组时,通常对组内数值所在的区间取左闭右开区间,最后一组取闭区间.
知识点 2 统计图表
条形图、折线图及扇形图
(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一
定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按
照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.
优点:条形统计图不但可以直观的反映数据分布的大致情况,还可以清晰地表示出各个区间的具体数
目,易于比较数据间的差别.
缺点:会损失数据的部分信息,且不能明确显示部分与整体的关系.
(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根
据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样
本数据的情况,这样的一种表示和分析数据的统计图称为折线图.
优点:折线统计图不但可以表示数量的多少,还可以通过折线的起伏清楚直观地表示数量的增减变化
情况.
缺点:折线统计图不能直观反映数据的分布情况,且不适合总体分布较多的情况
(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示
的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.
优点:扇形统计图可以很清楚的表示各部分与总体之间的关系,即扇形统计图能清楚地表示出各部分
在总体中所占的百分比
缺点:会损失数据的部分信息,且不能明确显示部分与整体的关系.
知识点 3 百分位数
(1)一组数据的第 p百分位数是这样一个值,它使得这组数据中至少有 p%的数据小于或等于这个值,
且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组几个数据第 p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算
i = n × p %.
第3步,若
i
不是整数,而大于
i
的比邻整数为
j ,则第
p
百分位数为第
j
项数据;若
i
是整数,则第
p
百分位数为第
i
项与第 ( i + 1) 项数据的平均数.
(3)四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第 25 百分位数也称为第一四分位数或下四分位数等,第 75 百分位数也称为第三四分位数或上四
分位数等.
知识点 4 总体集中趋势的估计
1.众数、中位数、平均数的理解
(1)一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.
注:如果有几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数
据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.
(2)如果一组数有奇数个数,且按照从小到大排列后为 x1,x2,…,x2n+1,则称xn+1
为这组数的中位数;
如果一组数有偶数个数,且按照从小到大排列后为 x1,x2,…,x2n,则称为这组数的中位数.
(3)如果给定的一组数是 x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn).
众数、中位数、平均数都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
2.众数、中位数、平均数的比较
名称 优点 缺点
众
数
①体现了样本数据的最大集中点;
②容易计算
①它只能表达样本数据中很少的一部
分信息;
②无法客观地反映总体的特征
中
位
数
①不受少数几个极端数据(即排序靠
前或靠后的数据)的影响;
②容易计算,便于利用中间数据的信
息
对极端值不敏感
平
均
数
代表性较好,是反映数据集中趋势的
量.一般情况下,可以反映出更多的
关于样本数据全体的信息
任何一个数据的改变都会引起平均数
的改变.数据越“离群”,对平均数
的影响越大
知识点 5 总体离散程度的估计
1、方差、标准差的定义
一组数据 x1,x2,…,xn,用表示这组数据的平均数,则这组数据的方差为 =(
相关推荐
-
四川省天府名校2021届高三下学期4月诊断性考试 数学(文)含答案
2024-09-10 39 -
2023届四川省达州市高三第二次诊断性测试生物试题 含解析
2025-01-15 63 -
2023届四川省达州市高三第二次诊断性测试生物试题
2025-01-15 78 -
2023届四川省成都市四七九名校全真模拟考试(二)英语试题
2025-01-15 56 -
2023届四川省成都市四七九名校高全真模拟考试(二)理综生物试题 含解析
2025-01-15 73 -
2023届四川省成都市四七九名校高全真模拟考试(二)理综生物试题
2025-01-15 105 -
2023届四川省成都市四七九名校高考全真模拟检测(二)语文试题 含解析
2025-01-15 124 -
2023届四川省成都市四川师大附中高三热身训练(二)语文试题 含解析
2025-01-15 136 -
2023届四川省成都市四川师大附中高三热身训练(二)语文试题
2025-01-15 98 -
2023届四川省成都市四川大学附属中学高三下学期高考热身考试二理综物理试题 含解析
2025-01-15 156
作者:cande
分类:高中
价格:3知币
属性:36 页
大小:1.51MB
格式:DOCX
时间:2025-05-10
作者详情
相关内容
-
2023届四川省成都市四七九名校高全真模拟考试(二)理综生物试题
分类:分省
时间:2025-01-15
标签:无
格式:DOCX
价格:3 知币
-
2023届四川省成都市四七九名校高考全真模拟检测(二)语文试题 含解析
分类:分省
时间:2025-01-15
标签:无
格式:DOCX
价格:3 知币
-
2023届四川省成都市四川师大附中高三热身训练(二)语文试题 含解析
分类:分省
时间:2025-01-15
标签:无
格式:DOCX
价格:3 知币
-
2023届四川省成都市四川师大附中高三热身训练(二)语文试题
分类:分省
时间:2025-01-15
标签:无
格式:DOCX
价格:3 知币
-
2023届四川省成都市四川大学附属中学高三下学期高考热身考试二理综物理试题 含解析
分类:分省
时间:2025-01-15
标签:无
格式:DOCX
价格:3 知币

