专题04 回归分析、独立性检验、分布列(解析版)-【新高考】2021年高考数学考前复习高频易考解答题专题
专题 04 回归分析、独立性检验、分布列
知识必备+难点剖析+模拟演练
知识必备
一、回归分析
1.回归方程 ,其中:
(注: 主要方便计算,其中(xi,yi)为样本数据, (为样本点的中心)
公式作用:通过刻画线性相关的两变量之间的关系,估计和分析数据的情况,解释一些实际问题,以及数据的变化趋
势.
公式联系:是进行残差分析的基础.
2.样本相关系数的具体计算公式:
公式作用:反映两个变量之间线性相关关系的强弱.当r的绝对值接近 1时,表明两个变量的线性相关性越强;当 r的
绝对值接近 0时,表明两个变量之间几乎不存在线性相关关系.规定当 r>0.75 时,认为两个变量有很强的线性相关关系.
公式联系:(1)由于分子与回归方程中的斜率 b的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当
r>0 时,两个变量正相关;当 r<0 时,两个变量负相关.
(2)常配合散点图判断两个随机变量是否线性相关.
散点图是从形上进行粗略地分析判断,这个判断是可行的、可靠的,也是进行线性回归分析的基础,否则回归方程失
效;它形象直观地反映了数据点的分布情况.
相关系数 r是从数上反映了两个随机变量是否具有线性相关关系,以及线性相关关系的强弱,它较精确地反映了数据
点的分布情况,准确可靠.
3.我们可以用相关指数 R2来刻画回归的效果,其计算公式是:
1
R2=1-
用R2来刻画回归的效果.对于已经获取的样本数据,R2表达式中的 为确定的数.因此 R2越大,意味着残差
平方和 越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.在线性回归模
型中,R2表示解释变量对于预报变量变化的贡献率.R2越接近于 1,表示回归的效果越好.R2是常用的选择模型的指标之
一,在实际应用中应该尽量选择 R2大的回归模型.
二、独立性检验
(一)基础概念的梳理与理解
1.分类变量:对于宗教信仰来说,其取值为信宗教信仰与不信宗教信仰两种.像这样的变量的不同“值”表示个体所属
的不同类别的变量称为分类变量.例如性别变量其取值为男和女两种,吸烟变量其取值为吸烟与不吸烟两种.
2.两个分类变量:是否吸烟与是否患肺癌,性别男和女与是否喜欢数学课程等等,这些关系是我们所关心的.
3.2×2列联表:列出的两个分类变量 X和Y,它们的取值分别为{x1,x2}和{y1,y2}的样本频数表称为 2×2列联表(如
下表).
y1y2总计
x1a b a+b
x2c d c+d
总计 a+c b+d a+b+c+d
(二)两个分类变量是否有关的粗略估计
等高条形图
由深、浅颜色的高度可见两种情况下的百分比;另一方面,数据 要比 小得多,因此,说明两分类变量 X
和Y有关系成立的可能性较大.
重点:等高条形图能直观地看出在两个分类变量频数相等的情况下,各部分所占的比例情况.
(三)独立性检验的基本思想
上面通过分析数据与图形,得出的估计是粗略的,因为我们说的“大得多”、“小得多”,到底是有多大的差距?也
就是说得到的结论是直观上的印象,其实与是否有关还是有较大的差距的.但是上面的分析给了我们一种重要的思想方
法.
下面从理论上说明两类分类变量是否有关,请同学们从中体会其思想方法.
1.基本思想与图形的联系
2
假设两类分类变量是无关的,可知如下的比应差不多,即: ≈ ⇒|ad-bc|=0.
构造随机变量 K2= (其中 n=a+b+c+d)(此公式如何记忆,其特点是什么?结合 2×2列
联表理解).
显然所构造的随机变量与|ad-bc|的大小具有一致性.
2.独立性检验的思想方法
如果 K2的观测值较大,说明其发生(无关系)的概率很小,此时不接受假设,也就是两分类变量是有关系的(称小概率事
件发生);如果 K2的观测值较小,此时接受假设,说明两分类变量是无关系的.其思想方法类似于数学上的反证法.
3.得到 K2的观测值k常与以下几个临界值加以比较:
如果 k>2.706,就有 90%的把握认为两分类变量 X和Y有关系;如果 k>3.841,就有 95%的把握认为两分类变量 X和Y
有关系;如果 k>6.635,就有 99%的把握认为两分类变量 X和Y有关系;如果 k>10.828,就有 99.9%的把握认为两分类
变量 X和Y有关;如果 k≤2.706,就认为没有充分的证据说明变量 X和Y有关系.
像这种利用随机变量 K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
三、离散型随机变量及其分布列
1.随机变量的有关概念
(1)随机变量:随着试验结果变化而变化的变量,常用字母
X , Y , ξ , η ,…表示 ❶.
(2)离散型随机变量:所有取值可以一一列出的随机变量.
2.离散型随机变量分布列的概念及性质
(1)概念:若离散型随机变量 X可能取的不同值为 x1,x2,…,xi,…,xn,X取每一个值 xi(i=1,2,…,n)的概率P(X=
xi)=pi,以表格的形式表示如下:
X x1x2…xi…xn
P p1p2…pi…pn
❷此表称为离散型随机变量 X的概率分布列,简称为 X的分布列.有时也用等式 PX=xi=pi,i=1,2,…,n表示 X
的分布列.
(2)分布列的性质
①pi≥0,i=1,2,3,…,n;②=1.
3.常见的离散型随机变量的分布列
(1)两点分布列
X0 1
P1-pp
若随机变量 X的分布列具有上表的形式,则称 X服从两点分布,并称 为成功概率
(2)超几何分布列❹
在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则 P(X=k)= ,k=0,1,2,…,m,其中 m =
min{ M , n } ,且
n ≤ N , M ≤ N , n , M , N ∈ N *
❺.
X0 1 … m
3
相关推荐
-
《中考数学核心考点强化突破(全国通用)》专题十 选择、填空小压轴题(解析版)
2025-04-17 8 -
专题2.2 相交线与平行线【章节复习专项训练】解析版
2025-04-18 23 -
专题08 数形结合之四边形中的线段最值问题专练(解析版)-【考点培优尖子生专用】2021-2022学年八年级数学下册专题训练(苏科版)
2025-05-18 51 -
专题08 数列(中档题)期末常考题型精选(原卷版)-2021-2022学年上学期高中数学期末常考题精选(人教A版2019)
2025-05-18 34 -
专题08 数列(中档题)期末常考题型精选(解析版)-2021-2022学年上学期高中数学期末常考题精选(人教A版2019)
2025-05-18 28 -
专题08 三角函数(中档题) 期末常考题型精选(原卷版)-2021-2022学年上学期高中数学期末常考题精选(人教A版2019)
2025-05-18 93 -
专题08 三角函数(中档题) 期末常考题型精选(解析版)-2021-2022学年上学期高中数学期末常考题精选(人教A版2019)
2025-05-18 118 -
专题08 三个二次关系-2021年初升高数学无忧衔接(苏教版2019)(原卷版)
2025-05-18 126 -
专题08 三个二次关系-2021年初升高数学无忧衔接(苏教版2019)(解析版)
2025-05-18 127 -
专题08 一元一次不等式组及其应用(知识串讲)-2021-2022学年七年级数学下学期期末考点大串讲(人教版)(解析版)
2025-05-18 122
作者:envi
分类:高中
价格:3知币
属性:31 页
大小:1.19MB
格式:DOCX
时间:2025-02-12
作者详情
相关内容
-
专题08 三角函数(中档题) 期末常考题型精选(原卷版)-2021-2022学年上学期高中数学期末常考题精选(人教A版2019)
分类:初中
时间:2025-05-18
标签:无
格式:DOCX
价格:3 知币
-
专题08 三角函数(中档题) 期末常考题型精选(解析版)-2021-2022学年上学期高中数学期末常考题精选(人教A版2019)
分类:初中
时间:2025-05-18
标签:无
格式:DOCX
价格:3 知币
-
专题08 三个二次关系-2021年初升高数学无忧衔接(苏教版2019)(原卷版)
分类:初中
时间:2025-05-18
标签:无
格式:DOCX
价格:3 知币
-
专题08 三个二次关系-2021年初升高数学无忧衔接(苏教版2019)(解析版)
分类:初中
时间:2025-05-18
标签:无
格式:DOCX
价格:3 知币
-
专题08 一元一次不等式组及其应用(知识串讲)-2021-2022学年七年级数学下学期期末考点大串讲(人教版)(解析版)
分类:初中
时间:2025-05-18
标签:无
格式:DOCX
价格:3 知币

