专题04 回归分析、独立性检验、分布列(解析版)-【新高考】2021年高考数学考前复习高频易考解答题专题

3.0 envi 2025-02-12 15 4 1.19MB 31 页 3知币
侵权投诉
专题 04 回归分析、独立性检验、分布列
知识必备+难点剖析+模拟演练
知识必备
一、回归分析
1.回归方程 ,其中:
(注: 主要方便计算,其中(xiyi)为样本数据, (为样本点的中心)
公式作用:通过刻画线性相关的两变量之间的关系,估计和分析数据的情况,解释一些实际问题,以及数据的变化趋
.
公式联系:是进行残差分析的基础.
2.样本相关系数的具体计算公式:
公式作用:反映两个变量之间线性相关关系的强弱.r的绝对值接近 1时,表明两个变量的线性相关性越强;当 r
绝对值接近 0时,表明两个变量之间几乎不存在线性相关关系.规定当 r>0.75 时,认为两个变量有很强的线性相关关系.
公式联系:(1)由于分子与回归方程中的斜率 b的分子一样(这也给出了公式的内在联系以及公式的记法),因此,当
r>0 时,两个变量正相关;当 r<0 时,两个变量负相关.
(2)常配合散点图判断两个随机变量是否线性相关.
散点图是从形上进行粗略地分析判断,这个判断是可行的、可靠的,也是进行线性回归分析的基础,否则回归方程失
效;它形象直观地反映了数据点的分布情况.
相关系数 r是从数上反映了两个随机变量是否具有线性相关关系,以及线性相关关系的强弱,它较精确地反映了数据
点的分布情况,准确可靠.
3.我们可以用相关指数 R2来刻画回归的效果,其计算公式是:
1
R21
R2来刻画回归的效果.对于已经获取的样本数据,R2表达式中的 为确定的.R2越大,意味着残差
平方和 越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.在线性回归模
型中,R2表示解释变量对于预报变量变化的贡献率.R2越接近于 1,表示回归的效果越好.R2是常用的选择模型的指标之
一,在实际应用中应该尽量选择 R2大的回归模型.
二、独立性检验
()基础概念的梳理与理解
1.分类变量:对于宗教信仰来说,其取值为信宗教信仰与不信宗教信仰两种.这样的变量的不同“值”表示个体所属
的不同类别的变量称为分类变量.例如性别变量其取值为男和女两种,吸烟变量其取值为吸烟与不吸烟两种.
2.两个分类变量:是否吸烟与是否患肺癌,性别男和女与是否喜欢数学课程等等,这些关系是我们所关心的.
3.2×2列联表:列出的两个分类变量 XY,它们的取值分别为{x1x2}{y1y2}的样本频数表称为 2×2列联表(
下表).
y1y2总计
x1a b ab
x2c d cd
总计 ac bd abcd
()两个分类变量是否有关的粗略估计
等高条形图
由深的高况下;另数据 得多说明X
Y有关系成立的可能性较大.
重点:等高条形图能直观地看出在两个分类变量频数相等的情况下,各部分所占的比例情况.
()独立性检验的基本思想
上面通过分析数据与图形,得出的估计是粗略的,因为我们说的“大得多”、“小得多”,到底是有多大的差距?也
就是说得到的结论是直观上的印象,其实与是否有关还是有较大的差距的.但是上面的分析给了我们一种重要的思想方
.
下面从理论上说明两类分类变量是否有关,请同学们从中体会其思想方法.
1.基本思想与图形的联系
2
假设两类分类变量是无关的,可知如下的比应差不多,即: ≈ |adbc|0.
构造随机变量 K2 (其中 nabcd)(此公式如,其点是什么?结合 2×2
联表理解).
显然所构造的随机变量与|adbc|的大小具有一.
2.立性检验的思想方法
如果 K2的观值较大,说明其发生(无关系)率很小,此时不接假设,也就是两分类变量是有关系的(称小
件发生);如果 K2的观值较小,此时接假设,说明两分类变量是无关系的.其思想方法类于数学上的反.
3.得到 K2的观k常与以下几个临界以比较:
如果 k>2.706,就有 90%认为两分类变量 XY有关系;如果 k>3.841,就有 95%把握认为两分类变量 XY
有关系;如果 k>6.635,就有 99%把握认为两分类变量 XY有关系;如果 k>10.828,就有 99.9%把握认为两分类
变量 XY有关;如果 k2.706,就认为分的据说明变量 XY有关系.
像这种用随机变量 K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的立性检验.
散型随机变量及其分布列
1随机变量的有关概念
(1)随机变量:随着试验结果变化变化的变量,常用字母
X Y ξ η 表示 .
(2)散型随机变量:所有取值可以一一列出的随机变量
2.离散型随机变量分布列的概念及性
(1)概念若离散型随机变量 X可能取的不同值为 x1x2xixnX一个值 xi(i1,2n)P(X
xi)pi,以表的形式表示如下:
X x1x2xixn
P p1p2pipn
此表称为散型随机变量 X率分布列,X的分布列.有时也用等式 PXxipii12n表示 X
的分布列.
(2)分布列的性
pi≥0i1,2,3n1.
3常见的散型随机变量的分布列
(1)两点分布列
X0 1
P1pp
随机变量 X的分布列具有上表的形式,则称 X从两点分布,称 为成功概
(2)分布列
M件次品N件产品中,n,其中X件次品,则 P(Xk)= ,k0,1,2m,其中 m
min{ M n }
n N M N n M N N *
.
X0 1 m
3
专题04 回归分析、独立性检验、分布列(解析版)-【新高考】2021年高考数学考前复习高频易考解答题专题.docx

共31页,预览5页

还剩页未读, 继续阅读

作者:envi 分类:高中 价格:3知币 属性:31 页 大小:1.19MB 格式:DOCX 时间:2025-02-12

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 31
客服
关注