3.2 独立性检验的基本思想及其初步应用
1.下面是一个2×2列联表:
y1 | y2 | 总计 | |
x1 | a | 21 | 73 |
x2 | 8 | 25 | 33 |
总计 | b | 46 | |
则表中a、b处的值分别为 ( D ).
A.94、96 B.52、50 C.52、60 D.54、52
2.下列关于等高条形图的叙述正确的是 ( C ).
A.从等高条形图中可以精确地判断两个分类变量是否有关系
B.从等高条形图中可以看出两个变量频数的相对大小
C.从等高条形图可以粗略地看出两个分类变量是否有关系
D.以上说法都不对
3.关于分类变量x与y的随机变量K2的观测值k,下列说法正确的是 ( B ).
A.k的值越大,“X和Y有关系”可信程度越小 B.k的值越小,“X和Y有关系”可信程度越小
C.k的值越接近于0,“X和Y无关”程度越小 D.k的值越大,“X和Y无关”程度越大
4.若由一个2×2列联表中的数据计算得k=4.013,那么在犯错误的概率不超过__0.05______的前提下认为两个变量之间有关系.
5.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
理科 | 文科 | |
男 | 13 | 10 |
女 | 7 | 20 |
已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到k=≈4.844.则认为选修文科与性别有关系出错的可能性约为___0.05___.
6.在二维条形图中,两个比值( )相差越大,要推断的论述成立的可能性就越大。
A.与 B.与 C.与 D.与
7.下列关于的说法中正确的是( C )
A.在任何相互独立问题中都可以用来检验有关还是无关
B.的值越大,两个事件的相关性就越大
C.是用来判断两个分类变量是否有关系的随机变量,只对两个分类变量适合
D.的观测值的计算公式为
8.在吸烟与患肺癌这两个分类变量的计算中,下列说法正确的是( C )。
A.若的观测值,我们有99%的把握认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患肺癌
B.从独立性检验可知,有99%的把握认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患肺癌
C.若从统计量中求出有95%的把握认为吸烟与患肺癌有关系,是指有5%的可能性使得推断出现错误
D.以上三种说法都不正确
9.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据,试问:文科学生总成绩不好与数学成绩不好有关系吗?
总成绩好 | 总成绩不好 | 总计 | |
数学成绩好 | 478 | 12 | 490 |
数学成绩不好 | 399 | 24 | 423 |
总计 | 877 | 36 | 913 |
解 依题意,计算随机变量K2的观测值:
k=≈6.233>5.024.
所以在犯错误的概率不超过0.025的前提下,认为“文科学生总成绩不好与数学成绩不好有关系”.
10.为考察高中生的数学成绩与语文成绩的关系,对高二(1)班的55名学生进行了一次摸底考试,按照考试成绩优秀和不优秀统计成绩后,得到如下列联表:
优秀 | 不优秀 | 总计 | |
数学成绩 | 21 | 34 | 55 |
语文成绩 | 13 | 42 | 55 |
总计 | 34 | 76 | 110 |
请问数学成绩与语文成绩在多大程度上有关系?
11.某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:请问有多大把握认为“高中生学习状况与生理健康有关”?
不健康 | 健 康 | 总计 | |
不优秀 | 41 | 626 | 667 |
优 秀 | 37 | 296 | 333 |
总 计 | 78 | 922 | 1000 |
12.某班主任对全班50名学生进行了作业量的调查,数据如表
认为作业量大 | 认为作业量不大 | 总计 | |
男生 | 18 | 9 | 27 |
女生 | 8 | 15 | 23 |
总计 | 26 | 24 | 50 |
则推断“学生的性别与认为作业量大有关”,这种推断犯错误的概率不超过( C ).
A.0.01 B.0.005 C.0.025 D.0.001
k=≈5.059>5.024.
∵P(K2≥5.024)=0.025,∴犯错误的概率不超过0.025.
13.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.如果k≥5.024,那么就有把握认为“X与Y有关系”的百分比为 ( D ).
P(K2≥k0) | 0.50 | 0.40 | 0.25 | 0.15 | 0.10 |
k0 | 0.455 | 0.708 | 1.323 | 2.072 | 2.706 |
P(K2≥k0) | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k0 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
A.25% B.75% C.2.5% D.97.5%
14.某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,认为糖尿病患者与遗传有关系的概率为__0.975______.
发病 | 不发病 | 总计 | |
阳性家族史 | 16 | 93 | 109 |
阴性家族史 | 17 | 240 | 257 |
总计 | 33 | 333 | 366 |
所以随机变量K2的观测值为
k=≈6.067>5.024,
所以在犯错误的概率不超过0.025的前提下,认为糖尿病患者与遗传有关.
15.高二(1)班班主任对全班50名学生进行了有关作业量多少的调查,得到如下列联表:
认为作业多 | 认为作业不多 | 总计 | |
喜欢玩电脑游戏 | 18 | 9 | 27 |
不喜欢玩电脑游戏 | 8 | 15 | 23 |
总 计 | 26 | 24 | 50 |
认为“喜欢玩电脑游戏与认为作业多有关系”的概率有多大?
解 由表中数据计算K2的观测值为k=≈5.059>5.024.
所以在犯错误的概率不超过0.025的前提下认为“喜欢玩电脑游戏与认为作业多有关”,其有关的概率为0.975.
16.(创新拓展)第16届亚运会于2010年11月12日至27日在中国广州进行,为了搞好接待工作,组委会招幕了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动.
(1)根据以上数据完成以下2×2列联表:
喜爱运动 | 不喜爱运动 | 总计 | |
男 | 10 | 16 | |
女 | 6 | 14 | |
总计 | 30 | ||
(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关?
解 (1)
喜爱运动 | 不喜爱运动 | 总计 | |
男 | 10 | 6 | 16 |
女 | 6 | 8 | 14 |
总计 | 16 | 14 | 30 |
(2)假设:是否喜爱运动与性别无关,由已知数据可求得:
k=≈1.157 5<2.706,
因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.
P(k2>k) | 0.50 | 0.40 | 0.25 | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k | 0.455 | 0.708 | 1.323 | 2.072 | 2.706 | 3.84 | 5.024 | 6.635 | 7.879 | 10.828 |
17
回答:ⅰ、如何求的观测值k?
ⅱ、如果P(k>10.828)= 表示有 的把握认为 “两个分类变量”有关系;
如果P(k>3.841)= 表示有 的把握认为 “两个分类变量”有关系。
18.在判断两个分类变量是否有关系的常用的方法中,最为精确的方法是(D )
A.通过三维柱形图判断 B.通过二维条形图判断
C.通过等高条形图判断 D.以上都不对
19.为调查中学生近视情况,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( C )
A.期望与方差 B.排列与组合 C.独立性检验 D.概率
20.在一次独立性检验中,根据计算结果,认为A与B无关的可能性不足1%,那么K2一个可能取值为( A )
A.6.635 B.5.024 C.7.897 D.3.841
21.统计推断,当__ K2>3.84____时,有95%的把握认为事件A与B有关;当____ K2≤2.706时,认为没有充分的证据显示事件A与B是有关的.
22.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
专业 性别 | 非统计专业 | 统计专业 |
男 | 13 | 10 |
女 | 7 | 20 |
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
K2=≈4.844,
因为K2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为5%___.
23.为了研究性格与血型的关系,抽取80名被试者,他们的血型与性格汇总如下,试判断性格与血型是否相关.
血型性格 | O型或A型 | B型或AB型 | 总计 |
A型 | 18 | 16 | 34 |
B型 | 17 | 29 | 46 |
总计 | 35 | 45 | 80 |
[解析] 由列联表中的数据得到:
K2=≈2.030≤2.706.
认为没有充分的证据显示“血型与性格有关系”
3.2 独立性检验的基本思想及其初步应用
1.下面是一个2×2列联表:
y1 | y2 | 总计 | |
x1 | a | 21 | 73 |
x2 | 文科男生学什么专业好8 | 25 | 33 |
总计 | b | 46 | |
则表中a、b处的值分别为 ( ).
A.94、96 B.52、50 C.52、60 D.54、52
2.下列关于等高条形图的叙述正确的是 ( ).
A.从等高条形图中可以精确地判断两个分类变量是否有关系
B.从等高条形图中可以看出两个变量频数的相对大小
C.从等高条形图可以粗略地看出两个分类变量是否有关系
D.以上说法都不对
3.关于分类变量x与y的随机变量K2的观测值k,下列说法正确的是 ( ).
A.k的值越大,“X和Y有关系”可信程度越小 B.k的值越小,“X和Y有关系”可信程度越小
C.k的值越接近于0,“X和Y无关”程度越小 D.k的值越大,“X和Y无关”程度越大
4.若由一个2×2列联表中的数据计算得k=4.013,那么在犯错误的概率不超过________的前提下认为两个变量之间有关系.
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论