SPSS数据分析与应用试题及答案
SPSS数据分析与应用试题及答案
一、单项选择题(本大题共15小题,每小题2分,共30分)
1下列用来描述一组数据的平均水平的是 [  ]
A.均值 B.标准差    C.偏度 D.峰度
2、下列用来描述数据的波动程度的是  [  ]
A.中位数 B.均值        C. 方差        D.偏度
3、在SPSS中双定性变量适合绘制下面那种图形  [  ]
A.堆积百分比图 B.箱线图C. 直方图D.散点图
4、在SPSS中双定量变量适合绘制下面那种图形 [  ]
A.堆积百分比图B.箱线图C. 直方图D.散点图
5、在SPSS中一个定性变量、一个定量变量适合绘制下面那种图形 
[  ]
A.堆积百分比图B.箱线图C. 直方图D.散点图
6、下列属于定性变量的是                    [  ]
A.年龄      B.驾龄 C.性别    D.销量
7、以下不属于定量变量的是                                [  ]
A.婚姻            B.收入 C.工龄            D.体重
8、以下哪个变量适合做线性回归的因变量[  ]
A.是否购买 B.是否出险    C.是否恋爱 D.房价
9、以下哪个变量适合做逻辑回归的因变量 [  ]
A.客户是否流失 B.酒店价格  C.二手房价 D.以上都不正确
10、因子分析的作用是  [  ]
A.分类 B.降维      C.回归D.以上都不正确
11、关于聚类分析,下列说法错误的是                        [  ]
A.聚类就是把“类似”的对象聚到一起     
B.聚类分析首先要确定特征指标
C.聚类分析中刻画相似度方法只有欧式距离
D.层次聚类法是聚类分析的一种
12“物以类聚,人以分”与下列哪个模型特征相似        [    ] 
A.线性回归        B.逻辑回归   
C.聚类分析        D.因子分析
13、以下哪个因变量可以用线性回归模型进行分析            [    ]
A.大学生薪资影响因素分析            B.信用卡是否逾期       
C.某用户是否患胃病的预测            D.明天是否降雨的预测 
14、线性回归模型的整体评价,不包括以下哪一项            [    ] 
A.F检验的结果                        B.调整的R
C.AUC                            D.R方的大小
15、关于聚类分析的要点,错误的是                        [  ]
A.根据不同的特征指标聚出的类是不同的 
B.定义什么是“相似的研究对象”
C.层次聚类就是k均值聚类 
D.如何归类
二、多项选择题(本大题共5小题,每小题4分,共20分)在每小题列出的五个备用选项中至少有两个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选、少选或未
选均无分。
16SPSS可以实现以下哪些分析?[  ]
A.频率分析   
B. 线性回归分析
C.因子分析         
D.聚类分析   
E.逻辑回归分析
17关于线性回归模型,描述正确的是                        [    ]
A.模型简单
B.可解读性较高 
C.在实际数据分析中很常用
D.因变量是定性数据
E.解决的是分类问题
18、以下关于直方图,描述正确的是                        [    ]                                       
A.一般用于定性数据
B.反映数据的分布情况
北京信用卡还款C.显示数据的对称性           
D.纵轴可表示频数
E.一般用于定量数据
E.明确要研究的问题,指出可能的商业价值
19、以下属于线性回归基本假设的有  [  ]
A.误差项ε的期望为0
B.误差项ε的方差相等
C.误差项ε相互独立
D.误差项ε服从正态分布
E.以上都不对
20、以下场景可以利用逻辑回归的有                        [    ]
A.NBA球员薪资影响因素
B.顾客是否购买某产品
C.火锅团购订单数分析 
D.学生对本课程是否满意
E.判断信用卡用户是否逾期
三、判断题(本大题共5小题,每小题2分,共10分)请在每小题的对应的括号内填写,正确的涂写T,错误的涂写F
21、当变量较多,且相关性较强时比较适合使用因子分析。[  ]
22、中位数是排序后位于中间的一位数或两位数的平均值。[  ]
23K均值聚类法就是一层一层地聚。 [  ]
24、二分类问题一般可以使用逻辑回归分析。[  ]
25、逻辑回归预测出来的是Y=0的概率。 [  ]
四、简答题(本大题共2小题,每小题5分,共10分)
26、茶及茶文化是大众生活中不可缺少的重要内容,但在电商平台上不同的茶叶销量差异很大,现想对影响茶叶销量的影响因素进行分析。以某电商在售茶叶数据为例(见表1),请根据茶叶数据回答以下问题。
1:茶叶数据样例
标题
价格
销售量
好评率
品牌
产品毛重
商品产地
2017新茶云雾绿茶4盒共500克一杯香茶叶明前春茶毛尖
86
96000
100%
一杯香
125
云南省
乐品乐茶 2017新茶 茶叶 绿茶 雀舌茶
59
32000
97%
乐品乐茶
210
安徽省
2件送精美西施砂壶 印象堂茶叶
39.8
40000
97%
印象堂
100
云南省
立顿(Lipton 茶叶 红茶 黄牌精选红茶100 200g (新老包装随机发货)
39.9
82000
97%
立顿
280
安徽省
乐品乐茶 2017新茶 茶叶 绿茶
99
26000
97%
乐品乐茶
450
安徽省
【首件26元买21再送杯】安溪铁观音茶叶散装
40
20000
95%
蓝翼
250
福建省
……
……
……
……
……
……
……
(1)请围绕问题说明数据中的因变量和自变量。
(2)请说明数据中的定量变量和定性变量。
27、收集了北京二手房数据,并对影响房价的影响因素进行分析,请根据北京二手房房价的描述分析图回答以下问题:
1)对北京二手房价的直方图进行解读,房价单位:元/平米。
1:二手房价直方图
2)对箱线图进行解读。
2:城区与单位房价的箱线图
五、案例分析(本大题共3小题,每小题10分,共30分)
28、北京市房地产市场是我国最为发达、最具代表性的房地产市场之一。因此以北京二手房为研究对象,通过线性回归分析探究了学区、地铁、房屋面积等相关因素对二手房价(单位:万元/平米)的影响作用,建立了线性回归模型,得到模型结果见表2

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。