SPSS数据分析与应用试题及答案
一、单项选择题(本大题共15小题,每小题2分,共30分)
1、下列用来描述一组数据的平均水平的是 [ ]
A.均值 B.标准差 C.偏度 D.峰度
2、下列用来描述数据的波动程度的是 [ ]
A.中位数 B.均值 C. 方差 D.偏度
3、在SPSS中双定性变量适合绘制下面那种图形 [ ]
A.堆积百分比图 B.箱线图C. 直方图D.散点图
4、在SPSS中双定量变量适合绘制下面那种图形 [ ]
A.堆积百分比图B.箱线图C. 直方图D.散点图
5、在SPSS中一个定性变量、一个定量变量适合绘制下面那种图形
[ ]
A.堆积百分比图B.箱线图C. 直方图D.散点图
6、下列属于定性变量的是 [ ]
A.年龄 B.驾龄 C.性别 D.销量
7、以下不属于定量变量的是 [ ]
A.婚姻 B.收入 C.工龄 D.体重
8、以下哪个变量适合做线性回归的因变量[ ]
A.是否购买 B.是否出险 C.是否恋爱 D.房价
9、以下哪个变量适合做逻辑回归的因变量 [ ]
A.客户是否流失 B.酒店价格 C.二手房价 D.以上都不正确
10、因子分析的作用是 [ ]
A.分类 B.降维 C.回归D.以上都不正确
11、关于聚类分析,下列说法错误的是 [ ]
A.聚类就是把“类似”的对象聚到一起
B.聚类分析首先要确定特征指标
C.聚类分析中刻画相似度方法只有欧式距离
D.层次聚类法是聚类分析的一种
12“物以类聚,人以分”与下列哪个模型特征相似 [ ]
A.线性回归 B.逻辑回归
C.聚类分析 D.因子分析
13、以下哪个因变量可以用线性回归模型进行分析 [ ]
A.大学生薪资影响因素分析 B.信用卡是否逾期
C.某用户是否患胃病的预测 D.明天是否降雨的预测
14、线性回归模型的整体评价,不包括以下哪一项 [ ]
A.F检验的结果 B.调整的R方
C.AUC值 D.R方的大小
15、关于聚类分析的要点,错误的是 [ ]
A.根据不同的特征指标聚出的类是不同的
B.定义什么是“相似的研究对象”
C.层次聚类就是k均值聚类
D.如何归类
二、多项选择题(本大题共5小题,每小题4分,共20分)在每小题列出的五个备用选项中至少有两个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选、少选或未
选均无分。
16、SPSS可以实现以下哪些分析?[ ]
A.频率分析
B. 线性回归分析
C.因子分析
D.聚类分析
E.逻辑回归分析
17、关于线性回归模型,描述正确的是 [ ]
A.模型简单
B.可解读性较高
C.在实际数据分析中很常用
D.因变量是定性数据
E.解决的是分类问题
18、以下关于直方图,描述正确的是 [ ]
A.一般用于定性数据
B.反映数据的分布情况
北京信用卡还款C.显示数据的对称性
D.纵轴可表示频数
E.一般用于定量数据
E.明确要研究的问题,指出可能的商业价值
19、以下属于线性回归基本假设的有 [ ]
A.误差项ε的期望为0
B.误差项ε的方差相等
C.误差项ε相互独立
D.误差项ε服从正态分布
E.以上都不对
20、以下场景可以利用逻辑回归的有 [ ]
A.NBA球员薪资影响因素
B.顾客是否购买某产品
C.火锅团购订单数分析
D.学生对本课程是否满意
E.判断信用卡用户是否逾期
三、判断题(本大题共5小题,每小题2分,共10分)请在每小题的对应的括号内填写,正确的涂写T,错误的涂写F。
21、当变量较多,且相关性较强时比较适合使用因子分析。[ ]
22、中位数是排序后位于中间的一位数或两位数的平均值。[ ]
23、K均值聚类法就是一层一层地聚。 [ ]
24、二分类问题一般可以使用逻辑回归分析。[ ]
25、逻辑回归预测出来的是Y=0的概率。 [ ]
四、简答题(本大题共2小题,每小题5分,共10分)
26、茶及茶文化是大众生活中不可缺少的重要内容,但在电商平台上不同的茶叶销量差异很大,现想对影响茶叶销量的影响因素进行分析。以某电商在售茶叶数据为例(见表1),请根据茶叶数据回答以下问题。
表1:茶叶数据样例
标题 | 价格 | 销售量 | 好评率 | 品牌 | 产品毛重 | 商品产地 |
2017新茶云雾绿茶4盒共500克一杯香茶叶明前春茶毛尖 | 86 | 96000 | 100% | 一杯香 | 125 | 云南省 |
乐品乐茶 2017新茶 茶叶 绿茶 雀舌茶 | 59 | 32000 | 97% | 乐品乐茶 | 210 | 安徽省 |
买2件送精美西施砂壶 印象堂茶叶 | 39.8 | 40000 | 97% | 印象堂 | 100 | 云南省 |
立顿(Lipton) 茶叶 红茶 黄牌精选红茶100包 200g (新老包装随机发货) | 39.9 | 82000 | 97% | 立顿 | 280 | 安徽省 |
乐品乐茶 2017新茶 茶叶 绿茶 | 99 | 26000 | 97% | 乐品乐茶 | 450 | 安徽省 |
【首件26元买2送1再送杯】安溪铁观音茶叶散装 | 40 | 20000 | 95% | 蓝翼 | 250 | 福建省 |
…… | …… | …… | …… | …… | …… | …… |
(1)请围绕问题说明数据中的因变量和自变量。
(2)请说明数据中的定量变量和定性变量。
27、收集了北京二手房数据,并对影响房价的影响因素进行分析,请根据北京二手房房价的描述分析图回答以下问题:
(1)对北京二手房价的直方图进行解读,房价单位:元/平米。
图1:二手房价直方图
(2)对箱线图进行解读。
图2:城区与单位房价的箱线图
五、案例分析(本大题共3小题,每小题10分,共30分)
28、北京市房地产市场是我国最为发达、最具代表性的房地产市场之一。因此以北京二手房为研究对象,通过线性回归分析探究了学区、地铁、房屋面积等相关因素对二手房价(单位:万元/平米)的影响作用,建立了线性回归模型,得到模型结果见表2。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论