spss商务数据分析心得体会--慧智精品网

spss商务数据分析心得体会

男孩名字

心得1：鹰犬塞途拿到一份数据，或者在看到国内外某个学者的文章有想法而自己手里的数据刚好符合这个想法可以做时，在整理好数据后不要急于建模。一定要对数据做缺失值处理、异常值处理。在数据预处理的基础上再进一步建模，否则可能得到错误的结果。

心得2：一是缺失值的处理。我个人有几个看法：数据样本量足够大，在删除缺失值样本的情况下不影响估计总体情况，可考虑删除缺失值；二是数据样本量本身不大的情况下，可从以下两点考虑：采用缺失值替换，SPSS中具体操作为“转换”菜单下的“替换缺失值”功能，里面有5种替换的方法。若数据样本量不大，同质性比较强，可考虑总体均值替换方法，如数据来自不同的总体（如我做农户调研不同村的数据），可考虑以一个小总体的均值作为替换（如我以一个村的均值替换缺失值）。二是根据原始问卷结合客观实际自行推断估计一个缺失值的样本值，或者以一个类似家庭的值补充缺失值。

湖南二本大学

实习总结范文心得3：数据预处理第二点异常值的处理。我大概学了两门统计软件SPSS和Stata，SPSS用的时间久些，熟悉一下，Stata最近才学，不是太熟。关于这点我结合着来说。关于异常值的处理可分为两点，一是怎么判定一个值是异常值，二是怎么去处理。判定异常值的方法我个

金融市场包括

qq飞车怎么升级快人认为常用的有两点：1是描述性统计分析，看均值、标准差和最大最小值。一般情况下，若标准差远远大于均值，可粗略判定数据存在异常值。2是通过做指标的箱图判定，箱图上加“*”的个案即为异常个案。发现了异常值，接下来说怎么处理的问题。大概有三种方法：一是正偏态分布数据取对数处理。我做农户微观实证研究，很多时候得到的数据（如收入）都有很大的异常值，数据呈正偏态分布，这种我一般是取对数处理数据。若原始数据中还有0，取对数ln（0）没意义，我就取ln（x+1）处理；二是样本量足够大删除异常值样本；三是从stata里学到的，对数据做结尾或者缩尾处理。这里的结尾处理其实就是同第二个方法，在样本量足够大的情况下删除首尾1%-5%的样本。缩尾指的是人为改变异常值大小。如有一组数据，均值为50，存在几个异常值，都是500多（我这么说有点夸张，大概是这个意思），缩尾处理就是将这几个500多的数据人为改为均值+3标准差左右数据大小，如改为100.总结而言，我个人认为做数据变换的方式比较好，数据变换后再做图或描述性统计看数据分布情况，再剔除个别极端异常值。

慧智精品网

spss商务数据分析心得体会

发表评论

推荐文章

【中国历史十五讲】读书说明与指导(吴树国)

中药泡脚的历史典故

关于司马迁的历史评价

3-真题专练-沈阳历史中考中国古代史-材料解析题

历史上对陶渊明的评价

热门文章

山西汉代政治,文化名人及作品

唐装的起源和历史演变

中国古代史阶段特征

中国历史上的汉朝文化发展

[汉代历史简介]汉代历史故事

历史汉代全部知识点总结

汉代经济发展对中国经济史的影响

汉代的文学体裁

汉源名字来历

简述汉代艺术的基本特征和美学风格

汉代文学的风格和特征

汉代陶瓷知识点归纳总结

汉代经济发展与中外贸易

中国古代史完整版

汉代的科学技术与数学发展

汉代的录囚名词解释

汉代对中国文化的影响-概述说明以及解释

汉代的思想大一统知识点

汉学与宋学的名词解释

汉唐文化交融研究

最新文章

3-真题专练-沈阳历史中考中国古代史-材料解析题

历史上对陶渊明的评价

互动训练B—《汉武帝巩固大一统王朝》

汉代耧车的历史价值

红星照耀中国汉代青铜读书笔记

湖南马王堆汉墓的发掘与研究

标签列表