用R语言做数据分析——二元数据的数字特征及相关系数之前说的数据分析基本上是来自一元总体X,而在实际情况中,许多数据来自多元数据的总体,
即来自总体(X1,X2,X3,...Xn)^T。对于来自多元总体的数据,除了分析各个分量的取值特点
外,更重要的是分析各个分量之间的相关关系,这就是多元数据的相关分析。先从二元数据开
手帐偷懒小技巧始讲解。
设(X,Y)^T是二元总体,从总取得观测样本(X1,Y1)^T,(X2,Y2)^T,...,(Xn,Y,)^T,其样本观测矩阵
为:
记
则称(X拔,Y拔)^T为二元观测样本的均值向量。
记
ps 抠图则称Sxx为变量X的观测样本的方差,称Syy为变量Y的观测样本的方差,称Sxy为变量X、Y的观
测样本的协方差,称
为观测样本的协方差矩阵。称
四月唯美句子简短为观测样本的相关系数。
例子:某种矿石有两种有用成分A、B,取10个样本,每个样本中成分A的含量百分数x(%)及B的
经营类游戏含量百分数y(%)的数据如下所示,计算样本的均值、方差、协方差和相关系数。
> x<>
> y<>
> ore<>
>ore.m<>
> ore.s<>川菜
> ore.r<>
>ore.m
x y
49.9 17.4
> ore.s
x y
x 252.7667 60.60000
y 60.6000 17.15556
共享打印机拒绝访问> ore.r
x y
x 1.0000000 0.9202595
y 0.9202595 1.0000000
上述计算中,cov()函数用于计算协方差或协方差矩阵,cor()函数用于计算相关系数或相关矩
阵,它们的使用格式为:
其中x是数值型向量、矩阵或数据框,y是控制(NULL、缺省值)、向量、矩阵或数据框,但需要与x的维数一致。与cov和cor相关的函数还有:cov.wt()用于计算加权协方差,st()用于计算相关性检验。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论