注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

零售创新,创新那些事儿,SPSS,VBA

零售创新

 
 
 

日志

 
 
关于我

新浪微博,零售创新 研究经理,数据分析师 希望和市场研究和零售业的同事共同进步! 本博客发表的都是免费或试用的资料,如果有版权问题请发邮件wangli12a@163.com联系删除。 spss excel vba blog

网易考拉推荐

【转载】3.3 SAS数据集转置描述统计相关系数计算  

2012-06-29 10:45:58|  分类: SAS学习 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

5数据集转置

有时我们需要改变观测与列的关系,这可以用TRANSPOSE过程来实现。

先举一个合并观测的例子。

1假设我们对若干个病人先后试验了A药和B药,药效记录在val变量中,数据见表

3.3数据集转置描述统计相关系数计算 - zzz - 水墨·点滴

 为了进行统计分析我们需要把两次的药效存入两个变量,即两个观测合并为一个观测,用如下程序可以实现:

proc sort data=onecol;

       by num;run;

proc transpose data=onecol out=twotest;

       var val;

         id test;

         by num;

run;

2转置当然也可以是同时对多行和多列进行,比如下面的例子中原始数据集为43列,转置后变成了34列。

data mat;

  input x1 x2 x3;

cards;

1 2 3

4 5 6

7 8 9

10 11 12

;

run;

程序如下

proc transpose data=mat out=matt;

var x1 x2 x3;

run;

6 描述统计

MEANSUNIVARIATEFREQ这三个过程用来计算简单的描述统计量。MEANSUNIVARIATE程对区间变量计算均值、标准差等数字特征,FREQ过程对离散变量计算取值频数分布。

1:要统计学生信息中的数学与语文成绩相关的统计量。

proc means data=student;

    var math chinese;

run;

结果将输出相关的:样本数目n,均值,标准差,最小值,最大值

UNIVARIATE过程则可以计算较多的统计量,输出包括五个部分。第一部分是矩统计量。第二部分为基本的位置和分散程度统计量,位置统计量包括均值、中位数、众数,分散程度统计量包括标准差、方差、极差、四分位间距。第三部分为关于均值等于零的三种检验的结果,包括t检验、符号检验和符号秩检验。第四部分为各个重要的分为数估计。第五部分是变量的五个最低值和五个最高值。

FREQ过程可以考察离散变量的取值分布,在TABLES语句中指定要分析的变量。比如,我们想了解C9501中性别的分布情况,可以用:

3.3数据集转置描述统计相关系数计算 - zzz - 水墨·点滴

注意:也可以在INSIGHT模块计算

 

7 相关系数计算

CORR过程用来计算变量的相关系数

:计算变量x1,x2,x3两两之间相关系数

proc corr data=aa;

   var x1 x2 x3;

 run;

注意:也可以在INSIGHT分析模块的多元部分计算。

  评论这张
 
阅读(241)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017