表格转换,多行聚集成列,长列转换成多行

------------恢复内容开始------------

我从中学开始就立体,较多维的数据理解不强,所以这部分进度慢些很正常

R ggplot2绘图常用一维数据列表的数据框,所以常用到多行聚为列这个功能。

减列数,创建一维:

常用包:reshape2,tidyr以及聚集了tidyr等包的tidyverse。

创建例子df<-data.frame(x=c("A","B","C"),"2010"=c(1,3,4),'2011'=c(3,5,2),check.names=FALSE)

表格转换,多行聚集成列,长列转换成多行

reshap2::melt(数据框,id.var=索引列,variable.name=转换后列变量名的列名,value.name=转换后变量对应值的列名)

> df_melt<-reshape2::melt(df,id.var="x",variable.name="year",value.name="value")

tidyr::gather(数据框,转换后列变量名的列名,转换后变量对应值的列名,-索引列)

注:-索引列是指除索引列其他都聚合。

> df_gather<-tidyr::gather(df,year,value,-x)

上面俩函数运行结果相同:

表格转换,多行聚集成列,长列转换成多行

加列数,加维 

reshape2::dcast(数据框,行标签~列标签,value.var=列对应的值)   注:这里行标签指第一列自变量标签

reshape2::dcast(df_melt,x~year,value.var = "value")

tidyr::spread(数据框,待转的列标签,对应的值)

df_spread<-tidyr::spread(df_gather,year,value)

表格转换,多行聚集成列,长列转换成多行

 备注:tidyverse是Hadley创建的R包的集合。核心软件包是ggplot2,dplyr,tidyr,readr,purrr,tibble,stringr和forcats。其中readr用于读取数据,tidyr用于整理数据,dplyr用于数据转换,ggplot2用于数据可视化,purrr用于函数式编程。