用R做数据分析汇总 更新中
办公室里最通用的数据处理,存储,分析工具应该就是Excel 了。但是随着数据增大,Excel 有点力不从心。最近迷上了用R 来处理数据大小在1Gb 左右大小的csv 数据,当然也可以用access 来处理,但比较慢。
tidyverse可能只是个入门。
read_csv函数让数据导入变得很快,十几秒就导入,从介绍来看和它数据类型是tibble 有关。
dplyr包里的数据处理函数,及通道处理%>%很好地解决了数据处理过程中的中间步骤。rename, mutate, arrange ,filter, select, group_by, summarise等函数像极了sql 语句。
stringr解决了大部分的字符串处理。str_sub
tidyr 包里的spread等函数
lubridate 包处理日期的函数
汇总有用的函数,及案例。。。。。