1、统计函数
均值 | mean |
---|---|
方差 | var |
中位数 | median |
开平方 | sqrt |
绝对值 | abs |
最大值 | max |
最小值 | min |
分位数 | quantile(w, probs=0.25) |
标准化 | scale(x) |
2、计算符号
x除以y求余数 | 2%%3(输出2) |
---|---|
整除求商 | 2%/%3(输出0) |
不小于3.8的最小整数 | ceiling(3.8),输出4 |
不大于3.8的最大整数 | floor(3.8), 输出3 |
保留几位小数 | round(3.,digits=3) |
滞后差分,lag 指定滞后几阶,默认1 | diff(x, lag=n) |
等差数列 | seq(0,1,0.25) |
例1、max()与min()
max(df2$EXPENDOP,na.rm=TRUE)
讯享网
na.rm=TRUE 去掉缺失值后找最大值
例2、ceiling() 与 floor()
讯享网x<-c(4.1, 3.2, 2.8) ceiling(x) floor(x)
例3、diff()
x<- c(1, 5, 23, 29) diff(x)
例4、分位数
讯享网df$AGE_0.25 <- quantile(df$AGE, probs=0.25) df$AGE_0.75 <- quantile(df$AGE, probs=c(0.25,0.5,0.75))[3]
probs=c(0.25,0.5,0.75)
又可以写为probs=seq(0,1,0.25)
,区别在于后者生成的是c(0,0.25,0.5,0.75.1)
例5、标准化
df$AGE1 <- scale(df$AGE)
3、把描述性统计整理到数据框中
讯享网detall<-data.frame("age", mean_age,var_age,min_age) Row2<- c("COUNTOP", mean_COUNTOP,var_COUNTOP,min_COUNTOP) detall <- rbind(detall, Row2) Row3<- c("EXPENDO",mean_EXPENDOP,var_EXPENDOP,min_EXPENDOP) detall <- rbind(detall, Row3) colnames(detall)<-c("variables","mean","var","min")
4、概率函数
1)dnorm( )
x<- seq(-3,3,0.2) y <- qnorm(x) plot(x, y, type = "l", xlab = "Normal Deviate", ylab = "Density", yaxs = "i")
2)pnorm( )
位于 z=1.96左侧的标准正态曲线下方面积是多少?
讯享网pnorm(1.96) # 累积分布率
3)qnorm( )
均值为 500,标准差为 100的正态分布的 0.9分位点值为多少?
qnorm(.9, mean=500, sd=100)
4)rnorm( )
生成 50个均值为 50,标准差为 10的正态随机数
讯享网rnorm(50, mean=50, sd=10)
5)runif( )
set.seed(1234) runif(5)
生成0到1区间上服从均匀分布的5个伪随机数,设定随机数种子。
5、生成多元正态数据
讯享网library(MASS) # 三维变量 options(digits=3) set.seed(1234) # 设定均值和方差 mean <- c(230.7, 146.7, 3.6) sigma <- matrix(c(15360.8, 6721.2, -47.1, 6721.2, 4700.9, -16.5, -47.1, -16.5, 0.3), nrow=3, ncol=3) # 生成满足正态条件的随机数组 mydata <- mvrnorm(500, mean, sigma) # 重命名列 names(mydata) <- c("y","x1","x2")
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/91626.html