banner

用R语言进行数据分析:R的统计表

作者: afenxi来源: afenxi时间:2017-04-06 10:27:16

R的统计表

R给出了详尽的统计表。R 还提供了相关函数来 计算累计概率分布函数 X <= x), 概率密度函数和分位数函数(给定 q,符合 P(X <= x) > q的最小x就是对应的分位数), 和基于概率分布的计算机模拟。

概率分布 R 对应的名字 附加参数 β分布 beta shape1, shape2, ncp 二项式分布 binom size, prob Cauchy 分布 cauchy location, scale 卡方分布 chisq df, ncp 指数分布 exp rate F分布 f df1, df1, ncp γ分布 gamma shape, scale 几何分布 geom prob 超几何分布 hyper m, n, k 对数正态分布 lnorm meanlog, sdlog logistic 分布 logis location, scale 负二项式分布 nbinom size, prob 正态分布 norm mean, sd Poisson 分布 pois lambda t 分布 t df, ncp 均匀分布 unif min, max Weibull 分布 weibull shape, scale Wilcoxon 分布 wilcox m, n

不同的名字前缀表示不同的含义,d表示概率密度函数,p 表示 累积分布函数(cumulative distribution function,CDF),q 表 示分位函数以及 r 表示随机模拟(random deviates)或者随机数发生器。 dxxx 的第一个参数是x,pxxx是q, qxxx 是 p,和rxxx的是n(rhyper 和rwilcox例外,二者的参数是 nn)。偏态指数(non-centrality parameter) ncp 现在仅用于累积分布函数,大多数概率密度函数 和部分其他情况:更细节的内容可以参考帮助文档。

pxxx 和 qxxx 函数都有逻辑 参数 lower.tail 和 log.p。dxxx 也有一个逻辑函数 log。 它们可以用来计算所要的函数值。 例如可以通过下式计算累计(“积分的”) 风险 (hazard)函数, ,

- pxxx(t, ..., lower.tail = FALSE, log.p = TRUE)

它们也可以直接用来计算更精确的对数似然值 (dxxx(..., log = TRUE))。

此外还有函数 ptukey 和 qtukey 计算 来自正态分布的样本的标准化全距(studentized range) 的分布。

这里是一些例子

> ## t分布的双侧p值 > 2*pt(-2.43, df = 13) > ## F(2, 7)分布的上1%分位数 > qf(0.99, 2, 7)

原创文章,作者:大西,如若转载,请注明出处:《用R语言进行数据分析:R的统计表》http://www.afenxi.com/post/2725

banner
看过还想看
可能还想看
最新文章
Yonghong Z-Suite一站式大数据分析平台 —— 以卓越的数据技术为客户创造价值,实现客户成功。