Next: , Previous: Probability distributions, Up: Probability distributions



8.1 R 的统计表

R 给出了详尽的统计表。R 还提供了相关函数来 计算累计概率分布函数 X <= x), 概率密度函数和分位数函数(给定 q,符合 P(X <= x) > q的最小x就是对应的分位数), 和基于概率分布的计算机模拟。

概率分布 R 对应的名字 附加参数
β分布 beta shape1, shape2, ncp
二项式分布 binom size, prob
Cauchy 分布 cauchy location, scale
卡方分布 chisq df, ncp
指数分布 exp rate
F分布 f df1, df1, ncp
γ分布 gamma shape, scale
几何分布 geom prob
超几何分布 hyper m, n, k
对数正态分布 lnorm meanlog, sdlog
logistic 分布 logis location, scale
负二项式分布 nbinom size, prob
正态分布 norm mean, sd
Poisson 分布 pois lambda
t 分布 t df, ncp
均匀分布 unif min, max
Weibull 分布 weibull shape, scale
Wilcoxon 分布 wilcox m, n

不同的名字前缀表示不同的含义,d表示概率密度函数,p 表示 累积分布函数(cumulative distribution function,CDF),q 表 示分位函数以及 r 表示随机模拟(random deviates)或者随机数发生器。 dxxx 的第一个参数是xpxxxqqxxxp,和rxxx的是n (rhyperrwilcox例外,二者的参数是 nn)。偏态指数(non-centrality parameter) ncp 现在仅用于累积分布函数,大多数概率密度函数 和部分其他情况:更细节的内容可以参考帮助文档。

pxxxqxxx 函数都有逻辑 参数 lower.taillog.pdxxx 也有一个逻辑函数 log。 它们可以用来计算所要的函数值。 例如可以通过下式计算累计(“积分的”) 风险 (hazard)函数, ,

      - pxxx(t, ..., lower.tail = FALSE, log.p = TRUE)

它们也可以直接用来计算更精确的对数似然值 (dxxx(..., log = TRUE))。

此外还有函数 ptukeyqtukey 计算 来自正态分布的样本的标准化全距(studentized range) 的分布。

这里是一些例子

     > ## t分布的双侧p值
     > 2*pt(-2.43, df = 13)
     > ## F(2, 7)分布的上1%分位数
     > qf(0.99, 2, 7)