统计学作为一门研究数据收集、分析、解释和展示的科学,在现代社会中扮演着至关重要的角色。无论是科学研究、商业决策还是日常生活中,统计学都提供了强大的工具来帮助我们理解复杂的数据模式。以下是一些常用的统计学公式,它们涵盖了概率分布、参数估计、假设检验等多个领域。
一、描述性统计
1. 平均值(Mean)
平均值是数据集中所有数值的总和除以数据点的数量。
\[
\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}
\]
2. 中位数(Median)
中位数是将数据按大小顺序排列后位于中间位置的数值。
- 如果数据点数量为奇数,则中位数为第 \(\frac{n+1}{2}\) 个数据点;
- 如果数据点数量为偶数,则中位数为第 \(\frac{n}{2}\) 和第 \(\frac{n}{2} + 1\) 个数据点的平均值。
3. 方差(Variance)
方差衡量数据与平均值之间的偏离程度。
\[
s^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}
\]
4. 标准差(Standard Deviation)
标准差是方差的平方根,表示数据的离散程度。
\[
s = \sqrt{s^2}
\]
二、概率分布
1. 正态分布(Normal Distribution)
正态分布的概率密度函数为:
\[
f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}
\]
其中,\(\mu\) 为均值,\(\sigma\) 为标准差。
2. 二项分布(Binomial Distribution)
二项分布的概率质量函数为:
\[
P(X=k) = C_n^k p^k (1-p)^{n-k}
\]
其中,\(C_n^k = \frac{n!}{k!(n-k)!}\),\(p\) 为成功概率。
3. 泊松分布(Poisson Distribution)
泊松分布的概率质量函数为:
\[
P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}
\]
其中,\(\lambda\) 为事件发生的平均次数。
三、参数估计
1. 点估计
点估计是通过样本数据对总体参数进行单一值估计的方法。
- 均值估计:\(\hat{\mu} = \bar{x}\)
- 方差估计:\(\hat{\sigma}^2 = s^2\)
2. 区间估计
区间估计是在一定置信水平下给出总体参数可能取值范围的方法。
\[
\hat{\mu} \pm z \cdot \frac{s}{\sqrt{n}}
\]
其中,\(z\) 为标准正态分布对应的分位数。
四、假设检验
1. 单样本 t 检验
用于判断样本均值是否显著不同于某一已知总体均值。
\[
t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}
\]
其中,\(\mu_0\) 为已知总体均值。
2. 卡方检验(Chi-Square Test)
用于检验实际观察频数与理论期望频数之间的差异。
\[
\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}
\]
其中,\(O_i\) 为实际观察频数,\(E_i\) 为理论期望频数。
以上公式涵盖了统计学中的核心概念和方法,希望这些工具能帮助你在数据分析和决策过程中更加得心应手。当然,统计学的应用远不止于此,深入学习和实践才能真正掌握其精髓。