[统计推断]第一章·概率论

1 概率论基础

1.1 公理化基础

\(\sigma\) algebra / Borel field: 若 \(S\) 的一族子集 \(\mathcal B\) 满足以下三个性质：

\(\varnothing\in\mathcal B\)
若 \(A\in\mathcal B\)，则 \(A^C\in\mathcal B\)
若 \(A_1,A_2,\ldots\in\mathcal B\)，则 \(\cup_{i=1}^\infty A_i\in\mathcal B\)

则称 \(\mathcal B\) 为一个 \(\sigma\) 代数或一个 Borel 域。

\(\{\varnothing,S\}\) 称为平凡的 \(\sigma\) 代数。

概率公理（Kolmogorov 公理）：已知样本空间 \(S\) 和 \(\sigma\) 代数 \(\mathcal B\)，若定义在 \(\mathcal B\) 上的函数 \(P\) 满足下列条件：

【非负性】对任意 \(A\in\mathcal B\)，\(P(A)\geq0\)
【归一性】\(P(S)=1\)
【可数可加性】若 \(A_1,A_2,\ldots\in\mathcal B\) 且两两不交，则 \(P(\cup_{i=1}^\infty A_i)=\sum_{i=1}^\infty P(A_i)\)

一些学者认为可数可加性并不显然，应该换成有限可加性。

1.2 概率演算

定理： \[ \begin{align} &P(B\cap A^C)=P(B)-P(A\cap B)\\ &P(A\cup B)=P(A)+P(B)-P(A\cap B) \end{align} \]

Bonferroni 不等式： \[ P(A\cap B)\geq P(A)+P(B)-1 \] 推广： \[ P\left(\bigcap_{i=1}^n A_i\right)\geq\sum_{i=1}^n P(A_i)-(n-1) \] Boole 不等式： \[ P\left(\bigcup_{i=1}^\infty A_i\right)\leq \sum_{i=1}^\infty P(A_i) \]

1.3 计数

从 \(n\) 个对象中选 \(r\) 个的方式：

	无放回	有放回
有序	\[\frac{n!}{(n-r)!}\]	\[n^r\]
无序	\[\binom{n}{r}\]	\[\binom{n+r-1}{r}\]

有序或无放回的情形都比较容易，难一点的是无序且有放回的情形。可以把 \(n\) 个对象看作 \(n\) 个箱子，然后把 \(r\) 个无差别的小球放到这些箱子中。这等价于在 \(r\) 个小球之间插入 \(n-1\) 个隔板，又等价于在 \(n+r-1\) 个对象中，挑 \(r\) 个当作小球，剩下 \(n-1\) 个当作隔板。因此答案是 \(\binom{n+r-1}{r}\).

2 条件概率与独立性

条件概率： \[ P(A\mid B)=\frac{P(A\cap B)}{P(B)} \]

Bayes 公式： \[ P(A_i\mid B)=\frac{P(B\mid A_i)P(A_i)}{\sum_{j}P(B\mid A_j)P(A_j)} \] 独立：称事件 \(A,B\) 统计独立，若： \[ P(A\cap B)=P(A)P(B) \] 称一列事件 \(A_1,\ldots,A_n\) 相互独立，若对任意 \(A_{i_1},\ldots,A_{i_k}\)，都有； \[ P\left(\bigcap_{j=1}^k A_{i_j}\right)=\prod_{j=1}^kP(A_{i_j}) \]

3 随机变量

3.1 累积分布函数（cdf）

\[ F_X(x)=P_X(X\leq x) \]

满足性质：

\(\lim\limits_{x\to-\infty} F(x)=0,\,\lim\limits_{x\to+\infty}F(x)=1\)
\(F(x)\) 是 \(x\) 的单调递增函数
\(F(x)\) 右连续，即 \(\lim\limits_{x\to x_0^+}F(x)=F(x_0)\)

同分布：随机变量 \(X\) 和 \(Y\) 同分布，当且仅当 \(\forall x,\,F_X(x)=F_Y(y)\).

3.2 概率密度函数（pdf）和概率质量函数（pmf）

对于某离散随机变量 \(X\)，其概率质量函数（pmf）为： \[ f_X(x)=P_X(X=x) \] 对于某连续随机变量 \(X\)，其概率密度函数（pdf）为满足下式的函数： \[ F_X(x)=\int_{-\infty}^x f_X(x)\mathrm dx \] 由于 \(F_X(x)\) 可能连续而不可导，因此上式并不总是成立。事实上确实存在这样的连续随机变量，对任意 \(f_X(x)\) 都不满足上式，但这不在本书涉及范围内。在更深入的教材中，称满足上式的随机变量绝对连续。

例：logistic 分布（的一个特例）的 cdf 和 pdf 分别是： \[\begin{align}&F_X(x)=\frac{1}{1+e^{-x}}\\&f_X(x)=\frac{\mathrm dF_X(x)}{\mathrm dx}=\frac{e^{-x}}{(1+e^{-x})^2}\end{align}\]

课程书籍笔记 > 统计推断

#statistics

[统计推断]第一章·概率论

https://xyfjason.github.io/blog-main/2022/02/24/统计推断-第一章·概率论/

作者

xyfJASON

发布于

2022年2月24日

许可协议

[统计推断]第二章·变换和期望上一篇

gitignore pattern format 下一篇