现在我们考虑状态空间 ( Ω , F ) (\Omega,\mathcal{F}) (Ω,F),假设 ξ \xi ξ是定义在状态空间上的实函数,即 ξ : ( Ω , F ) → ( R , B ( R ) ) \xi:(\Omega,\mathcal{F}) \to (\mathbb{R},\mathcal{B}(\mathbb{R})) ξ:(Ω,F)→(R,B(R))。
随机变量 或称为 F \mathcal{F} F可测函数,如果 ∀ B ∈ B ( R ) \forall B \in \mathcal{B}(\mathbb{R}) ∀B∈B(R), ξ − 1 ( B ) ∈ F \xi^{-1}(B) \in \mathcal{F} ξ−1(B)∈F。如果 F \mathcal{F} F是Borel代数,也称 ξ \xi ξ为Borel可测函数。如果 Ω \Omega Ω有限,称 ξ \xi ξ为简单随机变量;如果 Ω \Omega Ω可列,称 ξ \xi ξ为离散型随机变量。
评注 基础1中我们花了很多精力构造 σ \sigma σ-代数,是因为它包含所有可测的事件,因此随机变量的定义保证我们能够根据概率测度定义它的分布。
事件的概率 假设状态空间是一个概率空间,概率为 P P P,则事件 ξ ∈ B ( R ) \xi \in \mathcal{B}(\mathbb{R}) ξ∈B(R)的概率就是 P ξ ( B ) = P ( ξ − 1 ( B ) ) P_{\xi}(B) = P(\xi^{-1}(B)) Pξ(B)=P(ξ−1(B))
分布函数 考虑 B = ( ∞ , x ] B=(\infty,x] B=(∞,x],记此时的事件概率为分布函数 F ξ ( x ) = P ( ξ − 1 ( ( − ∞ , x ] ) ) F_{\xi}(x)=P(\xi^{-1}((-\infty,x])) Fξ(x)=P(ξ−1((−∞,x]))
如果分布函数连续,称 ξ \xi ξ为连续型随机变量;如果分布函数可导,即 ∃ f ξ ( x ) = F ξ ′ ( x ) \exists f_{\xi}(x)=F_{\xi}'(x) ∃fξ(x)=Fξ′(x),称 f ξ f_{\xi} fξ为概率密度。
要判断一个实变函数是不是随机变量,根据定义肯定是做不到的,我们不可能检查 B ( R ) \mathcal{B}(\mathbb{R}) B(R)中的每一个集合,下面这个引理可以减少需要检查的集合数目:
引理 假设 C \mathcal{C} C是一个集族, σ ( C ) = B ( R ) \sigma(\mathcal{C})=\mathcal{B}(\mathbb{R}) σ(C)=B(R),如果 ∀ C ∈ C , ξ − 1 ( C ) ∈ F \forall C \in \mathcal{C}, \xi^{-1}(C) \in \mathcal{F} ∀C∈C,ξ−1(C)∈F,则 ξ \xi ξ是 F \mathcal{F} F-可测的。
这是实分析中的结论,我们直接用就不再证明了。根据这个引理,我们只需要检查一个能生成Borel代数的集族即可。构造 C = { ( ∞ , x ] : x ∈ R } \mathcal{C}=\{(\infty,x]:x \in \mathcal{R}\} C={(∞,x]:x∈R},则 σ ( C ) = B ( R ) \sigma(\mathcal{C})=\mathcal{B}(\mathbb{R}) σ(C)=B(R),因此只要 ξ − 1 ( ( − ∞ , x ] ) ∈ F \xi^{-1}((-\infty,x])\in\mathcal{F} ξ−1((−∞,x])∈F, ξ \xi ξ就是随机变量。实际上 ξ − 1 ( ( − ∞ , x ) ) ∈ F \xi^{-1}((-\infty,x))\in\mathcal{F} ξ−1((−∞,x))∈F也可以。
除了按定义判断随机变量的方法之外,还可以基于已知的随机变量进行判断:
引理 假设 ψ \psi ψ是Borel函数, ξ \xi ξ是随机变量,则 η = ψ ( ξ ) \eta=\psi(\xi) η=ψ(ξ)是随机变量。 证明 根据定义进行判断, ∀ B ∈ B ( R ) \forall B \in \mathcal{B}(\mathbb{R}) ∀B∈B(R), η − 1 ( B ) = [ ψ ( ξ ) ] − 1 ( B ) = ξ − 1 ( ψ − 1 ( B ) ) ∈ F \eta^{-1}(B)=[\psi(\xi)]^{-1}(B) = \xi^{-1}(\psi^{-1}(B)) \in \mathcal{F} η−1(B)=[ψ(ξ)]−1(B)=ξ−1(ψ−1(B))∈F
基于上文分布函数的定义: F ξ ( x ) = P ( ξ − 1 ( ( − ∞ , x ] ) ) F_{\xi}(x)=P(\xi^{-1}((-\infty,x])) Fξ(x)=P(ξ−1((−∞,x]))
分布函数具有下面的性质:
F ξ ( x ) F_{\xi}(x) Fξ(x)非减; F ξ ( − ∞ ) = 0 , F ξ ( + ∞ ) = 1 F_{\xi}(-\infty)=0, F_{\xi}(+\infty)=1 Fξ(−∞)=0,Fξ(+∞)=1 F ξ ( x ) F_{\xi}(x) Fξ(x)右连续;证明 性质1非常简单,基于概率的单调性即可以得出,如果 x ≤ y x \le y x≤y,有 ( − ∞ , x ] ⊂ ( − ∞ , y ] ⇒ ξ − 1 ( ( − ∞ , x ] ) ⊂ ξ − 1 ( ( − ∞ , y ] ) (-\infty,x]\subset (-\infty,y] \Rightarrow \xi^{-1}((-\infty,x])\subset \xi^{-1}((-\infty,y]) (−∞,x]⊂(−∞,y]⇒ξ−1((−∞,x])⊂ξ−1((−∞,y]),则 P ( ξ − 1 ( − ∞ , x ] ) ≤ P ( ξ − 1 ( − ∞ , y ] ) P(\xi^{-1}(-\infty,x])\le P(\xi^{-1}(-\infty,y]) P(ξ−1(−∞,x])≤P(ξ−1(−∞,y]),即 F ( x ) ≤ F ( y ) F(x) \le F(y) F(x)≤F(y);
性质2也非常简单,取 a n ↓ − ∞ a_n \downarrow -\infty an↓−∞,则 F ξ ( − ∞ ) = lim n F ξ ( a n ) = lim n P ( ξ − 1 ( − ∞ , a n ] ) = P ( ξ − 1 ( lim n ( − ∞ , a n ] ) ) = 0 F_{\xi}(-\infty)=\lim_nF_{\xi}(a_n) = \lim_n P(\xi^{-1}(-\infty,a_n]) = P(\xi^{-1}(\lim_n (-\infty,a_n]))=0 Fξ(−∞)=limnFξ(an)=limnP(ξ−1(−∞,an])=P(ξ−1(limn(−∞,an]))=0;
性质3也比较简单,取 b n ↑ x b_n \uparrow x bn↑x, lim n F ξ ( b n ) = lim n P ( ξ − 1 ( − ∞ , b n ] ) = P ( ξ − 1 ( ⋃ n ( − ∞ , b n ] ) ) = P ( ξ − 1 ( − ∞ , x ] ) = F ξ ( x ) \lim_n F_{\xi}(b_n)=\lim_nP(\xi^{-1}(-\infty,b_n]) = P(\xi^{-1}(\bigcup_n(-\infty,b_n]))=P(\xi^{-1}(-\infty,x])=F_{\xi}(x) limnFξ(bn)=limnP(ξ−1(−∞,bn])=P(ξ−1(⋃n(−∞,bn]))=P(ξ−1(−∞,x])=Fξ(x)
概率空间4中讨论了Lebesgue-Stieltjes测度,假设函数 F : R → R F:\mathbb{R}\to \mathbb{R} F:R→R满足
F ( x ) F(x) F(x)非减; F ( − ∞ ) = 0 , F ( + ∞ ) = 1 F(-\infty)=0,\ F(+\infty)=1 F(−∞)=0, F(+∞)=1; ∀ x ∈ R \forall x \in \mathbb{R} ∀x∈R, F F F在 x x x处右连续且存在左极限;对于区间 ( a , b ] (a,b] (a,b],定义测量区间长度的函数: λ ( ( a , b ] ) = F ( b ) − F ( a ) \lambda((a,b])=F(b)-F(a) λ((a,b])=F(b)−F(a)
由此可以在可测空间 ( R , B ( R ) ) (\mathbb{R},\mathcal{B}(\mathbb{R})) (R,B(R))上建立外测度,用 E E E表示前开后闭区间: μ ∗ ( A ) = inf { ∑ n = 1 ∞ λ ( E n ) : A ⊂ ⨆ n = 1 ∞ E n } \mu^*(A)=\inf\{\sum_{n=1}^{\infty} \lambda(E_n):A \subset \bigsqcup_{n=1}^{\infty}E_n\} μ∗(A)=inf{n=1∑∞λ(En):A⊂n=1⨆∞En}
基于这个外测度导出的L-S测度通常来作为 ( R , B ( R ) ) (\mathbb{R},\mathcal{B}(\mathbb{R})) (R,B(R))上的概率测度,那么基于这个概率测度定义的分布函数与L-S定义中的分布函数会有什么关系吗?
考虑概率空间 ( R , H ( R ∗ ) , μ ∗ ) (\mathbb{R},H(R^*),\mu^*) (R,H(R∗),μ∗),假设 ξ : ( R , H ( R ∗ ) , μ ∗ ) → ( R , B ( R ) ) \xi:(\mathbb{R},H(R^*),\mu^*) \to (\mathbb{R},\mathcal{B}(\mathbb{R})) ξ:(R,H(R∗),μ∗)→(R,B(R)),定义 ξ \xi ξ的分布函数为 F ξ ( x ) = μ ∗ ( ξ − 1 ( ( − ∞ , x ] ) ) F_{\xi}(x)=\mu^*(\xi^{-1}((-\infty,x])) Fξ(x)=μ∗(ξ−1((−∞,x]))。根据L-S测度的定义 ∃ E σ , σ ∈ I \exists E_{\sigma},\sigma \in I ∃Eσ,σ∈I, E σ = ( a α , b σ ] E_{\sigma}=(a_{\alpha},b_{\sigma}] Eσ=(aα,bσ] F ξ ( x ) = μ ∗ ( ⋃ σ ∈ I E σ ) = ∑ σ ∈ I [ F ( b σ ) − F ( a σ ) ] F_{\xi}(x)=\mu^*(\bigcup_{\sigma \in I}E_{\sigma}) = \sum_{\sigma\in I} [F(b_{\sigma})-F(a_{\sigma})] Fξ(x)=μ∗(σ∈I⋃Eσ)=σ∈I∑[F(bσ)−F(aσ)]
其中 ξ − 1 ( ( − ∞ , x ] ) ⊂ ⋃ σ ∈ I E σ \xi^{-1}((-\infty,x]) \subset \bigcup_{\sigma \in I}E_{\sigma} ξ−1((−∞,x])⊂σ∈I⋃Eσ
由此可以看出, F ξ F_{\xi} Fξ主要是由L-S测度的分布函数与 ξ \xi ξ的构造决定的。