【OC】状态估计(2)

tech2022-08-20 201

前文链接

状态估计(1)

最小二乘估计

为了对未知量 $X$ 进行估计，对其进行 $k$ 次测量，测量值为 $z_i=h_iX+\varepsilon_i, i=1, 2, \dots, k$ 其中 $h_i$ 为已知量， $\varepsilon_i$ 为第 $i$ 次观测时的随机误差，设所得估计值为 $\hat{X}$ ，第 $i$ 次观测值与相应的估计值 $h_i\hat{X}$ 的误差为 $\hat{e}_i=z_i-h_i\hat{X}$ 计算误差平方和为 $J(\hat{X})=\sum_{i=1}^k(z_i-h_i\hat{X})^2$ 使得 $J(\hat{X})$ 取最小值的估计值 $\hat{X}$ 为 $X$ 的最小二乘估计，记做 $\hat{X}_{LS}$ . 使用向量矩阵形式，令 $Z=\left[ \begin{aligned} &z_1\\ &z_2\\ &\vdots\\ &z_k \end{aligned} \right]， H=\left[ \begin{aligned} &h_1\\ &h_2\\ &\vdots\\ &h_k \end{aligned} \right]， \varepsilon=\left[ \begin{aligned} &\varepsilon_1\\ &\varepsilon_2\\ &\vdots\\ &\varepsilon_k \end{aligned} \right]$ 得到估计方程和损失函数为 $\left\{ \begin{aligned} &Z=HX+\varepsilon\\ &J(\hat{X})=(Z-H\hat{X})^T(Z-H\hat{X}) \end{aligned} \right.$ 一阶条件得到 $\frac{\partial J(\hat{X})}{\partial \hat{X}}=-2H^T(Z-H\hat{X})=0$ 当 $H^TH)^{-1}$ 存在时，可以得到 $\hat{X}_{LS}=(H^TH)^{-1}H^TZ$

案例

根据对二维向量的 $x$ 的两次观测 $z_1=\left[ \begin{matrix} 2\\ 1 \end{matrix} \right]=\left[ \begin{matrix} 1 & 1\\ 0 & 1 \end{matrix} \right]x+\varepsilon_1\\ z_2=4=[\begin{matrix}1 & 2\end{matrix}] x+\varepsilon_2$ 求 $x$ 的最小估计. 解析：合并观测方程 $z=\left[ \begin{matrix} z_1\\ z_2 \end{matrix} \right]=\left[ \begin{matrix} 2\\ 1\\ 4 \end{matrix} \right]， H=\left[ \begin{matrix} H_1\\ H_2 \end{matrix} \right]=\left[ \begin{matrix} 1& 1\\ 0 & 1\\ 1 & 2 \end{matrix} \right]， \varepsilon=\left[ \begin{matrix} \varepsilon_1\\ \varepsilon_2 \end{matrix} \right]$ 因为 $r a n k (H) = 2$ ，所以 $H^TH)^{-1}$ 存在，根据计算公式可知 $\hat{X}_{LS}=\bigg\{\bigg[\begin{matrix} 1 & 0 & 1\\ 1 & 1 & 2 \end{matrix}\bigg]\Bigg[ \begin{matrix} 1& 1\\ 0 & 1\\ 1& 2 \end{matrix} \Bigg]\bigg\}^{-1}\bigg[\begin{matrix} 1 & 0 & 1\\ 1 & 1 & 2 \end{matrix}\bigg]\Bigg[ \begin{matrix} 2\\ 1\\ 4 \end{matrix} \Bigg]=\Bigg[ \begin{matrix} 1\\ \frac{4}{3} \end{matrix} \Bigg]$ 在最小二乘估计中，不需要知道联合概率分布，也不需要知道随机变量的二阶矩，属于线性估计，其误差方差阵一般会大于最小方差估计的误差方差阵.

投影定理

在欧式空间中，两个向量 $a$ 和 $b$ 为正交，通常是指 $\sum_{i=1}^Na_ib_i=0$ 或者 $a^Tb=0$ . 在随机问题中，两个随机向量 $X$ 和 $Y$ 正交是指 $\mathbb{E}(X-\mathbb{E}\hat{X})(Y-\mathbb{E}\hat{Y})^T=0$ 即两个随机向量的各分量之间彼此不相关. 定义：如果一个与随机向量 $X$ 同维数的随机向量 $\hat{X}$ 具有性质

\hat{X}=a+BZ

\mathbb{E}(X-\hat{X})=0

\mathbb{E}(X-\hat{X})Z^T=0

则称 $\hat{X}$ 为 $X$ 在向量 $Z$ 上的投影. 投影定理： (1). 设 $X, Z_1$ 为两个随机向量，维数分别为 $n$ 与 $m_1$ ，则 $\hat{\mathbb{E}}(AX\mid Z_1)=A\hat{\mathbb{E}}(X\mid Z_1)$ 其中 $A$ 为 $l\times n$ 矩阵 (2). 设 $X, Z_1, Z_2$ 为三个随机向量，维数分别为 $n, m_1, m_2$ ，令 $Z=\left(\begin{matrix}Z_1\\Z_2\end{matrix}\right)$ ，则 $\mathbb{\hat{E}}(X\mid Z)=\mathbb{\hat{E}}(X\mid Z_1)+(\mathbb{E}\widetilde{X}\widetilde{Z}_2^T)(\mathbb{E}\widetilde{Z}_2\widetilde{Z}_2^T)^{-1}\widetilde{Z}_2$ 其中 $\left\{ \begin{aligned} &\widetilde{X}=X-\hat{\mathbb{E}}(X\mid Z_1)\\ &\widetilde{Z}_2=Z_2-\mathbb{\hat{E}}(Z_2\mid Z_1) \end{aligned} \right.$ 根据 $\mathbb{\hat{E}}(X\mid Z_1)$ 是 $Z_1$ 的线性函数可以证明线性，无偏性和正交性. 几何意义： $(1)$ 的几何意义为，由 $n$ 维随机向量所组成的 $l$ 维随机向量 $A X$ 在 $Z_1$ 空间上的投影等于先用 $n$ 维随机向量在 $Z_1$ 空间上的投影，再乘上 $A$ 矩阵所构成的随机向量. $(2)$ 的几何意义为，随机向量 $X$ 在 $Z$ 上的投影等于两个分量之和，一个分量为 $X$ 在 $Z_1$ 子空间中的投影，另一个分量为在 $\widetilde{Z}_2$ 子空间中的投影，其中 $\widetilde{Z}_2$ 子空间 $\perp$ $Z_1$ 的子空间。

下列方程成立 $\begin{aligned} \mathbb{\hat{E}}(X\mid Z)&=\mathbb{E}X+cov(X, Z)(\mathbb{V}X)^{-1}(Z-\mathbb{E}Z)\\ &=\mathbb{\hat{E}}(X\mid Z_1)+(\mathbb{E}\widetilde{X}\widetilde{Z}_2^T)[\mathbb{E}\widetilde{Z}_2\widetilde{Z}_2]^{-1}\widetilde{Z}_2 \end{aligned}$

参考资料

现代控制理论（第二版）清华大学出版社张嗣瀛高立群投影定理与最小二乘

最新回复(0)

【OC】状态估计(2)

导航

前文链接

最小二乘估计

案例

投影定理

参考资料