Dekompozycja Kalmana

Dekompozycja Kalmana – termin używany w teorii sterowania na określenie konwersji realizacji stacjonarnego liniowego układu regulacji do postaci, w której układ ujawnia części obserwowalną i sterowalną co pozwala na wyciągnięcie wniosków odnośnie do osiągalnych i obserwowalnych podprzestrzeni dla danego układu.

Notacja

Wyprowadzenie przebiega tak samo zarówno dla (stacjonarnych) układów czasu ciągłego, jak i układów dyskretnych. Niech dany będzie liniowy, stacjonarny układ ciągły opisany równaniami stanu:

x ˙ ( t ) = A x ( t ) + B u ( t ) , {\displaystyle {\dot {x}}(t)=Ax(t)+Bu(t),}
y ( t ) = C x ( t ) + D u ( t ) . {\displaystyle y(t)=Cx(t)+Du(t).}

Układ taki można opisać za pomocą krotki czterech macierzy ( A , B , C , D ) . {\displaystyle (A,B,C,D).} Niech rząd systemu wynosi n . {\displaystyle n.} Wówczas dekompozycja Kalmana zdefiniowana jest jako transformacja krotki ( A , B , C , D ) {\displaystyle (A,B,C,D)} do postaci ( A ^ , B ^ , C ^ , D ^ ) {\displaystyle ({\hat {A}},{\hat {B}},{\hat {C}},{\hat {D}})} w następujący sposób:

A ^ = T 1 A T , {\displaystyle {\hat {A}}=T^{-1}AT,}
B ^ = T 1 B , {\displaystyle {\hat {B}}=T^{-1}B,}
C ^ = C T , {\displaystyle {\hat {C}}=CT,}
D ^ = D . {\displaystyle {\hat {D}}=D.}

T {\displaystyle T} jest macierzą odwrotną o rozmiarach n × n {\displaystyle n\times n} zdefiniowaną jako:

T = [ T r o ¯ T r o T r o ¯ T r ¯ o ] , {\displaystyle T={\begin{bmatrix}T_{r{\overline {o}}}&T_{ro}&T_{\overline {ro}}&T_{{\overline {r}}o}\end{bmatrix}},}

gdzie:

T r o ¯ {\displaystyle T_{r{\overline {o}}}} – macierz, której kolumny rozpięte są w podprzestrzeni stanów, które są zarówno osiągalne, jak i nieobserwowalne;
T r o {\displaystyle T_{ro}} – jest tak dobrana, że kolumny [ T r o ¯ T r o ] {\displaystyle {\begin{bmatrix}T_{r{\overline {o}}}&T_{ro}\end{bmatrix}}} stanowią bazę dla podprzestrzeni osiągalnej;
T r o ¯ {\displaystyle T_{\overline {ro}}} – jest tak dobrana, że kolumny [ T r o ¯ T r o ¯ ] {\displaystyle {\begin{bmatrix}T_{r{\overline {o}}}&T_{\overline {ro}}\end{bmatrix}}} stanowią bazę dla podprzestrzeni nieobserwowalnej;
T r ¯ o {\displaystyle T_{{\overline {r}}o}} – jest tak dobrana, że macierz [ T r o ¯ T r o T r o ¯ T r ¯ o ] {\displaystyle {\begin{bmatrix}T_{r{\overline {o}}}&T_{ro}&T_{\overline {ro}}&T_{{\overline {r}}o}\end{bmatrix}}} jest odwrotna.

Można zauważyć, że niektóre z tych macierzy mogą mieć wymiar równy zero. Na przykład jeśli system jest zarówno obserwowalny, jak i sterowalny, wówczas T = T r o , {\displaystyle T=T_{ro},} co sprawia, że inne macierze mają wymiar zerowy.

Forma standardowa

Korzystając z wyników dla sterowalności i obserwowalności, można pokazać, że układ po transformacji ( A ^ , B ^ , C ^ , D ^ ) {\displaystyle ({\hat {A}},{\hat {B}},{\hat {C}},{\hat {D}})} ma macierze o następującej postaci:

A ^ = [ A r o ¯ A 12 A 13 A 14 0 A r o 0 A 24 0 0 A r o ¯ A 34 0 0 0 A r ¯ o ] {\displaystyle {\hat {A}}={\begin{bmatrix}A_{r{\overline {o}}}&A_{12}&A_{13}&A_{14}\\0&A_{ro}&0&A_{24}\\0&0&A_{\overline {ro}}&A_{34}\\0&0&0&A_{{\overline {r}}o}\end{bmatrix}}}
B ^ = [ B r o ¯ B r o 0 0 ] {\displaystyle {\hat {B}}={\begin{bmatrix}B_{r{\overline {o}}}\\B_{ro}\\0\\0\end{bmatrix}}}
C ^ = [ 0 C r o 0 C r ¯ o ] {\displaystyle {\hat {C}}={\begin{bmatrix}0&C_{ro}&0&C_{{\overline {r}}o}\end{bmatrix}}}
D ^ = D {\displaystyle {\hat {D}}=D}

Prowadzi to do wniosku, że:

  • Podukład ( A r o , B r o , C r o , D ) {\displaystyle (A_{ro},B_{ro},C_{ro},D)} jest zarówno osiągalny, jak i obserwowalny.
  • Podukład ( [ A r o ¯ A 12 0 A r o ] , [ B r o ¯ B r o ] , [ 0 C r o ] , D ) {\displaystyle \left({\begin{bmatrix}A_{r{\overline {o}}}&A_{12}\\0&A_{ro}\end{bmatrix}},{\begin{bmatrix}B_{r{\overline {o}}}\\B_{ro}\end{bmatrix}},{\begin{bmatrix}0&C_{ro}\end{bmatrix}},D\right)} jest osiągalny.
  • Podukład ( [ A r o A 24 0 A r ¯ o ] , [ B r o 0 ] , [ C r o C r ¯ o ] , D ) {\displaystyle \left({\begin{bmatrix}A_{ro}&A_{24}\\0&A_{{\overline {r}}o}\end{bmatrix}},{\begin{bmatrix}B_{ro}\\0\end{bmatrix}},{\begin{bmatrix}C_{ro}&C_{{\overline {r}}o}\end{bmatrix}},D\right)} jest obserwowalny.

Zobacz też