next up previous
Next: Formas canónicas de las Up: Resultados generales Previous: Resultados generales

Diagonalización simultánea de una métrica y una forma bilineal simétrica

Antes de estudiar las cónicas y las cuádricas, conviene demostrar un resultado muy útil, con el que podremos expresar cualquier forma cuadrática definida en un espacio métrico en su forma diagonal, con una base ortonormal. El resultado se aplica también (y esto es importantísimo para la mecánica cuántica) a formas bilineales simétricas definidas en espacios vectoriales hermíticos (espacios vectoriales dotados de una forma hermítica). Lo vamos a enunciar para los dos tipos de espacios, pero sólo vamos a hacer la demostración en el caso euclídeo (es decir, sobre el cuerpo real). En concreto, el resultado es el siguiente

TEOREMA 4.1.1   Sea E un espacio vectorial de dimensión finita sobre el cuerpo $ \mathbb {R}$ ó $ \mathbb {C}$. Sea g una forma bilineal simétrica definida positiva (si el cuerpo es $ \mathbb {R}$) o una forma hermítica (si el cuerpo es $ \mathbb {C}$). Sea $ \varphi$ una forma bilineal simétrica sobre E. Existe una base ortonormal para g que es ortogonal para $ \varphi$. Es decir, existe una base de E para la cual la matriz de g es la identidad y la de $ \varphi$ es diagonal.

Recordemos, antes de demostrarlo, un concepto esencial en el estudio de la forma canónica de los endomorfismos.

Definición 4.1.2   Sea V un espacio vectorial y f : V $ \rightarrow$ V un endomorfismo. Sea $ \lambda$ un autovalor de f. El subespacio invariante asociado a $ \lambda$ es el subespacio vectorial

F($\displaystyle \lambda$) = ker(f - $\displaystyle \lambda$Id ) $\displaystyle \oplus$ ker(f - $\displaystyle \lambda$Id )2 $\displaystyle \oplus$ ...

que es un subespacio de V invariante y (recuerdo) admite una base (u1,..., uk) con

f (u1) = $\displaystyle \lambda$u1f (u2) = u1 + $\displaystyle \lambda$u2, ..., f (uk) = uk-1 + $\displaystyle \lambda$uk.

LEMA 4.1.3   Sea E un espacio vectorial real de dimensión finita, dotado de la forma bilineal simétrica definida positva g. Sea f : E $ \rightarrow$ E un endomorfismo. Supongamos que la matriz de f en una base $ \mathcal {B}$ ortonormal para g es simétrica, y sean $ \lambda$,$ \mu$ dos autovalores de f, reales y distintos. Entonces los subespacios propios asociados a $ \lambda$ y $ \mu$ son mutuamente ortogonales para g.

Demostración. Fijamos la base $ \mathcal {B}$ del enunciado, en la cual la matriz de g es la identidad y la de f es simétrica. Sean V($ \lambda$) y V($ \mu$) los subespacios propios asociados a $ \lambda$ y $ \mu$, respectivamente. Consideremos en E la forma bilineal simétrica H cuya matriz en $ \mathcal {B}$ es la misma que la de f y sean u $ \in$ V($ \lambda$) y v $ \in$ V($ \mu$) dos vectores no nulos de los subespacios respectivos. Hemos de comprobar que g(u, v) = 0. En la base $ \mathcal {B}$, los vectores se escribirán u = (u1,..., un) y v = (v1,..., vn) y es f (u) = $ \lambda$u, f (v) = $ \mu$v. Por un lado se tiene que

H(u, v) = (u1 ... un)M$\displaystyle \left(\vphantom{
\begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}}\right.$$\displaystyle \begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}$$\displaystyle \left.\vphantom{
\begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}}\right)$ = (u1 ... un)$\displaystyle \left(\vphantom{
\begin{array}{c}
\lambda v_{1}\\
\vdots\\
\lambda v_{n}
\end{array}}\right.$$\displaystyle \begin{array}{c}
\lambda v_{1}\\
\vdots\\
\lambda v_{n}
\end{array}$$\displaystyle \left.\vphantom{
\begin{array}{c}
\lambda v_{1}\\
\vdots\\
\lambda v_{n}
\end{array}}\right)$ = $\displaystyle \lambda$g(u, v),

la última igualdad porque $ \mathcal {B}$ es una base ortonormal para g. Por otro lado, fijándonos en ``la parte izquierda'' y razonando igual,

H(u, v) = (u1 ... un)M$\displaystyle \left(\vphantom{
\begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}}\right.$$\displaystyle \begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}$$\displaystyle \left.\vphantom{
\begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}}\right)$ = ($\displaystyle \mu$u1 ... $\displaystyle \mu$un)$\displaystyle \left(\vphantom{
\begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}}\right.$$\displaystyle \begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}$$\displaystyle \left.\vphantom{
\begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}}\right)$ = $\displaystyle \mu$g(u, v).

De donde $ \lambda$g(u, v) = $ \mu$g(u, v). Como $ \lambda$ y $ \mu$ son distintos, ha de ser g(u, v) = 0: es decir, u y v son ortogonales para g. $ \qedsymbol$

LEMA 4.1.4   Sea (E, g) un espacio métrico real de dimensión finita. Sea f : E $ \rightarrow$ E un endomorfismo que en una base $ \mathcal {B}$ ortonormal, es simétrico y sea $ \lambda$ un valor propio real de f. Entonces el subespacio invariante F($ \lambda$) es igual al subespacio propio V($ \lambda$) y, por tanto, existe una base de F($ \lambda$) formada por vectores propios.

Demostración. Hemos de demostrar que el espacio propio del autovalor $ \lambda$ es igual a F($ \lambda$). Si no lo fuera, por el teorema de Jordan existirían dos vectores no nulos u, v $ \in$ F($ \lambda$) tales que f (u) = $ \lambda$u y f (v) = u + $ \lambda$v. Escribiendo, como en el lema anterior, u = (u1,..., un) y v = (v1,..., vn), se tendría, por un lado

H(u, v) = (u1 ... un)M$\displaystyle \left(\vphantom{ \begin{array}{c} v_{1}\\ \vdots\\ v_{n} \end{array} }\right.$$\displaystyle \begin{array}{c} v_{1}\\ \vdots\\ v_{n} \end{array}$$\displaystyle \left.\vphantom{ \begin{array}{c} v_{1}\\ \vdots\\ v_{n} \end{array} }\right)$ = (u1 ... un)$\displaystyle \left(\vphantom{ \begin{array}{c} u_{1}+\lambda v_{1}\\ \vdots\\ u_{n}+ \lambda v_{n} \end{array} }\right.$$\displaystyle \begin{array}{c} u_{1}+\lambda v_{1}\\ \vdots\\ u_{n}+ \lambda v_{n} \end{array}$$\displaystyle \left.\vphantom{ \begin{array}{c} u_{1}+\lambda v_{1}\\ \vdots\\ u_{n}+ \lambda v_{n} \end{array} }\right)$ =    
  = g(u, u + $\displaystyle \lambda$v) = g(u, u) + $\displaystyle \lambda$g(u, v),    

y por otro,

H(u, v) = (u1 ... un)M$\displaystyle \left(\vphantom{
\begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}}\right.$$\displaystyle \begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}$$\displaystyle \left.\vphantom{
\begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}}\right)$ = ($\displaystyle \lambda$u1 ... $\displaystyle \lambda$un)$\displaystyle \left(\vphantom{
\begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}}\right.$$\displaystyle \begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}$$\displaystyle \left.\vphantom{
\begin{array}{c}
v_{1}\\  \vdots\\  v_{n}
\end{array}}\right)$ = $\displaystyle \lambda$g(u, v),

de donde g(u, u) + $ \lambda$g(u, v) = $ \lambda$g(u, v), es decir, g(u, u) = 0, que contradice el hecho de que g es una métrica (por tanto, definida) y que u $ \neq$ 0. $ \qedsymbol$

LEMA 4.1.5   Los valores propios de un endomorfismo f de un espacio vectorial real cuya matriz en alguna base $ \mathcal {B}$ es simétrica, son todos reales.

Demostración. Supongamos que no. Entonces f tiene dos autovalores complejos conjugados, $ \lambda$ y $ \overline{{\lambda }}$. El subespacio F = ker(f2 - 2Re($ \lambda$)f +|$ \lambda$$ \vert^{{2}}_{}$Id es invariante (compruébese). Se sabe (Jordan real) que en F hay dos vectores u, v no nulos tales que f (u) = Re($ \lambda$)u - Im($ \lambda$)v y f (v) = Im($ \lambda$)u + Re($ \lambda$)v. Por otro lado, como la matriz M de f en $ \mathcal {B}$ es simétrica, si escribimos u = (u1,..., un) y (v1,..., vn) y consideramos el producto escalar usual en la base $ \mathcal {B}$, se tiene que

$\displaystyle \left(\vphantom{ \begin{array}{ccc} v_{1} & \cdots & v_{n} \end{array} }\right.$$\displaystyle \begin{array}{ccc} v_{1} & \cdots & v_{n} \end{array}$$\displaystyle \left.\vphantom{ \begin{array}{ccc} v_{1} & \cdots & v_{n} \end{array} }\right)$M$\displaystyle \left(\vphantom{ \begin{array}{c} u_{1}\\ \vdots\\ u_{n} \end{array} }\right.$$\displaystyle \begin{array}{c} u_{1}\\ \vdots\\ u_{n} \end{array}$$\displaystyle \left.\vphantom{ \begin{array}{c} u_{1}\\ \vdots\\ u_{n} \end{array} }\right)$ = $\displaystyle \left(\vphantom{ \begin{array}{ccc} v_{1} & \cdots & v_{n} \end{array} }\right.$$\displaystyle \begin{array}{ccc} v_{1} & \cdots & v_{n} \end{array}$$\displaystyle \left.\vphantom{ \begin{array}{ccc} v_{1} & \cdots & v_{n} \end{array} }\right)$$\displaystyle \left(\vphantom{ \begin{array}{c} Re(\lambda )u_{1}-Im(\lambda )v_{1}\\ \vdots\\ Re(\lambda )u_{n} -Im(\lambda )v_{n} \end{array} }\right.$$\displaystyle \begin{array}{c} Re(\lambda )u_{1}-Im(\lambda )v_{1}\\ \vdots\\ Re(\lambda )u_{n} -Im(\lambda )v_{n} \end{array}$$\displaystyle \left.\vphantom{ \begin{array}{c} Re(\lambda )u_{1}-Im(\lambda )v_{1}\\ \vdots\\ Re(\lambda )u_{n} -Im(\lambda )v_{n} \end{array} }\right)$ =    
  = Re($\displaystyle \lambda$) < u, v > - Im($\displaystyle \lambda$)|v$\displaystyle \vert^{{2}}_{}$,    

mietras que, ``por el otro lado'',

$\displaystyle \left(\vphantom{ \begin{array}{ccc} v_{1} & \cdots & v_{n} \end{array} }\right.$$\displaystyle \begin{array}{ccc} v_{1} & \cdots & v_{n} \end{array}$$\displaystyle \left.\vphantom{ \begin{array}{ccc} v_{1} & \cdots & v_{n} \end{array} }\right)$M$\displaystyle \left(\vphantom{ \begin{array}{c} u_{1}\\ \vdots\\ u_{n} \end{array} }\right.$$\displaystyle \begin{array}{c} u_{1}\\ \vdots\\ u_{n} \end{array}$$\displaystyle \left.\vphantom{ \begin{array}{c} u_{1}\\ \vdots\\ u_{n} \end{array} }\right)$ =    
= $\displaystyle \left(\vphantom{ \begin{array}{ccc} Im(\lambda )u_{1} + Re(\lambda )v_{1} & \cdots & Im(\lambda )u_{n}+Re(\lambda ) v_{n} \end{array} }\right.$$\displaystyle \begin{array}{ccc} Im(\lambda )u_{1} + Re(\lambda )v_{1} & \cdots & Im(\lambda )u_{n}+Re(\lambda ) v_{n} \end{array}$$\displaystyle \left.\vphantom{ \begin{array}{ccc} Im(\lambda )u_{1} + Re(\lambda )v_{1} & \cdots & Im(\lambda )u_{n}+Re(\lambda ) v_{n} \end{array} }\right)$ $\displaystyle \left(\vphantom{ \begin{array}{c} u_{1}\\ \vdots\\ u_{n} \end{array} }\right.$$\displaystyle \begin{array}{c} u_{1}\\ \vdots\\ u_{n} \end{array}$$\displaystyle \left.\vphantom{ \begin{array}{c} u_{1}\\ \vdots\\ u_{n} \end{array} }\right)$ =    
= Re($\displaystyle \lambda$) < u, v > + Im($\displaystyle \lambda$) |v$\displaystyle \vert^{{2}}_{}$    

de donde

(|u$\displaystyle \vert^{{2}}_{}$ +|v$\displaystyle \vert^{{2}}_{}$)Im($\displaystyle \lambda$) = 0

y, puesto que u, v $ \neq$ 0, ha de ser Im($ \lambda$) = 0, contradicción. $ \qedsymbol$

Estamos ya en condiciones de demostrar el teorema 1.1.

Demostración. Demostración del Teorema 1.1. Partimos, como se dice en el enunciado, de un espacio métrico (E, g) y de una forma bilineal simétrica $ \varphi$ en E (sólo vamos a probar el resultado en el caso real). Fijemos una base $ \mathcal {B}$ de E que sea ortonormal para g. Puesto que $ \varphi$ es simétrica, su matriz en $ \mathcal {B}$ es una matriz simétrica; llamémosla M. Sabemos también, por el lema 1.5, que sus autovalores son todos reales.

Olvidémonos por un momento de que M es la matriz de una forma bilineal y consideremos el endomorfismo f de E cuya matriz asociada en la base $ \mathcal {B}$ es M(f,$ \mathcal {B}$) = M. Sean {$ \lambda_{{1}}^{}$,...,$ \lambda_{{r}}^{}$} los autovalores de f y F($ \lambda_{{1}}^{}$),..., F($ \lambda_{{r}}^{}$) los subespacios invariantes asociados a los valores propios. Por el lema 1.4 sabemos que F($ \lambda_{{i}}^{}$) = V($ \lambda_{{i}}^{}$) para todo i, es decir, que los subespacios invariantes son los subespacios propios. Por el lema 1.3, los F($ \lambda_{{i}}^{}$) son ortogonales dos a dos respecto de g. Si $ \mathcal {B}$1,...,$ \mathcal {B}$r son bases de F($ \lambda_{{1}}^{}$),..., F($ \lambda_{{r}}^{}$) y cada una de ellas es ortogonal para g, entonces la base $ \mathcal {B}$$\scriptstyle \prime$ = $ \mathcal {B}$1 $ \cup$ ... $ \cup$ $ \mathcal {B}$r es una base ortogonal para g. Y, evidentemente, si son ortonormales, también lo es $ \mathcal {B}$$\scriptstyle \prime$. Fijémonos en un subespacio F($ \lambda_{{i}}^{}$). Como F($ \lambda_{{i}}^{}$) = V($ \lambda_{{i}}^{}$), todos sus vectores son propios. Como g es definida positiva en todo E, también lo es en F($ \lambda_{{i}}^{}$), así que existe una base de F($ \lambda_{{i}}^{}$) ortonormal para g: llamémosla $ \mathcal {B}$i. Sea $ \mathcal {B}$$\scriptstyle \prime$ la base formada uniendo todas las $ \mathcal {B}$i. Esta $ \mathcal {B}$$\scriptstyle \prime$ es ortonormal para g y, evidentemente, diagonaliza f: si P = (pij) es la matriz de cambio de base de $ \mathcal {B}$ a $ \mathcal {B}$$\scriptstyle \prime$, se tiene que

Id = tP . IdP

por ser ambas bases ortonormales para g y que

P-1M(f,$\displaystyle \mathcal {B}$)P = D

donde D es una matriz diagonal.

Ahora bien, por la primera igualdad, resulta que P-1 = tP y, por tanto,

tPMP = D

(con D diagonal). Pero, puesto que M es la matriz de $ \varphi$ en la base $ \mathcal {B}$ y P es una matriz de cambio, esto significa que $ \mathcal {B}$$\scriptstyle \prime$ es una base ortogonal para $ \varphi$, que es lo que queríamos construir. $ \qedsymbol$


next up previous
Next: Formas canónicas de las Up: Resultados generales Previous: Resultados generales
Pedro Fortuny Ayuso 2001-06-15