Formas Cuadraticas
Formas Cuadraticas
24 de julio de 2015
Índice general
T αi = λi αi , i = 1, 2, . . . , n
2
0.1. VECTORES Y VALORES PROPIOS 3
A[α0 ] = λ0 [α0 ]
(A − λI)X = 0
det(A − λI) = 0
En realidad, sólo falta ver que vectores propios de valores propios dis-
tintos son linealmente independientes entre sí. Para ver esto, supongamos
que los n = dim(V ) valores propios de T son λ1 , . . . , λn , todos distintos en
los reales. Y supongamos que α1 , . . . , αn son los correspondientes vectores
propios. Entonces, si
c1 α1 + · · · + cn αn = 0,
4
P (λ) = λ2 + 1
que no tiene raíces reales. Esto dice que imposible esperar que T se pueda
diagonalizar en alguna base de R2 .
Aún cuando todas las raíces del polinomio característico existan en los
reales, no siempre existen suficientes vectores propios para formar una base
de V . Veamos un ejemplo de esto. Supongamos que T está representado en
la base canónica por la matriz
1 1
A=
0 1
Entonces T tiene polinomio característico
1 1
P (λ) = det − λI
0 1
0.1. VECTORES Y VALORES PROPIOS 5
1−λ 1
P (λ) = det
0 1−λ
P (λ) = (λ − 1)2
que tiene todas sus raíces en R: λ0 = 1 es raíz doble. Para buscar los vectores
propios miramos las soluciones no triviales del sistema
(A − λ0 I)X = 0
1 1
−I X = 0
0 1
0 1 x 0
=
0 0 y 0
que tiene como soluciones los múltiplos del vector e1 ; nada más. Con ese
vector solo no se llega a una base de R2 .
De regeso a nuestra discusión. De nuevo, si Φ es una base que diagonaliza
a T , se debe tener
T αi = λi αi , i = 1, 2, . . . , n
lo que en términos de la matriz A que representa a T en la base canónica se
convierte en
A[αi ] = λi [αi ] ; i = 1, 2, . . . , n
que a su vez puede ser leído en términos de la matriz cambio de base P
de la la nueva base Φ a la canónica. P es la matriz cuyas columnas son
los vectores αi ’s puestos en columna (es decir, P tiene por columnas a los
vectores [αi ]Can ’s.) Entonces, si existe la base que diagonaliza a T ,
P −1 AP = D
1.
1 −1 −1
A= 0 2 −1
0 0 3
2.
3 0 2
A = −1 1 −1
−1 0 0
3.
1 −1 −1
A = −1 2 −1
−1 −1 3
4.
2 1 0
A= 1 2 1
0 1 2
Ejercicio 0.2. Para los dos últimos casos del problema anterior, verificar que
es posible tomar la matriz P que diagonaliza a T con columnas ortogonales
entre sí y de norma uno. Calcule P −1 y compare con la traspuesta de P .
Ejercicio 0.3. Pruebe que si una matriz P n × n tiene por columnas los
vectores de una base de Rn cuyos vectores son ortogonales entre sí y cada
uno de norma uno, entonces P P T = I. Tales matrices se denominan orto-
gonales. Verifique que si dos matrices son ortogonales su producto también
lo es.
Ejercicio 0.4. Pruebe que toda matriz invertible A tiene todos sus valores
propios no nulos. Más aún, λ0 es un valor propio de A si y sólo si 1/λ0 es
valor propio de A−1 .
Ejercicio 0.6. Pruebe que una matriz ortogonal sólo tiene como valores
propios reales a ±1. Ayuda: Use los problemas anteriores y el hecho que el
determinante es invariante por trasposición.1
P T [T ]P = D
P T [T ]T P = D T = D = P T [T ]P
de donde
[T ]T = [T ]
1
En general, para tener todos los valores propios de una matriz en el cuerpo de escalares
hace falta que éste sea algebraicamente cerrado; es decir, que todo polinomio de grado
n > 0 con coeficientes en el cuerpo tenga todas sus n raíces en el cuerpo. En particular,
en el caso de una matriz ortogonal real, del análogo del ejercicio 0.5 pero en C, se sigue
que los valores propios sólo pueden ser de la forma eiθ = cos θ + i sin θ, con θ ∈ R.
8
hT α, βi = hα, T βi
Ejercicio 0.7. Pruebe que para toda matriz cuadrada An×n se cumple
hAα, βi = hα, AT βi
hα, βi = αT β
Aquí estamos pensando los vectores de Rn como matrices n×1; por lo tanto, la
operación de trasponer pone a los vectores en posición horizontal. Siguiendo
esta convención, pruebe que
hα; βi = αT × β
Por el teorema fundamental del álgebra (TFA), existe una raíz λ1 ∈ C del
polinomio característico de A: det(A − λI) = 0. Entonces el sistema homo-
géneo
(A − λ1 I)X = 0
tiene solución no trivial en el cuerpo de los complejos. Sea α1 una solución
no trivial; entonces
Aα = λ1 α1 ∈ Cn
Entonces, usando el producto interno canónico en Cn , se tiene
hλ1 α1 , α1 i = hα1 , λ1 α1 i
λ1 hα1 , α1 i = λ1 hα1 , α1 i
λ1 = λ1
porque hα1 , α1 i > 0. Esto prueba que λ1 es real. En ese caso, α1 pude tomarse
en Rn .
10
hλ1 α; βi = hα; λ2 βi
λ1 hα; βi = λ2 hα; βi
(λ1 − λ2 )hα; βi = 0
hα; βi = 0
que prueba la ortogonalidad de α y β.
hα; T βi = hT α; βi = 0
[T ]Φ = [[T α1 ]Φ , [T γ2]Φ , . . . , [T γn ]Φ ]
= [λ1 e1 , [T γ2 ]Φ , . . . , [T γn ]Φ ]
pero como cada T γi es combinación lineal sólo delos γj ’s, cada columna [T γj ]Φ
es combinación lineal sólo de ei ’s con 2 ≤ i ≤ n. O sea, la matriz de T en la
base Φ se ve así
λ1 0
A=
0 B
donde B en (n − 1) × (n − 1).
Afirmación 1: B es simétrica.
Esto se sigue de haber tomado la base {γ2 , . . . , γn } de W1⊥ ortonormal.
Es suficiente probar que
n−1
X
= bsi hes ; ej i
s=1
n−1
X
= bsi δsj
s=1
n−1
X
= bsi hγs+1 ; γj+1i
s=1
12
n−1
X
=h bsi γs+1; γj+1i
s=1
= hAγi+1 ; γj+1i
= hγi+1 ; Aγj+1i
n−1
X
= hγi+1 ; bsj γs+1i
s=1
n−1
X
= bsj hγi+1 ; γs+1i
s=1
n−1
X
= bsj δis
s=1
n−1
X
= bsj hei ; es i
s=1
n−1
X
= hei ; bsj es i
s=1
= hei ; Bej i
entonces B es simétrica. Crucial a esta cuenta fué el hecho que la base
{γ2 , . . . , γn } es ortonormal:
Ahora sí, por inducción existe una base ortonormal de Rn−1 α˜2 , . . . , α˜n
consistente de vectores propios de B
B α̃i = λi α̃i , i = 2, 3, . . . , n
donde
u2i
α̃i = ... ∈ Rn−1
uni
Afirmación 2: hαi ; αj i = δij
Que α1 es ortogonal a los αi ’s con 2 ≤ i ≤ n se sigue de la ortogonalidad
entre α1 y los γi ’s. Veámos que los αi ’s con 2 ≤ i ≤ n son ortogonales entre
si
n
X n
X
hαi ; αj i = h usi γs ; urj γr i
s=2 r=2
n
X
= usi urj hγs ; γr i
s,r=2
n
X
= usi urj δsr
s,r=2
n
X
= usi urj hes−1 ; er−1 i
s,r=2
n
X n
X
=h usi es−1 ; urj er−1 i
s=2 r=2
n
X
= usi [A(γs )]Φ
s=2
n
X
= usi Bes−1
s=2
14
n
X
= B( usi es−1 )
s=2
= B(α̃i )
= λi α̃i
n
X
= λi ( usi es−1 )
s=2
n
X
= λi ( usi [γs ]Φ )
s=2
= [λi αi ]Φ
Esto termina la prueba.
Ejercicio 0.8. En cada uno de los siguientes casos, encuentre una matriz
ortogonal P que diagonalice A.
1.
1 0 −1
A= 0 2 0
−1 0 1
2. √
3/2 √ 1/2 0
A= 1/2 − 3/2 0
0 0 2
3.
0 1 1
A= 1 2 1
1 1 0
4.
1 2 3
A= 2 3 4
3 4 5
5.
cos θ sin θ
A=
sin θ − cos θ
0.3. FORMAS CUADRÁTICAS 15
Ejercicio 0.10. En cada uno de los siguientes casos encuentre la matriz Substitucion
simétrica correspondiente a la forma cuadrática dada y una substitución ortogonal que
ortogonal que la diagonalice. Exprese la forma en las nuevas coordenadas la diagonalice
explícitamente. ???
1. 3x2 − 6xy + y 2
2. 8x2 + 9xy − 3y 2
5. 2xy
6. 3x2 + 4xy
7. −6xy + 8y 2
8. x2 + 2xy + y 2
9. 3x2 − 4xy + 3y 2
11. x2 + 2y 2 − 6xz + z 2 − 4w 2
18
Ejercicio 0.11. Sea Q(X) = X T AX. Para cada caso encuentre la P orto-
gonal que diagonaliza A y decida si la forma es definida positiva o negativa;
si es semidefinida positiva o negativa; o indefinida.
1.
0 1/2 1/2
A = 1/2 0 1/2
1/2 1/2 0
2. Q(x, y) = x2 + 2xy + y 2
3. Q(x, y) = x2 + 2xy
4.
3/2 0 1/2
A= 0 2 0
1/2 0 3/2
5.
−11 −5 3 1
−5 −11 1 3
A=
3 1 −11 −5
1 3 −5 −11
Ejercicio 0.12. Hallar una condición necesaria y suficiente para que la forma
ax2 + bxy + cy 2 se pueda diagonalizar ortogonalmente a una forma del tipo
ku2 .
Existe una manera de decidir sobre el signo de una forma cuadrática sin
necesidad de diagonalizarla (aunque tal vez no menos laborioso.)
Definición 0.5. Sea An×n una matriz. Una submatriz de orden k es una
matriz k × k que se obtiene de A omitiendo n − k filas y n − k columnas,
posiblemente distintas. Cuando las n − k filas y columnas que se omiten de A
son las mismas, la submatriz que se obtiene se dice submatriz principal.
Cuando las n − k filas y columnas que se omiten de A son las últimas k +
1, k + 2, . . . , n, la submatriz que se obtiene se dice submatriz principal
líder y se denotará A(k) . Los determinantes de las submatrices principales
se denominan menores pricipales de A. Los determinantes de submatrices
0.3. FORMAS CUADRÁTICAS 19
Por ejemplo, si
1 2 3
A= 4 5 6
7 8 9
entonces
4 6
7 9
es la submatriz de A que se obtiene omitiendo la fila primera y la columna
segunda; las submatrices principales líderes de A de orden 1, 2, 3 son respec-
tivamente
1 2 3
1 2
[1] , , 4 5 6
4 5
7 8 9
Los menores principales líderes son sus respectivos determinantes. Son me-
nores principales no líderes de A las matrices
5 6 1 3
[5] , [9] , ,
8 9 7 9
Sus determinantes, junto con los menores principales líderes, son todos los
menores principales de A.
Ejercicio 0.13. Use el teorema 0.3 para decidir el signo de las formas del
problema 0.10 y 0.11.
Ejercicio 0.14. Pruebe que si una matriz simétrica A tiene todos sus meno-
res principales de orden par no negativos y sus menores principales de orden
impar nulos, entonces A es la matriz nula. Ayuda: Primero mire los menores
principales de orden uno; luego piense en los menores principales de orden
dos.
mientras los menores principales de orden par son no negativos a menos que A misma sea
nula, posibilidad ésta excluída por la definición de forma cuadrática.
0.3. FORMAS CUADRÁTICAS 21
A(n−1) a
A=
aT an n
se puede descomponer usando operaciones elementales por filas y por colum-
nas (ambas simultáneamente) así:
A(n−1) 0
A = MT × ×M
0 d
(M es una matriz producto de elementales del tipo antes mencionado pero
que opera por columnas en vez de por filas; M usa el bloque A(n−1) para
22
(⇐) Asuma ahora al revés, supongamos que todos los menores principales
de A son positivos. El caso n = 1 es que a > 0 implica Q(x) = ax2 > 0,
para todo x ∈ R no nulo; así Q es positiva definida.
La hipótesis inductiva es ahora que si una matriz simétrica de tamaño
(n − 1) × (n − 1) tiene todos sus menores principales positivos, entonces
la forma cuadrática asociada es positiva definda.
Como A tiene todos sus menores principales positivos, det(A(n−1) ) > 0;
luego A(n−1) es invertible y las cuentas que llevaron a 1 y 2 son posibles.
Por 1, como detA > 0 y det(A(n−1) ) > 0, se tiene d > 0. Ahora,
como A(n−1) tiene todos sus menores principales positivos, por hipótesis
inductiva, Qn−1 es positiva definida. Luego, por 2, la forma sobre Rn con
matriz (M −1 )T A(M −1 ) debe ser positiva definida. Luego Q es positiva
definida por el lema 0.1 anterior. Listo
Esto termina la demostración del primer punto del teorema 0.3
Ejercicio 0.18. Realice con todo detalle los pasos de la demostración del
primer punto del teorema en el caso de n = 3. Use la expresión (2) para n =
3, 2, 1 hasta haber completado todos los cuadrados. Reescriba los coeficientes
en términos de los menores principales y recupere el teorema nuevamente.
Ejercicio 0.19. Hay otra aplicación interesante que se desprende del Lema
0.1. Denote con P una matriz permutación n × n, en otras palabras, P se
obtiene de la identidad haciendo la correspondiente permutación de sus filas.
En particular, las filas de P forman naturalmente una base ortonormal de
Rn ; esto es, P es una matriz ortogonal: P T P = I
Si A es simétrica n × n, por el lema mencionado, A es positiva definida si
y sólo si P T AP lo es. Verifique a través de ejemplos que esto significa que si
se permutan las variables de una forma, entonces el carácter de ser positiva
definida no cambia.
Vale lo mismo para negativa definida? Para semidefinidas? Indefinidas?
Interprete geométricamente el significado de este hecho.
Q(x, y) = 2bxy + cy 2
= c 2b/cxy + y 2
= c (y + b/cx)2 − b2 /c2 x2
En particular,
det((P T AP )(I) ) = det(A(σI) )
como queríamos probar. Listo el Lema.
Paso inductivo. Asuma que toda matriz A simétrica de tamaño (n −
1) × (n − 1) o menor es semidefinida positiva si y sólo si todos sus menores
principales son no negativos. Queremos ver que lo mismo vale para toda A
simétrica de tamaño n × n.
Supóngase que An×n es semidefinida positiva. En particular, haciendo
cero la variable xi en X T AX ≥ 0, se tiene que la submatriz principal A(i) de
tamaño (n − 1) × (n − 1) obtenida omitiendo la fila y la columna i-ésima de A
es semidefinida positiva, para cualquier 1 ≤ i ≤ n. Por Hipótesis inductiva,
todo menor principal de A(i) es no negativo, para 1 ≤ i ≤ n. Así todos los
menores principales de orden inferior a n son no negativos. Sólo falta ver que
el determinante de A mismo es no negativo. Para ver esto, tome P ortogonal
que diagonalice a A, digamos que λ1 , . . . , λn son los valores propios de A.
Entonces, haciendo el cambio de varialbles X = P U se tiene
0 ≤ X T AX = U T P T AP U = λ1 u21 + · · · + λn u2n
det(A) = det(P T AP ) = λ1 . . . λn ≥ 0
1 0 a a 1 −1/a11 a 1 0
× 11T × = T
−1/a11 a In−1 a An−1 0 In−1 0 −1/a11 a a + An−1
a11 0 a 0
= 11
0 B (I) 0 EIT BEI
1 0 1 0 a a 1 −1/a11 a 1 0
= T × × 11T × ×
0 EI −1/a11 a In−1 a An−1 0 In−1 0 EI
1 0 a11 a 1 −1/a11 aEI
= T × ×
−1/a11 EIT aT EI T
a An−1 0 EI
1 0 1 0 1 0 1 −1/a11 aEI
= × T ×A× ×
−1/a11 EIT aT Ik×k 0 EI 0 EI 0 Ik×k
28
1 0 1 −1/a11 aEI
= × A(I∪{1}) ×
−1/a11 EIT aT Ik×k 0 Ik×k
Tomando determinantes y observando que las matrices triangulares de los
extremos en la última identidad no cuentan a los fines del determinante, se
obtiene la identidad 3.
De la identidad 3 y como A tiene todos sus menores principales no ne-
gativos, se sigue que B(n−1)×(n−1) tiene todos sus menores no negativos. Por
hipótesis inductiva, B es semidefinida positiva. Como además a11 > 0, la
matriz
a11 0
= M T AM
0 B
es positiva semidefinida, donde
1 −1/a11 a
M :=
0 In−1
sig(B) = (+, −, −)
4 3 3 10
Q(X) = X T AX
sujeta a
BX = 0
donde A es simétrica de ordenn y B es una matriz m × n de rango m (caso
contrario, se descartan las filas redundantes de B.)
sujeta a
Im×m 0m×(n−m) × X = 0
Las restricciones simplemente dicen que las primeras m variables son cero:
x1 = 0, . . . , xm = 0 y la forma restringida resulta simplemente
donde A es la matriz diagonal con los λ’s en la diagonal y cero fuera. Es fácil
calcular los menores principales de H.
det(H (k) ) = 0, k = 1, 2, . . . , 2m − 1
porque
0m×m Im×m
(2m)
det(H ) = det
(m)
Im×m An×n
Esta matriz se le ocurre a un ser de este planeta sólo después de pensar en Hessianos,
7
una suerte de derivada segunda para funciones de varias variables. H es el Hessiano del
Lagrangiano asociado a Q con las restricciones dadas. Más de esto luego.
0.4. FORMAS CUADRÁTICAS CON RESTRICCIONES 33
0m×m Im×m
(2m)
det(H ) = det
Im×m 0m×m
haciendo operaciones elementales por fila del tipo ‘a una fila se le suma un
múltiplo de otra fila’ para hacer cero el bloque de A(k) .
0m×m Bm×n
H=
T
Bn×m An×n
Entonces,
1. QW es positiva definida sobre W si y sólo si (−1)m det(H (2m+k) ) > 0
para todo k = 1, 2, . . . , n − m.
1. x = 0 es positiva definida.
2. y = 0 es indefinida.
3. y = 0, z = 0 es negativa definida.
1. W = {(x, y, z) ∈ R3 | x + y = 0}
n hxi o
3 1 1 1 0
2. W = (x, y, z) ∈ R | [ 1 2 1 ] × z = [ 0 ]
y
n hxi o
3 0
3. W = (x, y, z) ∈ R | [ 1 1 1 ] × z = [ 0 ]
y
Ahora en cada uno de los casos anteriores encuentre una base ortonormal de
W y obtenga la matriz asociada a QW en esa base.
4. Q(x1 , x2 , x3 , x4 ) = x21 −x22 −x23 +x24 +x1 x2 +x3 x4 sujeta a las restricciones
x1 + x2 + x3 = 0 y x1 + x2 + x4 = 0
Q(X) = X T AX
(5)
sujeto a BX = 0
1er. Paso
Si cambiamos B por su reducida y escalonada RB el subespacio W no
cambia. Como se asumió que B tiene rango máximo, las m columnas de
RB donde aparecen los pivotes forman por sí solas la matriz identidad m ×
m. Esas columnas de RB pueden no ser las m primeras, pero es posible
reordenar las variables de X mediante multiplicación a izquierda por una
matriz permutación P de manera tal que la matriz RB P tiene la identidad
m × m en sus primeras m columnas. Entonces podemos asumir sin pérdida
de generalidad que la matriz que define al subespacio W tiene la forma
Im×m Cm×(n−m)
2do. Paso
Con el objeto de calcular QW explícitamente, vamos a despejar las varia-
bles con pivotes en términos de las variables libres para luego substituirlas
en la forma Q. Parta X = (X1 , X2 ) ∈ Rm × Rn−m en dos componentes.
Entonces, la restricción sobre X
X1
Im×m Cm×(n−m) × =0
X2
0.4. FORMAS CUADRÁTICAS CON RESTRICCIONES 37
está forzando
X1 = −CX2
10
Ahora substituímos en la forma Q. Para llevar a cabo estas cuentas es
conveniente escribir A en bloques que se correspondan con la partición de X
en (X1 , X2 ). Escribimos
A1 E
−CX2
= [−X2T C T , X2T ] × ×
X2
E T A2
3er. Paso
Pregunta:¿Qué relación existe entre cualquier menor principal de AW y
los de H?
Sean I = (i1 , . . . , ir ) las filas y columnas que se omiten de AW para
formar la submatriz principal AIW de tamaño k×k (k = n−m−r.) Denotemos
Entonces una cuenta simple que dejamos como ejercicio muestra que
AIW = CIT AI1 CI − CIT EI − EIT CI + AI2
Ahora si H I denota la matriz (2m + k) × (2m + k) obtenida a partir
de H omitiendo las filas y columnas correspondientes a los índices (2m +
i1 , . . . , 2m + ir ), entonces
I 0 0
0 I −CI ,
0 0 I
0 I CI 0 I 0
HI = I A1 EI → I A1 −A1 CI + EI
I 0 0
−A1 I 0 ,
−EIT 0 I
0 I 0
→ I 0 −A1 CI + EI
I 0 0
0 I 0 ,
0 −CIT I
40
I 0 A1 CI − EI
0 I 0 ,
0 0 I
se obtiene
0 I
I 0 0
0 0 AIW
Entonces
(−1)m det H I = det AIW
Recuerde esta identidad porque explica la conexión entre los menores de la
forma restringida y los menores de la matriz orlada.
4to. Paso
Use el teorema de la signatura para formas y obtenga los enunciados que
queremos probar.Q.E.D.