[go: up one dir, main page]

0% encontró este documento útil (0 votos)
11 vistas101 páginas

Apuntes Mecánica

Cargado por

pablolopse
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
11 vistas101 páginas

Apuntes Mecánica

Cargado por

pablolopse
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 101

Tema 1.

Pequeñas oscilaciones armónicas


1.1 Introducción

Consideremos un sistema Lagrangiano con n grados de libertad

L(q A , q̇ A , t), A = 1, · · · , n

y supongamos que L no depende del tiempo y tiene la forma


n X
X n
A A 1
L(q , q̇ ) = TAB q̇ A q̇ B − V (1)
2
A=1 B=1

donde TAB es una matriz simétrica y definida positiva que puede depender de las coordenadas
{q} y V es una función de {q}. Ser definida positiva significa que
n X
X n
TAB q̇ A q̇ B > 0 para todo q̇ A 6= 0. (2)
A=1 B=1

∂L
Para calcular las ecuaciones de Euler-Lagrange necesitamos conocer ∂ q̇ A
:

n n
! n n
∂L ∂ 1XX 1XX ∂ 
A
= A TBC (q)q̇ B q̇ C = TBC (q) A q̇ B q̇ C =
∂ q̇ ∂ q̇ 2 2 ∂ q̇
B=1 C=1 B=1 C=1
n n n n
1XX B C
 1X 1X
= TBC (q) δA q̇ + q̇ B δA
C
= TAC (q)q̇ C + TBA (q)q̇ B
2 2 2
B=1 C=1 C=1 B=1
n
X
= TAB (q)q̇ B
B=1

Si sustituimos en las ecuaciones de Euler-Lagrange


 
d ∂L ∂L
= A (3)
dt ∂ q̇ A ∂q

obtenemos !
n
X n n
d ∂V 1 X X ∂TBC B C
TAB (q)q̇ B =− + q̇ q̇ (4)
dt ∂q A 2 ∂q A
B=1 B=1 C=1

Podemos ahora considerar cuáles son los estados de equilibrio del sistema. Buscamos estados
q A = q0A donde q0A sean constantes (para que el sistema esté en equilibrio) y que satisfagan
las ecuaciones de Lagrange (4). Como q̇ A = 0, estas constantes serán solución si y solamente
si
∂V
= 0. (5)
∂q A q0
Es decir los estados de equilibrio son aquellas posiciones en los que el potencial tenga un
extremo. Nuestro interés es estudiar el movimiento del sistema cerca de esta punto.

1
1.2 Ecuaciones linealizadas y Lagrangiano asociado

Para analizar el movimiento cerca de un estado de equilibrio consideramos soluciones del tipo

q A (t) = q0A + QA (t) (6)

y queremos que QA (t) sean funciones pequeñas para todo t. Notemos que q̇ A = Q̇A . Esto
significa que podemos despreciar todos los términos cuadráticos en QA , tanto en posiciones
como en velocidades.

Observemos que tanto V como TAB dependen de q A . Por lo tanto, también dependerán de
QA . Para poder quedarnos a primer orden en las ecuaciones (4) debemos desarrollar tanto
∂V
TAB como ∂q A en serie de Taylor.

∂V
Para conocer ∂q A
a primer orden debemos desarrollar V (q) a segundo orden. Dado que esta-
∂V
mos en un punto extremo para V tenemos que ∂q A q
= 0 y el desarrollo es
0

n
X n n
∂V A1 X X ∂2V
V (q) = V (q0 + Q) = V (q0 ) + Q + QA QB + O(Q3 ) (7)
∂q A q0 2 ∂q A ∂q B q0
A=1 A=1 B=1
n n
1XX
= V0 + UAB QA QB + O(Q3 ) (8)
2
A=1 B=1

donde V0 := V (q0 ) y
∂2V
UAB := (9)
∂q A ∂q B q0

es una matriz simétrica formada por constantes.

Si U
PAB esPdefinida positiva, entonces q0 es un mı́nimo del potencial. Si la forma cuadráti-
ca nA=1 nB=1 UAB QA QB tiene otras signaturas, el punto extremo puede ser también un
máximo, o un punto de silla.
∂V
Para calcular la derivada ∂q A
usamos primero la regla de la cadena

n
X n
X
∂V ∂V ∂QB ∂V B ∂V
A
= B A
= B
δA = (10)
∂q ∂Q ∂q ∂Q ∂QA
B=1 B=1

B
donde hemos usado QA = q A − q0A , que implica ∂Q
∂q A
B . Usamos ahora el desarrollo de
= δA
Taylor (8) y llegamos a
Xn
∂V
= UAB QB + O(Q2 ). (11)
∂q A
B=1

En cuanto a TAB (q) tenemos

TAB (q) = TAB (q0 + Q) = TAB (q0 ) + O(Q) = MAB + O(Q) (12)

donde MAB := TAB (q0 ) es una matriz constante, simétrica y definida positiva.

2
Sustituyendo en las ecuaciones de Lagrange (4) tenemos
N
! n
d X B 2
X
MAB Q̇ + O(Q ) = − UAB QB + O(Q2 ), ⇐⇒
dt
B=1 B=1
N
X n
X
MAB Q̈B = − UAB QB + O(Q2 ).
B=1 B=1

Despreciamos ahora todos los términos cuadráticos y llegamos al sistema de ecuaciones dife-
renciales de segundo orden
n 
X 
MAB Q̈B + UAB QB = 0. (13)
B=1

Este sistema es lineal con coeficientes constantes, por lo que es mucho más simple que el
problema original. La simplificación ha provenido de analizar el movimiento cerca de un
punto de equilibrio del sistema.

Podemos obtener estas ecuaciones de manera mucho más directa si hacemos el desarrollo de
Taylor directamente al Lagrangiano (1):
n X
X n
1
L= TAB q̇ A q̇ B − V =
2
A=1 B=1
Xn X n n X
X n
1 1
= MAB Q̇A Q̇B − V0 − UAB QA QB + O(Q3 ).
2 2
A=1 B=1 A=1 B=1

Si despreciamos los términos cúbicos ası́ como la constante V0 , que es irrelevante dado que
simplemente modifica el origen de energı́as, llegamos al Lagrangiano

1 XX 
n n
L′ (QA , Q̇A ) = MAB Q̇A Q̇B − UAB QA QB . (14)
2
A=1 B=1

Es inmediato comprobar que las ecuaciones de Lagrange de este Lagrangiano coinciden con
las ecuaciones linealizadas (13).

En resumen, para obtener las ecuaciones del movimiento de pequeños desplazamientos alre-
dedor de un punto de equilibrio de un sistema Lagrangiano independiente del tiempo y de la
forma (1), podemos simplemente hacer un desarrollo de Taylor a segundo orden del propio
Lagrangian alrededor de ese punto de equilibrio.

1.3 Frecuencias y modos normales de oscilación

Busquemos soluciones para el sistema de ecuaciones (13) del tipo QA (t) = C A f (t) donde C A
son constantes y f (t) es una función de t a determinar. Si sustituimos en (13) obtenemos
N 
!
X  X N ¨(t)
f
f¨(t)MAB C B + UAB f (t)C B = 0 ⇐⇒ UAB + MAB C B = 0. (15)
f (t)
B=1 B=1

3
Los coeficientes UAB , MAB y C A son constantes por lo que la única posibilidad para que esta
ecuación tenga solución es que
f¨(t) = −λf (t) (16)
donde λ es una constante y, además se satisfaga
N
X
(UAB − λMAB )C B = 0. (17)
B=1

Este es un problema algebraico que se puede escribir en forma matricial de la siguiente manera:
Sea M la matriz cuadrada con coeficientes MAB , U la matriz cuadrada con coeficientes UAB
y C el vector columna con coeficientes C A . El problema algebraico a resolver es

(U − λM ) C = 0. (18)

Este es un problema de valores propios. La condición necesaria y suficiente para que exista
un vector propio C 6= 0 es que
det (U − λM ) = 0. (19)

El polinomio caracterı́stico
det (U − λM ) = 0 (20)
es un polinomio de grado n en λ. En principio, este polinomio admite n soluciones complejas
(contando multiplicidad). No obstante, en el caso concreto que nos ocupa los coeficientes son
reales, las matrices M y U son simétricas y M es definida positiva. Bajo estas condiciones
tenemos las siguientes propiedades:

1. Todas las raı́ces del polinomio caracterı́stico (20) son reales.


2. Todos los vectores propios C son reales.
3. El conjunto de vectores propios forman una base del espacio vectorial.
4. Dos vectores propios C 1 y C 2 correspondientes a valores propios distintos son ortogo-
nales con respecto a la matriz M , es decir satisfacen
n X
X n
MAB C1A C2B = 0. (21)
A=1 B=1

En notación matricial esta expresión se puede escribir como

C1 T M C2 = 0. (22)

5. Si un autovalor admite dos o más vectores propios linealmente independientes (es decir,
el autovalor tiene multiplicidad mayor que uno) entonces dichos vectores se pueden tomar
ortogonales entre sı́ (con respecto a la matriz M ).

Dado que M es definida positiva podemos normalizar C A de manera que sean unitarios con
respecto a esta matriz, es decir

C TA M C A = 1, A = 1, · · · , N. (23)

4
En resumen, existen n constantes reales λA (posiblemente repetidas) y n vectores reales CA
linealmente independientes que satisfacen
(U − λA M ) CA = 0,
C TA M CB = δAB . (24)

Para cada autovalor λ, tenemos una solución QA (t) = C A f (t), con C A el autovector de λ y
f (t) satisfaciendo
f¨ = −λf. (25)

La forma explı́cita de la solución depende del signo de λ:


√ √ 
Si λ > 0 entonces f (t) = a sin( λ t) + b cos( λt) 
Si λ = 0 entonces f (t) = a + bt p p 
Si λ < 0 entonces f (t) = a sinh( |λ| t) + b cosh( |λ|t)
donde a, b son constantes arbitrarias.
Como esto ocurre para cada autovalor λA , tenemos un conjunto de n soluciones del sistema
de ecuaciones y cada solución depende de dos constantes arbitrarias. Tenemos por lo tanto
2n soluciones arbitrarias, y por lo tanto la solución general del sistema de ecuaciones.
Notemos que si alguno de los autovalores es negativo, la solución correspondiente a este
autovalor se hace infinitamente grande a medida que transcurre el tiempo. Es decir, esta
solución no tiene la propiedad de que q A (t) = q0A + QA (t) se mantiene cercana al punto
de equilibrio q0A . La razón es que, en este caso, el punto de equilibrio no es un mı́nimo del
potencial sino que es un punto de silla o un máximo. Por lo tanto, el punto de equilibro es
inestable.
Cuando uno de los autovalores se anula, entonces hay términos de orden superior (que he-
mos despreciado) que deben ser tenidos en cuenta para analizar los detalles del movimiento.
Podemos ver por qué mediante un ejemplo sencillo. Consideremos una partı́cula de masa m
moviéndose en un potencial unidimensional del tipo V (x) = xk con k ≥ 3. EL lagrangiano es
1
L = mẋ2 − xk . (26)
2
La aproximación a segundo orden es L′ = 21 mẋ2 , por lo que el movimiento es uniforme.
Notemos que en la aproximación cuadrática V = 0, por lo que el autovalor del punto de
equilibrio es λ = 0. No obstante, si k es par tenemos un mı́nimo en x = 0, mientras que si
k es impar tenemos un punto de silla. Ambos casos son completamente distintos, tanto entre
sı́ como con el movimiento descrito por la aproximación lineal.
Es decir, cuando la aproximación lineal tiene un autovalor igual a cero, el esquema de aproxi-
mación deja de ser válido y es necesario tener en cuenta los órdenes superiores para estudiar
el movimiento.
El caso fı́sicamente más interesante ocurre cuando el punto de equilibrio es un punto de
equilibrio estable (es decir V (q) tiene un mı́nimo en q0 ) y la aproximación lineal es válida
(es decir, la matriz U no tiene ningún autovalor igual a cero). Estos puntos se denominan
puntos de equilibrio estable y no degenerado del potencial.

5
Cuando estamos en esta situación todos los autovalores son positivos y se pueden escribir en
la forma
2
λ A = ωA , ωA 6= 0 (27)

Si definimos el vector columna Q


 
Q1
 Q2 
 
Q= .. 
 . 
Qn

tenemos que, para cada ωA , la trayectoria


 
Q(t) = C A aA sin (ωA t) + bA cos (ωA t) (28)

satisface las ecuaciones del movimiento. En esta expresión el vector columna C A es el auto-
vector asociado al autovalor λA = ωA 2 y las constantes a y b son arbitrarias. Esta solución
A A
es oscilatoria con frecuencia angular ωA .

Al conjunto de frecuencias angulares {ωA } se denomina frecuencias normales de oscila-


ción. A la solución correspondiente

Q(t) = C A (aA sin (ωA t) + bA cos (ωA t)) (29)

se llama modo normal del oscilación

Podemos obtener la solución general del problema simplemente sumando los distintos modos
normales de oscilación
N
X  
Q(t) = CA aA sin (ωA t) + bA cos (ωA t) (30)
A=1

Este solución tiene n constantes arbitrarias aA (A = 1, · · · , n) y n constantes arbitrarias bA .


Tiene pues 2n constantes arbitrarias y es por lo tanto la solución general del problema.

En resumen:

La solución general del movimiento cercano a un punto de equilibrio estable y no degenerado


de un potencial arbitrario es una combinación lineal de los n modos normales de oscilación del
sistema.

Otra propiedad interesante de los modos normales de oscilación es que permiten desacoplar
completamente el problema original (que tiene n variables acopladas) en n problemas inde-
pendientes de una sola variable.

Para ello, vamos a considerar un cambio de variable entre las QA (que recordemos están
definidas mediante QA := q A − q0A ) y un nuevo conjunto de variables {Z 1 , · · · , Z n } definidas
mediante el cambio lineal
Q = CZ (31)

6
donde Z es el vector columna
 
Z1
 Z2 
 
Z= .. 
 . 
Zn
y la matriz C es la matriz cuadrada definida de manera que su columna A-ésima es el
autovector C A , es decir

C = ( C1 , · · · , Cn )

Recordemos que el Lagrangiano a segundo orden tiene la forma

1 XX 
n n
L′ = MAB Q̇A Q̇B − UAB QA QB . (32)
2
A=1 B=1

En notación matricial, este Lagrangiano se escribe en la forma


1 T 
L′ (Q, Q̇) = Q̇ M Q̇ − QT U Q . (33)
2

Mediante el cambio de variables (31), el Lagrangiano se convierte en


1h T   i
L′ (Z, Ż) = Ż C T M C Ż − Z T C T U C Z . (34)
2
Calculemos la forma explı́cita de la matriz C T M C. Su fila A y columna B será

C TA M C B = δAB

tal y como hemos visto en (24). Es decir, la matriz C T M C es simplemente la identidad.


En cuanto a la matriz C T U C, tenemos que

C TA U C B = C TA (U C B ) = C TA λB M C B = λA δAB . (35)

donde en la segunda igualdad hemos usado la propiedad de que C B es un autovector de U


(con respecto a la matriz M ) y que su autovalor es λA . En la segunda igualdad hemos usado
(24).
Por lo tanto la fila A, columna B de la matriz C T U C es

C TA U C B = λA δAB . (36)

En otras palabras,
   
λ1 0 ··· 0 ω12 0 ··· 0
 0 λ2 ··· 0   0 ω22 ··· 0 
   
CT U C =  .. .. .. .. = .. .. .. .. 
 . . . .   . . . . 
0 ··· 0 λn 0 ··· 0 ωn2

7
y el Lagrangiano en las coordenadas {Z 1 , · · · Z n } toma la forma
  2  
ω1
1 T  ..  
L′ (Z, Ż) = Ż Z − Z T  .  Z =
2 2
ωn
1 X 2 
n
2 2
= ŻA − ωA ZA
2
A=1

que es la suma de n lagrangianos independientes, cada uno con un solo grado de libertad.
Cada uno de estos Lagrangianos es
1 2 2 2

LA = ŻA − ωA ZA (37)
2
y por lo tanto describe a un oscilador armónico unidimensional de frecuencia angular ωA .

En las variables {Z A } la solución general del problema es la suma de n osciladores indepen-


dientes
Z A = aA sin(ωA t) + bA cos(ωA t). (38)

Notemos que aunque cada una de estas funciones es periódica, el movimiento del sistema no
es, en general, periódico. La condición necesaria y suficiente para que el sistema sea periódico
es que exista un tiempo T tal que ωA T = 2πnA , donde nA son números enteros. En otras
palabras, es necesario y suficiente que los cocientes entre cualesquiera dos modos normales de
oscilación del sistema sea un número racional. Si esto no ocurre, el sistema no es periódico.

Incluso si los modos normales tienen cocientes racionales, puede ocurrir que los valores de nA
sean muy grandes. En ese caso, el periodo T será una cantidad muy grande y el sistema se
comportará a todos los efectos como si no fuera periódico.

Una observación final importante. Como el sistema en las variables Z A está desacoplado,
podemos multiplicar cada una de las ZA por una constante (distinta para cada una de las
coordenadas) y las ecuaciones del movimiento para las nuevas coordenadas serán idénticas
(debido a que las ecuaciones son lineales). Teniendo en cuenta la forma que tiene el cambio
de variable entre las QA y las Z A observamos que multiplicar cada una de las Z A por una
constante (distinta) es equivalente a multiplicar el autovector CA por esa misma constante.
En otras palabras, podemos escoger los autovectores sin imponer ninguna normalización y el
cambio
 1   1 
Q   Z
 Q2   Z2 
   
 ..  =  C1 · · · Cn   .. 
 .   . 
Q n Zn

seguirá definiendo un conjunto de modos normales de vibración {Z A } que oscilan respectiva-


mente con frecuencia angular ωA y cuyo movimiento está desacoplado del resto.

1.4 Ejemplo. Péndulos acoplados.

8
Vamos a considerar el movimiento de dos péndulos acoplados, ambos de masa m y longitud
L, separados por una distancia L0 y acoplados con un muelle de constante recuperadora k y
longitud natural L0 tal y como se muestra en la figura. Queremos estudiar el movimiento de
los péndulos cerca de su posición de equilibrio, que se encuentra en θ1 = θ2 = 0.
111111111111111111111111111111111
000000000000000000000000000000000
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
~ex
L0
~n2
~n1 θ2
θ1
L
L

m m

La energı́a cinética del sistema es


1 1 1  
T = mL2 θ̇12 + mL2 θ̇22 = mL2 θ̇12 + θ̇22 . (39)
2 2 2
La energı́a potencial gravitatoria del sistema es (tomamos el origen a la altura a la que están
las pesas cuando θ = 0)
Vg = mgL (1 − cos θ1 ) + mgL (1 − cos θ2 ) . (40)
Dado que cos x = 1 − x2 /2 + O(x4 ), a segundo orden en θ1 y θ2 tenemos
1 
Vg = mgL θ12 + θ22 + O(2). (41)
2
Para calcular la energı́a elástica del muelle tenemos que calcular la longitud d del muelle en
función de los ángulos θ1 y θ2 . El vector de posición del segundo péndulo con respecto al
primero es (ver figura)
d~ = L0~ex + L~n2 − L~n1 = L0~ex + L (~n2 − ~n1 ) = (42)
Los vectores ~n1 y ~n2 son unitarios y el ángulo que forman es θ1 − θ2 . La longitud del muelle
~
es el módulo del vector d:
d2 = d~2 = L20 + 2LL0~ex · (~n1 − ~n2 ) + L2 (~n1 − ~n2 ) · (~n1 − ~n2 ) =
= L20 + 2LL0 (sin θ1 − sin θ2 ) + L2 (2 − 2(~n1 · ~n2 )) =
= L20 + 2LL0 (sin θ1 − sin θ2 ) + 2L2 (1 − cos(θ1 − θ2 )) . (43)
La energı́a potencial elástica es Vk = 12 k(d − L0 )2 . Para calcular Vk a segundo orden, necesi-
2
tamos calcular d − L0 a primer orden. Usando sin x = x + O(x3 ) y cos(x) = 1 − x2 + O(4) en
(43) obtenemos
d2 = L20 + 2LL0 (θ1 − θ2 ) + O(2) (44)

9
√ x
Tomando la raı́z cuadrada y usando a2 + x = a + 2a + O(x2 ) llegamos a

d = L0 + L (θ1 − θ2 ) + O(2) (45)

de manera que la energı́a potencial del muelle es


1
Vk = kL2 (θ1 − θ2 )2 + O(2) (46)
2
El lagrangiano del sistema es
1   1  1
L = T −V = T −Vg −Vk = mL2 θ̇12 + θ̇22 − mgL θ12 + θ22 − kL2 (θ1 − θ2 )2 +O(2). (47)
2 2 2
Para estudiar las oscilaciones pequeñas alrededor del punto de equilibrio debemos despreciar
los términos cuadráticos. El Lagrangiano queda
 
′ 1 2 2 2 g 2 2
 k 2
L = mL θ̇1 + θ̇2 − θ + θ2 − (θ1 − θ2 ) . (48)
2 L 1 m
q q
Si definimos ω := Lg y Ω := m k
y desarrollamos los cuadrados obtenemos

1 h     i
L′ = mL2 θ̇12 + θ̇22 − ω 2 + Ω2 θ12 + θ22 − 2Ω2 θ1 θ2 (49)
2
La matriz M es, por lo tanto
 
2 1 0
M = mL
0 1

y la matriz U es
 
2 ω 2 + Ω2 −Ω2
U = mL
−Ω2 ω 2 + Ω2

El polinomio caracterı́stico
det (U − λM ) = 0, (50)
toma la forma
ω 2 + Ω2 − λ −Ω2  2
2 = λ2 − 2λ ω 2 + Ω2 + ω 2 + Ω − 2Ω4 =
−Ω ω + Ω2 − λ
2
 
= λ − ω 2 λ − ω 2 − 2Ω2 .

Por lo tanto las dos frecuencias naturales del sistema son


p
ω1 = ω, ω2 = ω 2 + 2Ω2 . (51)

En cuanto a los modos normales de vibración, vienen determinados por los autovectores de
cada autovalor. Para obtenerlos debemos resolver
2

U − ωA M CA = 0

10
que explı́citamente tienen la siguiente forma. Para λ1 = ω 2
  1   
Ω2 −Ω2 C1 0
=
−Ω2 Ω2 C12 0

cuya solución (no normalizada) es


 
1
C1 =
1

Para λ2 = ω 2 + 2Ω2 , debemos resolver


  1   
−Ω2 −Ω2 C2 0
2 2 2 =
−Ω −Ω C2 0

cuya solución (no normalizada) es


 
1
C2 =
−1

Las variables {Z1 , Z2 } definidas mediante


      
θ1 1 1 Z1 Z1 + Z2
= =
θ2 1 −1 Z2 Z1 − Z2

son los modos normales de oscilación. Si invertimos, tenemos que Z1 =√(θ1 + θ2 )/2 oscila con
frecuencia angular ω y Z2 = (θ1 − θ2 )/2 oscila con frecuencia angular ω 2 + 2Ω2 .

Para observar los modos normales en el sistema basta con escoger los datos iniciales de manera
que todos los modos normales menos uno tengan posición y velocidad inicial igual a cero. En
el ejemplo de los péndulos acoplados, para observar el modo de oscilación Z1 debemos colocar
el sistema de manera que inicialmente Z2 = 0 y Ż2 = 0, Es decir que el instante inicial θ1 = θ2
y θ̇1 = θ̇2 . La solución satisface Z2 (t) = 0 y por lo tanto tenemos θ1 (t) = θ2 (t) para todo
t y el sistema oscila con la misma frecuencia que un péndulo simple (modo normal ω1 ). Si
los datos iniciales son θ0 (t0 ) = −θ1 (t0 ) y θ1 (t0 ) = −θ2 (t0 ) (es decir Z1 = Ż1 = 0 en t = t0 )
√ θ1 (t) = −θ2 (t) y el sistema oscila con la segunda frecuencia normal de oscilación
entonces
ω2 = ω 2 + 2Ω2 .

11
Tema 2. Cinemática del Sólido Rı́gido
2.1 Introducción y definición de sólido rı́gido.

Un sólido rı́gido es un cuerpo que no sufre deformaciones, es decir tal que la distancia entre
dos puntos cualesquiera del sólido es constante y no depende de las fuerzas que actúan sobre
él ni de su estado de movimiento.

El concepto de sólido rı́gido es una idealización. No hay ningún material totalmente inde-
formable. De hecho, su existencia es incluso incompatible con la relatividad especial (este
hecho no nos incumbe ahora porque estamos en el marco de la mecánica Newtoniana, pero
sı́ pone de manifiesto que los sólidos rı́gidos perfectos no pueden existir). No obstante es una
idealización extremadamente útil en numerosos casos.

Obviamente la idealización de sólido rı́gido depende no solamente del cuerpo en cuestión sino
también de las fuerzas que estén actuando y del estado de movimiento concreto del objeto.

Un viga de acero es un buen ejemplo de sólido rı́gido en muchas circunstancias pero si las
tensiones son suficientemente altas también se deformará (o incluso romperá).

Ejemplos de sólidos rı́gidos en situaciones cotidianas son: un piedra, una peonza, la luna, una
nave espacial, un barco, una barra de acero, etc.

2.2 Grados de libertad y coordenadas adecuadas.

La propiedad que caracteriza a un sólido rı́gido es que identificados dos puntos cualesquiera
en el sólido (por ejemplo mediante un punto dibujado con un rotulador), la distancia entre
los dos puntos se mantiene constante en el tiempo.

Para determinar el número de grados de libertad consideremos tres puntos p1 , p2 y p3 no


colineales del sólido (estamos suponiendo que el sólido no es unidimensional).

Podemos colocar el sólido en cualquier posición en el espacio, por lo que el punto p1 puede
ocupar cualquier localización. Necesitamos tres coordenadas para determinar su posición de
manera unı́voca.

p2
p2
p1

p3 p3

p1

1
Fijado el punto p1 , el punto p2 debe encontrarse a una distancia d(p1 , p2 ) conocida. Por lo
tanto debe estar sobre una esfera de ese radio centrada en la posición de p1 . Podemos orientar
el sólido de manera que p2 puede localizarse en cualquier punto de esa esfera. Necesitamos
dos coordenadas para fijar su posición.

Con los puntos p1 y p2 fijos solo podemos girar el cuerpo alrededor de eje formado por la
lı́nea que une p1 con p2 . Para fijar la posición de p3 debemos determinar un ángulo de giro
alrededor de ese eje.

En total tenemos 3 + 2 + 1 = 6 grados de libertad.

Si consideramos un sólido rı́gido como una colección de N >> 1 átomos puntuales, el numero
de grados de libertad sin la condición de sólido rı́gido serı́a 3N . La rigidez del sólido reduce
enermemente el número de grados de libertad. Esto hace que el sistema sea tratable y es la
razón por la que la idealización de sólido rı́gido resulta ser tan útil.

Sabemos que necesitamos 6 coordenadas para describir a un sólido rı́gido. ¿Qué coordenadas
se pueden usar para describir esos grados de libertad?

Tres de ellos resultan claros. Fijemos un punto cualquiera (que denotamos por O′ ) del sólido.
Para fijar su posición usar tres coordenadas de la forma habitual (pueden ser coordenadas
cartesianas, o esféricas o las que se necesiten, cualesquiera que permitan fijar la posición de
un punto en el espacio).

Fijado el punto O′ solamente queda orientar al sólido alrededor del punto O′ .

Para ello fijemos una base ortonormal de vectores con origen en O′ y ligados al sólido. Por
ejemplo:

~e ′z

O′
z
~e ′y
~e ′x

~ez

~ey y
~ex

2
Si conocemos la expresión de las base {~e ′1 = ~e ′x , ~e ′2 = ~e ′y , ~e ′3 = ~e ′z } en términos de la base
del sistema de referencia inercial {e1 = ex , e2 = ey , e1 = ez } conoceremos la orientación del
cuerpo.

Podemos expresar

~e ′x = a11~ex + a12~ey + a13~ez ,


~e ′y = a21~ex + a22~ey + a23~ez ,
~e ′z = a31~ex + a32~ey + a33~ez .

Hay nueve incógnitas, pero debemos imponer las siguientes condiciones

~e ′x · ~e ′x = 1, ~e ′y · ~e ′y = 1, ~e ′z · ~e ′z = 1,
~e ′x · ~e ′y = 0, ~e ′x · ~e ′z = 0, ~e ′y · ~e ′z = 0,

que son seis condiciones. Por lo tanto las rotaciones tienes tres parámetros libres. Más adelante
encontraremos una posible parametrización (hay varias).

Conociendo la posición de O′ y la orientación de los ejes ~e ′i fijos en el cuerpo conocemos la


posición del sólido.

Veamos ahora cómo se puede mover el sólido. Denotemos por xO′ , yO′ , zO′ la posición de O′ .
El movimiento viene descrito por

{xO′ (t), yO‘ (t), zO‘ (t)} {~e ′x (t), ~e ′y (t), ~e ′z (t)} (1)

que son doce funciones de t.

Los vectores ~e ′i son solidarios al cuerpo. Obtengamos una expresión para la derivada temporal
~ un vector de ese tipo. Podemos
de cualquier vector con origen en O′ y fijo en el cuerpo. Sea A(t)
descomponerlo en la base {~e i },′
~ = Ai~e ′i .
A (2)
Las cantidades Ai son constantes puesto que el vector A ~ es fijo en el sólido. Los vectores ~e ′
i
sı́ dependen del tiempo (con respecto a la base inercial). Podemos descomponer sus derivadas
con respecto al tiempo en la propia base móvil mediante nueve funciones
d~e ′x
= α11 (t)~e ′x + α12 (t)~e ′y + α13 (t)~e ′z ,
dt
d~e ′y
= α21 (t)~e ′x + α22 (t)~e ′y + α23 (t)~e ′z ,
dt
d~e ′z
= α31 (t)~e ′x + α32 (t)~e ′y + α33 (t)~e ′z .
dt

Si derivamos la condición ~e ′x (t) · ~e ′x (t) = 1 con respecto al tiempo tenemos

d~e ′x
· ~e ′x = 0 =⇒ α11 = 0 (3)
dt
y por la misma razón α22 = α33 = 0.

3
Si derivamos la condición ~e ′x (t) · ~e ′y (t) = 0 con respecto al tiempo tenemos

d~e ′x d~e ′y
· ~e ′y (t) + ~e ′x (t) · =0 =⇒ α12 + α21 = 0 (4)
dt dt
y por la misma razón α13 + α31 = 0 y α23 + α32 = 0.

Definamos las tres cantidades ω1 (t) := α23 (t), ω2 (t) := α23 (t) y ω3 (t) := α12 (t) y el vector
~ (t) := ω1~e ′x + ω2 (t)~e ′y + ω3 (t)~e ′z
ω

d~e ′x
= ω3 ~e ′y − ω2 ~e ′z = ω
~ × ~e ′x
dt
d~e ′y
= −ω3 ~e ′x + ω1 ~e ′z = ω~ × ~e ′y
dt
d~e ′z
= ω2 ~e ′x − ω1 ~e ′y = ω
~ × ~e ′z
dt
y llegamos a
~
dA
= A1 ω~ × ~e ′x + A2 ω
~ × ~e ′y + A3 ω
~ × ~e ′z , (5)
dt
es decir, para cualquier vector fijo con respecto al sólido, su variación con respecto al tiempo
~
dA
=ω ~
~ × A. (6)
dt

Podemos ahora determinar qué puntos del sólido se encuentran instantáneamente en reposo.
Un punto p con vector de posición ~rp con respecto del punto O′ se encuentra en reposo
instantáneo en el instante t0 si
d~rp (t0 )
=0 ⇐⇒ ω
~ (t0 )×~rp (t0 ) = 0 ⇐⇒ ~rp (t0 ) proporcional a ω
~ (t0 ).
dt
(7)

En consequencia, el vector ω
~ define una dirección en la que todos los puntos están instantáne-
manete en reposo, es decir apunta en la dirección del eje de giro del cuerpo. A este eje se le
denomina eje instantáneo de rotación.

En un movimiento general de un sólido, el eje de rotación va cambiando con respecto al


tiempo.

Para describir el movimiento de un sólido debemos escoger el punto O′ convenientemente.


Pueden darse dos casos:

Puede ocurrir que el sólido tenga un punto que esté obligado a permanecer en reposo
(un punto fijo). Por ejemplo, un columpio, una noria, una peonza que no se desplaza por el
suelo. En ese caso es conveniente escoger O′ como uno de los puntos fijos.

Si no hay ningún punto obligado a permanecer en reposo, entonces conviene escoger O′


como el centro de masas del sólido.

2.3 Energı́a cinética.

4
Vamos a calcular la energı́a cinética del cuerpo. Imaginemos el cuerpo formado por un número
finito de partı́culas de masas ma , a = 1 · · · N (más adelante tomaremos el lı́mite continuo).

La energı́a cinética es
N
1X
T = ma~v 2a . (8)
2
a=1

El vector de posición ~r ′a del punto a respecto de O′ es fijo con respecto al sólido. Si llamamos
~ra el vector de posición de a con respecto al sistema inercial tenemos
~ O′ + ~r ′a ,
~ra = R (9)
~ O′ es el vector de posición de O′ con respecto al origen del sistema de referencia.
donde R

Tomando la derivada con respecto del tiempo


~O ′ + ω
~va = V ~ × ~r ′a , (10)

donde V~O′ es la velocidad del punto O′ con respecto del sistema inercial. Este fórmula simple-
mente dice que la velocidad del punto p del sólido respecto del sistema de referencia inercial
es la velocidad de ese punto respecto del punto O′ del sólido más la velocidad del punto
O′ respecto del sistema de referencia inercial. Es importante observar que la velocidad de p
respecto de O′ no es la observada desde el punto de vista del sólido (puesto que se anuları́a)
sino la medida desde el sistema de referencia inercial. Corresponde a la relativa entre p y O′
medida en ese sistema de referencia.

Sustituyendo en T :

1X
N   2 
T = ma V~ 2′ + 2V
~O ′ · ω
~ × ~r ′a + ω ~ × ~r ′a
O
2
a=1
N
!! N
1 X 1X 2
2
= M VO‘ + V~O ′ · ω~× ma~r a ′
+ ~ × ~r ′a ,
ma ω
2 2
a=1 a=1

donde M es la masa total del sólido.


~ O′ del centro de masas con respecto a un punto,
De la definición de la posición R CM

N
X
~ CM
ma~r ′a = M R O‘
(11)
a=1

y obtenemos
1   1X N
2
~O ′ · ω O′
~ CM
2
T = M VO‘ + MV ~ ×R + ~ × ~r ′a .
ma ω (12)
2 2
a=1

Esta descomposición de la energı́a cinética de un sólido rı́gido fue obtenida por Samuel König
en 1751. Se la conoce como Teorema de König.

5
Observemos que la elección O′ = punto en reposo o bien O′ = CM hace que uno de los
sumandos se anule. Esta es la razón por la que dicha elección resulta ser útil.
~ 2′ corresponde a la energı́a cinética que tendrı́a el sólido si estuviera todo él
El término 12 M V O
concentrado en O′ . Se conoce como energı́a cinética de translación:

O′ 1 ~2
Ttrans = MV O′ . (13)
2
P
El término 21 N ω~r ′a )2 es la energı́a cinética debida al movimiento de rotación alrededor
a=1 ma (~
del punto O′ . Se la conoce como energı́a cinética del rotación respecto de O’:
N
′ 1X 2
O
Trot = ~ × ~r ′a .
ma ω (14)
2
a=1

El teorema de König establece


 
O′ O′ ~O ′ · ω O′
~ CM
T = Ttrans + Trot + MV ~ ×R (15)

y es válido para cualquier elección del punto O′ .

Vamos a obtener una expresión conveniente para la energı́a cinética de rotación, lo que nos
permitirá introducir los conceptos de momento de inercia y de tensor de inercia.

~ define el eje instantáneo de rotación (que pasa por O′ ). Denotemos a este


En un instante t, ω
eje ∆.

ρa

α ~ra
ω
~

Denominemos ρa la distancia de cada punto a con respecto al eje ∆(t). Del dibujo tenemos
2
~ × ~r ′a = ω 2 ra′ 2 sin2 α = ω 2 ρ2a
ω (16)

6
de manera que
N
1X 2 1
O‘
Trot = ~ × ~r ′a = I∆ ω 2
ma ω (17)
2 2
a=1
PN 2
donde I∆ := a=1 ma ρa es el momento de inercia del sólido con respecto al eje ∆.

I∆ es una propiedad geométrica del sólido. No depende de su estado de movimiento.

Notemos que en la expresión (17), tanto ∆ como ω


~ en general dependen del tiempo.

Dado que el eje de rotación va cambiando con el tiempo necesitamos conocer el momento de
inercia con respecto a todos los ejes del cuerpo, y hay infinitos de ellos.

Conviene encontrar una manera de hacer el cálculo de una vez por todas.

Notemos la identidad
2 
′ 2
~ × ~r ′a = ω 2 ra′ 2 sin2 α = ω 2 ra′ 2 (1 − cos2 α) = ω 2 ra′ 2 − ω 2 ra′ 2 cos2 α = ω
ω ~ 2~r ′2
a − ω
~ · ~r a .
(18)

Descompongamos ~r ′a en la base móvil ~e ′i mediante


3
X
~r ′a = ra′ i~e ′i (19)
i=1
P3
y recordemos que ω
~ = i=1 = ω i~e ′i . Como la bases {~e ′i } es ortonormal:
3
X 3 X
X 3
2
~ · ~r ′a =
ω ω i ra′ i =⇒ ~ · ~r ′a
ω = ω i ω j ra′ i ra′ j (20)
i=1 i=1 j=1

Además
3
X 3 X
X 3
~2 =
ω ωi ωi = ω i ω j δij (21)
i=1 i=1 j=1

y, en consecuencia
3 X
X 3
2 
ω
~ × ~r ′a = ra′ 2 δij − ra′ i ra′ j ω i ω j (22)
i=1 j=1

y la energı́a cinética de rotación es


 
N 3
3 X
′ 1X X 
0
Trot = ma  ra′ 2 δij − ra′ i ra′ j ω i ω j 
2
a=1 i=1 j=1
3 X
3 N
!
1 X X 
= ωi ωj ma ra′ 2 δij − ra′ i ra′ j .
2
i=1 j=1 a=1

7
Definimos una matriz 3 × 3 simétrica
N
X
′ 
IijO := ma ra′ 2 δij − ra′ i ra′ j (23)
a=1

de manera que la energı́a cinética de rotación toma la forma


3 X
X 3
O ′ ′
Trot = IijO ω i ω j . (24)
i=1 j=1


IijO se denomina tensor de inercia (a veces también matriz de inercia) respecto del puntó O′ .
Es una propiedad del sólido (independiente de su estado de movimiento) y depende del punto
O′ que se ha escogido en el sólido.

Si llamamos a las coordenadas del vector ~r ′a = x′a~e ′x + ya′ ~e ′y + za′ ~e ′z (es decir ra′ ,1 = x′a ,
ra′ 2 = ya′ , ra′ 3 = za′ ), la componente 11 de la matriz es
N
X N
′  X 
O
I11 = ma ra′ 2 − x′a 2 = ma ya′ 2 + za′ 2 . (25)
a=1 a=1

Las componentes del tensor de inercia son


 P P P 
N
 ′ a=1 ma (ya′ 2 + za′ 2 ) − Na=1 ma x′a ya′ − Na=1 ma x′a za′
 P PN P 
IO =  − N a=1 ma x′a ya′ a=1 ma (x′a 2 + za′ 2 ) − Na=1 ma ya′ za′ .
PN ′ ′
PN ′ ′
PN ′ 2 ′ 2
− a=1 ma xa za − a=1 ma ya za a=1 ma (xa + ya )

En el lı́mite continuo simplemente transformamos las sumas por integrales y sustituimos ma


por la densidad de masa.

Los elementos de la diagonal son los momentos de inercia con respecto de los ejes ~e ′x , ~e ′y , ~e ′z
respectivamente.

Los términos fuera de la diagonal se llaman productos de inercia.

En notación matricial y denotando por (ω) el vector columna


 1 
ω
(ω) =  ω 2 
ω3

la energı́a cinética de rotación es


1  ′
O′ T
Trot = (ω) I O (ω). (26)
2

El tensor de inercia permite calcular el momento de inercia con respecto de cualquier eje que
pase por el punto O′ .

8
Un eje ∆ viene definido por un vector unitario ~n definido sobre el punto O′ . Pongamos a
rotar el sólido con respecto de ese eje. Por lo tanto el vector velocidad angular es ω
~ = ω~n (y
~ 2 = ω 2 ).
ω

De las dos expresiones que tenemos para la energı́a cinética


 
X 3
3 X 3 X
X 3
O′ 1 ′ 1 ′
Trot = IijO ω i ω j = ω 2  IijO ni nj 
2 2
i=1 j=1 i=1 j=1

O′1 O′
Trot = ω 2 I∆ .
2
obtenemos
3 X
X 3
O ′ ′
I∆ = IijO ni nj . (27)
i=1 j=1

Esta expressión efectivamente permite calcular los momentos de inercia del sólido con respecto
a cualquier eje que pase por O′ a partir del tensor de inercia en ese punto. Esta es la gran
utilidad del tensor de inercia.

En notación matricial  ′
O′
I∆ = (n)T I O (n). (28)

De la expresión  ′
O′ 1
Trot = (ω)T I O (ω). (29)
2
vemos que el tensor de inercia juega un papel análogo en el caso de rotaciones al papel que
juega la masa en el movimiento de translación de una partı́cula puntual. El segundo es una
escalar mientras el primero es un tensor debido a que un sólido tiene estructura interna,
mientras que una partı́cula puntual no la tiene.

2.4 Momento angular de un sólido.

Queremos calcular el momento angular del sólido con respecto del origen del sistema de
referencia inercial.

De la definición
N
X N 
X   
J~ = ~ra × ~va = ~ O′ + ~r ′a × V
R ~O ′ + ω
~ × ~r ′a =
a=1 a=1
XN   
= ~ O′ × V
ma R ~O ′ + R
~ O′ × ω ~O‘ + ~r ′a × ω
~ × ~r ′a + ~r ′a × V ~ × ~r ′a
a=1
 
 ! !
 XN  XN XN

~ O′ × V ~ O′
~O ′ + R  ′  ′ ~O ′ +
= MR × ω~× ma~r a  + ma~r a ×V ma ~r ′a × ω
~ × ~r ′a .
 
 | a=1 {z } | a=1 {z } a=1

~O ′ O ′
MR CM M RCM

9
CM
a
~ O′
R CM
~ O′
~ra = ~r ′a + R
~r ′a
z
~ez O′

~ O′
R
y
~ey

x ~ex

~O ′ + ω
La combinación V ~ O′ es la velocidad del centro de masas (con respecto del sistema
~ ×R CM
de referencia)
N
X 
~ O′ × V
J~ = M R ~CM + M R O′
~ CM ~O ′ +
×V ma ~r ′a × ω
~ × ~r ′a . (30)
a=1

El segundo término se anula tanto si el punto O′ es fijo como si coincide con el centro de
masas.

Recordemos que el momento lineal total de un sistema de partı́culas es

P~ = M V
~CM (31)

por lo que la fórmula final es


N
X
O′

J~ = R ~ CM
~ O′ × P~ +M R ~O ′ +
×V ma ~r ′a × ω
~ × ~r ′a . (32)
| {z }
a=1
~ O′
L | {z }
~ ′
SO

El vector L ~ O′ es el momento angular orbital. Coincide con el momento angular que tendrı́a el
sólido si estuviera concentrado en su centro de masas.
~O′ se denomina momento angular de rotación o de espı́n alrededor del punto O′ .
El vector S

Cuando escojamos el punto O′ = CM denotaremos a los momentos angulares orbitales y de


~⋆yS
espı́n mediante los sı́mbolos L ~ ⋆ . Si no hay ambigüedad también podemos denotarlo por
~
LyS ~

10
La momento angular de espı́n se puede escribir en términos del momento de inercia del sólido.

Se tiene la siguiente identidad para tres vectores cualesquiera del espacio Euclı́deo

~a × (~b × ~c ) = (~a · ~c )~b − (~a · ~b)~c, (33)

de donde se sigue
N
X  
~O′ =
S ma ra′ 2 ω ~ · ~r ′a ~r ′ .
~− ω (34)
a=1

~O′ = P3 SO′ i~e ′ , tenemos


Si lo expresamos en la base móvil {~e ′i }, S i=1 i
  
XN 3
X
SO′ i = ma ra′ 2 ωi − ra′ i  ω j ra′ j 
a=1 j=1
N
X 3
X 
= ma ra′ 2 δij − ra′ i ra′ j ω j
a=1 j=1
3 N
!
X X 
= ma ra′ 2 δij − ra′ i ra′ j ωj
j=1 a=1

= IijO ω j .

Por lo tanto el momento angular de espı́n se expresa en términos del tensor de inercia como
3
X ′ ′
SO′ i = IijO ω j o, en notación matricial, (SO′ ) = (I O )(ω). (35)
j=1

Para un mismo objeto podemos necesitar conocer su tensor de inercia con respecto a diferentes
puntos del sólido. ¿Cómo se relacionan entre sı́?

2.5 Teorema de Steiner.

La relación siempre pasa por el centro de masas. Si queremos relacionar los tensores de inercia
con respecto a dos puntos cualesquiera pasaremos siempre por el centro de masas como paso
intermedio.

Consideremos un punto cualquiera O′ y el centro de masas CM . Escogeremos una base de


vectores ortonormal {~e ′i } ligada al cuerpo en el punto O′ y una base paralela a la anterior
ligada al CM .

Denominemos ~b al vector de posición de O′ respecto del CM. Una partı́cula cualquiera a del
sólido tendrá vector de posición ~r ⋆a con respecto del CM y vector de posición ~r ′a respecto de
O′ . Estos vectores están relacionados mediante

~r ′a = ~r ⋆a − ~b (36)

11
a
~r ′a

O′
~r ⋆a

~e ′x
~b

CM

~e ′x

Introducimos esta relación en la definición de tensor de inercia respecto de O′ . Usamos que


ra′ 2 = ra⋆ 2 + ~b 2 − 2~b · ~r ⋆a y que ra′ i = ra⋆ i − bi :
N
X
′ 
IijO = ma ra′ 2 δij − ra′ i ra′ j
a=1
XN   
= ma ra⋆ 2 + ~b 2 − 2~b · ~r ⋆a δij − ra⋆ i ra⋆ j + bi bj − ra⋆ i bj − bi ra⋆ j .
a=1

Ahora bien, como en el sistema de referencia centrado en el CM, la posición del centro de
masas se encuentra en el origen, tenemos que
N
X
ma ra⋆ i = 0 (37)
a=1

de manera que el segundo, cuarto y quinto términos en la expresión anterior se anulan y


obtenemos


N
X  XN  
IijO = ma ra⋆ 2 δij − ra⋆ i ra⋆ j + ma ~b 2 δij − bi bj
a=1 a=1
 
= IijCM + M ~b 2 δij − bi bj .

Podemos enunciar el teorema de Steiner:


Teorema 1 (Steiner). EL tensor de inercia de un sólido respecto de un punto cualquier O′
y respecto de su centro de masas CM con sistemas de referencia paralelos están relacionados
mediante  

IijO = IijCM + M ~b 2 δij − bi bj (38)

12
donde ~b es el vector de posición de O′ respecto del CM .

Notemos que el tensor  


M ~b 2 δij − bi bj (39)

es precisamente el tensor de inercia que tendrı́a respecto del CM una partı́cula puntual de
masa M situada en el punto O′ . Por lo tanto el teorema de Steiner se puede enunciar:

El tensor de inercia respecto de un punto O′ es el tensor de inercia respecto del CM más el


tensor de inercia que tendrı́a el sólido respecto del CM si toda su masa estuviera
concentrada en el punto O′ .

Los tensor de inercia son siempre definidos positivos (¿Por qué?). Por lo tanto el tensor de
inercia siempre es mı́nimo cuando lo calculamos respecto del CM de un cuerpo.

El sólido tiene menos inercia a las rotaciones alrededor del CM .

El teorema de Steiner nos permite relacionar los momento de inercia respecto de ejes paralelos
que pasen por distintos puntos. Como antes, si queremos relacionar dos puntos cualesquiera
debemos pasar por el CM como paso intermedio.

∆ ∆′

~n
D
O′

α
~n ~b

CM

Consideremos dos ejes ∆ y ∆′ , ambos paralelos y el primero que pasa por el CM y e segundo
por un punto cualquiera O′ . Sea ~n el vector unitario que apunta en la dirección de ∆ (o ∆′ ).

13
De la relación entre el tensor de inercia y los momentos de inercia

X 3
3 X

X 3
3 X  
I ∆′ = IijO nj nj = (IijCM ~
+ M b δij − bi bj nj nj
2

i=1 j=1 i=1 j=1


 
= I + M ~b 2 − (~b · ~n)2


= I∆ + M b2 − b2 cos2 α
= I∆ + M 2 b2 sin2 α
= I∆ + M 2 D 2

donde D es la distancia entre ejes.

Vemos nuevamente que el momento de inercia con respecto de una dirección es mı́nimo cuanto
el eje pasa por el centro de masas.

2.6 Ejes y momentos principales de inercia.

Fijemos un punto cualquiera O′ y consideremos un eje ∆ que pase por O′ . Sea ~n el vector
unitario tangente a ∆.

Si el sólido gira alrededor del eje ∆ entonces el vector de velocidad angular es ω


~ = ω~n.
Calculemos el momento angular de espı́n del sólido (recordemos que las componentes están
referidas a la base móvil {~e ′i } centrada en O′ )
3 3
!

X ′
X ′
SiO = IijO ω j = IijO nj ω. (40)
i=1 i=1


En general el vector S O no tiene la misma dirección que ω
~ . Las direcciones para las que el
espı́n sea paralelo al eje de giro son especiales:

Definición 1. Una eje ∆ se llama eje principal de inercia del sólido si el momento angular
de espı́n del sólido cuando éste gira alrededor del eje ∆ resulta ser paralelo a la velocidad
angular (o, lo que es lo mismo, paralelo al eje de giro).

La condición de eje principal es por lo tanto


3
X ′
IijO nj ∝ ni , (41)
i=1

es decir, existe un cantidad I~n tal que


3
X ′
IijO nj = I~n ni . (42)
i=1

Las direcciones principales de inercia son las direcciones asociadas a los vectores propios de la
matriz de inercial. El valor propio I~n es la momento de inercia en la dirección ~n (¿por qué?)
y recibe el nombre de momento principal de inercia.

14
Sabemos por álgebra que una matriz simétrica siempre se puede diagonalizar, es decir existe
una base de vectores propios. Los denominaremos {~ui }

Sabemos además que estos vectores pueden ser escogidos de manera que formen una base
ortonormal. A esta base se la denomina base principal de inercia.
′ ′ ′
A los autovalores correspondientes los denotaremos I1O , I2O , I3O y los llamaremos momentos
principales de inercia.

Las ecuaciones que se satisfacen son


3
X ′
IijO ui1 = I1 u1 j
i=1
X3

IijO ui2 = I2 u2 j
i=1
3
X ′
IijO ui3 = I3 u3 j
i=1

Si expresamos el tensor de inercia en la base principal {~ui } tendremos


 
 ′ I1 0 0
I O =  0 I2 0  .
0 0 I3

2.7 Tensor de inercia y simetrı́as.

La determinación de los ejes principales de inercia se simplifica notablemente si el sólido


tiene algún tipo de simetrı́a, ya que tanto el centro de masas como los ejes principales deben
respetar la simetrı́a del cuerpo.

Es importante que la simetrı́a del sólido se refiera a su distribución de masas. Esto coincide
con las simetrı́as geométricas solamente si el cuerpo es homogéneo.

Plano de simetrı́a: Un sólido tiene un plano de simetrı́a si las distribución de masa es


invariante bajo reflexión con respecto a dicho plano.

El centro de masas debe estar situado sobre el plano de simetrı́a.

El eje perpendicular al plano es un eje principal (y por lo tanto los otros dos ejes
principales son necesariamente tangentes al plano de simetrı́a):

Eje de simetrı́a: Un eje es de simetrı́a si, cuando giramos el sólido un ángulo α 6= 2π


alrededor de dicho eje, la distribución de masas queda invariante.

Si el sólido queda invariante bajo un giro de cualquier ángulo alrededor del eje llamaremos a
simetrı́a continua.

15
Si la simetrı́a no es continua entonces se llama discreta y necesariamente hay un ángulo
de giro mı́nimo que deja el sólido invariante. Llamemos α0 a ese ángulo. Es necesariamente
cierto que existe un número natural n ≥ 2 tal que α0 = 2πn (¿por qué?). Al número n se le
conoce conoce como orden del eje de simetrı́a. Las simetrı́a continuas se pueden ver como
simetrı́a discretas para las que n = ∞.

Si un cuerpo tiene un eje de simetrı́a

El centro de masas se encuentra necesariamente sobre el eje de simetrı́a.

El eje de simetrı́a es un eje principal.

Si el orden de la simetrı́a es n ≥ 3 entonces cualquier dirección perpendicular al eje de


simetrı́a también es una dirección principal y además los momentos principales de los ejes
perpendiculares son todos iguales, es decir en una base ortonormal {~ui } cualquiera en la que
la dirección ~u3 apunte en la dirección del eje de simetrı́a, el tensor de inercia toma la forma
 
 ′ I1 0 0
I O =  0 I1 0  .
0 0 I3

2.8 Ángulos de Euler.

Sabemos que las matrices de rotación tienen tres parámetros libres

Las nueve cantidades aij

~e ′x = a11~ex + a12~ey + a13~ez


~e ′y = a21~ex + a22~ey + a23~ez
~e ′z = a31~ex + a32~ey + a33~ez

satisfacen seis restricciones

~e ′x · ~e ′x = 1, ~e ′y · ~e ′y = 1, ~e ′z · ~e ′z = 1
~e ′x · ~e ′y = 0, ~e ′x · ~e ′z = 0, ~e ′y · ~e ′z = 0. (43)

¿De qué manera podemos expresar las aij en términos de tres parámetros libres? Las condi-
ciones (43) son no-lineales por lo que su resolución no es immediata. De hecho existen diversas
parametrizaciones de la solucion.

Una de las más utilizadas son los ángulos de Euler.

Llamemos {~ei } a una base ortonormal fija en el espacio y a {êi } a una base ortonormal fija
en el sólido. La base {êi } no tiene por qué ser principal, solamente ser ortonormal.

La idea es pasar de la base {~ei } a la base {êi } mediante tres rotaciones sucesivas.

Queremos hacer primero una rotación alrededor del eje z después una rotación alrededor del
eje x de la base obtenida y finalmente una rotación alrededor del eje z de la nueva base
obtenida.

16
Llamemos {x, y, z} los ejes del sistema de referencia cuya base es {~ei } y {x′ , y ′ , z ′ } a los ejes
del sistema de referencia cuya base es {êi }.

En general el plano x′ y ′ no coincide con el plano xy (si los dos casos coinciden estamos en
una situación degenerada que requiere de un tratamiento especial). Dos planos paralelos entre
sı́ intersectan en una lı́nea. A la intersección del plano xy con el plano x′ y ′ se la conoce como
lı́nea de nodos y juega un papel fundamental para definir los ángulos de Euler. Escojamos
una vector unitario N ~ tangente a la linea de nodos (notemos que hay dos posibles elecciones)
y lo denominamos vector nodal.

Sea Φ el ángulo que forma el eje x con la linea de nodos, o de manera más precisa el ángulo
que forma el vector ~ex con el vector N~ . Hacemos primer una rotación de la base {~ex , ~ey , ~ez } de
ángulo Φ con respecto al eje z. Esto produce una nueva base ortonormal {~e ′x , ~e ′y , ~e ′z } definida
por

~e ′x = cos Φ ~ex + sin Φ ~ey 
~e ′y = − sin Φ ~ex + cos Φ ~ey

~e ′z = ~ez

~ , es decir el nuevo eje x coincide con la lı́nea


Notemos que por construcción tenemos ~e ′x = N
de nodos.

Sea θ ∈ [0, π) el ángulo que forma el eje z ′ con el eje z, es decir θ es el ángulo esférico del
vector êz con respecto a la base {~ei }.
~ . La nueva base, que deno-
Aplicamos una rotación de ángulo θ alrededor del vector nodal N
′′
minamos {~e i } tiene la expresión

~
~e ′′x = ~e ′x = N 
′′ ′
~e y = cos θ ~e y + sin θ ~e z′

~e ′′z = − sin θ ~e ′y + cos θ ~e ′z

Notemos que por construcción êz = ~e ′′z . Por lo tanto no queremos modificar más este vector.

El último ángulo de Euler Ψ se define de la siguiente manera. Los vectores êx y êy están el
el plano x′ y ′ . El vector nodal también está en ese plano (está en la intersección de ese plano
con el plano original xy). Por lo tanto existe un ángulo Ψ entre el vector N ~ y el vector êx o,
de manera más precisa existe una ángulo Ψ de manera que si rotamos el vector N ~ alrededor
de la dirección êz obtenemos êx .

Si aplicamos esta rotación a la base {~e ′′x , ~e ′′y , ~e ′′z } obtenemos la base {êx , êy , êz } (¿por qué ? ).
Explı́citamente

êx = cos Ψ ~e ′′x + sin Ψ ~e ′′y 
êy = − sin Ψ ~e ′′x + cos Ψ ~e ′′y

êz = ~e ′′z

17
Si componemos los tres rotaciones encontramos el cambio de base entre la base original {~ei }
y la final {êi } en función de tres cantidades {θ, Φ, Ψ}. Estas tres cantidades son los ángulos
de Euler.
Multiplicar las tres rotaciones es un cálculo algo largo. El resultado es:

êx = (cos Ψ cos Φ − sin Ψ cos θ sin Φ) ~ex + (cos Ψ sin Φ + sin Ψ cos θ cos Φ) ~ey + sin Ψ sin θ~ez 
êy = (− sin Ψ cos Φ − cos Ψ cos θ sin Φ) ~ex + (− sin Ψ sin Φ + cos Ψ cos θ cos Φ) ~ey + cos Ψ sin θ~ez

êz = sin θ sin Φ~e1 − sin θ cos Φ~e2 + cos θ~e3

Las cantidades aij que se pueden extraer de estas expresiones satisfaces automáticamente las
ligaduras (43) y dependen de tres cantidades libres, como debe ser.
Determinar los ángulos de Euler de una rotación no es difı́cil:
(i) Nos fijamos en el vector êz y consideramos sus ángulo esféricos. El ángulo esférico θ es di-
rectamente uno de los ángulos de Euler. Además el ángulo esférico φ es por definición el

18
ángulo que forma el eje x con la proyección del vector êz en el plano xy. El vector nodal es
perpendicular a esta proyección y también está en el plano xy. Por lo tanto el ángulo Φ que
forma con el eje x es
π
Φ=φ+ (44)
2
(también podrı́amos escoger Φ = φ − π que corresponderı́a a la otra elección posible de N ~ ).
2

(ii) El ángulo Ψ especifica la posición del eje x′ alrededor del eje z ′ . Fija el ángulo que tenemos
que girar el vector nodal en el plano x′ y ′ para llegar al eje x′ .

2.9 Velocidad angular en función de los ángulos de Euler.

Si un sólido rı́gido está girando y fijamos una base {êi } ligada al sólido (principal o no), el
movimiento de rotación viene descrito por tres funciones de t

{θ(t), Φ(t), Ψ(t)} (45)

Resultará necesario conocer la velocidad angular de rotación ω


~ en términos de las velocidades
{θ̇(t), Φ̇(t), Ψ̇(t)}.
dê dêy
Una manera de obtenerlo serı́a calcular dê y dêz dêx
~ × ê1 ,
dt , dt , dt y usar las fórmulas dt = ω
x
dt =
dêz
~ × ê2 , dt = ω
ω ~ × ê3 para determinar ω
~ . Este método es largo y farragoso.

Resulta mucho mas sencillo notar que hemos realizado tres rotaciones y que como las veloci-
dades angulares provienen de derivadas son necesariamente aditivas.

Las tres velocidades angulares de rotación que se han aplicado son a lo largo de los vector ~ez ,
~ y ê3 con velocidades respectivas Φ̇, θ̇ y Ψ̇. Por lo tanto la velocidad angular de rotación es
N

ω ~ + Ψ̇êz .
~ = Φ̇~ez + θ̇N (46)

Podemos expresar este vector en la base que más nos convenga. En la base móvil {êi } tenemos
~ = ~e ′x = cos Ψ êx − sin Ψ êy
N
~ez = ~e ′z = cos θ ~e ′′z + sin θ ~e ′′y

y además

~e ′′z = êz
~e ′′y = cos Ψ êy + sin Ψ êx .

Podemos sustituir en (46) y obtenemos


     
~ = Φ̇ sin θ sin Ψ + θ̇ cos Ψ ê1 + Φ̇ sin θ cos Ψ − θ̇ sin Ψ ê2 + Φ̇ cos θ + Ψ̇ ê3 .
ω (47)
| {z } | {z } | {z }
ω1 ω2 ω3

que es la expressión de la velocidad angular en términos de los ángulos de Euler.

19
Tema 3. Dinámica del Sólido Rı́gido
3.1 Ecuaciones fundamentales de la dinámica del sólido rı́gido.

De la teorı́a general de un sistema de partı́culas sabemos que


~CM
dV
M = F~ E
dt
dJ~ ~E
=M
dt
donde V~CM es la velocidad del centro de masas, F~ E es la fuerza externa total que actúa
sobre el sistema, J~ es el momento angular total y M
~ E es el momento de la fuerzas externas.
El momento angular y el de las fuerzas están calculadas respecto del origen del sistema de
referencia inercial que se esté usando.

Tenemos pues dos ecuaciones diferenciales vectoriales, es decir seis ecuaciones escalares. Es
el mismo número que el de grados de libertad de un sólido rı́gido. Estas ecuaciones bastarán
para determinar las leyes del movimiento de un sólido rı́gido.

Recordemos que tanto si O′ es un punto fijo como si es el CM el sólido tenemos

J~ = M R
~ O′ × V ~ O′ .
~CM + S

Si derivamos con respecto del tiempo

dJ~ ~CM
dV ~ O′
dS
~ ~
= M VO′ × VCM + M RO′ ×~ +
dt dt dt
d ~ O′
S
=R~ O′ × F~ E + =M~E
dt

Por lo tanto ′ ′
~O
dS ~O
dS
=M~E −R ~ O′ × F~ E , =⇒ ~ E′
=M O
dt dt
y las ecuaciones del movimiento son
~CM
dV
M = F~ E
dt
~ O′
dS
=M ~ E′
O
dt
donde el punto O′ es o bien un punto fijo del sólido y el centro de masas.

Son ecuaciones vectoriales y, por lo tanto, se pueden escribir en la base de vectores que resulte
más conveniente.

3.2 Ecuaciones Euler para el sólido rı́gido.

En muchos casos (no siempre) es conveniente escribir la ecuación del espı́n en una base de
ejes principales del sólido {~u1 , ~u2 , ~u3 }.

1
Dado que el tensor de inercia es diagonal tenemos que, si el vector velocidad angular es
ω
~ = ω1 ~u1 + ω2 ~u2 + ω3 ~u3 , el espı́n en esta base es
~ O′ = I1O′ ω1 ~u1 + I2O′ ω2 ~u2 + I3O′ ω3 ~u3 ,
S

El tensor de inercia referido a una base ligada al sólido no depende del tiempo (ya que el
sólido no cambia de forma y se mantiene invariable respecto de un sistema de ejes solidario a

dIiO
él). Se tiene pues dt = 0.

Como las vectores ~ui son ligados al sólido

d~ui
~ × ~ui = (ω1 ~u1 + ω2 ~u2 + ω3 ~u3 ) × ~ui

dt
o explı́citamente

d~u1
= ω3 ~u2 − ω2 ~u3 ,
dt
d~u2
= −ω3 ~u1 + ω1 ~u3 ,
dt
d~u3
= ω2 ~u1 − ω1 ~u2 .
dt

Si sustituimos en la ecuación del espı́n tenemos



~O
dS ′ ′
=I1O (ω̇1 ~u1 + ω1 (ω3 ~u2 − ω2 ~u3 )) + I2O (ω̇2 ~u2 + +ω2 (−ω3 ~u1 + ω1 ~u3 ))
dt

+ I3O (ω̇3 ~u3 + +ω3 (ω2 ~u1 − ω1 ~u2 ))

Igualando componente a componente llegamos a las ecuaciones de Euler para un sólido


rı́gido
  

I1O dω 1
= ~ E′ · ~u1 + I O′ − I O′ ω2 ω3 
M 
dt O
 2′ 3
 

′ ′
O dω2 ~ E O
I2 dt = MO′ · ~u2 + I3 − I1 ω3 ω1 O
  


I3O dω 3
= ~ E′ · ~u3 + I O′ − I O′ ω1 ω2 
M 
dt O 1 2

Es importante notar que si conocemos las fuerzas externas que actúan sobre el sistema po-
demos calcular el momento de las fuerzas externas M ~ E′ respecto del punto O′ , pero en las
O
ecuaciones de Euler aparecen las componentes M ~ E′ · ~ui en la base móvil {~ui }. Esta base es
O
desconocida a priori. Para determinarla debemos saber cómo está orientado el sólido en cada
instante de tiempo, es decir necesitamos conocer cómo se está moviendo el sólido. Por lo
tanto, para poder determinar el movimiento debemos añadir las ecuaciones para d~ u1 d~
dt
u2
dt y
d~
u3
dt .

d~ui
~ × ~ui ,
=ω i = 1, 2, 3 (1)
dt

2
En total tenemos 12 ecuaciones diferenciales de primer orden. Solamente seis ecuaciones son
independientes porque los vectores {~u1 } satisfacen las seis condiciones ~ui · ~uj = δij .
En general, resolver las ecuaciones de Euler es un problema complicado.
Por el contrario en el caso en que sepamos cómo se mueve el sólido podemos determinar los
momentos de las fuerzas como consecuencia directa de las ecuaciones de Euler. Al disponer de
~ E′ sin más que sustituir en las ecuaciones
{~ui (t)} ( y por lo tanto de ωi (t)) podemos obtener M O
de Euler.
Otro caso en que las ecuaciones de Euler se simplifican de manera notable es cuando el sólido
no está sometido a momentos de fuerza externos M ~ E′ . En este caso las ecuaciones de Euler
O
se desacoplan y forman un sistema de tres ecuaciones para tres incógnitas
 ′  
′ O − I O′ ω ω 
I1O dω 1
= I 2 3 
dt
′ dω
 2′ 3

 
O
I2 dt = 2 O O
I 3 − I 1 ω3 ω 1
 ′  


I3O dω 3
= I O − I O′ ω ω  
dt 1 2 1 2

Una vez integradas y obtenidas ωi (t) podemos resolver las ecuaciones para {~ui } (1) y obtener
el movimiento del sólido.

3.3 Ecuaciones de evolución para la energı́a cinética de un sólido rı́gido

Queremos determinar bajo qué condiciones se conserva la energı́a cinética total y la energı́a
cinética de rotación en el movimiento de los sólidos rı́gidos.
Para ello debemos calcular la variación temporal del la expresión obtenida para la energı́a
cinética. Recordemos la descomposición
3 3
1 ~2 1 X X O′
T = MV O′ + Iij ωi ωj .
|2 {z } 2 i=1 j=1
Ttras | {z }
Trot

La derivada respecto del tiempo de cada término es


3 3 3 ′
dTtras ~
~ O ′ · d VO ′ dTrot X X O′ X dS O
= MV = Iij ωi ω̇j = ωi i .
dt dt dt dt
i=1 j=1 i=1

~ O′
Queremos expresar este resultado en términos de dSdt . Dado que esta derivadad es respecto
del sistema inercial y la base del sólido es móvil, tenemos
!
dSiO ′  
X3 ~ O′ X 3 O′ 3
X ′
′ ′ ′ d S dS ′ 
~ =
S O O
Si ~ei =⇒ = i ′ O
~ei + Si ω ′
~ × ~ei = ~ O′
~ei + ω × S
dt dt dt
i=1 i=1 i=1

por lo que
3 ′ ′
! ′
X dS O ~O
dS ~O
dS
ωi i = ω
~· ~ O′
−ω×S ~·

dt dt dt
i=1

3
y por lo tanto,

dTrot ~ O′
dS
=ω· .
dt dt
Para la energı́a cinética total:

dT ~ ~ O′
~ O ′ d VO ′ + ω
= MV ~·
dS
dt dt dt
que al ser vectoriales pueden escribirse en la base de vectores que resulte más conveniente.

Si usamos las ecuaciones del movimiento de un sólido rı́gido obtenemos


dTrot ~ E′ .
~ ·M
=ω O
dt
En particular, si el momento de las fuerzas externas respecto del punto O′ se anula la energı́a
cinética de rotación respecto de ese punto se conserva.

Con respecto a la energı́a cinética total, obtenemos la variación temporal dependiendo de si


O′ es un punto fijo o el centro de masas. Para O′ un punto fijo
dT dT
= rot = ω ~ E′ .
~ ·M O
dt dt
~CM
Si O′ es el centro de masas, podemos usar M dVdt = F~ E y tenemos

T = Ttras + Trot
dTtras ~CM · F~ E
=V
dt
dTrot ~ CM
E
~ ·M

dt

3.4 Movimiento de un sólido rı́gido libre.

Un solido libre es aquel sobre el que no actúan fuerzas externas netas ni momentos externos
netos.

Escogemos O′ = CM y por lo tanto


~CM
dV
M = F~ E = 0 =⇒ ~CM = const
V
dt
es decir, el centro de masas se mueve con movimiento rectilı́neo uniforme.

Además la ecuación para el espı́n proporciona


~
dS
=0 =⇒ ~ = const,
S
dt
es decir, el vector de momento angular es pı́n se mantiene constante (como vector referido a
la base inercial).

4
De las ecuaciones de evolución para la energı́a cinética, tenemos que Trot es una constante
del movimiento.

Fijemos que la propiedad de que el vector de espı́n S ~ sea una constante (vectorial) del mo-
vimiento no significa que la velocidad angular ω
~ se mantenga constante. La razón es que la
relación
X3
Si = Iij ωj
j=1

es válida en el sistema de referencia ligado al sólido {~ui } y en este sistema Si (t) dependen del
tiempo (puesto que la base ~ui (t) depende del tiempo en general).

Consideraremos dos casos: (a) cuando se trate de un sólido simétrico y (b) la estabilidad de
un sólido rı́gido arbitrario.

3.4.1 Sólido rı́gido simétrico.

Un sólido rı́gido se llama simétrico cuando tiene un eje de simetrı́a de orden n ≥ 3. También
reciben el nombre de peonzas simétricas.

Sabemos que el eje de simetrı́a siempre es un eje principal (que escogemos como eje ~u3 ).
Cualquier base ortonormal del tipo {~u1 , ~u2 , ~u3 } (es decir con ~u3 a lo largo del eje de simetrı́a
y por lo tanto ~u1 y ~u3 perpendiculares al eje de simetrı́a) es una base principal y los momentos
principales a lo largo de ~u1 y de ~u2 coincide.

El tensor de inercia en una de esas bases toma la forma


 
I 0 0
 0 I 0 .
0 0 I3

Las ecuaciones de Euler son


dω1
I = (I − I3 ) ω2 ω3
dt
dω2
I = − (I − I3 ) ω1 ω3
dt
dω3
=0
dt

Definimos la constante (con dimensiones de frecuencia)


I − I3
ω0 = ω3 ,
I
de manera que las ecuaciones a resolver son
dω1
= ω0 ω2 ,
dt
dω2
= −ω0 ω1 .
dt

5
Derivando la primera y usando la segundo tenemos ω̈1 = ω0 ω̇2 = −ω02 ω1 que es la ecuación
de un oscilador armónico, cuya solución es
ω1 = A sin (ω0 t + β))
donde A, β son constantes de integración. Por otro lado
1 dω1
ω2 = = A cos (ω0 t + β))
ω0 dt
y el vector velocidad angular en la base principal tiene la descomposición
ω
~ = A (sin(ω0 t + β))~u1 + cos(ω0 t + β))~u2 ) + ω3 ~u3
es decir, en la base principal ligada al sólido, el vector ω
~ forma un ángulo αc con el eje z que
viene dado por
A
tan αc =
ω3
y gira con velocidad angular ω0 alrededor de dicho eje.

ω3
ω
~
~uz αc

~uy
~ux

Notemos que conocemos ω ~ con respecto a unos ejes móviles, de manera que todavı́a no
sabemos su movimiento en el sistema de referencia inercial. Para obtenerlo usamos que el
~ está fijo en el espacio y lo expresamos en términos de ω
vector S ~ , como sigue
~ = I1 ω1 ~u1 + I2 ω2 ~u2 + I3 ω3 ~u3
S
= IA (sin(ω0 t + β))~u1 + cos(ω0 t + β))~u2 ) + I3 ω3 ~u3 (2)
ω − ω3 ~u3 ) + I3 ω3 ~u3
= I (~
ω + ω3 (I3 − I)~u3
= I~
ω − ω0 ~u3 ) .
= I (~

6
Podemos elegir nuestro sistema inercial de la manera que más nos convenga. Si escogemos la
dirección z del sistema de referencia inercial de manera que apunte en la misma dirección que
~ (que es un vector constante) tenemos S
S ~ = S~ez y por lo tanto

1~ S
ω
~ = S + ω0 ~u3 = ~ez + ω0 ~u3 .
I I

Multiplicando (2) by ~u3 y llamando θ al ángulo que forman el eje z y el eje ~u3 obtenemos

I 3 ω3
cos θ = ~ez · ~u3 =
S
que es constante.

Si usamos la base ortonormal {~er , ~eθ , ~eφ } asociadas a coordenadas esféricas {r, θ, φ} tenemos
que ~u3 = ~er y por lo tanto
d~u3 d~er
= = θ̇ ~eθ + sin θ φ̇ ~eφ
dt dt
y por otra parte
 
d~u3 S S S
=ω ~ × ~u3 = ~ez + ω0 ~u3 × ~u3 = ~ez × ~u3 = sin θ ~eφ
dt I I I

Igualando ambas expresiones


S
φ̇ = = const.
I
Ya podemos describir el movimiento del sólido. Por un lado el eje ~u3 del sólido gira con
velocidad angular constante SI alrededor del eje z y formando con éste un ángulo θ constante
que viene dado por cos θ = I3 ω3 /S. A este movimiento se le llama precesión. Al mismo
tiempo el sólido gira respecto de su eje de simetrı́a con una velocidad angular ω0 y todo esto
ocurre de manera que el eje definido por la vector ω (y que forma un ángulo αc con el eje z ′
con tan αc = A/ω3 ) se mantiene instantáneamente en reposo.

El movimiento de rotación tiene dos constantes arbitrarias A, ω3 (en realidad tiene tres, tal
y como debe ser, ¿cuál es la tercera?) que pueden determinarse a partir de las cantidades
conservadas S (el módulo del vector de espı́n) y Trot (la energı́a cinética de rotación), a partir
de las expresiones

S 2 = I12 ω12 + I22 ω22 + I32 ω32 = I 2 A2 sin2 (ω0 t + β)) + cos2 (ω0 t + β)) + I32 ω02 = I 2 A2 + I32 ω32
1  1 1
Trot = I1 ω 2 + I2 ω22 + I3 ω32 = IA2 + I3 ω32 ,
2 2 2
de manera que conocer S y Trot es equivalente a conocer A y ω3 mediante

S 2 = I 2 A2 + I32 ω32 ,
1 
Trot = IA2 + I3 ω32 .
2

7
z

~uz
~uy

~
S ~ux
I ω
~
θ
ω0 ~u3
αc

Al caso particular en que I = I3 se le llama sólido libre esférico o peonza esférica aunque
el sólido no tiene por qué ser una esfera. En este caso
S
ω
~ = ~e3
I
es un vector constante en el espacio. Como toda base ortonormal es una base principal po-
demos escoger ~u3 en la misma dirección que ω ~ . Es decir, el sólido gira con velocidad angular
constante ω a lo largo de un eje fijo. Es fácil comprobar que esta conclusión se puede obtener
también poniendo I3 = I (es decir ω0 = 0) en las ecuaciones anteriores.

3.4.2 Sólido libre arbitrario. Estabilidad.

El movimiento de un sólido libre sin simetrı́as es más complicado. Nos limitaremos a estudiar
la estabilidad de la rotación alrededor en torno a uno de sus ejes principales.
Las ecuaciones de Euler

I1 dω
dt = (I2 − I3 ) ω2 ω3 
1

I2 dω
dt = (I3 − I1 ) ω3 ω1 
2

dω3
I3 dt = (I1 − I2 ) ω1 ω2
admiten la solución ω
~ = ω3 ~u3 con ω3 constante.

8
Dado que S~ = I3 ω3 ~u3 y que S ~ es un vector constante, se sigue que ~u3 es constante, y en
consecuencia, el sólido gira con velocidad angular constante alrededor del eje principal z ′ , que
se mantiene fijo en el espacio. Obviamente lo mismo vale para las direcciones principales x′ o
y′ .

Supongamos que un sólido libre se mueve de esta manera, es decir, con ω ~ = ω3 ~u3 y que
comunicamos al cuerpo una pequeña perturbación de manera que el eje de rotación ya no sea
paralelo a ~u3 aunque sı́ muy próximo a él. Es decir, consideramos

ω
~ = ∆ω1 ~u1 + ∆ω2 ~u2 + (ω3 + ∆ω3 )~u3

y consideramos ∆ωi pequeños, de manera que podemos despreciar productos de dos de estas
cantidades. Con este aproximación las ecuaciones de Euler toman la forma
d∆ω1
I1 = (I2 − I3 ) ∆ω2 ω3
dt
d∆ω2
I2 = (I3 − I1 ) ∆ω1 ω3
dt
d∆ω3
I3 =0
dt
de donde tenemos que ∆ω3 es constante. Para obtener los otros dos, calculamos la derivada
de una ecuación y usamos la otra para obtener

d2 ∆ω1 I2 − I3 d∆ω2 (I2 − I3 )(I3 − I1 ) 2


2
= ω3 = ω3 ∆ω1 (3)
dt I1 dt I1 I2
Por el mismo procedimiento obtenemos una ecuación idéntica para ∆ω2

d2 ∆ω2 (I2 − I3 )(I3 − I1 ) 2


= ω3 ∆ω2 .
dt2 I1 I2
Debemos distinguir dos casos.

(a) Si (I3 −II21)(I


I2
3 −I1 ) 2
ω3 := Ω2 > 0 (que ocurre cuando I3 > max(I1 , I2 ) o bien I3 < min(I1 , I2 ))
entonces la ecuación es
d2 ∆ω1
= −Ω2 ∆ω1 =⇒ ∆ω1 = C cos(Ωt + β))
dt2
y análogamente para ∆ω1 . Las dos perturbaciones ∆ω1 y ∆ω2 permanecen pequeñas y por
lo tanto el movimiento es próximo al movimiento original. La rotación alrededor del eje z ′ es
estable.

La rotación alrededor de un eje principal cuyo momento de inercia es máximo o mı́nimo es


estable.

9
(b) Si (I3 −II21)(I
I2
3 −I1 ) 2
ω3 = −α2 < 0 (que ocurre cuando I1 < I3 < I2 o bien I2 < I3 < I1 ) entonces
la ecuación es
d2 ∆ω1
= α2 ∆ω1 =⇒ ∆ω1 = C1 eαt + C3 e−αt
dt2
(y análogamente para ∆ω2 ). Excepto para valores iniciales muy especiales, la perturbación
crece indefinidamente cuando t → +∞. Por lo tanto la aproximación de que ∆ω1 y ∆ω2 son
pequeños deja de ser válida y el movimiento es inestable.

La rotación alrededor de un eje principal cuyo momento de inercia sea intermedio con
respecto a los otro dos es inestable. Notemos que la inestabilidad aumenta tanto con el valor
de ω3 como con los valores de |I1I−I
1
3|
y de |I2I−I
2
3|
.

(c) Finalmente, en el caso de una peonza simétrica no esférica, tenemos que I1 = I2 6= I3 . La


rotación alrededor del eje principal ~u3 es siempre estable. La rotación alrededor de uno de los
ejes ortogonales (por ejemplo ~u1 ) es inestable porque la ecuación que se satisface es (debemos
intercambiar los ı́ndices (1, 2, 3) a (2, 3, 1) en la ecuación (3) )

d2 ∆ω2 (I3 − I1 )(I1 − I2 ) 2


2
= ω1 = 0 =⇒ ∆ω2 = At + B.
dt I1 I2
En este caso ∆ω2 crece indefinidamente pero no de manera exponencial sino solamente lineal.
El sistema es inestable, pero la inestabilidad es mucho más suave que en el caso anterior.

3.5 Péndulo fı́sico.

Un péndulo fı́sico es un sólido rı́gido que se mueve bajo la acción de la gravedad y que posee
un eje horizontal fijo y que no pase por el centro de masas. Notemos que no imponemos que
este eje sea ni de simetrı́a del cuerpo ni tampoco ortogonal a un plano de simetrı́a del cuerpo,
de manera que no tiene por qué ser principal. Esta suposición se hace de manera implı́cita o
explı́cita en buena parte de los libros de texto, pero es innecesaria.

Escogemos ejes inerciales de manera que el eje z sea vertical y el eje x coincida con la dirección
horizontal fija del sólido. Escogemos además el origen O de manera que el plano yz contenga
al centro de masas.

Escogemos ejes ligados al cuerpo centrados en el punto O de manera que el eje e′x coincida
con el eje x y que el vector ~e3 ′ apunte desde el centro de masas al punto O. La distancia entre
el CM y el punto O la denotamos por l. Como es habitual, denotamos por θ el ángulo que
forma el eje z y el eje z ′ .

La gravedad es una fuerza externa que actúa de la misma manera que si el cuerpo estuviera
totalmente concentrado en el centro de masas. Por lo tanto el momento de las fuerzas externas
respecto al punto O es
M~ OE = −M gl sin θ~ex + M
~
eje
~
donde M eje es el momento de las fuerzas que ejerce el eje fijo sobre el sólido.

10
~e ′z ~ez

~e ′y

~ey

CM
θ

M~g

Dado que la fuerza que ejerce el eje está aplicada sobre puntos a lo largo del eje x tenemos
que necesariamente M~
eje es perpendicular al eje x.

El sólido gira alrededor del eje x por lo que su velocidad angular es ω


~ = θ̇~ex .
Si usamos la ley fundamental de la mecánica del sólido rı́gido
~O
dS ~E
=M O
dt
y la proyectamos sobre el eje x obtenemos
~ O · ~ex )
d(S ~ OE · ~ex = −M gl sin θ.
=M (4)
dt

Por otro lado, como ω = θ̇~ex y ~ex = ~e ′x tenemos


 
X3 X 3 3
X 3
X
~O =
S SiO~e ′i =  IijO ω j  ~e ′i = θ̇IxOi~e ′i
i=1 i=1 j=1 i=1

y por lo tanto
~ O · ~e ′x = Ixx
S O
θ̇.
O = I). La′
Llamemos I al momento de inercia con respecto al eje fijo ~ex (de manera que Ixx
ecuación del movimiento (4) es
d2 θ d2 θ Mg l
I = −M g l sin θ =⇒ =− sin θ.
dt2 dt 2 I

11
Recordemos que la ecuación del movimiento de un péndulo matemático (una masa M puntual
colgada de una cuerda de longitud L sin masa e inextendible) es
d2 θ g
2
= − sin θ
dt L
por lo que el movimiento de un péndulo fı́sico coincide con el movimiento de un péndulo
matemático de longitud equivalente
I
L= .
Ml
Notemos que para un péndulo matemático el momento de inercia del cuerpo con respecto del
punto de suspensión es I = ml2 por lo que la longitud del péndulo equivalente es
I M l2
L= = =l
Ml Ml
tal y como debe ser.

3.6 El trompo de Lagrange.

El trompo de Lagrange consiste en el estudio del una peonza simétrica moviéndose bajo la
acción de la gravedad y con un punto fijo.
Tomemos el punto O′ como origen del sistema de referencia ligado al sólido. La única fuerza
externa que realiza momento respecto a O′ es la gravedad, y su valor es, usando coordenadas
esféricas para la posición del centro de masas respecto del punto O′ es
~ E′ = R
M ~ CM × M~g = l~er × (−M g~ez ) = M gl~eφ
O

donde l es la distancia entre el centro de masas y el punto O′ .


Un método para estudiar el movimiento es descomponer M ~ E′ en la base ligada al cuerpo y
O
usar las ecuaciones de Euler. Este procedimiento es ligeramente complicado porque el sistema
no se desacopla inmediatamente.
El lugar de ese procedimiento utilizamos el formalismo de Lagrange. El lagrangiano es L =
T − V y la energı́a cinética en este caso es exclusivamente de rotación por lo que
1  O′ 2 ′ ′

T = I1 ω1 + I2O ω22 + I3O ω32 ,
2

donde IiO son los momentos principales del sólido respecto del punto O′ . Para un trompo
′ ′ ′
simétrico I1O = I2O = I1 y I3O = I3 por lo que
1  1
T = I1 ω12 + ω22 + I3 ω32
2 2
Utilizamos los ángulos de Euler para describir la rotación del sólido:

ω1 = Φ̇ sin θ sin Ψ + θ̇ cos Ψ,


ω2 = Φ̇ sin θ cos Ψ − θ̇ sin Ψ,
ω3 = Φ̇ cos θ + Ψ̇.

12
~uz
~ez

θ
l

M~g
O′
~ey

~ex

de manera que
ω12 + ω22 = Φ̇2 sin2 θ + θ̇2 ,
y la energı́a cinética es
1   1  2
T = I1 Φ̇2 sin2 θ + θ̇2 + I3 Φ̇ cos θ + Ψ̇ .
2 2
Además la energı́a potencial es V = M gl cos θ por lo que el Lagrangiano de un trompo
simétrico es
1   1  2
L = T − V = T = I1 Φ̇2 sin2 θ + θ̇2 + I3 Φ̇ cos θ + Ψ̇ − M gl cos θ.
2 2

Tanto Φ como Ψ son coordenadas cı́clicas, de manera que sus momentos conjugados son
constantes del movimiento
∂L  
pΦ = = I1 Φ̇ sin2 θ + I3 Φ̇ cos θ + Ψ̇ cos θ := Jz
∂ Φ̇
∂L  
PΨ = = I3 Φ̇ cos θ + Ψ̇ := J3
∂ Ψ̇

Notemos que estas constantes corresponden respectivamente a la componente del monento


angular respecto del eje ~ue y del eje ~ez :

J3 = J~ · ~u3 , Jz = J~ · ~ez

La constancia de estas cantidades se puede deducir también del hecho de que el momento de
fuerzas externo solamente tiene componente en ~eφ .

13
Además L no depende de t, por lo que la función hamiltoniana es una constante del movi-
miento. Como T es homogéneo de grado dos en las velocidades, tenemos h = T + V = E y
esta constante del movimiento se expresa
1 1 (Jz − J3 cos θ)2 J32
E = I1 θ̇2 + + + M gl cos θ.
2 2 I1 sin2 θ 2I3

Esta expresión proporciona una ecuación diferencial para θ. Resulta útil definir u = cos θ por
lo que u̇ = − sin θ θ̇ de manera que
u̇2
θ̇2 =
1 − u2
y llegamos al sistema de ecuaciones que debe satisfacer un trompo de Lagrange
 
2E J2 2M glu (Jz − J3 u)2
u̇2 = (1 − u2 ) − 3 − −
I1 I1 I3 I1 I12
Jz − J3 u
Φ̇ =
I1 (1 − u2 )
J3 (Jz − J3 u)u
Ψ̇ = −
I3 I1 (1 − u2 )

Si determinamos u(t) de la primera ecuación, entonces podemos determinar Φ(t) y Ψ(t)


mediante integración de la segunda y tercera ecuaciones.
La ecuación para u(t) es del tipo

u̇2 = P3 (u) donde P3 (u) es un polinomio de grado 3 en u.

Dado que −1 ≤ u ≤ 1, solamente nos interesa analizar este polinomio en el rango (−1, 1). El
valor en u = −1 es
(Jz + J3 )2
P3 (u = −1) = − ≤0
I12
mientras que el valor en u = 1 es
(Jz − J3 )2
P3 (u = 1) = − ≤0
I12

Por otro lado cuando u → +∞ tenemos P3 → +∞ y cuando u → −∞ tenemos P3 → −∞.


De manera que hay una raı́z u3 a la derecha del intervalo de interés (u3 ≥ 1).
Un polinomio de grado tres o bien tiene una raı́z real o tres raı́ces reales (contando multipli-
cidad). Por otro lado, para tener un movimiento posible es necesario que el polinomio P3 (u)
esa positivo en algún intervalo. La única posibilidad es que existan tres raı́ces reales u1 , u2 , u3
que satisfagan
−1 ≤ u1 ≤ u2 ≤ 1 ≤ u3 .

El movimiento se realizará entre las raı́ces u1 y u2 , u1 ≤ u ≤ u2 o, de manera equivalente,

θ2 ≤ θ ≤ θ1

(el cambio de orden es debido a que cos θ es una función decreciente en el intervalo θ ∈ [0, π]).

14
La peonza realiza tres tipos de movimientos.

(a) Gira alrededor de su eje de simetrı́a con velocidad angular Ψ̇. Este movimiento se llama
de rotación.

(b) El eje de la peonza gira con velocidad angular Φ̇ alrededor de la vertical. Este movi-
miento de llama de precesión.

(c) El eje de la peonza realiza un movimiento de oscilación respecto de la vertical. Dicha


oscilación está acotada por dos ángulos θ1 y θ2 . Este movimiento se llama nutación.

Conviene notar que el signo de Φ̇ es el de Jz − J3 u. Supongamos que J3 6= 0. Entonces


podemos definir
Jz
u⋆ := .
J3
Tenemos dos posibilidades, o bien u⋆ 6∈ [u1 , u2 ] o bien u⋆ ∈ [u1 , u2 ]. En el primer caso,
Φ̇ tiene el mismo signo durante todo el movimiento. El eje de la peonza realiza un movimiento
del tipo:

~ez

θ2

θ1

~ey

~ex

En el segundo caso, es decir cuando u⋆ ∈ [u1 , u2 ] entonces Φ̇ cambia de signo a lo largo del
movimiento. La peonza gira alrededor del eje z a ratos en un sentido y a ratos en otro. El
movimiento es del tipo:

15
~ez

θ2

θ1

~ey

~ex

16
Tema 4. Sistemas de referencia no inerciales
4.1 Introducción.

En Mecánica newtoniana las ecuaciones de Newton son válidas únicamente en los sistemas
de referencia inerciales, es decir en aquellos sistemas de referencia en los que una partı́cula
libre (no sometida a ninguna interacción) tiene un movimiento rectilı́neo y uniforme.
En muchas situaciones puede ocurrir que los sistemas de referencia naturales no sean inercia-
les. Por ejemplo, el sistema de referencia ligado a un laboratorio en la Tierra no es inercial,
puesto que la Tierra rota alrededor de si misma (además de otros movimientos acelerados que
posee).
Queremos estudiar cómo deben modificarse las leyes de Newton para que sean válidas en
sistemas de referencia no inerciales.
Nos restringiremos a sistemas de referencia Cartesianos.

4.2 Transformación de velocidades.

Consideremos un sistema de referencia inercial S y un sistema cartesiano S ′ que se mueve de


forma arbitraria respecto de S.
Un punto cualquiera p del espacio tendrá un vector de posición ~r respecto de S y ~r ′ respecto
~ tenemos,
de S ′ . Si el vector de posición del origen O ′ de S ′ respecto de S es R,
~ + ~r ′ .
~r = R

Consideremos ahora un partı́cula puntual que se mueve en el espacio. Su vector de posición


en S es ~r(t) y su vector de posición en S ′ es ~r ′ (r). El origen O ′ también puede moverse por
~
lo que R(t). ~ + ~r ′ (t), obtenemos
Derivando ~r(t) = R(t)
d~r(t) ′
~ (t) + d~r
=V (1)
dt dt
~ (t) es la velocidad de O ′ respecto del sistema de referencia inercial S.
Donde V
r′
Está claro que ~v = d~
r
dt es la velocidad de la partı́cula respecto de S. ¿ Es
d~
dt la velocidad

respecto de S ? Veamos que no.
Para poder trabajar con componentes es necesario referir los vectores a alguna base. Es
natural que los vectores ~r y d~r
dt estén referidos a la base {~ e1 , ~e2 , ~e3 } de vectores unitarios a
lo largo de sus ejes, mientras que los vectores ~r ′ y ~v ′ estén referidos a la base {~e1′ , ~e2′ , ~e3′ } de
vectores unitarios a lo largo de sus propios ejes.
Los vectores {~ei }, (i = 1, 2, 3) están en reposo respecto del sistema S, pero el sistema de
referencia S ′ se puede mover arbitrariamente, de manera que ~ei′ (i = 1, 2, 3) dependen del
tiempo.
Si descomponemos ~r ′ (t) en la base móvil ~r ′ (t) = x(t)~e1 (t) + y(t)~e2 (t) + z(t)~e3 (t) y derivamos
d~r ′ d~e ′ d~e ′ d~e ′
= ẋ ′~e1′ + ẏ ′~e2′ + ż ′~ez′ + x ′ 1 + y ′ 2 + z ′ z (2)
dt dt dt dt

1
La velocidad de la partı́cula respecto de S ′ es

~v ′ = ẋ ′~e1′ + ẏ ′~e2′ + ż ′~ez′ .

En particular, si x ′ , y ′ , z ′ son constantes, la partı́cula está en reposo respecto de S ′ , por lo


r′
que su velocidad respecto de S ′ deber ser cero, pero d~ dt 6= 0 no se anula en general.

Debemos calcular las derivadas de los vectores ~ei′ respecto del tiempo.
~ que une dos puntos fijos cuales-
En el capı́tulo de sólido rı́gido, se demostró que un vector A
quiera de un sólido rı́gido tiene velocidad

~
dA ~
~ × A,

dt
donde ω
~ es la velocidad angular de rotación del sólido rı́gido.

El sistema inercial S ′ es rı́gido, por lo que podemos usar esta expresión. Los vectores de la
base {~e1′ , ~e2′ , ~e3′ } unen dos puntos fijos de S ′ , por lo que

d~ei′
~ × ~ei′

dt
y, por lo tanto,

d~e1′ d~e ′ d~e ′


x′ + y′ 1 + z′ 1 = ω~ × (x ′~e1′ + y ′~e2′ + z ′~e3 ) = ω
~ × ~r ′
dt dt dt

Sustituyendo en (2) y en (1) obtenemos


~ + ~v ′ + ω~ ′ × ~r ′
~v = V

que también podemos escribir

d~r ~
dR d~r ′
= + ~ × ~r ′ .

dt S dt dt S′
S

Es decir, la velocidad de la partı́cula respecto de S es la suma de su velocidad de S ′ respecto


de S, más la velocidad de la partı́cula respecto de S ′ , más una velocidad debida al movimiento
de los ejes de S ′ respecto de los de S.

Definimos la velocidad de arrastre como la velocidad que tiene una partı́cula en reposo
respecto de S ′ . Es decir
~ +ω
~va = V ~ × ~r ′ .

4.3 Ley de transformación de la aceleración.

2
El argumento anterior que nos ha permitido obtener

d~r ′ d~r ′
= ~ × ~r ′

dt S dt S′

~
es igualmente valido para cualquier vector A(t). Tenemos pues la siguiente relación entre
derivadas respecto del tiempo en S y en S ′

dA dA ~
= ~ × A.

dt S dt S′

Si derivamos
d~r ~
dR
= + ~v ′ + ω
~ × ~r ′
dt S dt
S
respecto del tiempo, obtenemos

d2~r ~
d2 R d~v ′ d~
ω d~r ′
= + + × ~r ′ + ω
~× (3)
dt2 S dt 2 dt S dt S dt S
S

d~v ′
El vector dt S no es la aceleración de la partı́cula respecto del sistema no inercial, puesto
que la derivada está tomada desde el punto de vista de S y no desde S ′ . Tenemos

d~v ′ d~v ′
= ~ × ~v ′ .

dt S dt S′

Por otro lado, ya sabemos


d~r ′
= ~v ′ + ω
~ × ~r ′ .
dt S

En cuanto a la derivada respecto del tiempo de la velocidad angular

d~
ω d~
ω d~
ω
= ~ ×ω
+ω ~ = ~˙
:= ω
dt S dt S′ dt S′

~ es independiente de si se calcula respecto de S o respecto de S ′ .


Es decir, la derivada de ω

Sustituyendo las tres expresiones en (3):

d2~r ~
d2 R d~v ′ 
= + +ω ~˙ × ~r ′ + ω
~ × ~v ′ + ω ~ × ~v ′ + ω
~ × ~r ′
dt2 S dt 2 dt S′
S

Reorganizando obtenemos la relación entre las aceleraciones de una partı́cula respecto de un


sistema de referencia inercial S y otro acelerado S ′

d2~r ~
d2 R d~v ′ 
= + ω × ~v ′ + ω
+ 2~ ~× ω ~˙ × ~r ′ .
~ × ~r ′ + ω
dt2 S dt 2 dt S′
S

3
Los distintos términos tienen los siguientes nombres e interpretación
d2 ~
r
• ~a := dt2 S
es la aceleración de la partı́cula respecto del sistema de referencia inercial.
También se denomina aceleración absoluta y se acostumbra a denominar ~a.
~
d2 R
• dt2 S
es la aceleración absoluta del origen O ′ del sistema de referencia no inercial. Su
~
d2 R
opuesta − dt2 S
se denomina aceleración de arrastre (la razón del cambio se signo
se entenderá más adelante).
d~v ′
• ~a ′ := ′
dt S ′ es la aceleración de la partı́cula relativa a S . La denotaremos por ~a ′ .
• ω ×~v ′ se denomina aceleración de Coriolis. Es siempre perpendicular a
−2~ la velocidad
de la partı́cula respecto del sistema S ′.
Notemos que se anula en tres casos: 1) cuando
la partı́cula está en reposo en el sistema de referencia S ′ , 2) cuando S ′ no rota respecto
de S, 3) cuando la partı́cula se mueve (respecto de S ′ ) a lo largo del eje de giro del
sistema de referencia. Notemos las similitudes que tiene con la parte magnética de la
fuerza de Lorentz del electromagnetismo. La velocidad angular juega el papel del campo
magnético.
• −~ ω × ~r ′ ) se denomina aceleración centrı́fuga. A partir de la siguiente figura
ω × (~

ω
~

~ × ~r ′
ω

ω × ~r ′ )
ω × (~
-~
~r ′

observamos que este vector apunta desde la posición de la partı́cula hacia fuera deje de
giro del sistema no inercial y tiene módulo ω 2 ρ, donde ρ es la distancia entre el punto
donde está la partı́cula y el eje de giro del sistema no inercial.
• −ω~˙ ×~r ′ se denomina aceleración azimutal. Es debida a las variaciones de la velocidad
angular, tanto en módulo como en dirección.

Es importante darse cuenta de que esta relación entre aceleraciones es un igualdad vectorial,
es decir todavı́a podemos referir los vectores que aparecen a cualquier base, tanto la {~ei } del
sistema S, como la {~ei′ } del sistema S ′ , como cualquier otra si resulta conveniente.

4.4 Segunda Ley de Newton en un sistema de referencia no inercial.

4
Sabemos que las leyes de Newton F~ = m~a son válidas en sistemas de referencia inerciales.

Si queremos estudiar un sistema mecánico con respecto a un sistema de referencia no inercial,


debemos obtener primero las ecuaciones de la dinámica que relacionen las fuerzas con la
trayectoria.

Si aislamos ~a ′ en la relación entre aceleraciones y multiplicamos por la masa

~
d2 R 
m~a ′ = m~a − m ω × ~v ′ − m~
− 2m~ ~˙ × ~r ′ .
~ × ~r ′ − mω
ω× ω
dt2
S

Usando la segunda ley de Newton F~ = m~a obtenemos el Teorema de Coriolis:

~
d2 R 
m~a ′ = F~ − m 2 ω × ~v ′ − m~
− 2m~ ~˙ × ~r ′ .
~ × ~r ′ − mω
ω× ω
dt
S

Para que el sistema S ′ pueda usar la segunda ley de Newton debe añadir a las fuerzas aplicadas
un conjunto de fuerzas denominadas de inercia que aparecen por el hecho de que S ′ es un
sistema acelerado. Para el sistema de referencia S ′ , las fuerzas de inercia son tan reales como
las aplicadas. Conviene evitar llamar a las fuerzas de inercia, fuerzas ficticias puesto que esto
da una idea equivocada de su naturaleza.

La fuerzas de inercia son las siguientes


2~
• −m ddtR2 es la fuerza de arrastre. Aparece siempre que el origen del sistema S ′
S
esté acelerado.
• −2m~ ω × ~v ′ el la fuerza de Coriolis. Su forma es análoga a la fuerza magnética, con
las sustituciones q → m y B ~ →ω~
• −m~ ω × (~ ω × ~r ′ ) es la fuerza centrı́fuga. Su magnitud varı́a como el cuadrado de la
distancia al eje de rotación del sistema S ′
• −mω ~˙ × ~r ′ es la fuerza azimutal.

Notemos que todas estas fuerzas son proporcionales a la masa de la partı́cula. En este sentido
son análogas a las fuerzas gravitatorias, que también poseen esta propiedad. Esta analogı́a
formal resulta ser mucho más profunda de lo que parece y constituye la base fundamental de
la Relatividad General.

La fuerza centrı́fuga en particular es fuente de muchas confusiones. Debe incluirse siempre


que estemos en un sistema no inercial, pero nunca cuando escribimos las ecuaciones en un
sistema inercial. En sistemas inerciales, esta fuerza simplemente no existe.

5
4.5 Ejemplos.
Ejemplo 1.

Consideremos un tiovivo que gira con velocidad angular constantes ω. Si escogemos los ejes
como en la figura
~ey

~ex′

~ey′ ~v ′

ωt
~ex

~ apunta hacia el sentido positivo del eje z (o el z ′ , que es el mismo).


ω

Supongamos que una partı́cula que se mueve radialmente hacia el centro con velocidad cons-
tante respecto del tiovivo (pensemos en un cobrador que camina sobre el tiovivo directamente
hacia una cabina central a velocidad constante).

Su aceleración en el sistema de referencia del tiovivo es cero, ~a ′ = 0.


~
Dado que R(t) ~˙ = 0, el sistema S ′ escribirá la siguiente segunda ley de Newton
= 0 y que ω
de la siguiente manera

m~a ′ = F~ − m~ ω× ω~ × ~r ′ − 2m~ ω × ~v ′ .

F~ es la fuerza aplicada sobre la partı́cula. La única fuerza de este tipo que recibe es la ejercida
por el suelo y la fuerza de la gravedad.

La fuerza centrı́fuga apunta radialmente hacia fuera y tiene módulo mω 2 r ′ .

La fuerza de Coriolis −2m~ω × v~′ . Como ~v ′ es radial hacia dentro, este fuerza tiene módulo
2mωv ′ y apunta hacia la derecha del movimiento.

Supongamos que queremos saber qúe fuerza F~p hace la partı́cula sobre el suelo. Por la tercera
ley de Newton, esta fuerza es la opuesta a la fuerza que hace el suelo sobre la partı́cula Fs ,
de decir F~p = −F~s .

Si usamos una base de vectores en coordenadas cilı́ncricas tenemos que la fuerza de la gravedad
es F~g = −mg~ez ′ , la fuierza centrı́fuga es mωρ ′2~eρ′ y la fuerza de Corilis es mωv ′~eφ ′ .

6
La segunda ley de Newton proporciona

0 = F~s − mg~ez ,′ + mωρ ′2~eρ′ + mωv ′~eφ ′ .

Por lo tanto la fuerza que hace la partı́cula es

F~p = −mg~ez ,′ + mωρ ′2~eρ′ + mωv ′~eφ ′ .

Ademas de la fuerza vertical habitual, debe hacer una fuerza con los pies hacia fuera (para
contrarestar la fuerza centrı́fuga) y otra hace la derecha del moviminiento (para contrarrestar
la fuerza de Coriolis).

Ejemplo 2. Cubo de Newton

Consideremos un cubo lleno de agua que gira con velocidad angular constante alrededor de
la vertical. Queremos saber cual es la forma de la superficie del agua.

El agua está en reposo respecto del cubo, por lo que cualquier elemento de volumen del agua
tiene ~r ′ constante con respecto al sistema de referencia ligado al cubo. En consecuencia la
aceleración relativa ~a ′ = 0. Usando la segunda ley de Newton en el sistema del cubo tenemos

0 = m~a ′ = F~app − m~ ω × ~r ′ ),
ω × (~

donde m es la masa del elemento de volumen. La fuerza de Coriolis se anula porque el elemento
de volumen está en reposo. La fuerza de arrastre se anula porque el origen del sistema de
referencia del cubo está en reposo (respecto del suelo) y la fuerza azimutal se anula porque
la velocidad angular es constante.

Para un elemento en la superficie del cubo las fuerzas aplicadas son la gravedad F~g = m~g =
−mg~ez (quitamos las primas al sistema de referencia no inercial por simplicidad) y la fuerza
debida a la presión que ejerce el resto del fluido Fp

La fuerza de presión es necesariamente perpendicular a la superficie del fluido. Si llamamos


~n al vector normal a la superficie del fluido tenemos F~p = Fp~n
ω
~
~n

d~r

7
Sabemos que la fuerza centrı́fuga apunta en la dirección radial hacia afuera del eje de rotación.
Por lo tanto, si usamos coordenadas cilı́ndricas ligadas al cubo

−m~ ω × ~r ′ ) = mω 2 ρ~eρ
ω × (~

La segunda ley de Newton proporciona

−mg~ez + Fp~n + mω 2 ρ~eρ = 0 (4)

A priori no conocemos el valor de Fp ni tampoco la dirección normal ~n.

Sea d~r un vector radial y tangente a la superficie. Descomponiendo en la base cilı́ndrica

d~r = dρ~eρ + dz~ez (5)

Multiplicamos (4) por (5) y usamos que ~n · d~r = 0 (~n es perpendicular a la superficie del
cubo).
−mgdz + mω 2 ρdρ = 0

Esta relación proporciona una ecuación diferencial para la forma de la superficie del cubo
descrita por z(ρ). Dividiendo por dρ
dz ω2
= ρ
dρ g
e integrando
ω2 2
z = z0 + ρ .
2g

La forma de la superficie es un paraboloide (que se convierte en un plano cuando ω = 0, tal


y como debe ocurrir).

4.6 Sistema Laboratorio Terrestre.

Consideremos un punto de colatitud θ sobre la superficie de la Tierra y construyamos un


sistema de referencia cartesiano S ′ en ese punto con el eje z ′ a lo largo de la vertical, el eje
x ′ apuntando hacia el este y el eje y ′ apuntando hacia el norte.

Consideremos otro sistema de referencia S con origen en el centro de la Tierra y con eje z
apuntando hacia el Polo Norte y que no gire respecto de las estrellas lejanas.

Aunque el centro de la Tierra tiene un movimiento acelerado (la Tierra gira alrededor del Sol
y este está acelerado respecto del centro de la Galaxia, etc.), su aceleración es muy pequeña,
comparada con las aceleraciones que tiene el punto O ′ debidas a la rotación de la Tierra.

Para experimentos de duración suficientemente corta (por ejemplo, dı́as), podemos considerar
que el sistema de referencia S es inercial.

El sistema de referencia S ′ está ligado a la Tierra, por lo que gira con la misma velocidad
angular que ésta.

8
ω
~

~ey′ ~e′z

~ez ~ex′

θ ~
R

~ey
~ex

La Tierra gira alrededor del eje z con velocidad angular constante ω. El valor de ω es
2π 2π
ω= = = 7, 2710−5 s−1 .
Trot 1 dı́a

Si expresamos el vector ~ez en la base del sistema S ′ tenemos, de la figura anterior,



~ = ω sin θ~ey′ + cos θ~ez′ .
ω

El origen O ′ del sistema S ′ se mueve respecto del sistema S. Como está fijo sobre la Tierra,
~ respecto de O tiene velocidad
su vector de posición R

~
dR ~
~ × R.

dt
S

La aceleración de arrastre es, por lo tanto,

~
d2 R ~
dR

=ω ~ × (~
=ω ~
ω × R).
dt2 dt
S S

En consecuencia la segunda Ley de Newton en el sistema S ′ (denominado del laboratorio),


es
m~a ′ = F~ − m~
ω × (~ ~ − m~
ω × R) ω × (~ω × ~r ′ ) − 2m~
ω × ~v ′ .
~
Si ~r ′ es de tamaño tı́pico de un sistema en la Tierra, tenemos que |~r ′ | << RT , donde RT = |R|
es el radio de la Tierra, y podemos despreciar ω ~ × (~ ′
ω × ~r ) frente a ω ~ × (~ ~
ω × R).

9
La segunda ley de Newton en el laboratorio es, por lo tanto,

m~a ′ = F~ − m~
ω × (~ ~ − 2m~
ω × R) ω × ~v ′ .

~ = RT ~ez′ , podemos calcular −m~


Como R ω × (~
ω × R):~

~ ×R
ω ~ = RT ω sin θ~ey′ + cos θ~ez′ × ~ez′ = RT ω sin θ~ex′ ,
   
−m~ω× ω ~ ×R~ = −mRT ω 2 sin θ~ey′ + cos θ~ez′ × sin θ~ex′ = mRT ω 2 sin θ − cos θ~ey′ + sin θ~ez′

La fuerza de arrastre tiene una componente radial hacia fuerza de magnitud mRT ω 2 sin2 θ, y
una componente hacia el sur (si estamos en el hemisferio norte) de magnitud mRT ω 2 sin θ cos θ.
Si estamos en el hemisferio sur (θ > π/2), la componente horizontal de la fuerza de arrastre
apunta hacia el norte.

La fuerza de arrastre es sentida por todos los cuerpos de manera independiente a su velocidad
o a su posición y con magnitud proporcional a su masa.

Es una fuerza que, desde el punto de vista del laboratorio es completamente indistinguible
de la fuerza de la gravedad, que también es constante (para distancias terrestres tı́picas) y
proporcional a la masa. Tenemos por lo tanto una gravedad efectiva que vale

~gef = −g~ez′ + RT ω 2 sin θ sin θ~ez′ − cos θ~ey′ .

En particular, si colgamos una plomada la dirección en la que quedará en reposo no es la


dirección radial hacia afuera, sino en la dirección de la gravedad efectiva. Esta es la dirección
que sentimos como vertical. En particular la dirección en la que las paredes están construidas.

En resumen, la dirección vertical y la dirección radial no son la misma.

El radio de la Tierra es RT = 6400Km, por lo que RT ω 2 = 3,39 × 10−2 m/s2 . Es una magnitud
pequeña frente a g = 9,8 m/s2 , pero no despreciable.

El módulo de la gravedad efectiva es


q
gef = (g − RT ω 2 sin2 θ)2 + RT2 ω 4 sin2 θ cos2 θ ≈ g − RT ω 2 sin2 θ

Es mı́nima cuando sin θ = 1 (θ = π/2), es decir en el Ecuador. Es máxima en los Polos


(θ = 0).

Esta es la razón por la que los lanzamientos espaciales siempre se realizan desde puntos
cercanos al Ecuador (deben vencer una gravedad menor).

La diferencia de gravedad efectiva en el Polo y en el Ecuador debida a la fuerza de arrastre es


RT ω 2 = 3,39 cm/s. La diferencia medida entre ambas gravedades es 5,22 cm/s. La fuerza de
arrastre explica 2/3 de la diferencia. El resto es debida a que la Tierra no es perfectamente
esférica y los Polos están más cerca del centro de la Tierra que el Ecuador.

El hecho de que la Tierra no sea perfectamente esférica es otra consecuencia de la presencia


de la fuerza de arrastre, es decir por la rotación de la Tierra.

10
En resumen, podemos escribir la segunda Ley de Newton en el laboratorio como

m~a ′ = F~ − m~gef − 2m~


ω × ~v ′ ,

donde F~ son todas las fuerzas aplicadas excepto la gravedad.

La dirección radial y la vertical son muy parecidas (en la latitud de Salamanca, el techo de un
edificio de 100 metros está desplazado 17 cm respecto de la dirección radial de la Tierra). Por
lo tanto, en la mayor parte de los casos, podemos simplemente identificar ambas direcciones
y escribir ~gef = −gef ~ez′ .

Cuando se trabaja en el sistema de laboratorio, sin referencia a ningún otro sistema de refe-
rencia se pueden ignorar todas las primas y escribir las coordenadas del sistema de referencia
como {x, y, z} y la base como {~ex , ~ey , ~ez }.

Efecto de la fuerza de Coriolis:

Consideremos un cuerpo que cae libremente desde un altura h.

En el sistema de referencia {x, y, z} del laboratorio terrestre, la posición inicial es x0 = y0 = 0,


z0 = h y ẋ0 = ẏ0 = ż0 = 0.

Despreciando la diferencia entre dirección radial y vertical, la ley de Newton toma la forma

m~a = −mgef ~ez − 2m~


ω × ~v .

En componentes

~ × ~v = ω (sin θ~ey + cos θ~ez ) × (ẋ~ex + ẏ~ey + ż~ez )


ω
h i
= ω (ż sin θ − ẏ cos θ)~ex + ẋ cos θ~ey − ẋ sin θ~ez

La segunda ley en componentes toma la forma



ẍ = 2ω (ẏ cos θ − ż sin θ) 
ÿ = −2ω ẋ cos θ .

z̈ = −gef + 2ω ẋ sin θ

Podemos integrar una vez, y usando las condiciones iniciales



ẋ = 2ωy cos θ + 2ω(h − z) sin θ 
ẏ = −2ωx cos θ .

ż = −gef t + 2ωx sin θ

Es un sistema de ecuaciones lineal inhomogéneo. Se puede integrar completamente, pero


resulta algo largo.

11
Por otro lado, la ecuación en el caso ω = 0 es muy sencilla de integrar. ¿Podemos obtener
la solución de forma perturbativa en ω?. Es decir, podemos buscar una solución del tipo
siguiente?

x(t) = x0 (t) + ωx1 (t) + O(ω 2 ) 
y(t) = y0 (t) + ωy1 (t) + O(ω 2 )

z(t) = z0 (t) + ωz1 (t) + O(ω 2 )

donde la dependencia en ω es explı́cita. Si sustituimos en el sistema de ecuaciones e igualamos


potencias iguales de ω obtenemos:

A orden ω 0 (orden cero)


 
ẋ0 = 0  x0 (t) = 0 
ẏ0 = 0 =⇒ y0 (t) = 0
 
ż0 = −gef t z0 (t) = h − 21 gef t2

que es el movimiento de caı́da obtenido habitualmente (cuando se ignora el efecto de rotación


de la Tierra).

Si nos quedamos con las potencias ω 1 (orden 1)


 
ω ẋ1 = 2ωy0 cos θ + 2ω(h − z0 ) sin θ  ẋ1 = gef t2 sin θ 
ω ẏ1 = −2ωx0 cos θ =⇒ ẏ1 = 0 =⇒
 
ω ż1 = 2ωx0 sin θ ż1 = 0

x1 (t) = 31 gef t3 sin θ 
y1 (t) = 0 .

z1 (t) = 0

Aquı́ hemos impuesto los datos iniciales x1 (0) = y1 (0) = z1 (0), por que la posición inicial ya
se ha usado en el orden cero.

La solución obtenida es

x(t) = 13 ωgef t3 sin θ 
y(t) = 0 + O(ω 2 ).
1 2 
z(t) = h − 2 gef t
q
2h
A primer orden en ω, cuando el objeto llega al suelo (z = 0, es decir t = gef ), se ha
desplazado hacia el este una cantidad
 3
1 2h 2
D = ωgef sin θ
3 gef

Si h = 100m y estamos a colatitud θ = 45o se tiene D = 1,5 cm. El objeto no cae sobre su
propia vertical.

Podemos interpretar esta desviación si observamos el movimiento desde el sistema inercial


del centro de la Tierra:

12
• La partı́cula esta inicialmente en reposo respecto de la Tierra, por lo que gira con su
misma velocidad angular.
• Su velocidad lineal es mayor que la del suelo, porque se encuentra en un punto más
alejado del eje de rotación.
• A medida que cae hacia el centro de la Tierra, en su movimiento avanza al punto sobre
el que estaba (puesto que se movı́a con mayor velocidad horizontal). Por lo tanto se
desplaza hacia el este.

Fuerza de Coriolis en movimientos horizontales:

Consideremos un movimiento horizontal z(t) = const. Como ż = 0, la fuerza de Coriolis es


h i
F~cor = −2mω (ż sin θ − ẏ cos θ) ~ex + ẋ cos θ~ey − ẋ sin θ~ez
= 2mω cos θ (ẏ~ex − ẋ~ey ) + 2mω sin θẋ~ez .

La componente vertical de esta fuerza es mucho más que pequeña que la de la gravedad
efectiva mgef (para velocidades tı́picas terrestres).

La componente horizontal es perpendicular a la velocidad ẋ~ex +ẏ~ey . Tiene módulo 2mωv| cos θ|
y va dirigida hacia la derecha del movimiento si 0 ≤ θ < π2 (hemisferio norte) o hacia la
izquierda del movimiento si π2 < θ ≤ 0 (hemisferio sur)

Péndulo de Foucault:

La fuerza de Coriolis es la responsable de que un péndulo sobre la Tierra no oscile en un


plano fijo (respecto del sistema del laboratorio).

El movimiento del grave es aproximadamente horizontal (para ángulos de oscilación pequeños,


cosa que supondremos a partir de ahora).

La fuerza de Coriolis es hacia la derecha del movimiento en el hemisferio norte.

El desplazamiento se va acumulando porque tanto cuando va como cuando vuelve el despla-


zamiento hace que el plano del péndulo gire en el mismo sentido.

Vamos a hacer un estudio cuantitativo del péndulo de Foucault de longitud l mediante la ley
de Newton en el sistema el laboratorio.

Las fuerzas aplicadas sobre el grave son la tensión de la cuerda T~ y la fuerza de la gravedad
efectiva.

La ley de Newton es
m~r¨ = T~ + ~gef − 2m~
ω × ~r˙

Si usamos la base de vectores cilı́ndrica tenemos, que cuando el péndulo está desplazado un
ángulo α respecto de la vertical

T~ = T cos α~ez − T sin α~eρ

13
α
l

T~

m~g

Recordemos que el vector radial ~eρ se puede descomponer como


x y
~eρ = cos φ~ex + sin φ~ey = ~ex + ~ey
ρ ρ

Por lo tanto
sin α T
T~ = T cos α~ez − T (x~ex + y~ey ) = T cos α~ez − (x~ex + y~ey )
ρ l
donde hemos usado que l sin α = ρ.

La relación entre α y la coordenada z es z = l(1 − cos α). Si los ángulos de desplazamiento


2
son pequeños podemos quedarnos a primer orden en α. Como cos α = 1 − α2 + · · · = 1 a este
nivel de aproximación y tenemos z(t) = 0 (movimiento plano) y

T
T~ = T ~ez − (x~ex + y~ey ) .
l

Para un movimiento plano la fuerza de Coriolis sabemos que vale F~cor = 2mω cos θ (ẏ~ex − ẋ~ey )+
2mω sin θẋ~ez

Las distintas componentes de la segunda ley de Newton son



mẍ = − Tl x + 2mω cos θẏ 
mÿ = − Tl y − 2mω cos θẋ

0 = mz̈ = T − mgef + 2mω sin θẋ

14
La tercera ecuación determina T = m (gef − 2ω sin θẋ).

En un péndulo la velocidad máxima ocurre cuando el péndulo pasa q por la vertical. Si la


amplitud del movimiento es A, esta velocidad máxima es vmax = A gl . Para el péndulo en el
atrio de nuestro edificio tenemos l = 14m y A = 2m. La velocidad máxima es vmax = 1,7m/s.
Por lo tanto
2ω sin θ ẋ ≈ 2 × 10−4 m/s2 << gef ≈ 9,8 m/s2

Podemos despreciar 2ω sin θẋ frente a gef y obtenemos T = mgef con lo que las ecuaciones
en el plano {x, y} quedan
mg 
(∗) mẍ = − l ef x + 2mω cos θẏ
mg
(∗∗) mÿ = − l ef y − 2mω cos θẋ

Es un sistema de ecuaciones lineal y homogéneo. Se puede integrar explı́citamente. Resulta


más rápido introducir una variable compleja auxiliar ξ = x + iy.

Si calculamos (∗) + i(∗∗) vemos que la ecuación que queda se puede escribir en términos de
ξ como
gef
ξ¨ + 2iω cos θξ˙ + ξ=0
l
Definamos dos frecuencias caracterı́sticas para el péndulo de Foucault
r
gef
Ω := ω cos θ, ω0 := .
l

Ω solamente depende de la localización del péndulo. ω0 es la frecuencia angular de oscilación


del péndulo cuando ignoramos el efecto de rotación de la Tierra.

La ecuación diferencial es
ξ¨ + 2iΩξ˙ + ω02 ξ = 0

Buscamos soluciones oscilatorias ξ = eipt . Sustituyendo en la ecuación diferencial


q
−p2 − 2Ωp + ω02 = 0, p = −Ω ∓ Ω2 + ω02
p
Si llamamos ω1 = Ω2 + ω02 tenemos que p = −Ω ∓ ω1 y la solución a la ecuación diferencial
es (usando linealidad)
ξ = ae−i(Ω+ω1 )t + be−i(Ω−ω1 )t
donde a, b son constantes arbitrarias.

Si escribimos a = 12 (A − B)e−i(α+β) y b = 12 (A + B)e−i(α−β) con A, B, α y β reales


1 1
ξ = (A − B)e−i[(Ωt+α+ω1 t+β] + (A + B)e−i[Ωt+α−(ω1 t+β)]
2 2

Usando las fórmulas eiu + e−iu = 2 cos u y eiu − e−iu = 2i sin u podemos rescribir ξ como

ξ = e−i(Ωt+α) (A cos (ω1 t + β) + iB sin (ω1 t + β))

15
Tomando parte real y parte imaginaria obtenemos directamente

x(t) = A cos (Ωt + α) cos (ω1 t + β) + B sin (Ωt + α) sin (ω1 t + β)
,
y(t) = −A sin (Ωt + α) cos (ω1 t + β) + B cos (Ωt + α) sin (ω1 t + β)

que podemos reescribir en forma matricial como


    
x(t) cos(Ωt + α) sin(Ωt + α) A cos(ω1 t + β)
= .
y(t) − sin(Ωt + α) cos(Ωt + α) B sin(ω1 t + β)

La parte x = A cos(ω1 t), y(t) = B sin(ω1 t) es una elipse de semiejes A, B recorrida con
velocidad angular de giro constante ω1 ( y periodo t = ω2π1 )

La matriz cuadrada anterior es un rotación con respecto al eje vertical con velocidad angular
de rotación Ω = ω cos θ y cuyo sentido de giro es el de las agujas del reloj en el hemisferio
norte (cos θ > 0) y en sentido contrario a las agujas del reloj en le hemisferio sur (cos θ < 0).

La órbita es por lo tanto una elipse que precesa con velocidad angular Ω. El tiempo que tarda
2π 2π
en dar una vuelta completa es T = |Ω| = ω| cos θ|

En el Polo Norte θ = 0 o Polo Sur θ = π, el periodo en dar una vuelta es un dı́a. En el


Ecuador, el periodo es T = ∞, es decir no hay precesión en absoluto.

A la colatitud de Salamanca θ = 49o el periodo de precesión del péndulo es T = 36,6 horas.

Si B = 0, la elipse se convierte en una recta que gira alrededor de la vertical. Este es el movi-
miento cuando el péndulo parte del reposo (el que observamos normalmente en los péndulos
de Foucault).
2π 2π
El periodo de oscilación del péndulo es T = ω1 =√ . Es distinto al periodo natural del
ω02 +Ω2
péndulo T0 = ω2π0 . No obstante para un péndulo como el del patio, l = 14 m, la modificación
es despreciable ω1 = ω0 (1 + 1, 6 × 10−9 )

16
Tema 5. Relatividad Especial
5.1 La mecánica clásica y la electrodinámica a finales del siglo XIX.

A finales del siglo XIX habı́a dos teorı́as fı́sicas fundamentales, la mecánica y el electromag-
netismo. Ambas teorı́as estaban bien contrastadas experimentalmente y tenı́an propiedades
muy distintas.

Por un lado la Mecánica, basada en las leyes de Newton satisfacı́a el principio de relatividad
de Galileo que establece que todos los sistemas de referencia inerciales son equivalentes desde
un punto de vista mecánico. En otras palabras, no es posible distinguir mediante experimentos
puramente mecánicos si el sistema de referencia se encuentra en reposo o en movimiento
rectilı́neo y uniforme. Ante esta imposibilidad, para la mecánica no existe un espacio absoluto
con el que podamos comparar para saber si nos encontramos en reposo o en movimiento.

Por otro lado, en Mecánica sı́ existe un tiempo absoluto que transcurre de la misma manera
independientemente del sistema de referencia que usemos para describir la fı́sica.

Notemos que un sistema de referencia acelerado sı́ puede ser distinguido de uno inercial. Basta
dejar una partı́cula sobre la que no actúe ninguna interacción. Como el sistema está acelerado,
la partı́cula describirá un movimiento acelerado y el primer principio de la mecánica no
tendrá validez.

Recordemos que dos sistemas de referencia inerciales S y S ′ se mueven con velocidad relativa
constante. Si denominamos ~v a la velocidad de S ′ respecto de S, el vector de posición ~r′ de
un punto en un instante de tiempo t visto desde S ′ se relaciona con el vector de posición ~r del
mismo punto en el mismo instante visto desde S mediante la denominada transformación
de Galileo
~r′ = ~r − (~v t + ~r0 ) , (1)
donde ~r0 es el vector de posición del origen de S ′ con respecto a S en el instante de tiempo
t = 0.

Aunque casi nunca se escribe explı́citamente, la transformación de Galileo incluye la ley de


transformación del tiempo. Como en Mecánica clásica el tiempo es absoluto, la transformación
es simplemente
t′ = t (2)
que simplemente dice que ambos sistemas de referencia miden el tiempo exactamente de la
misma manera.

Por otro lado, las ecuaciones fundamentales del electromagnetismo son las ecuaciones de
Maxwell, que el el vacı́o toman la forma
)
∇·B ~ = 0, ∇×E ~ + ∂ B~ = 0
∂t
∇·E ~ = 1 ρ, ∇×B ~ − µ0 ǫ0 ∂ E~ = µ0~j
ǫ0 ∂t

~ B
donde E, ~ son el campo eléctrico y magnético, ǫ0 es la permitividad eléctrica, µ0 es la
permeabilidad magnética, ρ la densidad de carga y ~j la corriente eléctrica.

1
Una de las consecuencias fundamentales de estas ecuaciones es que los campos eléctricos y
magnéticos se propagan como una onda con velocidad
1
c= √ = 3 · 108 m/s2 (3)
µ0 ǫ 0

En efecto, tomando la derivada respecto del tiempo en la última ecuación y sustituyendo la


segunda llegamos a la ecuación de ondas

∂2E~
~ − µ0 ǫ 0
∆E =0 (4)
∂t 2

donde ∆ es el Laplaciano ∇ · ∇.

Es natural preguntarse en qué sistema de referencia son válidas las ecuaciones de Maxwell.
Según la relatividad Galileana, si una onda se propaga a velocidad ~c en un sistema de referencia
inercial S, entonces propaga a velocidad ~c − ~v en un sistema de referencia S ′ que se mueva
con velocidad ~v respecto del anterior.

Esto implica que las ecuaciones de Maxwell son válidas únicamente en un sistema de referencia
inercial. Este sistema de referencia era conocido como sistema de referencia del éter.
Para la fı́sica del siglo XIX este hecho era de lo más razonable puesto que todas las ondas
necesitaban un medio por el que propagarse. Las ondas eran simplemente la vibraciones de
ese medio que se transmitı́an a través de él, de manera análoga a las olas del mar o las ondas
de sonido, donde los medios son respectivamente el agua y el aire.

No obstante el éter era un medio con propiedades muy extremas. Por un lado debı́a ser
extremadamente rı́gido para poder tener una velocidad de propagación tan alta (pensemos
en el sonido que se propaga más rápido en medios sólidos que en medios lı́quidos y en éstos
más rápido que en el aire; o en ondas en una cuerda, donde la velocidad de propagación de
proporcional a la raı́z cuadrada de la tensión de la cuerda). Por otro lado, el éter debı́a ser
muy sutil (de ahı́ la palabra etéreo) para que, por un lado, ocupara todo el espacio (la luz
se propaga por todas partes) y por otro lado no interfiera en el movimiento de los objetos.
Por ejemplo el movimiento de los planetas alrededor del Sol se explicaban con muchı́sima
precisión a partir de las leyes de la gravitación universal de Newton y no habı́a ningún efecto
perceptible de éter.

A pesar de estas propiedades peculiares, la casi totalidad de los fı́sicos del siglo XIX aceptaba
sin inconveniente que el éter era necesario y que existı́a en la realidad.

La existencia de un sistema de referencia privilegiado para las ecuaciones de Maxwell implica-


ba que el experimentos electromagnéticos realizados en sistemas de referencia en movimiento
respecto del éter a velocidad v, debı́an existir efectos que dependieran del cociente vc . Median-
te estos experimentos debı́a ser posible medir la velocidad del sistema de referencia respecto
del éter. Este tipo de experimentos permitirı́a además demostrar la existencia del propio éter.

El experimento más famoso para medir esta velocidad es la experimento de Michelson reali-
zado en 1881 y su versión mejorada llevada a cabo por Michelson y Morley en 1887.

5.2 Experimento de Michelson-Morley.

2
Este experimento consiste en un interferómetro que está fijo en el laboratorio. Como la Tierra
se mueve en el espacio a una cierta velocidad v respecto del éter, la distinta velocidad de
propagación en distintas direcciones hará que los caminos ópticos de las trayectorias del rayo
de luz en cada brazo sean distintos, y esto producirá franjas de interferencia en el detector.

Vamos a suponer por simplicidad que la velocidad ~v es paralela a uno de los brazos del
interferómetro y vamos a suponer que los dos brazos del interferómetro tienen exactamente la
misma longitud L. En realidad es imposible garantizar que los dos brazos tengan exactamente
la misma longitud pero eso se puede arreglar simplemente haciendo que el experimento con
una configuración y después rotando el interferómetro π/2 y observando cómo cambian las
franjas de interferencia.

La velocidad de la luz es c respecto del éter. En el brazo 1 la velocidad de la luz respecto del
interferómetro es c − v cuando la luz va hacia el espejo y c + v cuando vuelve del espejo. El
tiempo que tarda en hacer el recorrido de ida y vuelta es
L L 2cL 2L 1
t1 = + = 2 2
=  . (5)
c+v c−v c −v c 1 − v2
c2

Para el brazo 2 , para conocer la velocidad de la luz respecto del interferómetro podemos
situarnos en el sistema de referencia del éter, que observará el movimiento de la siguiente
manera:
1111
0000
0000
1111 00000
11111
00000
11111 0000
1111
0000
1111
0000
1111 00000
11111 0000
1111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 c
00000000
11111111
0000000
1111111
0
1 00000000
11111111
c 0 v 11111111
0000000
1111111
1 ′ 00000000
00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
00000
11111
0000000
1111111
0
100000
11111
00000
11111 00000
11111
00000000
11111111
00000
11111
00000
11111 v
0000000
1111111
0
1 00000000
11111111
00000
11111 00000
11111
00000000
11111111
00000
11111
0000000
1111111
00000
11111 0
100000
11111 00000
11111
00000000
11111111
0000000
1111111
00000
11111 0
100000
11111 00000
11111
00000000
11111111
00000
11111 00000
11111
00000
11111 00000
11111
00000
11111
00000
11111 00000
11111 00000
11111

La velocidad de la luz respecto del interferómetro es v ′ , que tiene módulo


p
v ′ = c2 − v 2 (6)

tanto en el camino de ida como en el de regreso. El tiempo del recorrido es, por lo tanto
2L 2L 2L 1
t2 = =√ = q . (7)
v′ 2
c −v 2 c 1− v2
c2

Ambos tiempos sin distintos por lo que el patrón de interferencia depende de la velocidad
2
v. El efecto es proporcional a vc2 que es muy pequeño. Si tomamos v como la velocidad de

3
rotación de Tierra tenemos vR = ωR ≈ 0,5 · 103 m/s Por otro lado, la velocidad de traslación
de la Tierra alrededor del Sol es VT ≈ 3 · 104 m/s. Para este último caso
 2
v2 3 · 104
≈ = 10−8 , (8)
c2 3 · 108

que es muy pequeño. No obstante la interferometrı́a es muy precisa y velocidades de este orden
deben ser observables con el dispositivo del experimento de Michelson-Morley. No obstante,
el experimento proporcionó un resultado negativo. El interferómetro se comportaba como si
la velocidad de la luz fuera c en todos las trayectorias a lo largo de los brazos.

Una posible explicación fue propuesta


qpor FitzGerald en 1889 y se basa en que todo objeto
2
sufra una contracción con un factor 1 − vc2 en la dirección de su movimiento respecto del
éter.

Esta idea fue retomada por Lorentz en 1892 y propuso un posible mecanismo fı́sico basado
en la teorı́a de electrones que explicara dicha contracción de longitudes.

A dicha contracción de longitudes se la conoce actualmente como contracción de FitzGerald-


Lorentz (muchas veces simplemente contracción de Lorentz).

Veamos que este efecto explicarı́a la ausencia de franjas de interferencia: El brazo que se
mueve perpendicular a la dirección del movimiento no sufre ninguna contracción de manera
que el tiempo que se tarda en recorrerlo sigue siendo t2 = 2L
c
q 1
2
. Por otro lado, el brazo 1
1− v2
q c
2
se contrae de manera que su longitud pasa a ser L′ = L 1 − vc2 y el tiempo del recorrido es

2L′ 2L 1
t1 =  = q . (9)
2
c 1 − vc2 c 1− v2
c2

Ambos tiempos son iguales por lo que no hay interferencias.

No obstante esta explicación es ad hoc. No hay ninguna base sólida que explique por qué se
produce esa contracción.

Resultaba necesario encontrar una explicación mejor para la ausencia de efectos en el expe-
rimento de Michelson-Morley.

Einstein fue quien dio el paso decisivo para dar esa explicación. Su propuesta estaba basada
en una modificación radical de los conceptos fı́sicos más básicos, el espacio y el tiempo.

Aunque Einstein conocı́a el experimento de Michelson-Morley, su motivación principal no


radicaba en explicar este experimento. A Einstein le resultaba intuitivamente absurdo que
mientras que la Mecánica era incapaz de detectar movimientos absolutos, la electrodinámica
tuviera un sistema en reposo absoluto. Esta simetrı́a resultaba le resultaba muy desagradable.

Einstein consideró que el principio de relatividad (es decir, que todos los sistemas de referencia
inerciales eran equivalentes) estaba por encima de cualquier teorı́a fı́sica

4
Propuso dos postulados, a priori nada radicales, y desarrolló un cuerpo teórico que modificaba
radicalmente muchas de las concepciones de la época y que ha demostrado ser extremadamente
preciso: la teorı́a de la relatividad especial.

5.3 Postulados de Einstein de la relatividad especial.

El primer postulado establece el principio de relatividad.

Principio de relatividad (textual de Einstein) Las mismas leyes de la electrodinámica y la óptica


son válidas en todos los sistemas en los que valen las leyes de la mecánica.

Aceptaremos como punto de partida que las leyes de la mecánica son válidas en todos los
sistemas de referencia inerciales, definidos como aquellos en los que una partı́cula libre se
mueve en lı́nea recta y a velocidad constante.

Por lo tanto, tomamos como principio que las leyes de la electromagnetismo, la óptica y la
mecánica son las mismas en todos los sistemas de referencia inerciales.

El segundo postulado se refiere a la velocidad de la luz y en su versión original de Einstein


dice

Constancia de la velocidad de la luz La luz se propaga en el vacı́o a una velocidad definida c


independiente del estado de movimiento del cuerpo emisor.

Desde el punto de vista de la fı́sica ondulatoria, este postulado es completamente natural.


Las ondas se propagan en un medio y su velocidad de propagación no depende de quien las
emitió. Pensemos en las olas del mar generadas por el movimiento de un barco Su velocidad
de propagación no dependen de la velocidad del barco.

Cada postulado por sı́ mismo es completamente razonable y casi intuitivo. No obstante,
cuando se combinan ambos las consecuencias son sorprendentes y obligan a una revisión de
conceptos básicos de espacio y tiempo.

A los postulados anteriores hay que añadir otros dos que Einstein no hizo explı́citos porque
en la época se consideraban obvios.

Homogeneidad del espacio y del tiempo Todos los puntos del espacio y todos los instantes de
tiempo son equivalentes desde un punto de vista fı́sico.

Isotropı́a del espacio Todas las direcciones del espacio son equivalentes.

En otras palabras: En ausencia de campos externos, ningún proceso fı́sico puede privilegiar
un punto del espacio, un instante de tiempo o una dirección del espacio sobre ningún otro.

Los postulados de la relatividad especial tienen consecuencias sorprendentes. Una de ellas es


que el concepto de simultaneidad no es universal.

Para entender este enunciado es necesario definir primero el concepto de simultaneidad. Em-
pecemos por un concepto todavı́a más básico, el de suceso.

5
Suceso. Un suceso es un fenómeno fı́sico que ocurre en algún lugar del espacio y en algún instante
de tiempo.

Ejemplos de sucesos serı́an el choque con el suelo de un piedra lanzada al aire, la emisión de
un fotón, la colisión entre un palo de golf y la pelota, etc.

El concepto de suceso es una idealización ya que suponemos que el fenómeno fı́sico no tiene
ninguna extensión espacial y ninguna duración temporal. En una idealización similar a la que
hacemos al definir un punto del espacio. En realidad, como un suceso podrı́a en principio
ocurrir en cualquier sitio y en cualquier instante de tiempo, podemos considerar un suceso
simplemente como un punto del espacio en un instante de tiempo.

Sistema de referencia. Un sistema de referencia es un procedimiento fı́sico por el cual asignamos


a cada suceso posible tres coordenadas de espacio, que determinan el punto del espacio donde ocurre
el suceso, y una coordenada de tiempo, que determina en qué instante de tiempo ocurre el suceso.

Además de la hipótesis de homogeneidad e isotropı́a del espacio, la relatividad espacial su-


pone la validez de un quinto postulado (que Einstein tampoco hizo explı́cito puesto que se
consideraba absolutamente obvio) que establece que el espacio es Euclı́deo, que es lo mismo
que decir que el teorema de Pitágoras es válido:
p
La diagonal de un paralelepı́pedo de lados x, y, z tiene longitud l = x2 + y 2 + z 2 .

En estas condiciones, las coordenadas más naturales para el espacio son las coordenadas
cartesianas.

Para medir el tiempo podemos, por ejemplo, utilizar un reloj situado en el origen del sistema
de coordenadas y que mida los instantes de tiempo en los que cualquier suceso es observado
desde eso punto.

Este método tiene el inconveniente que, como la luz viaja a velocidad finita, hay un retraso
entre el instante de tiempo en el que suceso ocurre y el instante en que es observado desde
el origen del sistema, lo que nos obligarı́a a corregir todos las mediciones de tiempo con el
retraso que tarda el suceso en ser observado.

Una alternativa que resulta útil es la siguiente. Supongamos que sabemos donde ocurrirá el
suceso que nos interesa. Proporcionamos a otro experimentador/a un reloj idéntico al nuestro
(y sincronizado, es decir que marcan el mismo número en el mismo instante de tiempo) y
le mandamos hasta el punto donde ocurrirá el suceso. Para prevenir la posibilidad de que el
desplazamiento del reloj afecte a su ritmo de medición, lo mandamos de manera adiabática,
es decir tan lenta como queramos. Cuando el suceso ocurra, simplemente preguntamos al
observamos qué marcaba su reloj cuando el suceso ocurrió.

Si no sabemos dónde va a ocurrir el suceso simplemente le pedimos a suficientes experimenta-


dores/as, todos ellos dotados de un reloj idéntico y sincronizado, que se desplacen a muchos
puntos de manera que cualquier suceso que pueda ocurrir tenga un reloj suficientemente
cercano. Para no cometer errores, podemos incluso suponer que hemos mandado a un expe-
rimentador/a a cada punto del espacio. Obviamente esto es una idealización, pero a priori
podemos aproximarnos tanto como queramos a esta idealización.

6
Al conjunto de experimentadores/as provistos de relojes idénticos y sincronizados le llamamos
observador

Podemos ya definir el concepto de simultaneidad entre dos sucesos

Simultaneidad. Dos sucesos son simultáneos cuando los relojes sincronizados del observador mi-
den el mismo instante de tiempo en los respectivos puntos donde ocurren.

Veamos que la simultaneidad no es universal.

Supongamos una vı́a de tren recta y un tren que se mueve sobre la vı́a a velocidad v y
consideremos un sistema de referencia S ′ ligado al tren y otro sistema de referencia S ligado
a la vı́a.

Supongamos que, de manera simultánea según S ′ , caen dos rayos de luz uno en la cabeza y
otro en la cola del tren. Al caer estos rayos dejan marcas en la vı́a en dos puntos A y B.

Consideremos el punto medio del tren (con respecto al sistema de referencia S ′ ). Como la luz
se propaga a velocidad constante c y el punto medio se encuentra a la misma distancia de la
cola que de la cabeza, lo luz de los dos rayos llega a ese punto medio en el mismo instante de
tiempo.

Como la velocidad de la luz es finita, en el tiempo que ha transcurrido (en S ′ ) entre la caı́da
de los rayos y su llegada al punto medio, los puntos A y B de la vı́a se han desplazado hacia
la izquierda. El punto medio M entre esos dos puntos (medido con respecto a S) también se
ha desplazado hacia la izquierda. Por lo tanto, el suceso correspondiente a que las dos señales
luminosas se encuentran en el centro del tren es visto desde S como un suceso en el que la
luz proveniente de la cola ya ha atravesado M mientras que la luz proveniente de la cabeza
aun no ha llegado a M . Si las caı́das de los rayos fueran simultáneas en S, los dos señales
luminosas tienen que llegar a M en el mismo instante, cosa que no ha sucedido. Por lo tanto,
los sucesos no pueden ser simultáneos en S. El suceso A es anterior a B.

5.4 Transformaciones de Lorentz

Consideremos dos sistemas de referencia inerciales con ejes cartesianos S y S ′ . Denotaremos la


medición del tiempo y las coordenadas cartesianas según t mediante las cantidades (t, x, y, z)
y las mediciones de tiempo y coordenadas cartesianas según S ′ mediante (t′ , x′ , y ′ , z ′ ).

Denotaremos el origen del sistema S con el sı́mbolo O y el origen de S ′ con el sı́mbolo O′ .

Como tenemos dos sistemas de coordenadas para cada suceso, debe existir una transformación
que relacione los valores de (t′ , x′ , y ′ , z ′ ) con los valores de (t, x, y, z), es decir deben existir
funciones

t = g0 (t′ , x′ , y ′ , z ′ )
x = g1 (t′ , x′ , y ′ , z ′ )
y = g2 (t′ , x′ , y ′ , z ′ )
z = g3 (t′ , x′ , y ′ , z ′ )

Esta transformación debe estar definida y ser invertible en todo R × R3

7
La propiedad fundamental que define a los sistema de referencia inerciales es que cualquier
movimiento rectilı́neo y uniforme visto desde S ′ debe ser también observado desde S como
un movimiento rectilı́neo y uniforme.

Se puede demostrar que esta propiedad implica necesariamente que la transformación anterior
debe ser lineal, es decir que existan constantes de manera que

t = a 0 t′ + a 1 x ′ + a 2 y ′ + a 3 z ′ + t0 ,
x = b0 t ′ + b1 x ′ + b2 y ′ + b3 z ′ + x 0 ,
y = c 0 t ′ + c 1 x ′ + c 2 y ′ + c 3 z ′ + y0 ,
z = d 0 t′ + d 1 x ′ + d 2 y ′ + d 3 z ′ + z0 ,

Los sistemas de coordenadas cartesianos y el tiempo en cada sistema de referencia no son


únicos. Podemos trasladar el origen de tiempos, el origen del sistema de referencia y podemos
rotar los ejes.

Mediante la elección del origen del espacio y del tiempo de S ′ podemos imponer (t0 = 0, x0 =
0, y0 = 0, z0 = 0). Esta elección corresponde a que el suceso “posición de O′ en t′ = 0”
corresponda al suceso “posición de O en t = 0”.

Ambos sistemas aún pueden escoger de manera arbitraria sus ejes. Para simplificar el resultado
supongamos que S elige su eje x de manera que el movimiento del origen del sistema S ′
está dirigido a lo largo del eje x.

La trayectoria del origen O′ en el sistema S ′ es x′ = y ′ = z ′ = 0, t′ arbitrario. Esta trayectoria


vista desde S es la curva

t = a 0 t′
x = b0 t ′
y = c 0 t′
z = d 0 t′

por lo tanto ~r(t) = a10 (b0 , c0 , d0 )t = ~v t. Como hemos escogido que ~v esté dirigido a lo largo
del eje x tenemos b0 = a0 v, c0 = 0 y d0 = 0.

Aún podemos orientar los ejes de S ′ como mejor nos convenga.


Impondremos que el plano z ′ = 0 deslice con velocidad uniforme v sobre el plano z = 0 y
también que el plano y ′ = 0 deslice sobre el plano y = 0 con velocidad uniforme v.

La condición que todos los puntos con z ′ = 0 tengan z = 0 impone d1 = d2 = 0 y la condición


de coincidencia entre y ′ = 0 y y = 0 requiere c1 = c3 = 0. Por lo que la transformación se
simplifica a

t = a 0 t′ + a 1 x ′ + a 2 y ′ + a 3 z ′ , 


x = a0 vt′ + b1 x′ + b2 y ′ + b3 z ′
(10)
y = c2 y ′ 


z = d3 z ′

8
Supongamos ahora que giramos la configuración de los ejes de S y de los ejes de S ′ un ángulo
π/2 alrededor del eje x. Esto corresponde a una rotación del espacio. Como éste es isótropo
la transformación entre los nueves ejes debe ser idéntica a la transformación con los antiguos
ejes. Los nuevos ejes en S son t̂ = t, x̂ = x, ŷ = z y ẑ = −y. De manera análoga t̂′ = t′ ,
x̂′ = x′ , ŷ ′ = z ′ y ẑ ′ = −y ′ . Si hacemos estas sustituciones en la transformación obtenemos

t̂ = a0 t̂′ + a1 x̂′ − a2 ẑ ′ + a3 ŷ ′  

x̂ = a0 v t̂′ + b1 x̂′ − b2 ẑ ′ + b3 ŷ ′
−ẑ = −c2 ẑ ′ 


ŷ = d3 ŷ ′

La única forma como esta transformación puede ser formalmente idéntica a (10) es que a2 =
a3 = −a2 (que implica a2 = a3 = 0) b2 = b3 = −b2 (que implica b2 = b3 = 0) y c2 = d3 := m.
La transformación se ha simplificado a

t = a 0 t′ + a 1 x ′ 


x = a0 vt′ + b1 x′
.
y = my ′ 


z = mz ′

Por el momento todavı́a no hemos usado el postulados de constancia de la velocidad de la luz


y todavı́a no hemos escogido el sentido positivo de x′ . Escogemos esta orientación de manera
que el rayo de luz (x′ = ct′ , y ′ = z ′ = 0) se mueve hacia el sentido positivo de las x. Por
lo tanto, el rayo (x′ = −c t′ , y ′ = z ′ = 0) se mueve en el sentido negativo de las x. Por la
constancia de la velocidad de la luz esto implica que el rayo x′ = ±ct′ sigue la trayectoria
x = ±c t en el sistema S. Si sustituimos estas condiciones en la transformación

t = a0 t′ ± a1 ct′
.
±c t = a0 vt′ ± b1 c t′

Estas ecuaciones debe ser ciertas paro todo t′ . Si dividimos la segunda por la primera (en
t 6= 0 y t′ 6= 0) obtenemos dos ecuaciones, una para cada signo,
a 0 v + b1 c a 0 v − b1 c
c= , −c = , (11)
a0 + a1 c a0 − a1 c
que podemos reescribir como

c (a0 + a1 c) = a0 v + b1 c
c (a0 − a1 c) = −a0 v + b1 c
Sumando y restando obtenemos
a0 v
b1 = a0 , a1 = , (12)
c2
de manera que la transformación queda
 
t = a0 t′ + cv2 x′ 


x = a0 (vt′ + x′ )
.
y = my ′ 


z = mz ′

9
Si consideramos la trayectoria luminosa (y ′ = c t′ , x′ = z ′ = 0) y sustituimos en la transfor-
mación obtenemos

t = a 0 t′  

x = a0 vt′
.
y = mct′  

z =0
m2 c 2
La velocidad de esta trayectoria es (v, mc 2
a0 , 0) que tiene módulo al cuadrado v + a20
. Esta
cantidad debe coincidir con c2
por la constancia de la velocidad de la luz. Esta ecuación
solamente tiene solución si la velocidad v es estrictamente menor que c.

Por lo tanto, una consecuencia fundamental de los postulados de la relatividad es que la


velocidad de un sistema de referencia inercial con respecto a otro no puede sobrepasar la
velocidad de la luz. Esta es un limitación fundamental a las velocidades que podemos adquirir
y corresponde a un efecto puramente relativista.

Si definimos
1
γv := q (13)
v2
1− c2
m2 c 2 v2 c2
obtenemos a20
= c2 − v 2 = c2 (1 − c2
) = γv2
y obtenemos a0 en términos de m como

a20 = m2 γv2 , a0 = |m|γv . (14)

Mediante un reflexión y ′ ↔ −y ′ e z ′ ↔ −z ′ podemos conseguir que m sea positivo y llegamos


a la siguiente forma para la transformación de sistemas de referencia inerciales:
 
t = mγv t′ + cv2 x′  

x = mγv (vt′ + x′ )
. (15)
y = my ′ 


z = mz ′
Solamente queda determinar m. La inversa de esta transformación es
1
 
t′ = m γv t − cv2 x 
1 
x′ = m γv (−vt + x)
1 ,
y′ = m y 

1 
z′ = m z

que implica que el origen de S es observado desde S ′ moviéndose con velocidad −v a lo largo
del eje x′ (en particular, concluı́mos que si la velocidad de S ′ respecto de S es ~v entonces la
velocidad de S respecto de S ′ es −~v ). Si hacemos ahora una reflexión de los ejes coordenados
x y y, es decir definimos t̂ = t, x̂ = −x, ŷ = −y, ẑ = z y lo mismo con las primas, la ley de
transformación se convierte en
1
 
t̂′ = m γv t̂ + cv2 x̂ 
1 
x̂′ = m γv v t̂ + x̂
1
ŷ ′ = m ŷ 

′ 1 
ẑ = m ẑ

10
y S x′ S′

v
x z′

z z′

x̂ x̂′

ẑ ẑ ′

Ŝ ′ ŷ ′

Figura 1: Estas dos configuraciones son idénticas por la isotropı́a del espacio.

Pero observemos que, por la isotropı́a del espacio esta configuración es exactamente idéntica
a la configuración inicial, ver Figura 1.
Por lo tanto la ley de transformación debe ser formalmente idéntica a (15) (si no lo fuera
1
podrı́amos distinguir direcciones del espacio). Por lo tanto debe ocurrir m = m es decir
2
m = 1 y como m > 0 la única solución posible es m = 1. Llegamos a la siguiente ley de
transformaciones, que es conocida como transformación de Lorentz:
 
t = γv t′ + cv2 x′  

x = γv (vt′ + x′ )
.
y = y′ 


z = z′

Dadas las elecciones de ejes que hemos hecho por el camino, a esta transformación se la conoce
como transformación de Lorentz de ejes paralelos y con velocidad a lo largo del
eje x.

5.5 Ley de adición de velocidades.

Consideremos una partı́cula que se mueve con respecto a un sistema de referencia S ′ a ve-
locidad ~u′ mientras este se mueve con velocidad ~v con respecto a otro sistema de referencia
S. Un resultado fundamental en mecánica Galileana es que la velocidad de la partı́cula con
respecto al sistema S es ~u = ~v + ~u′

11
Queremos deducir qué ocurre en relatividad especial. Supongamos por simplicidad que los
sistemas de referencia S y S ′ tienen ejes paralelos y que la velocidad de S ′ con respecto a S
está dirigida en la dirección x de manera que ~v = v~ex .
La trayectoria en el sistema S ′ será x′ (t′ )~ex ′ + y ′ (t′ )~ey ′ + z ′ (t′ )~ez ′ y su velocidad es ~u ′ =

dx′ ′
ex ′ + dy
dt′ ~ dt′ ~ey ′ + dz
dt′ ~ez ′ = u′z ~ex ′ + u′y ~ey ′ + u′z ~ez ′ .
Para conocer la velocidad con respecto de S debemos conocer la trayectoria con respecto de
S. Si tomamos diferenciales en la trasformación de Lorentz
 
t = γv t′ + cv2 x′ 

x = γv (vt′ + x′ )
y = y′ 


z = z′
tenemos
 
dt = γv dt′ + cv2 dx′ 


dx = γv (vdt′ + dx′ )
dy = dy ′ 


dz = dz ′
La velocidad respecto del sistema S es, por lo tanto
dx dx′ + vdt′ u′x + v
ux = = ′ = ′ ,
dt dt + cv2 dx′ 1 + vu 2
x
c
dy dy ′ u′y
uy = = = ,
dt γv (dt′ + cv2 dx′ ) γv (1 + vu

x
)
c2
dz dz ′ u′z
uz = = = .
dt γv (dt′ + cv2 dx′ ) γv (1 + vu 2

x
)
c

En resumen,la ley de adiciones de velocidad en relatividad especial tiene la forma


u′x + v
ux = vu′x
,
1+ c2
u′y
uy = vu′x
,
γv (1 + c2
)
u′z
uz = vu′x
.
γv (1 + c2
)

Si la velocidad de la velocidad de la partı́cula respecto de S ′ y la velocidad de S ′ respecto



de S son pequeñas respecto de la velocidad de la luz, entonces γ ≈ 1 y vu c2
x
<< 1 por lo que
estas transformaciones se reducen a la ley de adición de velocidades de Galileo.
¿Qué ocurre si la partı́cula se mueve a la velocidad de la luz con respecto de S ′ ? Supongamos
que se mueve a lo largo del eje x por simplicidad. Entonces u′x = c, u′y = 0 y u′z = 0.
sustituyendo en la ley de adición de velocidades tenemos
c+v
ux = = c, uy = 0, uz = 0,
1 + vc
c2

12
es decir la partı́cula también se mueve a velocidad de la luz respecto de S. Lo mismo ocurre
si la velocidad de la partı́cula en S tiene dirección arbitraria.

Por otro lado, ¿qué ocurre si tanto la velocidad de la partı́cula respecto de S ′ es menor que
la de la luz? Supongamos, de nuevo por simplicidad, que las velocidades van a lo largo del
eje x.

Tenemos que u′x = c (1 − α) con 0 < α < 1 y v = c (1 − β) con 0 < β < 1. Sustituyendo en
ux tenemos
c (1 − α) + c (1 − β) c (2 − (α + β))
ux = c2 (1−α)(1−β)
= <c (16)
1+ 2 − (α + β) + αβ
c2
La última desigualdad se sigue porque 2 − (α + β) + αβ siempre es mayor que 2 − (α + β).

Concluimos que si la velocidad de una partı́cula es menor que la de la luz en un sistema de


referencia es menor que la de la luz, entonces es menor que la de la luz en todos los sistemas
de referencia y que si su velocidad es la de la luz en un sistema de referencia entonces se
mueve a la velocidad de la luz en todos los sistemas de referencia.

5.6 Dilatación del tiempo.

Supongamos que dos sucesos ocurren en el mismo sitio en un sistema de referencia S ′ . Estos
sucesos ocurren en t′A y t′B según los relojes de S ′ . El intervalo que transcurre es τ0 = t′B − t′A .

A este intervalo de tiempo se le llama tiempo propio. Es el intervalo entre dos sucesos
medido por el reloj inercial para el que ocurren en el mismo sitio.

¿Qué intervalo de tiempo medirı́a S? Usemos la transformación de Lorentz referida al tiempo


 
′ vx′
t=γ t + 2 (17)
c

y tomemos incrementos. Como ∆x′ = x′B − x′A = 0 tenemos


τ0
∆t = γ∆t′ = q (18)
v2
1− c2

Notemos que ∆t > τ0 . Por lo tanto cualquier sistema de referencia en el que los dos sucesos
no ocurran en el mismo sitio medirá un intervalo de tiempo mayor entre los dos sucesos que
el intervalo de tiempo propio. A este fenómeno se le llama dilatación del tiempo.

Una consecuencia de la relatividad especial es que el transcurso del tiempo no es universal


sino que es distinto para cada partı́cula, depende de la trayectoria que sigue.

Este hecho ha sido comprobado experimentalmente en infinidad de ocasiones. Por ejemplo, los
muones (que son partı́culas leptónicas parecidas a los electrones, aunque con mayor masa) son
partı́culas inestables con un semiperiodo de desintegración de 2 µs. Estos muones se pueden
formar en las capas altas de la atmósfera debido a las interacción con los rayos cósmicos. La
velocidad (respecto de la atmósfera) a la que se forman es muy cercana a la velocidad de la
luz v = 0,998c.

13
Si el tiempo fuera universal, el camino medio que recorrerı́an antes de que la mitad de los
muones se desintegrara es de
0,998c × 2 · 10−6 = 600 m (19)

Como se forman a muchos miles de quilómetros de altura deberı́an llegar a la superficie de la


Tierra muy pocos. Con obstante, experimentalmente se observa que no es ası́.

El tiempo de semidesintegración es una propiedad intrı́nseca de la partı́cula y corresponde al


intervalo de tiempo propio del proceso. En el sistema de referencia de la Tierra, este intervalo
está dilatado por el efecto relativista, de manera que el tiempo de semidesintegración en el
sistema de la Tierra es
τ0 2 µs
τ=q =p = 32 µs (20)
2
1 − vc2 1 − 0, 9982

Por lo tanto el camino medio que recorren antes de que sobrevivan la mitad de ellos es de
τ × 0, 998c = 9500 s, lo que explica el gran número de muones que llegan a la superficie de la
Tierra.

¿De qué manera se verá este proceso desde el punto de vista del muón? Para esta partı́cula,
la Tierra se acerca a velocidad 0, 998c. Cuando la Tierra se haya acercado 600 m, habrán
desaparecido la mitad de los muones.

¿Cómo es posible que lleguen tantos a la superficie? La respuesta está en otro fenómeno propio
de la relatividad especial.

5.7 Contracción de longitudes.

Consideremos una barra. Llamamos longitud propia de la barra a la longitud que tiene
la barra medida en el sistema de referencia en la que se encuentra en reposo. Llamemos S ′
a este sistema y consideremos otro sistema de referencia inercial con respecto al cual S ′ se
está moviendo con velocidad v en el sentido positivo del eje x. Supongamos además que la
barra es paralela al eje x′ y que los dos sistemas tienen ejes paralelos.

¿Cuál es la medida de la longitud de la barra que hace S? Es decir, ¿qué longitud tiene la
barra de longitud propia cuando se mueve a velocidad v?

Para poder medir esta longitud tenemos que localizar la posición de la cabeza y la cola en
un mismo instante de tiempo y restar ambas posiciones. No podemos simplemente parar la
barra y medirla, porque no estarı́amos midiendo su longitud en movimiento.

Llamemos A a la posición de cabeza de la barra y B a la posición de la cola de la barra en


un mismo instante de tiempo t0 en S. La coordenada x (en S) de A la denominamos xA y la
coordenada x de B la denominamos xB . Consideremos cuales son las posiciones de estos dos
sucesos en el sistema S ′ . La ley de Lorentz en la componente x entre los sistemas S y S ′ es

x′ = γ (x − vt) . (21)

Evaluamos esta transformación en el suceso A y en el B y restamos. Como ∆t = 0 obtenemos

(x′A − x′B ) = γ (xA − xB ) (22)

14
Ahora bien, en el sistema de referencia S ′ la cabeza de la barra se encuentra a distancia L0
de la cola, aunque las posiciones de ambos puntos las midamos en tiempos distintos (ya que
la barra está en reposo en S ′ ). Por lo tanto x′B − x′A = L0 y obtenemos que la longitud de la
barra en S es r
L0 v2
L = xB − xA = = L0 1 − 2 < L0 . (23)
γ c
Por lo tanto, la longitud de la barra en movimiento es menor que su longitud propia. A este
fenómeno se le conoce como contracción de longitudes. Es un efecto completamente real
y no un defecto de medición. La barra es realmente más corta cuando es observada por un
sistema de referencia en la que está en movimiento.

Volviendo al caso de los muones, la distancia entre el punto de creación y la superficie de la


Tierra es, pongamos 9500m. Esta longitud es propia porque está medida en reposo desde la
Tierra. Desde el punto de vista del muón existe una contracción de longitudes, que hace que
la superficie de la Tierra se encuentre solamente a
r
v2 p
D = D0 1 − 2 = 9500 1 − 0,9982 = 600 m (24)
c
que explica que aunque el tiempo de semidesintegración ahora es 2 µs, lleguen muchos muones
a la superficie de la Tierra.

5.8 Simultaneidad relativa.

Supongamos que dos sucesos A y B ocurren simultáneamente en un sistema de referencia


inercial S ′ . Es decir, ambos sucesos tiene coordenadas (supongamos que ambos sucesos ocurren
en el eje x′ )
A = (t′ , x′1 ), B = (t′ , x′2 ). (25)
Ambos sucesos tienen el mismo valor de t′ porque son simultáneos en S ′ . Consideremos un
sistema de referencia S que se mueve con ejes paralelos en la dirección x′ con velocidad v
hacia la izquierda. Según este sistema, los sucesos ocurren en otras coordenadas

A = (t1 , x1 ), B = (t2 , x2 ). (26)

y queremos conocer qué vale ∆t. Observemos que si ∆t 6= 0, entonces los sucesos no son
simultáneos en S y por lo tanto el concepto de simultaneidad será relativo al sistema de
referencia que lo mida.

De la componente t de la transformación de Lorentz tenemos


 
′ vx′
t=γ t + 2 , (27)
c
por lo que el incremento de tiempo es
 
v∆x′ v
∆t = t2 − t1 = γ ∆t′ + 2 = 2 γ∆x′ (28)
c c
Esta cantidad es distinta de cero excepto si los dos sucesos tienen la misma coordenada x′ .
Concluimos que dos sucesos simultáneos en un sistema de referencia no lo serán, en general, en

15
otro sistema de referencia inercial. Las transformaciones de Lorentz incorporan la propiedad
de que la simultaneidad es un concepto relativo al sistema de referencia, tal y como ya
obtuvimoa a partir de los dos postulados de la relatividad especial.

5.9 El intervalo espacio-temporal y tiempo propio.

¿Existe alguna magnitud que tenga el mismo valor en todos los sistemas de referencia? A
magnitudes de este tipo se las llama invariantes Lorentz (o simplemente invariantes).

Sabemos que la velocidad de la luz es la misma en todos los sistemas de referencia. Esto
implica que si tenemos dos sucesos situados sobre la trayectoria de un rayo de luz en el vacı́o
tenemos que sus coordenadas en cualquier sistema de referencia deben satisfacer

∆x2 + ∆y 2 + ∆z 2 − c2 ∆t2 = 0. (29)

En consecuencia, si en un sistema de referencia inercial S dos sucesos con coordenadas


(t1 , x1 y1 , z1 ) y (t2 , x2 , y2 , z2 ) satisfacen

∆x2 + ∆y 2 + ∆z 2 − c2 ∆t2 = 0. (30)

entonces sus coordenadas (t′1 , x′1 y1′ , z1′ ) y (t′2 , x′2 , y2′ , z2′ ) en otro sistema de referencia inercial
S ′ también debe satisfacer

∆x′2 + ∆y ′2 + ∆z ′2 − c2 ∆t′2 = 0. (31)

Resulta natural preguntarse si esta magnitud también es invariante cuando cuando su valor
no es cero.

Definimos el intervalo espacio-temporal entre dos sucesos (t1 , x1 y1 , z1 ) y (t2 , x2 , y2 , z2 )


mediante
∆s2 := −c2 ∆t2 + ∆x2 + ∆y 2 + ∆z 2 . (32)
Notemos que aunque tenga un cuadrado, ∆s2 no tiene por qué ser positivo.

Vamos a comprobar que el intervalo espacio-temporal es un invariante. Por simplicidad lo


haremos para dos sistemas con ejes paralelos que se mueven a lo largo del eje x. De la
transformación de Lorentz tenemos, tomando incrementos
 
∆t′ = γ ∆t − cv2 ∆x 

∆x′ = γ (∆x − v∆t)
∆y ′ = ∆y 

′ 
∆z = ∆z

Como ∆y y ∆z no cambian solamente debemos comprobar si es cierto que

−c2 ∆t′2 + ∆x′2 = −c2 ∆t2 + ∆x2 (33)

16
Si sustituimos las expresiones anteriores
  2 
2 ′2 ′2 2 v 2
−c ∆t + ∆x = γ − c∆t − ∆x + (∆x − v∆t) =
c
  
 v2
= γ 2 −∆t2 c2 − v 2 + ∆x2 1 − 2 =
c
  
1 2 2 2
 2 v2
= 2 −∆t c − v + ∆x 1 − 2 =
1 − v2 c
c
= −c ∆t2 + ∆x2 .
2

Concluimos que el intervalo espacio-temporal es invariante para todos los sistemas de refe-
rencia inerciales.

5.10 Causalidad y cono de luz.

Supongamos dos sucesos A y B que ocurren en el sistema de referencia S con coordenadas


A = (t1 , x1 ) y B = (t2 , x2 ) y Supongamos que B es posterior a A, es decir t2 > t1 , o
equivalentemente ∆t := t2 − t1 > 0. Si calculamos el intervalo de tiempo entre estos dos
sucesos en un sistema S ′ (moviéndose a lo largo del eje x) tenemos
 
′ v∆x
∆t = γ ∆t − 2 . (34)
c

Si existe algún sistema de referencia en el que ∆t′ es negativo, entonces no puede haber
una relación de causa-efecto entre A yB. Si, por otro lado, ∆t′ > 0 en cualquier sistema de
referencia entonces a priori podrı́a existir una relación de causalidad entre ambos de manera
que A fuera la causa de B. Vamos a analizar cuando se satisface que ∆t′ > 0 en cualquier
sistema de referencia inercial.

Usando (34) la condición ∆t′ > 0 es equivalente a

v∆x v
∆t − >0 ⇐⇒ c∆t > ∆x. (35)
c2 c
Como esto tiene que pasar para todo v ∈ (−c, c) (es decir, en todos los sistemas de referencia
inerciales), la condición que hay que imponer es que

|∆x| ≤ c∆t (36)

que es equivalente a
∆s2 = −c2 ∆t2 + ∆x2 ≤ 0. (37)

Si el intervalo espacio-temporal es negativo entre dos sucesos A y B puede existir una relación
de causa efecto entre ambos.

A un intervalo de espacio-tiempo negativo se le llama intervalo tipo tiempo o también


temporal.

17
Si el intervalo espacio-temporal es igual a cero, entonces puede haber relación de causa efecto
entre A y B y además emitir un rayo de luz en A que alcance B. Un intervalo de este tipo se
llama luminoso (también nulo).

Si el intervalo espacio-temporal entre A y B es positivo entonces no puede haber relación


causal entre A yB. A este tipo de intervalos se las denomina intervalo de tipo espacio o
espacial.

Notemos que si el intervalo entre dos sucesos es espacial entonces existe un sistema de refe-
rencia en el que los dos sucesos son simultáneos. En efecto:
 
′ v∆x ∆t
∆t = 0 = γ ∆t − 2 =⇒ v = c2 (38)
c ∆x

Como ∆s2 > 0, tenemos −c2 ∆t2 + ∆x2 > 0 que es equivalente a c|∆t| < |∆x| y el módulo de
la velocidad es
c2 |∆t| c|∆x|
v= < =c (39)
|∆x| |∆x|
Como esta velocidad es menor que la de la luz, existen el sistema de referencia S ′ en el que
los sucesos son simultáneos.

5.10 Espacio-tiempo de Minkowski.

Hemos visto que el relatividad espacial no existe un tiempo absoluto y que las transforma-
ciones de coordenadas involucran tanto al espacio como al tiempo.

Si consideramos todos los sucesos posibles (es decir el conjunto de todos los puntos del espacio
en todos los instantes de tiempo) tenemos un espacio de cuatro dimensiones, de las cuales
tres corresponden a direcciones espaciales y una a una dirección temporal. Este es el llamado
espacio-tiempo de Minkowski.

Definamos coordenadas x0 = ct, x1 = x, x2 = y y x3 = z. El intervalo espacio-temporal


entre un suceso A con coordenadas (t, x, y, z) y el suceso O situado en el origen del sistema
de coordenadas y en el origen de tiempos (es decir O = (t = 0, x = 0, y = 0, z = 0)) es

∆s2 = −c2 t2 + x2 + y 2 + z 2 = −(x0 )2 + (x1 )2 + (x2 )2 + (x2 )2 . (40)

El vector columna
 
x0
 x1 
 
 x2 
x3
define el vector de posición del suceso A con respecto al origen del sistema de referencia.
Podemos definir una “longitud” al cuadrado para este vector mediante la definición
  0 
−1 0 0 0 x
   
0 1 0 0   x1 
−(x0 )2 + (x1 )2 + (x2 )2 + (x2 )2 = x0 , x1 , x2 , x3  
 0 0 1 0   x2  .
0 0 0 1 x3

18
A la matriz cuadrada que aparece se la denomina métrica de Minkowski y se la denota
por ηµν , donde los ı́ndices griegos toman los valores 0, 1, 2, 3. En otras palabras η00 = −1,
η11 = η22 = η33 = 1 y el resto cero.

En términos de la métrica de Minkowski el intervalo espacio-temporal entre el suceso A y el


origen es
∆s2 = ηµν xµ xν , (41)
es decir, el módulo al cuadrado (con la métrica de Minkowski) del vector de posición de A
respecto del origen.

La invariancia del intervalo espacio-temporal implica que todos los sistemas de referencia
inerciales con el mismo origen usan la misma fórmula para el módulo al cuadrado de este
vector
∆s2 = ηµν x′µ x′ν . (42)
En otras palabras, si transformamos las cooordenadas mediante una transformación de Lo-
rentz, la forma de la métrica de Minkowski queda invariante.

Los sucesos conectados causalmente con el origen O del sistema de coordenadas son aquellos
que tienen ∆s2 ≤ 0, es decir

(x0 )2 ≥ (x1 )2 + (x2 )2 + (x3 )2 . (43)

Este conjunto de puntos define un cono dentro del espacio-tiempo de Minkowski. Se denomina
cono de luz, porque los puntos en su frontera son los que satisfacen

(x0 )2 = (x1 )2 + (x2 )2 + (x3 )2 . (44)

que son precisamente el conjunto de todos los sucesos por lo que pasan la colección de rayos
de luz emitidos en O en todas la direcciones del espacio (si x0 ≥ 0) o bien recibidos en O
desde todas las direcciones del espacio (si x0 ≤ 0).

El espacio-tiempo de Minkowski tiene cuatro dimensiones por lo que no podemos visualizarlo


fácilmente. Si suprimimos una dimensión para poder representarlo, el cono de luz es el interior
del cono representado en la siguiente figura:
x0 = c t

Futuro de O

x2 = y
x1 = x Pasado de O

Esto es un ejemplo de diagrama espacio-temporal.

19
5.11 Diagramas espacio-temporales.

Un diagrama espacio-temporal respecto de un sistema de referencia S es un representación


del espacio de Minkowski usando las coordenadas cartesianas (t, x, y, z) de S en la que el
tiempo se representa en el eje vertical y las coordenadas de espacio en los ejes horizontales.

Consideremos una partı́cula masiva que siga una trayectoria cualquiera ~r(t). En coordenadas
cartesianas en un sistema inercial, la trayectoria vendrá descrita por xα = (ct, ~x(t)).

En cada instante de tiempo podemos imaginar que la partı́cula lleva consigo un sistema de
referencia. Como sabemos que dos sistemas de referencia no pueden moverse a velocidad
superior a la de la luz, se sigue que la partı́cula no puede viajar a velocidad superior a c.
d~
x d~
x
Dado que dx0
= cdt = ~vc , la condición d~
x
dt < c es equivalente a d~
x
dx0
< 1.

La trayectoria de la partı́cula forma un ángulo α con respecto de la vertical que debe satisfacer
x0 = c t
d~x
α
dx0

x2 = y

x1 = x

|d~x| π
tan α = <1 ⇐⇒ |α| < . (45)
dx0 4
La partı́cula debe avanzar siempre dentro del cono de luz futuro den suceso en el que esté en
ese momento.

20
x0 = c t x0 = c t
x0 = c t

x2 = y x2 = y x2 = y

x1 = x
x1 = x x1 = x
(b) Movimiento rectilı́neo uni- (c) Oscilación periódica a lo lar-
(a) Partı́cula en reposo.
forme. go del eje y.
x0 = c t
x0 = ct

x2 = y
x2 = y x1 = x
x1 = x

(e) Movimientos imposibles.


(d) Rotación en el plano x, y.

5.12 Tiempo propio de una trayectoria.

Calculemos de qué manera transcurre el tiempo propio para esta partı́cula. En un instante
de tiempo dado t0 , la partı́cula se está moviendo a velocidad

d~x
= ~v0 (46)
dt t=t0

y se encuentra en el suceso p = (c t0 , ~x0 ). Podemos considerar un sistema de referencia inercial


S ′ cuyo origen esté en p que que se mueva con velocidad constante ~v0 con respecto del sistema
S.

Sabemos que, por la dilatación del tiempo, dos sucesos que ocurran en el mismo sitio en S ′ y
en un intervalo de tiempo ∆t′ , serán observados en S con una diferencia de tiempos
1
∆t = γ∆t′ = q ∆t′ . (47)
~v02
1− c2

S ′ ve la partı́cula instantáneamente en reposo y en el origen del sistema de referencia. Los


relojes de S ′ y el ligado a la partı́cula están por lo tanto en reposo relativo. En este punto

21
la teorı́a de la relatividad especial hace una hipótesis adicional que consiste en suponer que
los relojes de S ′ y el reloj que se mueve con la partı́cula marcan exactamente al mismo
ritmo justo en ese momento. Este hipótesis es equivalente a suponer que el ritmo de los
relojes depende de la velocidad de los relojes, pero no de su aceleración. Esta hipótesis se ha
verificado experimentalmente en multitud de ocasiones.

Dado que la coincidencia entre el ritmo de los dos relojes ocurre solamente durante un lapso
de tiempo muy breve, consideremos que miden un intervalo de tiempo infinitesimal. De la
fórmula de dilatación del tiempo, obtenemos que el intervalo de tiempo dt medido por el
sistema de referencia inercial y el intervalo de tiempo dτ medido por el reloj que lleva la
partı́cula están relacionados por
1
dt = q dτ. (48)
2
1 − vc2
El reloj que se mueve con la partı́cula marca el tiempo que está transcurriendo para la
partı́cula y se denomina tiempo propio.

La expresión anterior permite relacionar el intervalo de tiempo propio, con el intervalo espacio-
temporal.
r r
v2 (vdt)2 1p 2 2 1p 2 2
dτ = 1 − 2 dt = dt2 − = c dt − (d~
x ) 2 = c dt − dx2 − dy 2 − dz 2 . (49)
c c2 c c
Dado que el intervalo espacio-temporal entre dos sucesos infinitesimales es

ds2 = −c2 dt2 + dx2 + dy 2 + dz 2 (50)

obtenemos finalmente
1p
dτ = −ds2 . (51)
c
En otras palabras, el intervalo espacio-temporal mide directamente el tiempo propio que
transcurre para la trayectoria. Dado que el intervalo espacio-temporal es el mismo en todos
los sistemas de referencia, esta relación indica que todos los sistemas de referencia estarán de
acuerdo en el tiempo propio marcado por el reloj en movimiento. Esta es una condición de
autoconsistencia necesaria e indica que la hipótesis que hace la relatividad especial sobre el
ritmo de los relojes con movimientos arbitrarios es consistente.

5.13 Cuadrivector velocidad.

Volvamos a la trayectoria xα (t). El vector xα es un vector en el espacio-tiempo de Minkowski.


Es decir, un objeto en el que todos los sistemas de referencia están de acuerdo, aunque cada
uno lo exprese en componentes distintas.

Queremos definir su velocidad de manera que también obtengamos un vector en el espacio-


tiempo de Minkowski.
α
Si calculamos dxdt obtenemos una cantidad que depende del sistema de referencia porque todos
los sistemas de referencia están de acuerdo en el significado de dxα (es el vector de posición
relativo entre dos sucesos del espacio-tiempo), pero cada sistema usa un valor distinto de dt,
por lo que el cociente no es un objeto en que todos los sistemas de referencia estén de acuerdo.

22
Para definir vectores debemos dividir por un cantidad en la que todos los sistemas de referencia
estén de acuerdo en su valor (a una magnitud cuyo valor es el mismo en todos los sistemas
de referencia se la llama escalar).

Buscamos un escalar que mida tiempo y que coincida en valor para todos los sistemas de
referencia. Tenemos un candidato completamente natural: el tiempo propio de la trayectoria.

Dada la relación
1p
dτ = −ds2 (52)
c
ya sabemos que todos los sistemas de referencia están de acuerdo en su valor. Además, en un
sistema de referencia concreto tenemos
r
1 v2
dτ = dt = 1 − 2 dt (53)
γ c
p
y 1 − v 2 /c2 6= 0 por lo que la relación entre t y τ es invertible y podemos usar τ para
parametrizar la trayectoria
xα (τ ) = (x0 (τ ), ~x(τ )). (54)
Si calculamos la derivada con respecto al tiempo propio tenemos
   
dxα dt d~x d~x dt
= c , = cγ, = (cγ, ~v γ) = γ (c, ~v ) := uα (55)
dτ dτ dτ dt dτ

A este vector se le llama cuadrivelocidad de la trayectoria. Tiene la siguiente propiedad:

dxα dxβ ηαβ dxα dxβ ds2 −c2 dτ 2


ηαβ uα uβ = ηαβ = = = = −c2 (56)
dτ dτ dτ 2 (dτ )2 dτ 2
Es decir, el cuadrivector velocidad para una trayectoria temporal tiene módulo al cuadrado
igual a −c2
ηαβ uα uβ = −c2 . (57)

También lo podemos obtener de la siguiente manera


 
ηαβ uα uβ = −(u0 )2 + (u1 )2 + (u2 )2 + (u3 )2 = −c2 γ 2 + γ 2 vx2 + vy2 + vz2 = γ 2 −c2 + v 2
1 2 2

= 2 −c + v = −c2
1 − vc2

5.14 Ángulo hiperbólico de una transformación de Lorentz

El vector de posición xα de un suceso tiene componentes, en un sistema de referencia inercial


xα = (c t, x, y, x).

Si cambiamos de sistema de referencia inercial las componentes de este vector de posición se


transforman mediante una transformación de Lorentz.

Supongamos por simplicidad que estamos que los dos sistemas de referencia tiene velocidad
relativa v a lo largo de eje x y que lo ejes son paralelos

23
Sabemos que las transformaciones de Lorentz son
 
t′ = γ t − cv2 x 


x′ = γ (x − vt)
y′ = y 


z′ = z

Como x0 = c t, en términos de esta variable la transformación de Lorentz toma la forma


 
x′0 = γ x0 − vc x1   

x′1 = γ − vc x0 + x1
x′2 = x2 


x′3 = x3

que es una forma mucho más simétrica que la anterior.

Podemos escribir esta transformación en forma matricial como


 ′0    
x γ − γv
c 0 0 (x)0
 x′1   − γv γ  
0 0   (x)1 
 = c 
 x   0
′2 0 1 0   (x)2 
x′3 0 0 0 1 (x)3

A la matriz 4 × 4 simétrica que define a esta transformación de Lorentz se le llama boost de


Lorentz en la dirección x.

Los boost de Lorentz están parametrizados por una cantidad v que toma valores entre v ∈
(−c, c) y recordemos que
1
γ=q . (58)
v2
1 − c2

Una pregunta natural es si podemos encontrar una parametrización distinta que simplifique
la forma del boost de Lorentz.

Definamos el parámetro β mediante la expresión


v
= tanh β (59)
c
La función tanh tiene dominio (−∞, ∞) y toma valores en (−1, 1). Además es un función
estrictamente creciente. Por lo tanto, para cada valor de v ∈ (−c, c) tenemos un único valor
de β que satisface (59).

La ventaja de usar β en lugar de v es que γ se escribe de manera mucho más simple:


1 1 1 cosh β
γ=q =p =q =p = cosh β (60)
2 sinh 2
β 2 2
1− v2 1 − tanh β 1 − cosh2 β cosh β − sinh β
c2

Además,
v
γ = cosh β tanh β = sinh β (61)
c

24
y el boost de Lorentz toma la siguiente forma, mucho más sencilla
 ′0    0 
x cosh β − sinh β 0 0 x
 x′1   − sinh β cosh β 0 0   x1 
    
 x′2  =  0 0 1 0   x2 
x′3 0 0 0 1 x3

La inversa de esta transformación se obtiene sustituyendo β → −β, porque si S ′ se mueve con


velocidad v respecto de S con velocidad S, la velocidad de S respecto de S ′ es −v y, además
v
− = − tanh(β) = tanh(−β) (62)
c
Podemos notar la similitud con las rotaciones en dos dimensiones. Los boost de Lorentz son
rotaciones hiperbólicas en el plano (x0 , x1 ).
A la magnitud β se la conoce como ángulo hiperbólico. También se acostumbra a usar el
término rapidez.
Para velocidades pequeñas, la rapidez es simplemente la velocidad de la partı́cula en unidades
de c. Esto se sigue de que para valores pequeños de x tanh x = x + O(x3 ) y por lo tanto, para
β pequeño
v
≈β (63)
c
Para velocidades altas, un incremento de β (por ejemplo doblar la rapidez) apenas disminuye
el valor de la velocidad, que se aproxima a c asintóticamente.
En las rotaciones bidimensionales, el ángulo de rotación tiene la propiedad de que si com-
ponemos dos rotaciones de ángulo α1 y α2 en el mismo plano el resultado es un rotación
en ese plano de ángulo α1 + α2 . Podemos preguntarnos si lo mismo ocurre con los ángulos
hiperbólicos.
Debemos componer dos boost de Lorentz, ambos en el plano (x0 , x1 ) y de ángulos hiperbólicos
β1 y β2 .
Cada una de las transformaciones es
 0     ′0 
x cosh β1 sinh β1 x
= ,
x1 sinh β1 cosh β1 x′1
 ′0     ′′0 
x cosh β2 sinh β2 x
= .
x′1 sinh β2 cosh β2 x′′1

Si componemos ambas transformaciones obtenemos


 0      ′′0 
x cosh β1 sinh β1 cosh β2 sinh β2 x
= .
x 1 sinh β1 cosh β1 sinh β2 cosh β2 x′′1

Multiplicamos las matrices y obtenemos

    
x0 cosh β1 cosh β2 + sinh β1 sinh β2 cosh β2 sinh β1 + sinh β1 cosh β2 x′′0
= .
x1 cosh β2 sinh β1 + sinh β1 cosh β2 cosh β1 cosh β2 + sinh β1 sinh β2 x′′1

25
Usando las relaciones trigonométricas cosh a cosh b+sinh a sinh b = cosh(a+b) y cosh a sinh b+
sinh a cosh b = sinh(a + b) llegamos a
 ′0     ′′0 
x cosh(β1 + β2 ) sinh(β1 + β2 ) x
= .
x′1 sinh(β1 + β2 ) cosh(β1 + β2 ) x′′1

Los boost de Lorentz paralelos se componen simplemente sumando las rapideces de cada
boost.

Notemos que esta ley permite reproducir la ley de adición de velocidades de manera muy
simple. La velocidad de S ′′ respecto de S ′ es v2 y la velocidad de S ′ respecto de S es v1 ,
donde v1 y v2 están relacionadas con β1 y β2 mediante
v1 v2
= tanh β1 , = tanh β2 , (64)
c c
Acabamos de demostrar que la rapidez de S ′′ respecto de S es β1 + β2 . Para calcular la
velocidad V correspondiente
tanh β1 + tanh β1 v1 + v2
V = c tanh(β1 + β2 ) = c = (65)
1 + tanh β1 tanh β2 1 + v1c2v2
tanh a+tanh b
donde hemos usado la igualdad trigonométrica tanh(a + b) = 1+tanh a tanh b .

Hemos obtenido la ley de adición de velocidades a partir de la aditividad de las rapideces en


la composición de los boost de Lorentz.

26
Tema 6. Mecánica Relativista
6.1 Introducción.

En mecánica newtoniana tenemos que el momento P lineal p~ = m~v es un vector y que para un
sistema aislado el momento lineal total del sistema Na=1 p
~a se conserva a lo largo del tiempo.

Un ejemplo concreto de esta ley de conservación ocurre en choques (independientemente de


que sean elásticos o inelásticos). Supongamos que dos partı́culas colisionan con momentos
incidentes p~1 y p~2 . Si las partı́culas emergen de la colisión con momentos ~q1 y ~q2 se sebe
satisfacer que
p~1 + p~2 = ~q1 + ~q2 .

Por otro lado, en mecánica newtoniana la segunda ley de Newton relaciona la fuerza que
actúa con el cambio del momento lineal de la partı́cula

d~
p
f~ = .
dt

Si actuamos con una fuerza constante (en módulo, dirección y sentido), el momento lineal
aumentará de manera lineal de manera que la velocidad de la partı́cula aumentará sin lı́mite
y eventualmente sobrepasará la velocidad de la luz.

Sabemos que esto es imposible en relatividad espacial, por lo que resulta claro que es necesario
modificar las leyes de la mecánica de Newton para hacerlas compatibles con la relatividad
especial.

De hecho, si queremos preservar la propiedad fundamental de que el momento lineal total


se conserva en un choque, resulta necesario modificar la definición de momento lineal en
relatividad especial.

6.2 Momento lineal relativista.

Consideremos un choque totalmente inelástico de dos masas iguales y supongamos que la


definición de momento lineal sigue siendo p~ = m~v y que satisface la ley de conservación en
choques.

Situémonos en el sistema de referencia en el que ambas partı́culas se mueven con velocidades


iguales y opuestas y escogemos ejes de manera que el movimiento ocurra en el eje x:

p~1 = mv~ex , p~2 = −mv~ex .

Después del choque tenemos un partı́cula de masa 2m y en reposo (porque el momento lineal
total se anula y se conserva en un choque).

Nos situamos ahora en un sistema de referencia S ′ que se mueve con velocidad −v a lo largo
del eje x.

1
La velocidad de las partı́culas 1 y 2 en el sistema S ′ es, por la ley de adición de velocidades,
2v
v1′ = v2
, v2′ = 0,
1+ c2

mientras que la partı́cula saliente tiene velocidad v3′ = v. Se sigue que mv1′ + mv2′ 6= 2mv3′ , y
el momento lineal newtoniano no se conserva en S ′ .

Debemos modificar la definición de momento lineal. Queremos que a velocidades pequeñas la


definición relativista se reduzca a la definición newtoniana p~ = m~v .

Además p~ tiene que ser un vector bajo rotaciones tridimensionales y debe tener la misma
dirección y sentido que la velocidad, por lo que

p~ = f (~v )~v .

El factor de proporcionalidad f (~v ) no puede depender de la dirección y el sentido de ~v


porque podemos cambiar esta dirección y sentido mediante un cambio de ejes, y eso no
puede modificar al vector p~. Por lo tanto f solo puede depender del módulo de la velocidad
f (|v|).

Dado que existe una relación biunı́voca entre v y γ, podemos escribir f (|v|) en la forma

f (|v|) = γg(γ)

donde g(γ) es una función a determinar.

g puede depender de la partı́cula en cuestión, pero dos partı́culas idénticas deben tener la
misma función g (de otra forma, las partı́culas podrı́an ser distinguidas y dejarı́an de ser
idénticas).

En el apéndice a este capı́tulo se demuestra que, si imponemos la condición de que el momento


lineal relativista se conserve en las colisiones en todos los sistemas de referencia, la única
posibilidad es que g sea independiente de v. Dado que a velocidades pequeñas γ ≈ 1 y el
momento lineal newtoniano es p~ = m~v se sigue que g = m, por lo que el momento lineal
relativista es
p~ = mγ~v .

En términos del cuadrimomento lineal uα tenemos

pi = mui .

m es una constante independiente de la velocidad y coincide con la masa a velocidades muy


bajas. Se denomina masa inercial o también masa en reposo de la partı́cula. Este segundo
nombre es más por razones históricas que por ser un nombre realmente adecuado.

6.2 Energı́a relativista y vector de cuadrimomento lineal.

2
En mecánica newtoniana la energı́a se define mediante el trabajo que hacen las fuerzas.
La derivada de la energı́a con respecto a tiempo es la potencia aplicada al sistema, que
corresponde a las fuerzas aplicadas por la velocidad de la partı́cula.

dE d~
p
= f~ · ~v = · ~v .
dt dt
En la segunda igualdad hemos usado la ley de Newton. En mecánica relativista, tanto la
definición de momento lineal como las leyes de newton deben ser modificadas No obstante,
podemos intentar preservar la relación

dE d~
p
= · ~v
dt dt
donde p~ es el momento lineal relativista y ver si proporciona una definición razonable de
energı́a.

Tenemos
   
dE d~
p d(γ~v ) dγ 2 d~v dγ 2 dv v 2 dγ + γvdv
= · ~v = m · ~v = m v + γ ~v =m v + γv =m
dt dt dt dt dt dt dt dt

De la definición de γ tenemos
 
2 2 1 dγ
v =c 1− 2 =⇒ 2vdv = 2c2 3
γ γ
 
1 c2
=⇒ v 2 dγ + γvdv = c2 1 − 2 dγ + 2 dγ = c2 dγ
γ γ

y por lo tanto
dE dγ
= mc2 .
dt dt
Integrando obtenemos
E = mc2 γ + K,
donde K es una constante que puede depender de las propiedades de la partı́cula pero no de
su velocidad.

Sabemos que uα es un cuadrivector que tiene componentes uα = (γc, γ~v ). Como E = mc2 γ+K
y p~ = mγv, esto sugiere que la constante de integración debe ser K = 0 de manera que
podamos definir un cuadrivector de momento lineal relativista pα mediante
 
α α α E
p = mu , p = , p~ .
c

6.4 Colisiones relativistas: Choques elásticos e inelásticos.

Una propiedad importante de la relatividad especial es que la conservación del momento lineal
en los choque implica necesariamente la conservación de la energı́a. Esta propiedad es muy
distinta en mecánica newtoniana, donde la energı́a no se conserva en general en las colisiones.

3
Por simplicidad lo demostraremos en un choque unidimensional en el que las partı́culas inci-
dentes sean las mismas que las resultantes.

En un sistema de referencia inercial S tenemos una partı́cula de masa inercial m1 con momento
lineal p1 que incide sobre otra partı́cula de masa inercial m2 con momento lineal p2 . Después
de la colisión, la partı́cula 1 sale con momento lineal p̂1 y la partı́cula 2 con momento p̂2 .
Como se ha dicho, vamos a suponer que la colisión no modifica a las partı́culas, de manera
que sus masas inerciales siguen siendo m1 y m2 .

La conservación del momento lineal impone

p1 + p2 = p̂1 + p̂2 .

En otro sistema de referencia S ′ que se mueve a velocidad u respecto de S y dado que


pµ = (E/c, p) se transforma según la ley de Lorentz tenemos que los valores de la energı́a y
del momento lineal (E ′ , p′ ) en el sistema S ′ vienen dados por
 E′    E 
c
γ − γu
c c
=
p′ − γuc γ p

donde γ es la factor de Lorentz de la velocidad u. Tenemos por lo tanto que


 
′ uE
p =γ − 2 +p
c
para cada una de las partı́culas del sistema. Si imponemos ahora la conservación del momento
lineal en el sistema S ′ , es decir
p′1 + p′2 = p̂′1 + p̂′2
obtenemos   !
uE1 uE2 uÊ1 uÊ2
γ − 2 + p1 − 2 + p2 =γ − 2 + p̂1 − 2 − p̂2 .
c c c c
Como p1 + p2 = p̂1 + p̂2 , obtenemos
uγ uγ  
(E 1 + E 2 ) = Ê 1 + Ê 2 =⇒ E1 + E2 = Ê1 + Ê2 .
c2 c2
Notemos que el mecánica newtoniana llamamos choques elásticos a aquellos en los que la
energı́a se conserva. En mecánica relativista, la energı́a siempre se conserva en los choques.
Por lo tanto el nombre elástico (con el significado de conservación de la energı́a) deja de ser
útil en relatividad especial. Por lo tanto, el concepto “elástico” se puede usar para describir
una situación completamente distinta. En relatividad especial se adopta la definición de que
un choque elástico es aquel en el que las partı́culas resultantes son idénticas a las incidentes.
Se debe tener mucho cuidado sobre cuál es el significado que se está usando de la palabra
“elástico”.

La mecánica newtoniana se debe recuperar como un lı́mite de la mecánica relativista cuando


las velocidades son bajas, En el primer caso, hay choques que no conservan la energı́a, mientras
que en el segundo la energı́a siempre se conserva (tanto a velocidades altas como bajas). Esto
parece ser una contradicción: ¿Cómo puede ser que existan choques en mecánica newtoniana
en los que la energı́a no se conserva?

4
La clave está en que el concepto de energı́a en mecánica newtoniana y en mecánica relativista
es distinto. La energı́a no necesariamente conservada en choques newtonianos es la energı́a
cinética, que tiene la propiedad que se anula cuando la velocidad de la partı́cula se anula. Por
otro lado, la energı́a que se conserva en relatividad especial es la energı́a definida por E = mγc2
que no se anula cuando la partı́cula está en reposo. De hecho a la energı́a E0 = mc2 se la
denomina energı́a en reposo de la partı́cula.

Podemos reconciliar las dos leyes de conservación de la energı́a (relativista y newtoniana) si


consideramos que E0 = mc2 contiene toda la energı́a de la partı́cula que no es debida a su
movimiento.

Si modifico las condiciones de la partı́cula, por ejemplo la caliento o la comprimo, estaré tam-
bién cambiando su contenido de energı́a interna y, por lo tanto, según la expresión E0 = mc2 ,
también estamos cambiando su masa inercial. De hecho, podemos considerar que la masa
inercial es simplemente una medida de la energı́a interna de la partı́cula. Por lo tanto, si se
absorbe o libera energı́a se estará también cambiando la masa inercial de la partı́cula.

Este hecho conduce a la predicción relativista de que la masa se puede transformar en energı́a.
De hecho la masa no es más que una forma de medir la energı́a interna, por lo que no resulta
en absoluto extraño que pueda transformar parte de esa energı́a en otras formas de energı́a.

En un choque inelástico en mecánica newtoniana (y con el significado de que no se conserva la


energı́a cinética) lo que ocurre es que la energı́a que se libera es absorbida por las partı́culas que
salen (por ejemplo calentándose, o comprimiéndose). Por lo tanto cambian su masa inercial y
las partı́culas resultantes no son idénticas a las partı́culas incidentes. Esta es la razón por la
que tiene sentido definir choques relativistas inelásticos como aquellos en los que las partı́culas
resultantes son distintas que las incidentes y llamar choques elásticos a aquellos en los que
las partı́culas resultantes son idénticas a las incidentes.

Por otro lado, una vez aceptamos que la masa inercial es un medida de la energı́a interna de
la partı́cula ya resulta perfectamente razonable que todos los choques relativistas conserven
la energı́a. En efecto, la energı́a E = mγc2 incorpora tanto la parte de la energı́a debida al
movimiento como aquella almacenada en la propia partı́cula. Por lo tanto, la conservación
de esta energı́a en las colisiones no es más que una manifestación de que la energı́a total no
puede crearse ni destruirse.

Concluimos que la energı́a total se debe conservar en cualquier choque relativista, sea este
elástico o inelástico.

Consideremos qué ocurre en una desintegración de una partı́cula en dos. Llamemos a la


partı́cula inicial 1 y a las resultantes a y b. Sabemos que tanto el momento lineal p~1 como la
energı́a relativista E1 se conservan, es decir

p~1 = p~a + p~b ,


E1 = Ea + Eb .

Dado que el cuadrimomento relativista de las partı́culas 1, a y b es precisamente


     
µ E1 µ Ea µ Eb
p1 = , p~1 , pa = , p~a , pb = , p~b ,
c c c

5
las leyes de conservación anteriores se pueden unificar en una que establece que el cuadrimo-
mento lineal se conserva en un choque relativista, es decir

P µ = pµ1 = pµa + pµb .

donde P µ es el cuadrimomento lineal total del sistema.

Si hacemos un diagrama espacio-temporal la desintegración tiene la siguiente representación:


x0 = ct


pµb
pµa

x2 = y
pµ1 = Pµ

x1 = x

La conservación de P µ en la colisión/desintegración resulta completamente natural. Este


cuadrivetor es independiente del sistema de referencia justo antes de la colisión/desintegración
y justo después de la colisión/desintegración. Si este vector cambiara en la colisión lo tendrı́a
que hacer mediante una ley que fuera la misma en todos los sistemas de referencia inerciales.
La posibilidad más sencilla es que simplemente no cambie en absoluto, lo que conduce a la
conservación del cuadrimomento total en las colisiones.

6.5 Propiedades del cuadrimomento lineal

De la definición de cuadrimomento lineal pµ = muµ tenemos

ηµν pµ pν := pµ pµ = m2 uµ uµ = −m2 c2 .

Por lo tanto la masa inercial de una partı́cula se puede obtener directamente del módulo
al cuadrado de su cuadrimomento. Como el cuadrado de un cuadrivector es un invariante
relativista, también lo es la masa inercial de una partı́cula. Todos los sistemas de referencia
están de acuerdo en el mismo valor. Esta propiedad es plenamente consistente con el hecho
de que la masa inercial es un propiedad intrı́nseca de la partı́cula independiente de quien la
observe.

6
Por otro lado, en un sistema inercial S tenemos
 
µ E
p = , p~
c

y por lo tanto

E2 2 p
pµ pµ = −(p0 )2 +~
p2 = − +p = −m2 c2 ⇐⇒ E 2 = p2 c2 +m2 c4 ⇐⇒ E= p2 c2 + m2 c4
c2

La velocidad a la que se mueve la partı́cula en un sistema de referencia inercial se puede


obtener fácilmente del cuadrimomento lineal a partir de
 
µ E p~ c2
p = , p~ = m (γc, γ~v ) =⇒ ~v =
c E

La energı́a cinética es la parte de la energı́a total que es debida al movimiento de la partı́cula.


Por lo tanto, definimos la energı́a cinética T mediante

T := E − mc2 = mγc2 − mc2 = mc2 (γ − 1) .

Veamos que esta definición es compatible con la definición newtoniana. Para velocidades
pequeñas
1 1 v2 v4
γ=q =1+ 2
+ O( 4 ),
2
1 − vc2 2c c

de manera que  
2 1 v2 v4 1 v4
T = mc + O( ) = mv 2 + O( 4 ).
2 c2 c4 2 c

Veamos que la conservación de la energı́a total implica que la masa inercial no puede conser-
varse en general en las colisiones. Consideremos una desintegración de una partı́cula de masa
inercial M en dos partı́culas de masas inercial m1 y m2 respectivamente

El cuadrimomento total antes de la colisión es P µ = M uµ . Si los cuadrimomentos de las


partı́culas resultantes son pµ1 y pµ2 tenemos la ley de conservación

P µ = pµ1 + pµ2

Si elevamos al cuadrado y usamos que P µ Pµ = −M 2 c2 tenemos

P µ Pµ = (pµ1 + pµ2 ) (p1µ + p2µ ) = pµ1 p1µ + pµ2 p2µ + 2pµ1 p2µ =⇒
−M 2 c2 = −m21 c2 − m22 c2 + 2pµ1 p2µ .

En términos de las cuadrivelocidades uµ1 y uµ2 tenemos pµ1 = m1 uµ1 , pµ2 = m2 uµ2 de manera que

M 2 c2 = m21 c2 + m22 c2 − 2m1 m2 uµ1 u2µ (1)

7
Necesitamos calcular el producto escalar uµ1 u2µ . El cuadrivector uµ1 es

uµ1 = (γ1 c, γ1~v1 ) = (γ1 c, γ1 v1~n1 ) = c (cosh β1 , sinh β1~n1 ) β1 ≥ 0

donde ~n1 es un vector espacial unitario que indica la dirección y sentido de la velocidad ~v1
en el sistema de referencia S y v1 /c = tanh β! . De manera análoga

uµ2 = c (cosh β2 , sinh β2~n2 ) , β2 ≥ 0.

El producto escalar uµ1 u2µ es

−uµ1 u2µ = c2 (cosh β1 cosh β2 − sinh β1 sinh β2~n1~n2 ) ≥ c2 (cosh β1 cosh β2 − sinh β1 sinh β2 )
= c2 cosh (β1 − β2 ) ≥ c2

y, sustituyendo en (1):

M 2 c2 = m1 c2 + m22 c2 − 2m1 m2 uµ1 u2µ ≥ m1 c2 + m22 c2 − 2m1 m2 c2 = (m1 + m2 )2 c2 ,

es decir M ≥ m1 + m2 . Además, la igualdad solamente puede ocurrir cuando ~n1 · ~n2 = 1 y


β1 −β2 = 0, es decir las dos cuadrivelocidades coinciden uµ1 = uµ2 que es un caso completamente
excepcional (las partı́culas que se forman están en reposo relativo en el momento de formarse).
Excepto en este caso especial, la suma de las masas de las partı́culas resultantes es menor que
la inicial. La energı́a sobrante es la que permite que las partı́culas resultantes tengan energı́a
cinética positiva (en el sistema de referencia en la que la partı́cula inicial está en reposo).

6.6 Cuadrimomento de un fotón y efecto Doppler.

Hasta ahora hemos considerado partı́culas masivas. Sabemos que este tipo de partı́culas se
tienen que mover a velocidades inferiores a la de la luz.
No obstante sabemos que hay partı́culas que viajan a la velocidad de la luz, por ejemplo los
fotones.
La conclusión necesaria es que los fotones deben tener masa inercial igual a cero. No obstante
todavı́a debe poseer energı́a y momento lineal y cuadrivector de momento pµ .
De la condición
pµ pµ = −m2 c2 = 0
se sigue que el cuadrivector de momento es luminoso. Dado que, en componentes
 
µ E
p = , p~
c
tenemos que
E2
− p~ 2 = 0, ⇐⇒ E = |~ p|c.
c2
Para el caso de partı́culas masivas hemos obtenido anteriormente una expresión para la velo-
cidad de la partı́cula en términos del cuadrimonento según
p~c2
~v =
E

8
Esta expresión sigue siendo válida para partı́culas sin masa ya que
p~ c2 p~
~v = =c
|~
p |c |~
p|

El vector ~n = |~pp~ | es unitario, tiene la misma dirección y sentido que ~v y además |~v | = c, como
debe ser para una partı́cula sin masa.
p|~n = Ec ~n obtenemos que el cuadrivector de momento para una partı́cula sin masa
De p~ = |~
adopta la forma
E
P µ = (1, ~n) .
c
Es costumbre denotar al cuadrimomento de un partı́cula sin masa mediante el sı́mbolo K µ ,
es decir
E
K µ = (1, ~n) .
c
Podemos obtener a partir de esta expresión la ley de Doppler si tenemos en cuenta que, según
la mecánica cuántica la energı́a de un fotón está relacionada con su frecuencia ν mediante
E = hν,
donde h es la constante de Planck y ν la frecuencia del fotón. Por lo tanto el cuadrimomento
es

Kµ = (1, ~n) .
c
Supongamos que un fotón tiene frecuencia ν es un sistema de referencia S. Consideremos un
sistema S ′ que se mueve con velocidad ~v respecto del anterior. Si escogemos los ejes de los
sistema de manera que ~v sea paralelo al eje x, la transformación de Lorentz es
 
γ − γv
c 0 0
 − γv γ 0 0 
 c 
 0 0 1 0 
0 0 0 1
Si aplicamos esta transformación al cuadrivector K µ expresando en el sistema S obtenemos
el mismo cuadrivector expresado en en el sistema S ′ , es decir
     hν 
hν ′
c γ − γv
c 0 0 c
 hν ′ ′   γv
 c nx   − c γ 0 0   hν nx 
 c 
 hν ′ ′  = 
 c ny  0 0 1 0   hν c ny


hν ′ hν
0 0 0 1 c nz
c nz

Si nos quedamos con la componente 0, obtenemos


hν ′ hν  v 
= γ 1 − nx .
c c c
Teniendo en cuenta que por la elección de ejes que hemos hecho ~v = v~ex y por lo tanto
vnx = ~v · ~n y llegamos a siguiente expresión general para el efecto Doppler relativista
 
′ ~v · ~n
ν = νγ 1 − .
c

9
6.7 Efecto Compton

El efecto Compton es el cambio de frecuencia de un fotón cuando es desviado por una partı́cula
cargada, tı́picamente un electrón.

Este efecto no puede ser explicado dentro de la teorı́a ondulatoria de la luz y por lo tanto
proporciona evidencia experimental del comportamiento corpuscular de los fotones en ciertas
condiciones, de acuerdo con la mecánica cuántica.

Tı́picamente la desviación se produce con electrones en átomos, para los que las velocidades
son muy inferiores a c. Podemos por lo tanto considerar el caso en que el fotón incide sobre
un electrón en reposo. Después de la colisión, el electrón se encontrará en movimiento y el
fotón tendrá distinta energı́a (y por lo tanto distinta frecuencia).

Si llamamos θ al ángulo formado entre las direcciones de movimiento del fotón incidente y el
fotón desviado, el efecto Compton establece que la longitud de onda λ′ del fotón desviado y
la longitud de onda λ del fotón incidente satisfacen
h
λ′ − λ = (1 − cos θ)
me c
donde me es la masa del electrón (o, en general, de la partı́cula sobre la que incide el fotón).

Vamos a deducir esta expresión como consecuencia de le ley de conservación del cuadrimo-
mento lineal total en una colisión. El electrón está inicialmente en reposo por lo que su energı́a
es me c2 . La conservación de la energı́a impone

hν + me c2 = hν ′ + Ee′ (2)

donde Ee′ es la energı́a del electrón después de la colisión. Esta energı́a está relacionada con
el momento lineal del electrón después de la colisión mediante

Ee′ 2 = pe′ 2 c2 + m2e c4 . (3)

Necesitamos determinar p~e′ 2 . El momento lineal inicial del electrón se anula, por lo que la
conservacion del momento lineal es
p~e′ = p~f − p~f′
donde p~f es el momento lineal del fotón incidente y p~f′ es el momento lineal del fotón resultante.
Si elevamos al cuadrado esta igualdad vectorial obtenemos,

p~e′ 2 = pf2 + p′f2 − 2pf p′f cos θ.

Para un fotón tenemos la relación E = pc y, por lo tanto,



pe′ 2 c2 = p2f c2 + p′f2 c2 − 2pf p′f c2 cos θ = Ef2 + Ef′ 2 − 2Ef Ef′ cos θ = h2 ν 2 + ν ′ 2 − 2νν ′ cos θ .

Sustituyendo en (3) 
Ee′ 2 = h2 ν 2 + ν ′2 − 2νν ′ cos θ + m2e c4 .

10
Si aislamos Ee′ de la conservación de la energı́a (2) y elevamos al cuadrado obtenemos
2  
Ee′ 2 = hν + me c2 − hν ′ = h2 ν 2 + ν ′2 − 2νν ′ + m2e c4 + 2hme c2 ν − ν ′ =

= h2 ν 2 + ν ′2 − 2νν ′ cos θ + m2e c4 .
Cancelando términos tenemos

2hme c2 ν − ν ′ = 2h2 νν ′ (1 − cos θ) .
c
Dividiendo por νν ′ y usando que λ = ν

me c λ′ − λ = h (1 − cos θ) ,
que es la fórmula para el efecto Compton.

6.8 Leyes de Newton en relatividad especial.

La ley de Newton en mecánica relativista es


d~v
f~ = m .
dt
Sabemos que esta ley debe ser modificada porque fuerzas constantes durante suficiente tiempo
conducen a velocidades mayores que las de la luz.
Por otro lado, la ecuación de Newton también se puede escribir como
d~
p
f~ =
dt
y de hecho esta es la forma correcta en sistemas de masa variable, por ejemplo en problemas
de propulsión.
En relatividad especial hemos cambiado la definición de momento lineal de manera que el
momento lineal total se conserva en los choques. Resulta por lo tanto natural adoptar como
segunda ley de Newton la ecuación
d~
p
f~ = (4)
dt
donde p~ es el vector de momento lineal relativista. En términos de la velocidad tiene la forma
 
d  m~v 
f~ = q .
dt 1− v2
c2

El momento lineal relativista crece indefinidamente cuando v → c de manera que aunque


hagamos fuerza durante un tiempo indefinidamente grande, la velocidad no llegará nunca a
igualar la de la luz. Por otra lado, para velocidades pequeñas comparadas con las de la luz,
esta ley se reduce a la ley newtoniana de la dinámica. Notemos que esta expresión para la ley
de Newton relativista hace que el denominado Teorema de las fuerzas vivas, y que asegura
que la variación de la energı́a coincide con la potencia aplicada al sistema, sigue siendo válido
dE
= f~ · ~v (5)
dt
dE d~
p
(recordemos que dt = dt · ~v se ha usado para definir la energı́a relativista).

11
Al vector tridimensional f~ se le denomina 3−f uerza. No es un vector de Lorentz y ni siquiera
es la parte espacial de un cuadrivector.

La expresión covariante, es decir que sı́ define un cuadrivector es


dpµ
Fµ = .

donde τ es el tiempo propio, que sı́ es un escalar Lorentz. F µ es la denominada cuadrifuerza

Esta expresión covariante nos permite determinar de qué manera se transforma la 3-fuerza
bajo un cambio de sistema de referencia.

Lo primero que debemos observar es que F µ es siempre ortogonal al cuadrimomento de la


partı́cula (o equivalentemente a su cuadrivelocidad). En efecto

dpµ duµ
Fµ = =m
dτ dτ
y si derivamos el modulo al cuadrado de la cuadrivelocidad
d duµ duν duµ
0= (uµ uν ηµν ) = ηµν uν + uµ ηµν = 2 ηµν uν = 2F µ ηµν uν = 0
dτ dτ dτ dτ
es decir, ortogonal a la cuadrivelocidad.

En componentes, esta ecuación dice

F~ · ~v
−u0 F 0 + ~u · F~ = 0, ⇐⇒ −γcF 0 + γ~v F~ = 0, ⇐⇒ F0 = .
c
Por otro lado , la componente espacial de la cuadrifuerza es

d~
p p dt
d~
F~ = = = γ f~
dτ dt dτ
~
Sustituyendo en F 0 obtenemos F 0 = γ v·cf por lo que la cuadrivelocidad se puede escribir en
términos de la 3-fuerza como  
µ f · ~v ~
F =γ ,f
c

Sabiendo que F µ se transforma como un cuadrivector podemos obtener la ley de transforma-


ción de f~ bajo cambios de sistema de referencia inerciales.

6.8 Apéndice. Definición de momento lineal relativista.

Consideremos un sistema de referencia inercial S en el que dos partı́culas idénticas con velo-
cidades iguales y opuestas colisionan. Después de la colisión esas mismas partı́culas salen con
velocidades iguales y opuestas pero en dirección perpendicular a la de incidencia.

12
Si tomamos ejes en S de manera que el eje x vaya a lo largo de la dirección de incidencia y
el eje y a lo largo de la dirección de salida de las partı́culas tenemos que la velocidad de las
partı́culas 1 y 2 antes de la colisión es
~v1 = v~ex , ~v2 = −v~ex
mientras que sus velocidades después de la colisión son
~u1 = v~ey , ~u2 = −v~ey .

Consideremos un sistema de referencia S ′ con ejes paralelos a S y que se mueve con velocidad
−v~ex con respecto a S.
Por la ley de adición de velocidades tenemos que las velocidades de las partı́culas 1 y 2 antes
y después de la colisión en el sistema S ′ son
2v
~v1′ = ~e ,
v2 x
~v2′ = 0,
1+ c2
v v
~u1′ = v~ex + ~ey , ~u1′ = v~ex − ~ey .
γv γv

En S ′ el módulo de la velocidad de las partı́culas incidentes es, respectivamente


2v
v1′ = v2
, v2′ = 0.
1+ c2
Cada partı́cula saliente sale con una velocidad cuyo módulo es
v2 v4
u′2 = v 2 + = 2v 2
− .
γv2 c2
La conservación del momento lineal en el eje x en el sistema S ′ es
v1′ γv1′ g(γv1′ ) = 2vγu′ g(γu′ ), (6)
donde hemos usado que todas las partı́culas son idénticas y por lo tanto la función g que
aparece en el definición de momento lineal es la misma para todas ellas.
Necesitamos determinar v1′ γv1′ y 2vγu′ . Por un lado
v′ 2v 1 2v
v1′ γv1′ = q 1 = v2
r = v2
v1′ 2 1+ 4v 2 1−
1− c2
c2 1− 2 c2
c2 (1+ v2 )2
c

y por otro
2v 2v 2v
2vγu′ = q =q = v2
.
1− u′2
1− 2v 2
+ v4 1− c2
c2 c2 c2

Ambas son iguales por lo que la ley de conservación (6) se simplifica a


g(γv1′ ) = g(γu′ ).
Dado que v1′ es distinto a u′ y que v es arbitrario, concluimos que la función g tiene que ser
constante.

13

También podría gustarte