Apuntes Mecánica
Apuntes Mecánica
L(q A , q̇ A , t), A = 1, · · · , n
donde TAB es una matriz simétrica y definida positiva que puede depender de las coordenadas
{q} y V es una función de {q}. Ser definida positiva significa que
n X
X n
TAB q̇ A q̇ B > 0 para todo q̇ A 6= 0. (2)
A=1 B=1
∂L
Para calcular las ecuaciones de Euler-Lagrange necesitamos conocer ∂ q̇ A
:
n n
! n n
∂L ∂ 1XX 1XX ∂
A
= A TBC (q)q̇ B q̇ C = TBC (q) A q̇ B q̇ C =
∂ q̇ ∂ q̇ 2 2 ∂ q̇
B=1 C=1 B=1 C=1
n n n n
1XX B C
1X 1X
= TBC (q) δA q̇ + q̇ B δA
C
= TAC (q)q̇ C + TBA (q)q̇ B
2 2 2
B=1 C=1 C=1 B=1
n
X
= TAB (q)q̇ B
B=1
obtenemos !
n
X n n
d ∂V 1 X X ∂TBC B C
TAB (q)q̇ B =− + q̇ q̇ (4)
dt ∂q A 2 ∂q A
B=1 B=1 C=1
Podemos ahora considerar cuáles son los estados de equilibrio del sistema. Buscamos estados
q A = q0A donde q0A sean constantes (para que el sistema esté en equilibrio) y que satisfagan
las ecuaciones de Lagrange (4). Como q̇ A = 0, estas constantes serán solución si y solamente
si
∂V
= 0. (5)
∂q A q0
Es decir los estados de equilibrio son aquellas posiciones en los que el potencial tenga un
extremo. Nuestro interés es estudiar el movimiento del sistema cerca de esta punto.
1
1.2 Ecuaciones linealizadas y Lagrangiano asociado
Para analizar el movimiento cerca de un estado de equilibrio consideramos soluciones del tipo
y queremos que QA (t) sean funciones pequeñas para todo t. Notemos que q̇ A = Q̇A . Esto
significa que podemos despreciar todos los términos cuadráticos en QA , tanto en posiciones
como en velocidades.
Observemos que tanto V como TAB dependen de q A . Por lo tanto, también dependerán de
QA . Para poder quedarnos a primer orden en las ecuaciones (4) debemos desarrollar tanto
∂V
TAB como ∂q A en serie de Taylor.
∂V
Para conocer ∂q A
a primer orden debemos desarrollar V (q) a segundo orden. Dado que esta-
∂V
mos en un punto extremo para V tenemos que ∂q A q
= 0 y el desarrollo es
0
n
X n n
∂V A1 X X ∂2V
V (q) = V (q0 + Q) = V (q0 ) + Q + QA QB + O(Q3 ) (7)
∂q A q0 2 ∂q A ∂q B q0
A=1 A=1 B=1
n n
1XX
= V0 + UAB QA QB + O(Q3 ) (8)
2
A=1 B=1
donde V0 := V (q0 ) y
∂2V
UAB := (9)
∂q A ∂q B q0
Si U
PAB esPdefinida positiva, entonces q0 es un mı́nimo del potencial. Si la forma cuadráti-
ca nA=1 nB=1 UAB QA QB tiene otras signaturas, el punto extremo puede ser también un
máximo, o un punto de silla.
∂V
Para calcular la derivada ∂q A
usamos primero la regla de la cadena
n
X n
X
∂V ∂V ∂QB ∂V B ∂V
A
= B A
= B
δA = (10)
∂q ∂Q ∂q ∂Q ∂QA
B=1 B=1
B
donde hemos usado QA = q A − q0A , que implica ∂Q
∂q A
B . Usamos ahora el desarrollo de
= δA
Taylor (8) y llegamos a
Xn
∂V
= UAB QB + O(Q2 ). (11)
∂q A
B=1
TAB (q) = TAB (q0 + Q) = TAB (q0 ) + O(Q) = MAB + O(Q) (12)
donde MAB := TAB (q0 ) es una matriz constante, simétrica y definida positiva.
2
Sustituyendo en las ecuaciones de Lagrange (4) tenemos
N
! n
d X B 2
X
MAB Q̇ + O(Q ) = − UAB QB + O(Q2 ), ⇐⇒
dt
B=1 B=1
N
X n
X
MAB Q̈B = − UAB QB + O(Q2 ).
B=1 B=1
Despreciamos ahora todos los términos cuadráticos y llegamos al sistema de ecuaciones dife-
renciales de segundo orden
n
X
MAB Q̈B + UAB QB = 0. (13)
B=1
Este sistema es lineal con coeficientes constantes, por lo que es mucho más simple que el
problema original. La simplificación ha provenido de analizar el movimiento cerca de un
punto de equilibrio del sistema.
Podemos obtener estas ecuaciones de manera mucho más directa si hacemos el desarrollo de
Taylor directamente al Lagrangiano (1):
n X
X n
1
L= TAB q̇ A q̇ B − V =
2
A=1 B=1
Xn X n n X
X n
1 1
= MAB Q̇A Q̇B − V0 − UAB QA QB + O(Q3 ).
2 2
A=1 B=1 A=1 B=1
Si despreciamos los términos cúbicos ası́ como la constante V0 , que es irrelevante dado que
simplemente modifica el origen de energı́as, llegamos al Lagrangiano
1 XX
n n
L′ (QA , Q̇A ) = MAB Q̇A Q̇B − UAB QA QB . (14)
2
A=1 B=1
Es inmediato comprobar que las ecuaciones de Lagrange de este Lagrangiano coinciden con
las ecuaciones linealizadas (13).
En resumen, para obtener las ecuaciones del movimiento de pequeños desplazamientos alre-
dedor de un punto de equilibrio de un sistema Lagrangiano independiente del tiempo y de la
forma (1), podemos simplemente hacer un desarrollo de Taylor a segundo orden del propio
Lagrangian alrededor de ese punto de equilibrio.
Busquemos soluciones para el sistema de ecuaciones (13) del tipo QA (t) = C A f (t) donde C A
son constantes y f (t) es una función de t a determinar. Si sustituimos en (13) obtenemos
N
!
X X N ¨(t)
f
f¨(t)MAB C B + UAB f (t)C B = 0 ⇐⇒ UAB + MAB C B = 0. (15)
f (t)
B=1 B=1
3
Los coeficientes UAB , MAB y C A son constantes por lo que la única posibilidad para que esta
ecuación tenga solución es que
f¨(t) = −λf (t) (16)
donde λ es una constante y, además se satisfaga
N
X
(UAB − λMAB )C B = 0. (17)
B=1
Este es un problema algebraico que se puede escribir en forma matricial de la siguiente manera:
Sea M la matriz cuadrada con coeficientes MAB , U la matriz cuadrada con coeficientes UAB
y C el vector columna con coeficientes C A . El problema algebraico a resolver es
(U − λM ) C = 0. (18)
Este es un problema de valores propios. La condición necesaria y suficiente para que exista
un vector propio C 6= 0 es que
det (U − λM ) = 0. (19)
El polinomio caracterı́stico
det (U − λM ) = 0 (20)
es un polinomio de grado n en λ. En principio, este polinomio admite n soluciones complejas
(contando multiplicidad). No obstante, en el caso concreto que nos ocupa los coeficientes son
reales, las matrices M y U son simétricas y M es definida positiva. Bajo estas condiciones
tenemos las siguientes propiedades:
C1 T M C2 = 0. (22)
5. Si un autovalor admite dos o más vectores propios linealmente independientes (es decir,
el autovalor tiene multiplicidad mayor que uno) entonces dichos vectores se pueden tomar
ortogonales entre sı́ (con respecto a la matriz M ).
Dado que M es definida positiva podemos normalizar C A de manera que sean unitarios con
respecto a esta matriz, es decir
C TA M C A = 1, A = 1, · · · , N. (23)
4
En resumen, existen n constantes reales λA (posiblemente repetidas) y n vectores reales CA
linealmente independientes que satisfacen
(U − λA M ) CA = 0,
C TA M CB = δAB . (24)
Para cada autovalor λ, tenemos una solución QA (t) = C A f (t), con C A el autovector de λ y
f (t) satisfaciendo
f¨ = −λf. (25)
5
Cuando estamos en esta situación todos los autovalores son positivos y se pueden escribir en
la forma
2
λ A = ωA , ωA 6= 0 (27)
satisface las ecuaciones del movimiento. En esta expresión el vector columna C A es el auto-
vector asociado al autovalor λA = ωA 2 y las constantes a y b son arbitrarias. Esta solución
A A
es oscilatoria con frecuencia angular ωA .
Podemos obtener la solución general del problema simplemente sumando los distintos modos
normales de oscilación
N
X
Q(t) = CA aA sin (ωA t) + bA cos (ωA t) (30)
A=1
En resumen:
Otra propiedad interesante de los modos normales de oscilación es que permiten desacoplar
completamente el problema original (que tiene n variables acopladas) en n problemas inde-
pendientes de una sola variable.
Para ello, vamos a considerar un cambio de variable entre las QA (que recordemos están
definidas mediante QA := q A − q0A ) y un nuevo conjunto de variables {Z 1 , · · · , Z n } definidas
mediante el cambio lineal
Q = CZ (31)
6
donde Z es el vector columna
Z1
Z2
Z= ..
.
Zn
y la matriz C es la matriz cuadrada definida de manera que su columna A-ésima es el
autovector C A , es decir
C = ( C1 , · · · , Cn )
1 XX
n n
L′ = MAB Q̇A Q̇B − UAB QA QB . (32)
2
A=1 B=1
C TA M C B = δAB
C TA U C B = C TA (U C B ) = C TA λB M C B = λA δAB . (35)
C TA U C B = λA δAB . (36)
En otras palabras,
λ1 0 ··· 0 ω12 0 ··· 0
0 λ2 ··· 0 0 ω22 ··· 0
CT U C = .. .. .. .. = .. .. .. ..
. . . . . . . .
0 ··· 0 λn 0 ··· 0 ωn2
7
y el Lagrangiano en las coordenadas {Z 1 , · · · Z n } toma la forma
2
ω1
1 T ..
L′ (Z, Ż) = Ż Z − Z T . Z =
2 2
ωn
1 X 2
n
2 2
= ŻA − ωA ZA
2
A=1
que es la suma de n lagrangianos independientes, cada uno con un solo grado de libertad.
Cada uno de estos Lagrangianos es
1 2 2 2
LA = ŻA − ωA ZA (37)
2
y por lo tanto describe a un oscilador armónico unidimensional de frecuencia angular ωA .
Notemos que aunque cada una de estas funciones es periódica, el movimiento del sistema no
es, en general, periódico. La condición necesaria y suficiente para que el sistema sea periódico
es que exista un tiempo T tal que ωA T = 2πnA , donde nA son números enteros. En otras
palabras, es necesario y suficiente que los cocientes entre cualesquiera dos modos normales de
oscilación del sistema sea un número racional. Si esto no ocurre, el sistema no es periódico.
Incluso si los modos normales tienen cocientes racionales, puede ocurrir que los valores de nA
sean muy grandes. En ese caso, el periodo T será una cantidad muy grande y el sistema se
comportará a todos los efectos como si no fuera periódico.
Una observación final importante. Como el sistema en las variables Z A está desacoplado,
podemos multiplicar cada una de las ZA por una constante (distinta para cada una de las
coordenadas) y las ecuaciones del movimiento para las nuevas coordenadas serán idénticas
(debido a que las ecuaciones son lineales). Teniendo en cuenta la forma que tiene el cambio
de variable entre las QA y las Z A observamos que multiplicar cada una de las Z A por una
constante (distinta) es equivalente a multiplicar el autovector CA por esa misma constante.
En otras palabras, podemos escoger los autovectores sin imponer ninguna normalización y el
cambio
1 1
Q Z
Q2 Z2
.. = C1 · · · Cn ..
. .
Q n Zn
8
Vamos a considerar el movimiento de dos péndulos acoplados, ambos de masa m y longitud
L, separados por una distancia L0 y acoplados con un muelle de constante recuperadora k y
longitud natural L0 tal y como se muestra en la figura. Queremos estudiar el movimiento de
los péndulos cerca de su posición de equilibrio, que se encuentra en θ1 = θ2 = 0.
111111111111111111111111111111111
000000000000000000000000000000000
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
000000000000000000000000000000000
111111111111111111111111111111111
~ex
L0
~n2
~n1 θ2
θ1
L
L
m m
9
√ x
Tomando la raı́z cuadrada y usando a2 + x = a + 2a + O(x2 ) llegamos a
1 h i
L′ = mL2 θ̇12 + θ̇22 − ω 2 + Ω2 θ12 + θ22 − 2Ω2 θ1 θ2 (49)
2
La matriz M es, por lo tanto
2 1 0
M = mL
0 1
y la matriz U es
2 ω 2 + Ω2 −Ω2
U = mL
−Ω2 ω 2 + Ω2
El polinomio caracterı́stico
det (U − λM ) = 0, (50)
toma la forma
ω 2 + Ω2 − λ −Ω2 2
2 = λ2 − 2λ ω 2 + Ω2 + ω 2 + Ω − 2Ω4 =
−Ω ω + Ω2 − λ
2
= λ − ω 2 λ − ω 2 − 2Ω2 .
En cuanto a los modos normales de vibración, vienen determinados por los autovectores de
cada autovalor. Para obtenerlos debemos resolver
2
U − ωA M CA = 0
10
que explı́citamente tienen la siguiente forma. Para λ1 = ω 2
1
Ω2 −Ω2 C1 0
=
−Ω2 Ω2 C12 0
son los modos normales de oscilación. Si invertimos, tenemos que Z1 =√(θ1 + θ2 )/2 oscila con
frecuencia angular ω y Z2 = (θ1 − θ2 )/2 oscila con frecuencia angular ω 2 + 2Ω2 .
Para observar los modos normales en el sistema basta con escoger los datos iniciales de manera
que todos los modos normales menos uno tengan posición y velocidad inicial igual a cero. En
el ejemplo de los péndulos acoplados, para observar el modo de oscilación Z1 debemos colocar
el sistema de manera que inicialmente Z2 = 0 y Ż2 = 0, Es decir que el instante inicial θ1 = θ2
y θ̇1 = θ̇2 . La solución satisface Z2 (t) = 0 y por lo tanto tenemos θ1 (t) = θ2 (t) para todo
t y el sistema oscila con la misma frecuencia que un péndulo simple (modo normal ω1 ). Si
los datos iniciales son θ0 (t0 ) = −θ1 (t0 ) y θ1 (t0 ) = −θ2 (t0 ) (es decir Z1 = Ż1 = 0 en t = t0 )
√ θ1 (t) = −θ2 (t) y el sistema oscila con la segunda frecuencia normal de oscilación
entonces
ω2 = ω 2 + 2Ω2 .
11
Tema 2. Cinemática del Sólido Rı́gido
2.1 Introducción y definición de sólido rı́gido.
Un sólido rı́gido es un cuerpo que no sufre deformaciones, es decir tal que la distancia entre
dos puntos cualesquiera del sólido es constante y no depende de las fuerzas que actúan sobre
él ni de su estado de movimiento.
El concepto de sólido rı́gido es una idealización. No hay ningún material totalmente inde-
formable. De hecho, su existencia es incluso incompatible con la relatividad especial (este
hecho no nos incumbe ahora porque estamos en el marco de la mecánica Newtoniana, pero
sı́ pone de manifiesto que los sólidos rı́gidos perfectos no pueden existir). No obstante es una
idealización extremadamente útil en numerosos casos.
Obviamente la idealización de sólido rı́gido depende no solamente del cuerpo en cuestión sino
también de las fuerzas que estén actuando y del estado de movimiento concreto del objeto.
Un viga de acero es un buen ejemplo de sólido rı́gido en muchas circunstancias pero si las
tensiones son suficientemente altas también se deformará (o incluso romperá).
Ejemplos de sólidos rı́gidos en situaciones cotidianas son: un piedra, una peonza, la luna, una
nave espacial, un barco, una barra de acero, etc.
La propiedad que caracteriza a un sólido rı́gido es que identificados dos puntos cualesquiera
en el sólido (por ejemplo mediante un punto dibujado con un rotulador), la distancia entre
los dos puntos se mantiene constante en el tiempo.
Podemos colocar el sólido en cualquier posición en el espacio, por lo que el punto p1 puede
ocupar cualquier localización. Necesitamos tres coordenadas para determinar su posición de
manera unı́voca.
p2
p2
p1
p3 p3
p1
1
Fijado el punto p1 , el punto p2 debe encontrarse a una distancia d(p1 , p2 ) conocida. Por lo
tanto debe estar sobre una esfera de ese radio centrada en la posición de p1 . Podemos orientar
el sólido de manera que p2 puede localizarse en cualquier punto de esa esfera. Necesitamos
dos coordenadas para fijar su posición.
Con los puntos p1 y p2 fijos solo podemos girar el cuerpo alrededor de eje formado por la
lı́nea que une p1 con p2 . Para fijar la posición de p3 debemos determinar un ángulo de giro
alrededor de ese eje.
Si consideramos un sólido rı́gido como una colección de N >> 1 átomos puntuales, el numero
de grados de libertad sin la condición de sólido rı́gido serı́a 3N . La rigidez del sólido reduce
enermemente el número de grados de libertad. Esto hace que el sistema sea tratable y es la
razón por la que la idealización de sólido rı́gido resulta ser tan útil.
Sabemos que necesitamos 6 coordenadas para describir a un sólido rı́gido. ¿Qué coordenadas
se pueden usar para describir esos grados de libertad?
Tres de ellos resultan claros. Fijemos un punto cualquiera (que denotamos por O′ ) del sólido.
Para fijar su posición usar tres coordenadas de la forma habitual (pueden ser coordenadas
cartesianas, o esféricas o las que se necesiten, cualesquiera que permitan fijar la posición de
un punto en el espacio).
Para ello fijemos una base ortonormal de vectores con origen en O′ y ligados al sólido. Por
ejemplo:
~e ′z
O′
z
~e ′y
~e ′x
~ez
~ey y
~ex
2
Si conocemos la expresión de las base {~e ′1 = ~e ′x , ~e ′2 = ~e ′y , ~e ′3 = ~e ′z } en términos de la base
del sistema de referencia inercial {e1 = ex , e2 = ey , e1 = ez } conoceremos la orientación del
cuerpo.
Podemos expresar
~e ′x · ~e ′x = 1, ~e ′y · ~e ′y = 1, ~e ′z · ~e ′z = 1,
~e ′x · ~e ′y = 0, ~e ′x · ~e ′z = 0, ~e ′y · ~e ′z = 0,
que son seis condiciones. Por lo tanto las rotaciones tienes tres parámetros libres. Más adelante
encontraremos una posible parametrización (hay varias).
Veamos ahora cómo se puede mover el sólido. Denotemos por xO′ , yO′ , zO′ la posición de O′ .
El movimiento viene descrito por
{xO′ (t), yO‘ (t), zO‘ (t)} {~e ′x (t), ~e ′y (t), ~e ′z (t)} (1)
Los vectores ~e ′i son solidarios al cuerpo. Obtengamos una expresión para la derivada temporal
~ un vector de ese tipo. Podemos
de cualquier vector con origen en O′ y fijo en el cuerpo. Sea A(t)
descomponerlo en la base {~e i },′
~ = Ai~e ′i .
A (2)
Las cantidades Ai son constantes puesto que el vector A ~ es fijo en el sólido. Los vectores ~e ′
i
sı́ dependen del tiempo (con respecto a la base inercial). Podemos descomponer sus derivadas
con respecto al tiempo en la propia base móvil mediante nueve funciones
d~e ′x
= α11 (t)~e ′x + α12 (t)~e ′y + α13 (t)~e ′z ,
dt
d~e ′y
= α21 (t)~e ′x + α22 (t)~e ′y + α23 (t)~e ′z ,
dt
d~e ′z
= α31 (t)~e ′x + α32 (t)~e ′y + α33 (t)~e ′z .
dt
d~e ′x
· ~e ′x = 0 =⇒ α11 = 0 (3)
dt
y por la misma razón α22 = α33 = 0.
3
Si derivamos la condición ~e ′x (t) · ~e ′y (t) = 0 con respecto al tiempo tenemos
d~e ′x d~e ′y
· ~e ′y (t) + ~e ′x (t) · =0 =⇒ α12 + α21 = 0 (4)
dt dt
y por la misma razón α13 + α31 = 0 y α23 + α32 = 0.
Definamos las tres cantidades ω1 (t) := α23 (t), ω2 (t) := α23 (t) y ω3 (t) := α12 (t) y el vector
~ (t) := ω1~e ′x + ω2 (t)~e ′y + ω3 (t)~e ′z
ω
d~e ′x
= ω3 ~e ′y − ω2 ~e ′z = ω
~ × ~e ′x
dt
d~e ′y
= −ω3 ~e ′x + ω1 ~e ′z = ω~ × ~e ′y
dt
d~e ′z
= ω2 ~e ′x − ω1 ~e ′y = ω
~ × ~e ′z
dt
y llegamos a
~
dA
= A1 ω~ × ~e ′x + A2 ω
~ × ~e ′y + A3 ω
~ × ~e ′z , (5)
dt
es decir, para cualquier vector fijo con respecto al sólido, su variación con respecto al tiempo
~
dA
=ω ~
~ × A. (6)
dt
Podemos ahora determinar qué puntos del sólido se encuentran instantáneamente en reposo.
Un punto p con vector de posición ~rp con respecto del punto O′ se encuentra en reposo
instantáneo en el instante t0 si
d~rp (t0 )
=0 ⇐⇒ ω
~ (t0 )×~rp (t0 ) = 0 ⇐⇒ ~rp (t0 ) proporcional a ω
~ (t0 ).
dt
(7)
En consequencia, el vector ω
~ define una dirección en la que todos los puntos están instantáne-
manete en reposo, es decir apunta en la dirección del eje de giro del cuerpo. A este eje se le
denomina eje instantáneo de rotación.
Puede ocurrir que el sólido tenga un punto que esté obligado a permanecer en reposo
(un punto fijo). Por ejemplo, un columpio, una noria, una peonza que no se desplaza por el
suelo. En ese caso es conveniente escoger O′ como uno de los puntos fijos.
4
Vamos a calcular la energı́a cinética del cuerpo. Imaginemos el cuerpo formado por un número
finito de partı́culas de masas ma , a = 1 · · · N (más adelante tomaremos el lı́mite continuo).
La energı́a cinética es
N
1X
T = ma~v 2a . (8)
2
a=1
El vector de posición ~r ′a del punto a respecto de O′ es fijo con respecto al sólido. Si llamamos
~ra el vector de posición de a con respecto al sistema inercial tenemos
~ O′ + ~r ′a ,
~ra = R (9)
~ O′ es el vector de posición de O′ con respecto al origen del sistema de referencia.
donde R
donde V~O′ es la velocidad del punto O′ con respecto del sistema inercial. Este fórmula simple-
mente dice que la velocidad del punto p del sólido respecto del sistema de referencia inercial
es la velocidad de ese punto respecto del punto O′ del sólido más la velocidad del punto
O′ respecto del sistema de referencia inercial. Es importante observar que la velocidad de p
respecto de O′ no es la observada desde el punto de vista del sólido (puesto que se anuları́a)
sino la medida desde el sistema de referencia inercial. Corresponde a la relativa entre p y O′
medida en ese sistema de referencia.
Sustituyendo en T :
1X
N 2
T = ma V~ 2′ + 2V
~O ′ · ω
~ × ~r ′a + ω ~ × ~r ′a
O
2
a=1
N
!! N
1 X 1X 2
2
= M VO‘ + V~O ′ · ω~× ma~r a ′
+ ~ × ~r ′a ,
ma ω
2 2
a=1 a=1
N
X
~ CM
ma~r ′a = M R O‘
(11)
a=1
y obtenemos
1 1X N
2
~O ′ · ω O′
~ CM
2
T = M VO‘ + MV ~ ×R + ~ × ~r ′a .
ma ω (12)
2 2
a=1
Esta descomposición de la energı́a cinética de un sólido rı́gido fue obtenida por Samuel König
en 1751. Se la conoce como Teorema de König.
5
Observemos que la elección O′ = punto en reposo o bien O′ = CM hace que uno de los
sumandos se anule. Esta es la razón por la que dicha elección resulta ser útil.
~ 2′ corresponde a la energı́a cinética que tendrı́a el sólido si estuviera todo él
El término 12 M V O
concentrado en O′ . Se conoce como energı́a cinética de translación:
O′ 1 ~2
Ttrans = MV O′ . (13)
2
P
El término 21 N ω~r ′a )2 es la energı́a cinética debida al movimiento de rotación alrededor
a=1 ma (~
del punto O′ . Se la conoce como energı́a cinética del rotación respecto de O’:
N
′ 1X 2
O
Trot = ~ × ~r ′a .
ma ω (14)
2
a=1
Vamos a obtener una expresión conveniente para la energı́a cinética de rotación, lo que nos
permitirá introducir los conceptos de momento de inercia y de tensor de inercia.
ρa
α ~ra
ω
~
Denominemos ρa la distancia de cada punto a con respecto al eje ∆(t). Del dibujo tenemos
2
~ × ~r ′a = ω 2 ra′ 2 sin2 α = ω 2 ρ2a
ω (16)
6
de manera que
N
1X 2 1
O‘
Trot = ~ × ~r ′a = I∆ ω 2
ma ω (17)
2 2
a=1
PN 2
donde I∆ := a=1 ma ρa es el momento de inercia del sólido con respecto al eje ∆.
Dado que el eje de rotación va cambiando con el tiempo necesitamos conocer el momento de
inercia con respecto a todos los ejes del cuerpo, y hay infinitos de ellos.
Conviene encontrar una manera de hacer el cálculo de una vez por todas.
Notemos la identidad
2
′ 2
~ × ~r ′a = ω 2 ra′ 2 sin2 α = ω 2 ra′ 2 (1 − cos2 α) = ω 2 ra′ 2 − ω 2 ra′ 2 cos2 α = ω
ω ~ 2~r ′2
a − ω
~ · ~r a .
(18)
Además
3
X 3 X
X 3
~2 =
ω ωi ωi = ω i ω j δij (21)
i=1 i=1 j=1
y, en consecuencia
3 X
X 3
2
ω
~ × ~r ′a = ra′ 2 δij − ra′ i ra′ j ω i ω j (22)
i=1 j=1
7
Definimos una matriz 3 × 3 simétrica
N
X
′
IijO := ma ra′ 2 δij − ra′ i ra′ j (23)
a=1
′
IijO se denomina tensor de inercia (a veces también matriz de inercia) respecto del puntó O′ .
Es una propiedad del sólido (independiente de su estado de movimiento) y depende del punto
O′ que se ha escogido en el sólido.
Si llamamos a las coordenadas del vector ~r ′a = x′a~e ′x + ya′ ~e ′y + za′ ~e ′z (es decir ra′ ,1 = x′a ,
ra′ 2 = ya′ , ra′ 3 = za′ ), la componente 11 de la matriz es
N
X N
′ X
O
I11 = ma ra′ 2 − x′a 2 = ma ya′ 2 + za′ 2 . (25)
a=1 a=1
Los elementos de la diagonal son los momentos de inercia con respecto de los ejes ~e ′x , ~e ′y , ~e ′z
respectivamente.
El tensor de inercia permite calcular el momento de inercia con respecto de cualquier eje que
pase por el punto O′ .
8
Un eje ∆ viene definido por un vector unitario ~n definido sobre el punto O′ . Pongamos a
rotar el sólido con respecto de ese eje. Por lo tanto el vector velocidad angular es ω
~ = ω~n (y
~ 2 = ω 2 ).
ω
O′1 O′
Trot = ω 2 I∆ .
2
obtenemos
3 X
X 3
O ′ ′
I∆ = IijO ni nj . (27)
i=1 j=1
Esta expressión efectivamente permite calcular los momentos de inercia del sólido con respecto
a cualquier eje que pase por O′ a partir del tensor de inercia en ese punto. Esta es la gran
utilidad del tensor de inercia.
En notación matricial ′
O′
I∆ = (n)T I O (n). (28)
De la expresión ′
O′ 1
Trot = (ω)T I O (ω). (29)
2
vemos que el tensor de inercia juega un papel análogo en el caso de rotaciones al papel que
juega la masa en el movimiento de translación de una partı́cula puntual. El segundo es una
escalar mientras el primero es un tensor debido a que un sólido tiene estructura interna,
mientras que una partı́cula puntual no la tiene.
Queremos calcular el momento angular del sólido con respecto del origen del sistema de
referencia inercial.
De la definición
N
X N
X
J~ = ~ra × ~va = ~ O′ + ~r ′a × V
R ~O ′ + ω
~ × ~r ′a =
a=1 a=1
XN
= ~ O′ × V
ma R ~O ′ + R
~ O′ × ω ~O‘ + ~r ′a × ω
~ × ~r ′a + ~r ′a × V ~ × ~r ′a
a=1
! !
XN XN XN
~ O′ × V ~ O′
~O ′ + R ′ ′ ~O ′ +
= MR × ω~× ma~r a + ma~r a ×V ma ~r ′a × ω
~ × ~r ′a .
| a=1 {z } | a=1 {z } a=1
~O ′ O ′
MR CM M RCM
9
CM
a
~ O′
R CM
~ O′
~ra = ~r ′a + R
~r ′a
z
~ez O′
~ O′
R
y
~ey
x ~ex
~O ′ + ω
La combinación V ~ O′ es la velocidad del centro de masas (con respecto del sistema
~ ×R CM
de referencia)
N
X
~ O′ × V
J~ = M R ~CM + M R O′
~ CM ~O ′ +
×V ma ~r ′a × ω
~ × ~r ′a . (30)
a=1
El segundo término se anula tanto si el punto O′ es fijo como si coincide con el centro de
masas.
P~ = M V
~CM (31)
El vector L ~ O′ es el momento angular orbital. Coincide con el momento angular que tendrı́a el
sólido si estuviera concentrado en su centro de masas.
~O′ se denomina momento angular de rotación o de espı́n alrededor del punto O′ .
El vector S
10
La momento angular de espı́n se puede escribir en términos del momento de inercia del sólido.
Se tiene la siguiente identidad para tres vectores cualesquiera del espacio Euclı́deo
de donde se sigue
N
X
~O′ =
S ma ra′ 2 ω ~ · ~r ′a ~r ′ .
~− ω (34)
a=1
Por lo tanto el momento angular de espı́n se expresa en términos del tensor de inercia como
3
X ′ ′
SO′ i = IijO ω j o, en notación matricial, (SO′ ) = (I O )(ω). (35)
j=1
Para un mismo objeto podemos necesitar conocer su tensor de inercia con respecto a diferentes
puntos del sólido. ¿Cómo se relacionan entre sı́?
La relación siempre pasa por el centro de masas. Si queremos relacionar los tensores de inercia
con respecto a dos puntos cualesquiera pasaremos siempre por el centro de masas como paso
intermedio.
Denominemos ~b al vector de posición de O′ respecto del CM. Una partı́cula cualquiera a del
sólido tendrá vector de posición ~r ⋆a con respecto del CM y vector de posición ~r ′a respecto de
O′ . Estos vectores están relacionados mediante
~r ′a = ~r ⋆a − ~b (36)
11
a
~r ′a
O′
~r ⋆a
~e ′x
~b
CM
~e ′x
Ahora bien, como en el sistema de referencia centrado en el CM, la posición del centro de
masas se encuentra en el origen, tenemos que
N
X
ma ra⋆ i = 0 (37)
a=1
′
N
X XN
IijO = ma ra⋆ 2 δij − ra⋆ i ra⋆ j + ma ~b 2 δij − bi bj
a=1 a=1
= IijCM + M ~b 2 δij − bi bj .
12
donde ~b es el vector de posición de O′ respecto del CM .
es precisamente el tensor de inercia que tendrı́a respecto del CM una partı́cula puntual de
masa M situada en el punto O′ . Por lo tanto el teorema de Steiner se puede enunciar:
Los tensor de inercia son siempre definidos positivos (¿Por qué?). Por lo tanto el tensor de
inercia siempre es mı́nimo cuando lo calculamos respecto del CM de un cuerpo.
El teorema de Steiner nos permite relacionar los momento de inercia respecto de ejes paralelos
que pasen por distintos puntos. Como antes, si queremos relacionar dos puntos cualesquiera
debemos pasar por el CM como paso intermedio.
∆ ∆′
~n
D
O′
α
~n ~b
CM
Consideremos dos ejes ∆ y ∆′ , ambos paralelos y el primero que pasa por el CM y e segundo
por un punto cualquiera O′ . Sea ~n el vector unitario que apunta en la dirección de ∆ (o ∆′ ).
13
De la relación entre el tensor de inercia y los momentos de inercia
X 3
3 X
′
X 3
3 X
I ∆′ = IijO nj nj = (IijCM ~
+ M b δij − bi bj nj nj
2
= I∆ + M b2 − b2 cos2 α
= I∆ + M 2 b2 sin2 α
= I∆ + M 2 D 2
Vemos nuevamente que el momento de inercia con respecto de una dirección es mı́nimo cuanto
el eje pasa por el centro de masas.
Fijemos un punto cualquiera O′ y consideremos un eje ∆ que pase por O′ . Sea ~n el vector
unitario tangente a ∆.
′
En general el vector S O no tiene la misma dirección que ω
~ . Las direcciones para las que el
espı́n sea paralelo al eje de giro son especiales:
Definición 1. Una eje ∆ se llama eje principal de inercia del sólido si el momento angular
de espı́n del sólido cuando éste gira alrededor del eje ∆ resulta ser paralelo a la velocidad
angular (o, lo que es lo mismo, paralelo al eje de giro).
Las direcciones principales de inercia son las direcciones asociadas a los vectores propios de la
matriz de inercial. El valor propio I~n es la momento de inercia en la dirección ~n (¿por qué?)
y recibe el nombre de momento principal de inercia.
14
Sabemos por álgebra que una matriz simétrica siempre se puede diagonalizar, es decir existe
una base de vectores propios. Los denominaremos {~ui }
Sabemos además que estos vectores pueden ser escogidos de manera que formen una base
ortonormal. A esta base se la denomina base principal de inercia.
′ ′ ′
A los autovalores correspondientes los denotaremos I1O , I2O , I3O y los llamaremos momentos
principales de inercia.
Es importante que la simetrı́a del sólido se refiera a su distribución de masas. Esto coincide
con las simetrı́as geométricas solamente si el cuerpo es homogéneo.
El eje perpendicular al plano es un eje principal (y por lo tanto los otros dos ejes
principales son necesariamente tangentes al plano de simetrı́a):
Si el sólido queda invariante bajo un giro de cualquier ángulo alrededor del eje llamaremos a
simetrı́a continua.
15
Si la simetrı́a no es continua entonces se llama discreta y necesariamente hay un ángulo
de giro mı́nimo que deja el sólido invariante. Llamemos α0 a ese ángulo. Es necesariamente
cierto que existe un número natural n ≥ 2 tal que α0 = 2πn (¿por qué?). Al número n se le
conoce conoce como orden del eje de simetrı́a. Las simetrı́a continuas se pueden ver como
simetrı́a discretas para las que n = ∞.
~e ′x · ~e ′x = 1, ~e ′y · ~e ′y = 1, ~e ′z · ~e ′z = 1
~e ′x · ~e ′y = 0, ~e ′x · ~e ′z = 0, ~e ′y · ~e ′z = 0. (43)
¿De qué manera podemos expresar las aij en términos de tres parámetros libres? Las condi-
ciones (43) son no-lineales por lo que su resolución no es immediata. De hecho existen diversas
parametrizaciones de la solucion.
Llamemos {~ei } a una base ortonormal fija en el espacio y a {êi } a una base ortonormal fija
en el sólido. La base {êi } no tiene por qué ser principal, solamente ser ortonormal.
La idea es pasar de la base {~ei } a la base {êi } mediante tres rotaciones sucesivas.
Queremos hacer primero una rotación alrededor del eje z después una rotación alrededor del
eje x de la base obtenida y finalmente una rotación alrededor del eje z de la nueva base
obtenida.
16
Llamemos {x, y, z} los ejes del sistema de referencia cuya base es {~ei } y {x′ , y ′ , z ′ } a los ejes
del sistema de referencia cuya base es {êi }.
En general el plano x′ y ′ no coincide con el plano xy (si los dos casos coinciden estamos en
una situación degenerada que requiere de un tratamiento especial). Dos planos paralelos entre
sı́ intersectan en una lı́nea. A la intersección del plano xy con el plano x′ y ′ se la conoce como
lı́nea de nodos y juega un papel fundamental para definir los ángulos de Euler. Escojamos
una vector unitario N ~ tangente a la linea de nodos (notemos que hay dos posibles elecciones)
y lo denominamos vector nodal.
Sea Φ el ángulo que forma el eje x con la linea de nodos, o de manera más precisa el ángulo
que forma el vector ~ex con el vector N~ . Hacemos primer una rotación de la base {~ex , ~ey , ~ez } de
ángulo Φ con respecto al eje z. Esto produce una nueva base ortonormal {~e ′x , ~e ′y , ~e ′z } definida
por
~e ′x = cos Φ ~ex + sin Φ ~ey
~e ′y = − sin Φ ~ex + cos Φ ~ey
~e ′z = ~ez
Sea θ ∈ [0, π) el ángulo que forma el eje z ′ con el eje z, es decir θ es el ángulo esférico del
vector êz con respecto a la base {~ei }.
~ . La nueva base, que deno-
Aplicamos una rotación de ángulo θ alrededor del vector nodal N
′′
minamos {~e i } tiene la expresión
~
~e ′′x = ~e ′x = N
′′ ′
~e y = cos θ ~e y + sin θ ~e z′
~e ′′z = − sin θ ~e ′y + cos θ ~e ′z
Notemos que por construcción êz = ~e ′′z . Por lo tanto no queremos modificar más este vector.
El último ángulo de Euler Ψ se define de la siguiente manera. Los vectores êx y êy están el
el plano x′ y ′ . El vector nodal también está en ese plano (está en la intersección de ese plano
con el plano original xy). Por lo tanto existe un ángulo Ψ entre el vector N ~ y el vector êx o,
de manera más precisa existe una ángulo Ψ de manera que si rotamos el vector N ~ alrededor
de la dirección êz obtenemos êx .
Si aplicamos esta rotación a la base {~e ′′x , ~e ′′y , ~e ′′z } obtenemos la base {êx , êy , êz } (¿por qué ? ).
Explı́citamente
êx = cos Ψ ~e ′′x + sin Ψ ~e ′′y
êy = − sin Ψ ~e ′′x + cos Ψ ~e ′′y
êz = ~e ′′z
17
Si componemos los tres rotaciones encontramos el cambio de base entre la base original {~ei }
y la final {êi } en función de tres cantidades {θ, Φ, Ψ}. Estas tres cantidades son los ángulos
de Euler.
Multiplicar las tres rotaciones es un cálculo algo largo. El resultado es:
êx = (cos Ψ cos Φ − sin Ψ cos θ sin Φ) ~ex + (cos Ψ sin Φ + sin Ψ cos θ cos Φ) ~ey + sin Ψ sin θ~ez
êy = (− sin Ψ cos Φ − cos Ψ cos θ sin Φ) ~ex + (− sin Ψ sin Φ + cos Ψ cos θ cos Φ) ~ey + cos Ψ sin θ~ez
êz = sin θ sin Φ~e1 − sin θ cos Φ~e2 + cos θ~e3
Las cantidades aij que se pueden extraer de estas expresiones satisfaces automáticamente las
ligaduras (43) y dependen de tres cantidades libres, como debe ser.
Determinar los ángulos de Euler de una rotación no es difı́cil:
(i) Nos fijamos en el vector êz y consideramos sus ángulo esféricos. El ángulo esférico θ es di-
rectamente uno de los ángulos de Euler. Además el ángulo esférico φ es por definición el
18
ángulo que forma el eje x con la proyección del vector êz en el plano xy. El vector nodal es
perpendicular a esta proyección y también está en el plano xy. Por lo tanto el ángulo Φ que
forma con el eje x es
π
Φ=φ+ (44)
2
(también podrı́amos escoger Φ = φ − π que corresponderı́a a la otra elección posible de N ~ ).
2
(ii) El ángulo Ψ especifica la posición del eje x′ alrededor del eje z ′ . Fija el ángulo que tenemos
que girar el vector nodal en el plano x′ y ′ para llegar al eje x′ .
Si un sólido rı́gido está girando y fijamos una base {êi } ligada al sólido (principal o no), el
movimiento de rotación viene descrito por tres funciones de t
Resulta mucho mas sencillo notar que hemos realizado tres rotaciones y que como las veloci-
dades angulares provienen de derivadas son necesariamente aditivas.
Las tres velocidades angulares de rotación que se han aplicado son a lo largo de los vector ~ez ,
~ y ê3 con velocidades respectivas Φ̇, θ̇ y Ψ̇. Por lo tanto la velocidad angular de rotación es
N
ω ~ + Ψ̇êz .
~ = Φ̇~ez + θ̇N (46)
Podemos expresar este vector en la base que más nos convenga. En la base móvil {êi } tenemos
~ = ~e ′x = cos Ψ êx − sin Ψ êy
N
~ez = ~e ′z = cos θ ~e ′′z + sin θ ~e ′′y
y además
~e ′′z = êz
~e ′′y = cos Ψ êy + sin Ψ êx .
19
Tema 3. Dinámica del Sólido Rı́gido
3.1 Ecuaciones fundamentales de la dinámica del sólido rı́gido.
Tenemos pues dos ecuaciones diferenciales vectoriales, es decir seis ecuaciones escalares. Es
el mismo número que el de grados de libertad de un sólido rı́gido. Estas ecuaciones bastarán
para determinar las leyes del movimiento de un sólido rı́gido.
J~ = M R
~ O′ × V ~ O′ .
~CM + S
dJ~ ~CM
dV ~ O′
dS
~ ~
= M VO′ × VCM + M RO′ ×~ +
dt dt dt
d ~ O′
S
=R~ O′ × F~ E + =M~E
dt
Por lo tanto ′ ′
~O
dS ~O
dS
=M~E −R ~ O′ × F~ E , =⇒ ~ E′
=M O
dt dt
y las ecuaciones del movimiento son
~CM
dV
M = F~ E
dt
~ O′
dS
=M ~ E′
O
dt
donde el punto O′ es o bien un punto fijo del sólido y el centro de masas.
Son ecuaciones vectoriales y, por lo tanto, se pueden escribir en la base de vectores que resulte
más conveniente.
En muchos casos (no siempre) es conveniente escribir la ecuación del espı́n en una base de
ejes principales del sólido {~u1 , ~u2 , ~u3 }.
1
Dado que el tensor de inercia es diagonal tenemos que, si el vector velocidad angular es
ω
~ = ω1 ~u1 + ω2 ~u2 + ω3 ~u3 , el espı́n en esta base es
~ O′ = I1O′ ω1 ~u1 + I2O′ ω2 ~u2 + I3O′ ω3 ~u3 ,
S
El tensor de inercia referido a una base ligada al sólido no depende del tiempo (ya que el
sólido no cambia de forma y se mantiene invariable respecto de un sistema de ejes solidario a
′
dIiO
él). Se tiene pues dt = 0.
d~ui
~ × ~ui = (ω1 ~u1 + ω2 ~u2 + ω3 ~u3 ) × ~ui
=ω
dt
o explı́citamente
d~u1
= ω3 ~u2 − ω2 ~u3 ,
dt
d~u2
= −ω3 ~u1 + ω1 ~u3 ,
dt
d~u3
= ω2 ~u1 − ω1 ~u2 .
dt
Es importante notar que si conocemos las fuerzas externas que actúan sobre el sistema po-
demos calcular el momento de las fuerzas externas M ~ E′ respecto del punto O′ , pero en las
O
ecuaciones de Euler aparecen las componentes M ~ E′ · ~ui en la base móvil {~ui }. Esta base es
O
desconocida a priori. Para determinarla debemos saber cómo está orientado el sólido en cada
instante de tiempo, es decir necesitamos conocer cómo se está moviendo el sólido. Por lo
tanto, para poder determinar el movimiento debemos añadir las ecuaciones para d~ u1 d~
dt
u2
dt y
d~
u3
dt .
d~ui
~ × ~ui ,
=ω i = 1, 2, 3 (1)
dt
2
En total tenemos 12 ecuaciones diferenciales de primer orden. Solamente seis ecuaciones son
independientes porque los vectores {~u1 } satisfacen las seis condiciones ~ui · ~uj = δij .
En general, resolver las ecuaciones de Euler es un problema complicado.
Por el contrario en el caso en que sepamos cómo se mueve el sólido podemos determinar los
momentos de las fuerzas como consecuencia directa de las ecuaciones de Euler. Al disponer de
~ E′ sin más que sustituir en las ecuaciones
{~ui (t)} ( y por lo tanto de ωi (t)) podemos obtener M O
de Euler.
Otro caso en que las ecuaciones de Euler se simplifican de manera notable es cuando el sólido
no está sometido a momentos de fuerza externos M ~ E′ . En este caso las ecuaciones de Euler
O
se desacoplan y forman un sistema de tres ecuaciones para tres incógnitas
′
′ O − I O′ ω ω
I1O dω 1
= I 2 3
dt
′ dω
2′ 3
′
O
I2 dt = 2 O O
I 3 − I 1 ω3 ω 1
′
′
I3O dω 3
= I O − I O′ ω ω
dt 1 2 1 2
Una vez integradas y obtenidas ωi (t) podemos resolver las ecuaciones para {~ui } (1) y obtener
el movimiento del sólido.
Queremos determinar bajo qué condiciones se conserva la energı́a cinética total y la energı́a
cinética de rotación en el movimiento de los sólidos rı́gidos.
Para ello debemos calcular la variación temporal del la expresión obtenida para la energı́a
cinética. Recordemos la descomposición
3 3
1 ~2 1 X X O′
T = MV O′ + Iij ωi ωj .
|2 {z } 2 i=1 j=1
Ttras | {z }
Trot
~ O′
Queremos expresar este resultado en términos de dSdt . Dado que esta derivadad es respecto
del sistema inercial y la base del sólido es móvil, tenemos
!
dSiO ′
X3 ~ O′ X 3 O′ 3
X ′
′ ′ ′ d S dS ′
~ =
S O O
Si ~ei =⇒ = i ′ O
~ei + Si ω ′
~ × ~ei = ~ O′
~ei + ω × S
dt dt dt
i=1 i=1 i=1
por lo que
3 ′ ′
! ′
X dS O ~O
dS ~O
dS
ωi i = ω
~· ~ O′
−ω×S ~·
=ω
dt dt dt
i=1
3
y por lo tanto,
dTrot ~ O′
dS
=ω· .
dt dt
Para la energı́a cinética total:
dT ~ ~ O′
~ O ′ d VO ′ + ω
= MV ~·
dS
dt dt dt
que al ser vectoriales pueden escribirse en la base de vectores que resulte más conveniente.
T = Ttras + Trot
dTtras ~CM · F~ E
=V
dt
dTrot ~ CM
E
~ ·M
=ω
dt
Un solido libre es aquel sobre el que no actúan fuerzas externas netas ni momentos externos
netos.
4
De las ecuaciones de evolución para la energı́a cinética, tenemos que Trot es una constante
del movimiento.
Fijemos que la propiedad de que el vector de espı́n S ~ sea una constante (vectorial) del mo-
vimiento no significa que la velocidad angular ω
~ se mantenga constante. La razón es que la
relación
X3
Si = Iij ωj
j=1
es válida en el sistema de referencia ligado al sólido {~ui } y en este sistema Si (t) dependen del
tiempo (puesto que la base ~ui (t) depende del tiempo en general).
Consideraremos dos casos: (a) cuando se trate de un sólido simétrico y (b) la estabilidad de
un sólido rı́gido arbitrario.
Un sólido rı́gido se llama simétrico cuando tiene un eje de simetrı́a de orden n ≥ 3. También
reciben el nombre de peonzas simétricas.
Sabemos que el eje de simetrı́a siempre es un eje principal (que escogemos como eje ~u3 ).
Cualquier base ortonormal del tipo {~u1 , ~u2 , ~u3 } (es decir con ~u3 a lo largo del eje de simetrı́a
y por lo tanto ~u1 y ~u3 perpendiculares al eje de simetrı́a) es una base principal y los momentos
principales a lo largo de ~u1 y de ~u2 coincide.
5
Derivando la primera y usando la segundo tenemos ω̈1 = ω0 ω̇2 = −ω02 ω1 que es la ecuación
de un oscilador armónico, cuya solución es
ω1 = A sin (ω0 t + β))
donde A, β son constantes de integración. Por otro lado
1 dω1
ω2 = = A cos (ω0 t + β))
ω0 dt
y el vector velocidad angular en la base principal tiene la descomposición
ω
~ = A (sin(ω0 t + β))~u1 + cos(ω0 t + β))~u2 ) + ω3 ~u3
es decir, en la base principal ligada al sólido, el vector ω
~ forma un ángulo αc con el eje z que
viene dado por
A
tan αc =
ω3
y gira con velocidad angular ω0 alrededor de dicho eje.
ω3
ω
~
~uz αc
~uy
~ux
Notemos que conocemos ω ~ con respecto a unos ejes móviles, de manera que todavı́a no
sabemos su movimiento en el sistema de referencia inercial. Para obtenerlo usamos que el
~ está fijo en el espacio y lo expresamos en términos de ω
vector S ~ , como sigue
~ = I1 ω1 ~u1 + I2 ω2 ~u2 + I3 ω3 ~u3
S
= IA (sin(ω0 t + β))~u1 + cos(ω0 t + β))~u2 ) + I3 ω3 ~u3 (2)
ω − ω3 ~u3 ) + I3 ω3 ~u3
= I (~
ω + ω3 (I3 − I)~u3
= I~
ω − ω0 ~u3 ) .
= I (~
6
Podemos elegir nuestro sistema inercial de la manera que más nos convenga. Si escogemos la
dirección z del sistema de referencia inercial de manera que apunte en la misma dirección que
~ (que es un vector constante) tenemos S
S ~ = S~ez y por lo tanto
1~ S
ω
~ = S + ω0 ~u3 = ~ez + ω0 ~u3 .
I I
Multiplicando (2) by ~u3 y llamando θ al ángulo que forman el eje z y el eje ~u3 obtenemos
I 3 ω3
cos θ = ~ez · ~u3 =
S
que es constante.
Si usamos la base ortonormal {~er , ~eθ , ~eφ } asociadas a coordenadas esféricas {r, θ, φ} tenemos
que ~u3 = ~er y por lo tanto
d~u3 d~er
= = θ̇ ~eθ + sin θ φ̇ ~eφ
dt dt
y por otra parte
d~u3 S S S
=ω ~ × ~u3 = ~ez + ω0 ~u3 × ~u3 = ~ez × ~u3 = sin θ ~eφ
dt I I I
El movimiento de rotación tiene dos constantes arbitrarias A, ω3 (en realidad tiene tres, tal
y como debe ser, ¿cuál es la tercera?) que pueden determinarse a partir de las cantidades
conservadas S (el módulo del vector de espı́n) y Trot (la energı́a cinética de rotación), a partir
de las expresiones
S 2 = I12 ω12 + I22 ω22 + I32 ω32 = I 2 A2 sin2 (ω0 t + β)) + cos2 (ω0 t + β)) + I32 ω02 = I 2 A2 + I32 ω32
1 1 1
Trot = I1 ω 2 + I2 ω22 + I3 ω32 = IA2 + I3 ω32 ,
2 2 2
de manera que conocer S y Trot es equivalente a conocer A y ω3 mediante
S 2 = I 2 A2 + I32 ω32 ,
1
Trot = IA2 + I3 ω32 .
2
7
z
~uz
~uy
~
S ~ux
I ω
~
θ
ω0 ~u3
αc
Al caso particular en que I = I3 se le llama sólido libre esférico o peonza esférica aunque
el sólido no tiene por qué ser una esfera. En este caso
S
ω
~ = ~e3
I
es un vector constante en el espacio. Como toda base ortonormal es una base principal po-
demos escoger ~u3 en la misma dirección que ω ~ . Es decir, el sólido gira con velocidad angular
constante ω a lo largo de un eje fijo. Es fácil comprobar que esta conclusión se puede obtener
también poniendo I3 = I (es decir ω0 = 0) en las ecuaciones anteriores.
El movimiento de un sólido libre sin simetrı́as es más complicado. Nos limitaremos a estudiar
la estabilidad de la rotación alrededor en torno a uno de sus ejes principales.
Las ecuaciones de Euler
I1 dω
dt = (I2 − I3 ) ω2 ω3
1
I2 dω
dt = (I3 − I1 ) ω3 ω1
2
dω3
I3 dt = (I1 − I2 ) ω1 ω2
admiten la solución ω
~ = ω3 ~u3 con ω3 constante.
8
Dado que S~ = I3 ω3 ~u3 y que S ~ es un vector constante, se sigue que ~u3 es constante, y en
consecuencia, el sólido gira con velocidad angular constante alrededor del eje principal z ′ , que
se mantiene fijo en el espacio. Obviamente lo mismo vale para las direcciones principales x′ o
y′ .
Supongamos que un sólido libre se mueve de esta manera, es decir, con ω ~ = ω3 ~u3 y que
comunicamos al cuerpo una pequeña perturbación de manera que el eje de rotación ya no sea
paralelo a ~u3 aunque sı́ muy próximo a él. Es decir, consideramos
ω
~ = ∆ω1 ~u1 + ∆ω2 ~u2 + (ω3 + ∆ω3 )~u3
y consideramos ∆ωi pequeños, de manera que podemos despreciar productos de dos de estas
cantidades. Con este aproximación las ecuaciones de Euler toman la forma
d∆ω1
I1 = (I2 − I3 ) ∆ω2 ω3
dt
d∆ω2
I2 = (I3 − I1 ) ∆ω1 ω3
dt
d∆ω3
I3 =0
dt
de donde tenemos que ∆ω3 es constante. Para obtener los otros dos, calculamos la derivada
de una ecuación y usamos la otra para obtener
9
(b) Si (I3 −II21)(I
I2
3 −I1 ) 2
ω3 = −α2 < 0 (que ocurre cuando I1 < I3 < I2 o bien I2 < I3 < I1 ) entonces
la ecuación es
d2 ∆ω1
= α2 ∆ω1 =⇒ ∆ω1 = C1 eαt + C3 e−αt
dt2
(y análogamente para ∆ω2 ). Excepto para valores iniciales muy especiales, la perturbación
crece indefinidamente cuando t → +∞. Por lo tanto la aproximación de que ∆ω1 y ∆ω2 son
pequeños deja de ser válida y el movimiento es inestable.
La rotación alrededor de un eje principal cuyo momento de inercia sea intermedio con
respecto a los otro dos es inestable. Notemos que la inestabilidad aumenta tanto con el valor
de ω3 como con los valores de |I1I−I
1
3|
y de |I2I−I
2
3|
.
Un péndulo fı́sico es un sólido rı́gido que se mueve bajo la acción de la gravedad y que posee
un eje horizontal fijo y que no pase por el centro de masas. Notemos que no imponemos que
este eje sea ni de simetrı́a del cuerpo ni tampoco ortogonal a un plano de simetrı́a del cuerpo,
de manera que no tiene por qué ser principal. Esta suposición se hace de manera implı́cita o
explı́cita en buena parte de los libros de texto, pero es innecesaria.
Escogemos ejes inerciales de manera que el eje z sea vertical y el eje x coincida con la dirección
horizontal fija del sólido. Escogemos además el origen O de manera que el plano yz contenga
al centro de masas.
Escogemos ejes ligados al cuerpo centrados en el punto O de manera que el eje e′x coincida
con el eje x y que el vector ~e3 ′ apunte desde el centro de masas al punto O. La distancia entre
el CM y el punto O la denotamos por l. Como es habitual, denotamos por θ el ángulo que
forma el eje z y el eje z ′ .
La gravedad es una fuerza externa que actúa de la misma manera que si el cuerpo estuviera
totalmente concentrado en el centro de masas. Por lo tanto el momento de las fuerzas externas
respecto al punto O es
M~ OE = −M gl sin θ~ex + M
~
eje
~
donde M eje es el momento de las fuerzas que ejerce el eje fijo sobre el sólido.
10
~e ′z ~ez
~e ′y
~ey
CM
θ
M~g
Dado que la fuerza que ejerce el eje está aplicada sobre puntos a lo largo del eje x tenemos
que necesariamente M~
eje es perpendicular al eje x.
y por lo tanto
~ O · ~e ′x = Ixx
S O
θ̇.
O = I). La′
Llamemos I al momento de inercia con respecto al eje fijo ~ex (de manera que Ixx
ecuación del movimiento (4) es
d2 θ d2 θ Mg l
I = −M g l sin θ =⇒ =− sin θ.
dt2 dt 2 I
11
Recordemos que la ecuación del movimiento de un péndulo matemático (una masa M puntual
colgada de una cuerda de longitud L sin masa e inextendible) es
d2 θ g
2
= − sin θ
dt L
por lo que el movimiento de un péndulo fı́sico coincide con el movimiento de un péndulo
matemático de longitud equivalente
I
L= .
Ml
Notemos que para un péndulo matemático el momento de inercia del cuerpo con respecto del
punto de suspensión es I = ml2 por lo que la longitud del péndulo equivalente es
I M l2
L= = =l
Ml Ml
tal y como debe ser.
El trompo de Lagrange consiste en el estudio del una peonza simétrica moviéndose bajo la
acción de la gravedad y con un punto fijo.
Tomemos el punto O′ como origen del sistema de referencia ligado al sólido. La única fuerza
externa que realiza momento respecto a O′ es la gravedad, y su valor es, usando coordenadas
esféricas para la posición del centro de masas respecto del punto O′ es
~ E′ = R
M ~ CM × M~g = l~er × (−M g~ez ) = M gl~eφ
O
12
~uz
~ez
θ
l
M~g
O′
~ey
~ex
de manera que
ω12 + ω22 = Φ̇2 sin2 θ + θ̇2 ,
y la energı́a cinética es
1 1 2
T = I1 Φ̇2 sin2 θ + θ̇2 + I3 Φ̇ cos θ + Ψ̇ .
2 2
Además la energı́a potencial es V = M gl cos θ por lo que el Lagrangiano de un trompo
simétrico es
1 1 2
L = T − V = T = I1 Φ̇2 sin2 θ + θ̇2 + I3 Φ̇ cos θ + Ψ̇ − M gl cos θ.
2 2
Tanto Φ como Ψ son coordenadas cı́clicas, de manera que sus momentos conjugados son
constantes del movimiento
∂L
pΦ = = I1 Φ̇ sin2 θ + I3 Φ̇ cos θ + Ψ̇ cos θ := Jz
∂ Φ̇
∂L
PΨ = = I3 Φ̇ cos θ + Ψ̇ := J3
∂ Ψ̇
J3 = J~ · ~u3 , Jz = J~ · ~ez
La constancia de estas cantidades se puede deducir también del hecho de que el momento de
fuerzas externo solamente tiene componente en ~eφ .
13
Además L no depende de t, por lo que la función hamiltoniana es una constante del movi-
miento. Como T es homogéneo de grado dos en las velocidades, tenemos h = T + V = E y
esta constante del movimiento se expresa
1 1 (Jz − J3 cos θ)2 J32
E = I1 θ̇2 + + + M gl cos θ.
2 2 I1 sin2 θ 2I3
Esta expresión proporciona una ecuación diferencial para θ. Resulta útil definir u = cos θ por
lo que u̇ = − sin θ θ̇ de manera que
u̇2
θ̇2 =
1 − u2
y llegamos al sistema de ecuaciones que debe satisfacer un trompo de Lagrange
2E J2 2M glu (Jz − J3 u)2
u̇2 = (1 − u2 ) − 3 − −
I1 I1 I3 I1 I12
Jz − J3 u
Φ̇ =
I1 (1 − u2 )
J3 (Jz − J3 u)u
Ψ̇ = −
I3 I1 (1 − u2 )
Dado que −1 ≤ u ≤ 1, solamente nos interesa analizar este polinomio en el rango (−1, 1). El
valor en u = −1 es
(Jz + J3 )2
P3 (u = −1) = − ≤0
I12
mientras que el valor en u = 1 es
(Jz − J3 )2
P3 (u = 1) = − ≤0
I12
θ2 ≤ θ ≤ θ1
(el cambio de orden es debido a que cos θ es una función decreciente en el intervalo θ ∈ [0, π]).
14
La peonza realiza tres tipos de movimientos.
(a) Gira alrededor de su eje de simetrı́a con velocidad angular Ψ̇. Este movimiento se llama
de rotación.
(b) El eje de la peonza gira con velocidad angular Φ̇ alrededor de la vertical. Este movi-
miento de llama de precesión.
~ez
θ2
θ1
~ey
~ex
En el segundo caso, es decir cuando u⋆ ∈ [u1 , u2 ] entonces Φ̇ cambia de signo a lo largo del
movimiento. La peonza gira alrededor del eje z a ratos en un sentido y a ratos en otro. El
movimiento es del tipo:
15
~ez
θ2
θ1
~ey
~ex
16
Tema 4. Sistemas de referencia no inerciales
4.1 Introducción.
En Mecánica newtoniana las ecuaciones de Newton son válidas únicamente en los sistemas
de referencia inerciales, es decir en aquellos sistemas de referencia en los que una partı́cula
libre (no sometida a ninguna interacción) tiene un movimiento rectilı́neo y uniforme.
En muchas situaciones puede ocurrir que los sistemas de referencia naturales no sean inercia-
les. Por ejemplo, el sistema de referencia ligado a un laboratorio en la Tierra no es inercial,
puesto que la Tierra rota alrededor de si misma (además de otros movimientos acelerados que
posee).
Queremos estudiar cómo deben modificarse las leyes de Newton para que sean válidas en
sistemas de referencia no inerciales.
Nos restringiremos a sistemas de referencia Cartesianos.
1
La velocidad de la partı́cula respecto de S ′ es
Debemos calcular las derivadas de los vectores ~ei′ respecto del tiempo.
~ que une dos puntos fijos cuales-
En el capı́tulo de sólido rı́gido, se demostró que un vector A
quiera de un sólido rı́gido tiene velocidad
~
dA ~
~ × A,
=ω
dt
donde ω
~ es la velocidad angular de rotación del sólido rı́gido.
El sistema inercial S ′ es rı́gido, por lo que podemos usar esta expresión. Los vectores de la
base {~e1′ , ~e2′ , ~e3′ } unen dos puntos fijos de S ′ , por lo que
d~ei′
~ × ~ei′
=ω
dt
y, por lo tanto,
d~r ~
dR d~r ′
= + ~ × ~r ′ .
+ω
dt S dt dt S′
S
Definimos la velocidad de arrastre como la velocidad que tiene una partı́cula en reposo
respecto de S ′ . Es decir
~ +ω
~va = V ~ × ~r ′ .
2
El argumento anterior que nos ha permitido obtener
d~r ′ d~r ′
= ~ × ~r ′
+ω
dt S dt S′
~
es igualmente valido para cualquier vector A(t). Tenemos pues la siguiente relación entre
derivadas respecto del tiempo en S y en S ′
dA dA ~
= ~ × A.
+ω
dt S dt S′
Si derivamos
d~r ~
dR
= + ~v ′ + ω
~ × ~r ′
dt S dt
S
respecto del tiempo, obtenemos
d2~r ~
d2 R d~v ′ d~
ω d~r ′
= + + × ~r ′ + ω
~× (3)
dt2 S dt 2 dt S dt S dt S
S
d~v ′
El vector dt S no es la aceleración de la partı́cula respecto del sistema no inercial, puesto
que la derivada está tomada desde el punto de vista de S y no desde S ′ . Tenemos
d~v ′ d~v ′
= ~ × ~v ′ .
+ω
dt S dt S′
d~
ω d~
ω d~
ω
= ~ ×ω
+ω ~ = ~˙
:= ω
dt S dt S′ dt S′
d2~r ~
d2 R d~v ′
= + +ω ~˙ × ~r ′ + ω
~ × ~v ′ + ω ~ × ~v ′ + ω
~ × ~r ′
dt2 S dt 2 dt S′
S
d2~r ~
d2 R d~v ′
= + ω × ~v ′ + ω
+ 2~ ~× ω ~˙ × ~r ′ .
~ × ~r ′ + ω
dt2 S dt 2 dt S′
S
3
Los distintos términos tienen los siguientes nombres e interpretación
d2 ~
r
• ~a := dt2 S
es la aceleración de la partı́cula respecto del sistema de referencia inercial.
También se denomina aceleración absoluta y se acostumbra a denominar ~a.
~
d2 R
• dt2 S
es la aceleración absoluta del origen O ′ del sistema de referencia no inercial. Su
~
d2 R
opuesta − dt2 S
se denomina aceleración de arrastre (la razón del cambio se signo
se entenderá más adelante).
d~v ′
• ~a ′ := ′
dt S ′ es la aceleración de la partı́cula relativa a S . La denotaremos por ~a ′ .
• ω ×~v ′ se denomina aceleración de Coriolis. Es siempre perpendicular a
−2~ la velocidad
de la partı́cula respecto del sistema S ′.
Notemos que se anula en tres casos: 1) cuando
la partı́cula está en reposo en el sistema de referencia S ′ , 2) cuando S ′ no rota respecto
de S, 3) cuando la partı́cula se mueve (respecto de S ′ ) a lo largo del eje de giro del
sistema de referencia. Notemos las similitudes que tiene con la parte magnética de la
fuerza de Lorentz del electromagnetismo. La velocidad angular juega el papel del campo
magnético.
• −~ ω × ~r ′ ) se denomina aceleración centrı́fuga. A partir de la siguiente figura
ω × (~
ω
~
~ × ~r ′
ω
ω × ~r ′ )
ω × (~
-~
~r ′
observamos que este vector apunta desde la posición de la partı́cula hacia fuera deje de
giro del sistema no inercial y tiene módulo ω 2 ρ, donde ρ es la distancia entre el punto
donde está la partı́cula y el eje de giro del sistema no inercial.
• −ω~˙ ×~r ′ se denomina aceleración azimutal. Es debida a las variaciones de la velocidad
angular, tanto en módulo como en dirección.
Es importante darse cuenta de que esta relación entre aceleraciones es un igualdad vectorial,
es decir todavı́a podemos referir los vectores que aparecen a cualquier base, tanto la {~ei } del
sistema S, como la {~ei′ } del sistema S ′ , como cualquier otra si resulta conveniente.
4
Sabemos que las leyes de Newton F~ = m~a son válidas en sistemas de referencia inerciales.
~
d2 R
m~a ′ = m~a − m ω × ~v ′ − m~
− 2m~ ~˙ × ~r ′ .
~ × ~r ′ − mω
ω× ω
dt2
S
~
d2 R
m~a ′ = F~ − m 2 ω × ~v ′ − m~
− 2m~ ~˙ × ~r ′ .
~ × ~r ′ − mω
ω× ω
dt
S
Para que el sistema S ′ pueda usar la segunda ley de Newton debe añadir a las fuerzas aplicadas
un conjunto de fuerzas denominadas de inercia que aparecen por el hecho de que S ′ es un
sistema acelerado. Para el sistema de referencia S ′ , las fuerzas de inercia son tan reales como
las aplicadas. Conviene evitar llamar a las fuerzas de inercia, fuerzas ficticias puesto que esto
da una idea equivocada de su naturaleza.
Notemos que todas estas fuerzas son proporcionales a la masa de la partı́cula. En este sentido
son análogas a las fuerzas gravitatorias, que también poseen esta propiedad. Esta analogı́a
formal resulta ser mucho más profunda de lo que parece y constituye la base fundamental de
la Relatividad General.
5
4.5 Ejemplos.
Ejemplo 1.
Consideremos un tiovivo que gira con velocidad angular constantes ω. Si escogemos los ejes
como en la figura
~ey
~ex′
~ey′ ~v ′
ωt
~ex
Supongamos que una partı́cula que se mueve radialmente hacia el centro con velocidad cons-
tante respecto del tiovivo (pensemos en un cobrador que camina sobre el tiovivo directamente
hacia una cabina central a velocidad constante).
F~ es la fuerza aplicada sobre la partı́cula. La única fuerza de este tipo que recibe es la ejercida
por el suelo y la fuerza de la gravedad.
La fuerza de Coriolis −2m~ω × v~′ . Como ~v ′ es radial hacia dentro, este fuerza tiene módulo
2mωv ′ y apunta hacia la derecha del movimiento.
Supongamos que queremos saber qúe fuerza F~p hace la partı́cula sobre el suelo. Por la tercera
ley de Newton, esta fuerza es la opuesta a la fuerza que hace el suelo sobre la partı́cula Fs ,
de decir F~p = −F~s .
Si usamos una base de vectores en coordenadas cilı́ncricas tenemos que la fuerza de la gravedad
es F~g = −mg~ez ′ , la fuierza centrı́fuga es mωρ ′2~eρ′ y la fuerza de Corilis es mωv ′~eφ ′ .
6
La segunda ley de Newton proporciona
Ademas de la fuerza vertical habitual, debe hacer una fuerza con los pies hacia fuera (para
contrarestar la fuerza centrı́fuga) y otra hace la derecha del moviminiento (para contrarrestar
la fuerza de Coriolis).
Consideremos un cubo lleno de agua que gira con velocidad angular constante alrededor de
la vertical. Queremos saber cual es la forma de la superficie del agua.
El agua está en reposo respecto del cubo, por lo que cualquier elemento de volumen del agua
tiene ~r ′ constante con respecto al sistema de referencia ligado al cubo. En consecuencia la
aceleración relativa ~a ′ = 0. Usando la segunda ley de Newton en el sistema del cubo tenemos
0 = m~a ′ = F~app − m~ ω × ~r ′ ),
ω × (~
donde m es la masa del elemento de volumen. La fuerza de Coriolis se anula porque el elemento
de volumen está en reposo. La fuerza de arrastre se anula porque el origen del sistema de
referencia del cubo está en reposo (respecto del suelo) y la fuerza azimutal se anula porque
la velocidad angular es constante.
Para un elemento en la superficie del cubo las fuerzas aplicadas son la gravedad F~g = m~g =
−mg~ez (quitamos las primas al sistema de referencia no inercial por simplicidad) y la fuerza
debida a la presión que ejerce el resto del fluido Fp
d~r
7
Sabemos que la fuerza centrı́fuga apunta en la dirección radial hacia afuera del eje de rotación.
Por lo tanto, si usamos coordenadas cilı́ndricas ligadas al cubo
−m~ ω × ~r ′ ) = mω 2 ρ~eρ
ω × (~
Multiplicamos (4) por (5) y usamos que ~n · d~r = 0 (~n es perpendicular a la superficie del
cubo).
−mgdz + mω 2 ρdρ = 0
Esta relación proporciona una ecuación diferencial para la forma de la superficie del cubo
descrita por z(ρ). Dividiendo por dρ
dz ω2
= ρ
dρ g
e integrando
ω2 2
z = z0 + ρ .
2g
Consideremos otro sistema de referencia S con origen en el centro de la Tierra y con eje z
apuntando hacia el Polo Norte y que no gire respecto de las estrellas lejanas.
Aunque el centro de la Tierra tiene un movimiento acelerado (la Tierra gira alrededor del Sol
y este está acelerado respecto del centro de la Galaxia, etc.), su aceleración es muy pequeña,
comparada con las aceleraciones que tiene el punto O ′ debidas a la rotación de la Tierra.
Para experimentos de duración suficientemente corta (por ejemplo, dı́as), podemos considerar
que el sistema de referencia S es inercial.
El sistema de referencia S ′ está ligado a la Tierra, por lo que gira con la misma velocidad
angular que ésta.
8
ω
~
~ey′ ~e′z
~ez ~ex′
θ ~
R
~ey
~ex
La Tierra gira alrededor del eje z con velocidad angular constante ω. El valor de ω es
2π 2π
ω= = = 7, 2710−5 s−1 .
Trot 1 dı́a
El origen O ′ del sistema S ′ se mueve respecto del sistema S. Como está fijo sobre la Tierra,
~ respecto de O tiene velocidad
su vector de posición R
~
dR ~
~ × R.
=ω
dt
S
~
d2 R ~
dR
~×
=ω ~ × (~
=ω ~
ω × R).
dt2 dt
S S
9
La segunda ley de Newton en el laboratorio es, por lo tanto,
m~a ′ = F~ − m~
ω × (~ ~ − 2m~
ω × R) ω × ~v ′ .
La fuerza de arrastre tiene una componente radial hacia fuerza de magnitud mRT ω 2 sin2 θ, y
una componente hacia el sur (si estamos en el hemisferio norte) de magnitud mRT ω 2 sin θ cos θ.
Si estamos en el hemisferio sur (θ > π/2), la componente horizontal de la fuerza de arrastre
apunta hacia el norte.
La fuerza de arrastre es sentida por todos los cuerpos de manera independiente a su velocidad
o a su posición y con magnitud proporcional a su masa.
Es una fuerza que, desde el punto de vista del laboratorio es completamente indistinguible
de la fuerza de la gravedad, que también es constante (para distancias terrestres tı́picas) y
proporcional a la masa. Tenemos por lo tanto una gravedad efectiva que vale
~gef = −g~ez′ + RT ω 2 sin θ sin θ~ez′ − cos θ~ey′ .
El radio de la Tierra es RT = 6400Km, por lo que RT ω 2 = 3,39 × 10−2 m/s2 . Es una magnitud
pequeña frente a g = 9,8 m/s2 , pero no despreciable.
Esta es la razón por la que los lanzamientos espaciales siempre se realizan desde puntos
cercanos al Ecuador (deben vencer una gravedad menor).
10
En resumen, podemos escribir la segunda Ley de Newton en el laboratorio como
La dirección radial y la vertical son muy parecidas (en la latitud de Salamanca, el techo de un
edificio de 100 metros está desplazado 17 cm respecto de la dirección radial de la Tierra). Por
lo tanto, en la mayor parte de los casos, podemos simplemente identificar ambas direcciones
y escribir ~gef = −gef ~ez′ .
Cuando se trabaja en el sistema de laboratorio, sin referencia a ningún otro sistema de refe-
rencia se pueden ignorar todas las primas y escribir las coordenadas del sistema de referencia
como {x, y, z} y la base como {~ex , ~ey , ~ez }.
Despreciando la diferencia entre dirección radial y vertical, la ley de Newton toma la forma
En componentes
11
Por otro lado, la ecuación en el caso ω = 0 es muy sencilla de integrar. ¿Podemos obtener
la solución de forma perturbativa en ω?. Es decir, podemos buscar una solución del tipo
siguiente?
x(t) = x0 (t) + ωx1 (t) + O(ω 2 )
y(t) = y0 (t) + ωy1 (t) + O(ω 2 )
z(t) = z0 (t) + ωz1 (t) + O(ω 2 )
Aquı́ hemos impuesto los datos iniciales x1 (0) = y1 (0) = z1 (0), por que la posición inicial ya
se ha usado en el orden cero.
La solución obtenida es
x(t) = 13 ωgef t3 sin θ
y(t) = 0 + O(ω 2 ).
1 2
z(t) = h − 2 gef t
q
2h
A primer orden en ω, cuando el objeto llega al suelo (z = 0, es decir t = gef ), se ha
desplazado hacia el este una cantidad
3
1 2h 2
D = ωgef sin θ
3 gef
Si h = 100m y estamos a colatitud θ = 45o se tiene D = 1,5 cm. El objeto no cae sobre su
propia vertical.
12
• La partı́cula esta inicialmente en reposo respecto de la Tierra, por lo que gira con su
misma velocidad angular.
• Su velocidad lineal es mayor que la del suelo, porque se encuentra en un punto más
alejado del eje de rotación.
• A medida que cae hacia el centro de la Tierra, en su movimiento avanza al punto sobre
el que estaba (puesto que se movı́a con mayor velocidad horizontal). Por lo tanto se
desplaza hacia el este.
La componente vertical de esta fuerza es mucho más que pequeña que la de la gravedad
efectiva mgef (para velocidades tı́picas terrestres).
La componente horizontal es perpendicular a la velocidad ẋ~ex +ẏ~ey . Tiene módulo 2mωv| cos θ|
y va dirigida hacia la derecha del movimiento si 0 ≤ θ < π2 (hemisferio norte) o hacia la
izquierda del movimiento si π2 < θ ≤ 0 (hemisferio sur)
Péndulo de Foucault:
Vamos a hacer un estudio cuantitativo del péndulo de Foucault de longitud l mediante la ley
de Newton en el sistema el laboratorio.
Las fuerzas aplicadas sobre el grave son la tensión de la cuerda T~ y la fuerza de la gravedad
efectiva.
La ley de Newton es
m~r¨ = T~ + ~gef − 2m~
ω × ~r˙
Si usamos la base de vectores cilı́ndrica tenemos, que cuando el péndulo está desplazado un
ángulo α respecto de la vertical
13
α
l
T~
m~g
Por lo tanto
sin α T
T~ = T cos α~ez − T (x~ex + y~ey ) = T cos α~ez − (x~ex + y~ey )
ρ l
donde hemos usado que l sin α = ρ.
T
T~ = T ~ez − (x~ex + y~ey ) .
l
Para un movimiento plano la fuerza de Coriolis sabemos que vale F~cor = 2mω cos θ (ẏ~ex − ẋ~ey )+
2mω sin θẋ~ez
14
La tercera ecuación determina T = m (gef − 2ω sin θẋ).
Podemos despreciar 2ω sin θẋ frente a gef y obtenemos T = mgef con lo que las ecuaciones
en el plano {x, y} quedan
mg
(∗) mẍ = − l ef x + 2mω cos θẏ
mg
(∗∗) mÿ = − l ef y − 2mω cos θẋ
Si calculamos (∗) + i(∗∗) vemos que la ecuación que queda se puede escribir en términos de
ξ como
gef
ξ¨ + 2iω cos θξ˙ + ξ=0
l
Definamos dos frecuencias caracterı́sticas para el péndulo de Foucault
r
gef
Ω := ω cos θ, ω0 := .
l
La ecuación diferencial es
ξ¨ + 2iΩξ˙ + ω02 ξ = 0
Usando las fórmulas eiu + e−iu = 2 cos u y eiu − e−iu = 2i sin u podemos rescribir ξ como
15
Tomando parte real y parte imaginaria obtenemos directamente
x(t) = A cos (Ωt + α) cos (ω1 t + β) + B sin (Ωt + α) sin (ω1 t + β)
,
y(t) = −A sin (Ωt + α) cos (ω1 t + β) + B cos (Ωt + α) sin (ω1 t + β)
La parte x = A cos(ω1 t), y(t) = B sin(ω1 t) es una elipse de semiejes A, B recorrida con
velocidad angular de giro constante ω1 ( y periodo t = ω2π1 )
La matriz cuadrada anterior es un rotación con respecto al eje vertical con velocidad angular
de rotación Ω = ω cos θ y cuyo sentido de giro es el de las agujas del reloj en el hemisferio
norte (cos θ > 0) y en sentido contrario a las agujas del reloj en le hemisferio sur (cos θ < 0).
La órbita es por lo tanto una elipse que precesa con velocidad angular Ω. El tiempo que tarda
2π 2π
en dar una vuelta completa es T = |Ω| = ω| cos θ|
Si B = 0, la elipse se convierte en una recta que gira alrededor de la vertical. Este es el movi-
miento cuando el péndulo parte del reposo (el que observamos normalmente en los péndulos
de Foucault).
2π 2π
El periodo de oscilación del péndulo es T = ω1 =√ . Es distinto al periodo natural del
ω02 +Ω2
péndulo T0 = ω2π0 . No obstante para un péndulo como el del patio, l = 14 m, la modificación
es despreciable ω1 = ω0 (1 + 1, 6 × 10−9 )
16
Tema 5. Relatividad Especial
5.1 La mecánica clásica y la electrodinámica a finales del siglo XIX.
A finales del siglo XIX habı́a dos teorı́as fı́sicas fundamentales, la mecánica y el electromag-
netismo. Ambas teorı́as estaban bien contrastadas experimentalmente y tenı́an propiedades
muy distintas.
Por un lado la Mecánica, basada en las leyes de Newton satisfacı́a el principio de relatividad
de Galileo que establece que todos los sistemas de referencia inerciales son equivalentes desde
un punto de vista mecánico. En otras palabras, no es posible distinguir mediante experimentos
puramente mecánicos si el sistema de referencia se encuentra en reposo o en movimiento
rectilı́neo y uniforme. Ante esta imposibilidad, para la mecánica no existe un espacio absoluto
con el que podamos comparar para saber si nos encontramos en reposo o en movimiento.
Por otro lado, en Mecánica sı́ existe un tiempo absoluto que transcurre de la misma manera
independientemente del sistema de referencia que usemos para describir la fı́sica.
Notemos que un sistema de referencia acelerado sı́ puede ser distinguido de uno inercial. Basta
dejar una partı́cula sobre la que no actúe ninguna interacción. Como el sistema está acelerado,
la partı́cula describirá un movimiento acelerado y el primer principio de la mecánica no
tendrá validez.
Recordemos que dos sistemas de referencia inerciales S y S ′ se mueven con velocidad relativa
constante. Si denominamos ~v a la velocidad de S ′ respecto de S, el vector de posición ~r′ de
un punto en un instante de tiempo t visto desde S ′ se relaciona con el vector de posición ~r del
mismo punto en el mismo instante visto desde S mediante la denominada transformación
de Galileo
~r′ = ~r − (~v t + ~r0 ) , (1)
donde ~r0 es el vector de posición del origen de S ′ con respecto a S en el instante de tiempo
t = 0.
Por otro lado, las ecuaciones fundamentales del electromagnetismo son las ecuaciones de
Maxwell, que el el vacı́o toman la forma
)
∇·B ~ = 0, ∇×E ~ + ∂ B~ = 0
∂t
∇·E ~ = 1 ρ, ∇×B ~ − µ0 ǫ0 ∂ E~ = µ0~j
ǫ0 ∂t
~ B
donde E, ~ son el campo eléctrico y magnético, ǫ0 es la permitividad eléctrica, µ0 es la
permeabilidad magnética, ρ la densidad de carga y ~j la corriente eléctrica.
1
Una de las consecuencias fundamentales de estas ecuaciones es que los campos eléctricos y
magnéticos se propagan como una onda con velocidad
1
c= √ = 3 · 108 m/s2 (3)
µ0 ǫ 0
∂2E~
~ − µ0 ǫ 0
∆E =0 (4)
∂t 2
donde ∆ es el Laplaciano ∇ · ∇.
Es natural preguntarse en qué sistema de referencia son válidas las ecuaciones de Maxwell.
Según la relatividad Galileana, si una onda se propaga a velocidad ~c en un sistema de referencia
inercial S, entonces propaga a velocidad ~c − ~v en un sistema de referencia S ′ que se mueva
con velocidad ~v respecto del anterior.
Esto implica que las ecuaciones de Maxwell son válidas únicamente en un sistema de referencia
inercial. Este sistema de referencia era conocido como sistema de referencia del éter.
Para la fı́sica del siglo XIX este hecho era de lo más razonable puesto que todas las ondas
necesitaban un medio por el que propagarse. Las ondas eran simplemente la vibraciones de
ese medio que se transmitı́an a través de él, de manera análoga a las olas del mar o las ondas
de sonido, donde los medios son respectivamente el agua y el aire.
No obstante el éter era un medio con propiedades muy extremas. Por un lado debı́a ser
extremadamente rı́gido para poder tener una velocidad de propagación tan alta (pensemos
en el sonido que se propaga más rápido en medios sólidos que en medios lı́quidos y en éstos
más rápido que en el aire; o en ondas en una cuerda, donde la velocidad de propagación de
proporcional a la raı́z cuadrada de la tensión de la cuerda). Por otro lado, el éter debı́a ser
muy sutil (de ahı́ la palabra etéreo) para que, por un lado, ocupara todo el espacio (la luz
se propaga por todas partes) y por otro lado no interfiera en el movimiento de los objetos.
Por ejemplo el movimiento de los planetas alrededor del Sol se explicaban con muchı́sima
precisión a partir de las leyes de la gravitación universal de Newton y no habı́a ningún efecto
perceptible de éter.
A pesar de estas propiedades peculiares, la casi totalidad de los fı́sicos del siglo XIX aceptaba
sin inconveniente que el éter era necesario y que existı́a en la realidad.
El experimento más famoso para medir esta velocidad es la experimento de Michelson reali-
zado en 1881 y su versión mejorada llevada a cabo por Michelson y Morley en 1887.
2
Este experimento consiste en un interferómetro que está fijo en el laboratorio. Como la Tierra
se mueve en el espacio a una cierta velocidad v respecto del éter, la distinta velocidad de
propagación en distintas direcciones hará que los caminos ópticos de las trayectorias del rayo
de luz en cada brazo sean distintos, y esto producirá franjas de interferencia en el detector.
Vamos a suponer por simplicidad que la velocidad ~v es paralela a uno de los brazos del
interferómetro y vamos a suponer que los dos brazos del interferómetro tienen exactamente la
misma longitud L. En realidad es imposible garantizar que los dos brazos tengan exactamente
la misma longitud pero eso se puede arreglar simplemente haciendo que el experimento con
una configuración y después rotando el interferómetro π/2 y observando cómo cambian las
franjas de interferencia.
La velocidad de la luz es c respecto del éter. En el brazo 1 la velocidad de la luz respecto del
interferómetro es c − v cuando la luz va hacia el espejo y c + v cuando vuelve del espejo. El
tiempo que tarda en hacer el recorrido de ida y vuelta es
L L 2cL 2L 1
t1 = + = 2 2
= . (5)
c+v c−v c −v c 1 − v2
c2
Para el brazo 2 , para conocer la velocidad de la luz respecto del interferómetro podemos
situarnos en el sistema de referencia del éter, que observará el movimiento de la siguiente
manera:
1111
0000
0000
1111 00000
11111
00000
11111 0000
1111
0000
1111
0000
1111 00000
11111 0000
1111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 c
00000000
11111111
0000000
1111111
0
1 00000000
11111111
c 0 v 11111111
0000000
1111111
1 ′ 00000000
00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1 00000000
11111111
00000000
11111111
0000000
1111111
0
1 00000000
11111111
0000000
1111111
0
1
0000000
1111111
0
1 00000000
11111111
00000
11111
0000000
1111111
0
100000
11111
00000
11111 00000
11111
00000000
11111111
00000
11111
00000
11111 v
0000000
1111111
0
1 00000000
11111111
00000
11111 00000
11111
00000000
11111111
00000
11111
0000000
1111111
00000
11111 0
100000
11111 00000
11111
00000000
11111111
0000000
1111111
00000
11111 0
100000
11111 00000
11111
00000000
11111111
00000
11111 00000
11111
00000
11111 00000
11111
00000
11111
00000
11111 00000
11111 00000
11111
tanto en el camino de ida como en el de regreso. El tiempo del recorrido es, por lo tanto
2L 2L 2L 1
t2 = =√ = q . (7)
v′ 2
c −v 2 c 1− v2
c2
Ambos tiempos sin distintos por lo que el patrón de interferencia depende de la velocidad
2
v. El efecto es proporcional a vc2 que es muy pequeño. Si tomamos v como la velocidad de
3
rotación de Tierra tenemos vR = ωR ≈ 0,5 · 103 m/s Por otro lado, la velocidad de traslación
de la Tierra alrededor del Sol es VT ≈ 3 · 104 m/s. Para este último caso
2
v2 3 · 104
≈ = 10−8 , (8)
c2 3 · 108
que es muy pequeño. No obstante la interferometrı́a es muy precisa y velocidades de este orden
deben ser observables con el dispositivo del experimento de Michelson-Morley. No obstante,
el experimento proporcionó un resultado negativo. El interferómetro se comportaba como si
la velocidad de la luz fuera c en todos las trayectorias a lo largo de los brazos.
Esta idea fue retomada por Lorentz en 1892 y propuso un posible mecanismo fı́sico basado
en la teorı́a de electrones que explicara dicha contracción de longitudes.
Veamos que este efecto explicarı́a la ausencia de franjas de interferencia: El brazo que se
mueve perpendicular a la dirección del movimiento no sufre ninguna contracción de manera
que el tiempo que se tarda en recorrerlo sigue siendo t2 = 2L
c
q 1
2
. Por otro lado, el brazo 1
1− v2
q c
2
se contrae de manera que su longitud pasa a ser L′ = L 1 − vc2 y el tiempo del recorrido es
2L′ 2L 1
t1 = = q . (9)
2
c 1 − vc2 c 1− v2
c2
No obstante esta explicación es ad hoc. No hay ninguna base sólida que explique por qué se
produce esa contracción.
Resultaba necesario encontrar una explicación mejor para la ausencia de efectos en el expe-
rimento de Michelson-Morley.
Einstein fue quien dio el paso decisivo para dar esa explicación. Su propuesta estaba basada
en una modificación radical de los conceptos fı́sicos más básicos, el espacio y el tiempo.
Einstein consideró que el principio de relatividad (es decir, que todos los sistemas de referencia
inerciales eran equivalentes) estaba por encima de cualquier teorı́a fı́sica
4
Propuso dos postulados, a priori nada radicales, y desarrolló un cuerpo teórico que modificaba
radicalmente muchas de las concepciones de la época y que ha demostrado ser extremadamente
preciso: la teorı́a de la relatividad especial.
Aceptaremos como punto de partida que las leyes de la mecánica son válidas en todos los
sistemas de referencia inerciales, definidos como aquellos en los que una partı́cula libre se
mueve en lı́nea recta y a velocidad constante.
Por lo tanto, tomamos como principio que las leyes de la electromagnetismo, la óptica y la
mecánica son las mismas en todos los sistemas de referencia inerciales.
Cada postulado por sı́ mismo es completamente razonable y casi intuitivo. No obstante,
cuando se combinan ambos las consecuencias son sorprendentes y obligan a una revisión de
conceptos básicos de espacio y tiempo.
A los postulados anteriores hay que añadir otros dos que Einstein no hizo explı́citos porque
en la época se consideraban obvios.
Homogeneidad del espacio y del tiempo Todos los puntos del espacio y todos los instantes de
tiempo son equivalentes desde un punto de vista fı́sico.
Isotropı́a del espacio Todas las direcciones del espacio son equivalentes.
En otras palabras: En ausencia de campos externos, ningún proceso fı́sico puede privilegiar
un punto del espacio, un instante de tiempo o una dirección del espacio sobre ningún otro.
Para entender este enunciado es necesario definir primero el concepto de simultaneidad. Em-
pecemos por un concepto todavı́a más básico, el de suceso.
5
Suceso. Un suceso es un fenómeno fı́sico que ocurre en algún lugar del espacio y en algún instante
de tiempo.
Ejemplos de sucesos serı́an el choque con el suelo de un piedra lanzada al aire, la emisión de
un fotón, la colisión entre un palo de golf y la pelota, etc.
El concepto de suceso es una idealización ya que suponemos que el fenómeno fı́sico no tiene
ninguna extensión espacial y ninguna duración temporal. En una idealización similar a la que
hacemos al definir un punto del espacio. En realidad, como un suceso podrı́a en principio
ocurrir en cualquier sitio y en cualquier instante de tiempo, podemos considerar un suceso
simplemente como un punto del espacio en un instante de tiempo.
En estas condiciones, las coordenadas más naturales para el espacio son las coordenadas
cartesianas.
Para medir el tiempo podemos, por ejemplo, utilizar un reloj situado en el origen del sistema
de coordenadas y que mida los instantes de tiempo en los que cualquier suceso es observado
desde eso punto.
Este método tiene el inconveniente que, como la luz viaja a velocidad finita, hay un retraso
entre el instante de tiempo en el que suceso ocurre y el instante en que es observado desde
el origen del sistema, lo que nos obligarı́a a corregir todos las mediciones de tiempo con el
retraso que tarda el suceso en ser observado.
Una alternativa que resulta útil es la siguiente. Supongamos que sabemos donde ocurrirá el
suceso que nos interesa. Proporcionamos a otro experimentador/a un reloj idéntico al nuestro
(y sincronizado, es decir que marcan el mismo número en el mismo instante de tiempo) y
le mandamos hasta el punto donde ocurrirá el suceso. Para prevenir la posibilidad de que el
desplazamiento del reloj afecte a su ritmo de medición, lo mandamos de manera adiabática,
es decir tan lenta como queramos. Cuando el suceso ocurra, simplemente preguntamos al
observamos qué marcaba su reloj cuando el suceso ocurrió.
6
Al conjunto de experimentadores/as provistos de relojes idénticos y sincronizados le llamamos
observador
Simultaneidad. Dos sucesos son simultáneos cuando los relojes sincronizados del observador mi-
den el mismo instante de tiempo en los respectivos puntos donde ocurren.
Supongamos una vı́a de tren recta y un tren que se mueve sobre la vı́a a velocidad v y
consideremos un sistema de referencia S ′ ligado al tren y otro sistema de referencia S ligado
a la vı́a.
Supongamos que, de manera simultánea según S ′ , caen dos rayos de luz uno en la cabeza y
otro en la cola del tren. Al caer estos rayos dejan marcas en la vı́a en dos puntos A y B.
Consideremos el punto medio del tren (con respecto al sistema de referencia S ′ ). Como la luz
se propaga a velocidad constante c y el punto medio se encuentra a la misma distancia de la
cola que de la cabeza, lo luz de los dos rayos llega a ese punto medio en el mismo instante de
tiempo.
Como la velocidad de la luz es finita, en el tiempo que ha transcurrido (en S ′ ) entre la caı́da
de los rayos y su llegada al punto medio, los puntos A y B de la vı́a se han desplazado hacia
la izquierda. El punto medio M entre esos dos puntos (medido con respecto a S) también se
ha desplazado hacia la izquierda. Por lo tanto, el suceso correspondiente a que las dos señales
luminosas se encuentran en el centro del tren es visto desde S como un suceso en el que la
luz proveniente de la cola ya ha atravesado M mientras que la luz proveniente de la cabeza
aun no ha llegado a M . Si las caı́das de los rayos fueran simultáneas en S, los dos señales
luminosas tienen que llegar a M en el mismo instante, cosa que no ha sucedido. Por lo tanto,
los sucesos no pueden ser simultáneos en S. El suceso A es anterior a B.
Como tenemos dos sistemas de coordenadas para cada suceso, debe existir una transformación
que relacione los valores de (t′ , x′ , y ′ , z ′ ) con los valores de (t, x, y, z), es decir deben existir
funciones
t = g0 (t′ , x′ , y ′ , z ′ )
x = g1 (t′ , x′ , y ′ , z ′ )
y = g2 (t′ , x′ , y ′ , z ′ )
z = g3 (t′ , x′ , y ′ , z ′ )
7
La propiedad fundamental que define a los sistema de referencia inerciales es que cualquier
movimiento rectilı́neo y uniforme visto desde S ′ debe ser también observado desde S como
un movimiento rectilı́neo y uniforme.
Se puede demostrar que esta propiedad implica necesariamente que la transformación anterior
debe ser lineal, es decir que existan constantes de manera que
t = a 0 t′ + a 1 x ′ + a 2 y ′ + a 3 z ′ + t0 ,
x = b0 t ′ + b1 x ′ + b2 y ′ + b3 z ′ + x 0 ,
y = c 0 t ′ + c 1 x ′ + c 2 y ′ + c 3 z ′ + y0 ,
z = d 0 t′ + d 1 x ′ + d 2 y ′ + d 3 z ′ + z0 ,
Mediante la elección del origen del espacio y del tiempo de S ′ podemos imponer (t0 = 0, x0 =
0, y0 = 0, z0 = 0). Esta elección corresponde a que el suceso “posición de O′ en t′ = 0”
corresponda al suceso “posición de O en t = 0”.
Ambos sistemas aún pueden escoger de manera arbitraria sus ejes. Para simplificar el resultado
supongamos que S elige su eje x de manera que el movimiento del origen del sistema S ′
está dirigido a lo largo del eje x.
t = a 0 t′
x = b0 t ′
y = c 0 t′
z = d 0 t′
por lo tanto ~r(t) = a10 (b0 , c0 , d0 )t = ~v t. Como hemos escogido que ~v esté dirigido a lo largo
del eje x tenemos b0 = a0 v, c0 = 0 y d0 = 0.
8
Supongamos ahora que giramos la configuración de los ejes de S y de los ejes de S ′ un ángulo
π/2 alrededor del eje x. Esto corresponde a una rotación del espacio. Como éste es isótropo
la transformación entre los nueves ejes debe ser idéntica a la transformación con los antiguos
ejes. Los nuevos ejes en S son t̂ = t, x̂ = x, ŷ = z y ẑ = −y. De manera análoga t̂′ = t′ ,
x̂′ = x′ , ŷ ′ = z ′ y ẑ ′ = −y ′ . Si hacemos estas sustituciones en la transformación obtenemos
t̂ = a0 t̂′ + a1 x̂′ − a2 ẑ ′ + a3 ŷ ′
x̂ = a0 v t̂′ + b1 x̂′ − b2 ẑ ′ + b3 ŷ ′
−ẑ = −c2 ẑ ′
ŷ = d3 ŷ ′
La única forma como esta transformación puede ser formalmente idéntica a (10) es que a2 =
a3 = −a2 (que implica a2 = a3 = 0) b2 = b3 = −b2 (que implica b2 = b3 = 0) y c2 = d3 := m.
La transformación se ha simplificado a
t = a 0 t′ + a 1 x ′
x = a0 vt′ + b1 x′
.
y = my ′
z = mz ′
Estas ecuaciones debe ser ciertas paro todo t′ . Si dividimos la segunda por la primera (en
t 6= 0 y t′ 6= 0) obtenemos dos ecuaciones, una para cada signo,
a 0 v + b1 c a 0 v − b1 c
c= , −c = , (11)
a0 + a1 c a0 − a1 c
que podemos reescribir como
c (a0 + a1 c) = a0 v + b1 c
c (a0 − a1 c) = −a0 v + b1 c
Sumando y restando obtenemos
a0 v
b1 = a0 , a1 = , (12)
c2
de manera que la transformación queda
t = a0 t′ + cv2 x′
x = a0 (vt′ + x′ )
.
y = my ′
z = mz ′
9
Si consideramos la trayectoria luminosa (y ′ = c t′ , x′ = z ′ = 0) y sustituimos en la transfor-
mación obtenemos
t = a 0 t′
x = a0 vt′
.
y = mct′
z =0
m2 c 2
La velocidad de esta trayectoria es (v, mc 2
a0 , 0) que tiene módulo al cuadrado v + a20
. Esta
cantidad debe coincidir con c2
por la constancia de la velocidad de la luz. Esta ecuación
solamente tiene solución si la velocidad v es estrictamente menor que c.
Si definimos
1
γv := q (13)
v2
1− c2
m2 c 2 v2 c2
obtenemos a20
= c2 − v 2 = c2 (1 − c2
) = γv2
y obtenemos a0 en términos de m como
que implica que el origen de S es observado desde S ′ moviéndose con velocidad −v a lo largo
del eje x′ (en particular, concluı́mos que si la velocidad de S ′ respecto de S es ~v entonces la
velocidad de S respecto de S ′ es −~v ). Si hacemos ahora una reflexión de los ejes coordenados
x y y, es decir definimos t̂ = t, x̂ = −x, ŷ = −y, ẑ = z y lo mismo con las primas, la ley de
transformación se convierte en
1
t̂′ = m γv t̂ + cv2 x̂
1
x̂′ = m γv v t̂ + x̂
1
ŷ ′ = m ŷ
′ 1
ẑ = m ẑ
10
y S x′ S′
v
x z′
z z′
x̂ x̂′
ẑ ẑ ′
Ŝ
Ŝ ′ ŷ ′
ŷ
Figura 1: Estas dos configuraciones son idénticas por la isotropı́a del espacio.
Pero observemos que, por la isotropı́a del espacio esta configuración es exactamente idéntica
a la configuración inicial, ver Figura 1.
Por lo tanto la ley de transformación debe ser formalmente idéntica a (15) (si no lo fuera
1
podrı́amos distinguir direcciones del espacio). Por lo tanto debe ocurrir m = m es decir
2
m = 1 y como m > 0 la única solución posible es m = 1. Llegamos a la siguiente ley de
transformaciones, que es conocida como transformación de Lorentz:
t = γv t′ + cv2 x′
x = γv (vt′ + x′ )
.
y = y′
z = z′
Dadas las elecciones de ejes que hemos hecho por el camino, a esta transformación se la conoce
como transformación de Lorentz de ejes paralelos y con velocidad a lo largo del
eje x.
Consideremos una partı́cula que se mueve con respecto a un sistema de referencia S ′ a ve-
locidad ~u′ mientras este se mueve con velocidad ~v con respecto a otro sistema de referencia
S. Un resultado fundamental en mecánica Galileana es que la velocidad de la partı́cula con
respecto al sistema S es ~u = ~v + ~u′
11
Queremos deducir qué ocurre en relatividad especial. Supongamos por simplicidad que los
sistemas de referencia S y S ′ tienen ejes paralelos y que la velocidad de S ′ con respecto a S
está dirigida en la dirección x de manera que ~v = v~ex .
La trayectoria en el sistema S ′ será x′ (t′ )~ex ′ + y ′ (t′ )~ey ′ + z ′ (t′ )~ez ′ y su velocidad es ~u ′ =
′
dx′ ′
ex ′ + dy
dt′ ~ dt′ ~ey ′ + dz
dt′ ~ez ′ = u′z ~ex ′ + u′y ~ey ′ + u′z ~ez ′ .
Para conocer la velocidad con respecto de S debemos conocer la trayectoria con respecto de
S. Si tomamos diferenciales en la trasformación de Lorentz
t = γv t′ + cv2 x′
x = γv (vt′ + x′ )
y = y′
z = z′
tenemos
dt = γv dt′ + cv2 dx′
dx = γv (vdt′ + dx′ )
dy = dy ′
dz = dz ′
La velocidad respecto del sistema S es, por lo tanto
dx dx′ + vdt′ u′x + v
ux = = ′ = ′ ,
dt dt + cv2 dx′ 1 + vu 2
x
c
dy dy ′ u′y
uy = = = ,
dt γv (dt′ + cv2 dx′ ) γv (1 + vu
′
x
)
c2
dz dz ′ u′z
uz = = = .
dt γv (dt′ + cv2 dx′ ) γv (1 + vu 2
′
x
)
c
12
es decir la partı́cula también se mueve a velocidad de la luz respecto de S. Lo mismo ocurre
si la velocidad de la partı́cula en S tiene dirección arbitraria.
Por otro lado, ¿qué ocurre si tanto la velocidad de la partı́cula respecto de S ′ es menor que
la de la luz? Supongamos, de nuevo por simplicidad, que las velocidades van a lo largo del
eje x.
Tenemos que u′x = c (1 − α) con 0 < α < 1 y v = c (1 − β) con 0 < β < 1. Sustituyendo en
ux tenemos
c (1 − α) + c (1 − β) c (2 − (α + β))
ux = c2 (1−α)(1−β)
= <c (16)
1+ 2 − (α + β) + αβ
c2
La última desigualdad se sigue porque 2 − (α + β) + αβ siempre es mayor que 2 − (α + β).
Supongamos que dos sucesos ocurren en el mismo sitio en un sistema de referencia S ′ . Estos
sucesos ocurren en t′A y t′B según los relojes de S ′ . El intervalo que transcurre es τ0 = t′B − t′A .
A este intervalo de tiempo se le llama tiempo propio. Es el intervalo entre dos sucesos
medido por el reloj inercial para el que ocurren en el mismo sitio.
Notemos que ∆t > τ0 . Por lo tanto cualquier sistema de referencia en el que los dos sucesos
no ocurran en el mismo sitio medirá un intervalo de tiempo mayor entre los dos sucesos que
el intervalo de tiempo propio. A este fenómeno se le llama dilatación del tiempo.
Este hecho ha sido comprobado experimentalmente en infinidad de ocasiones. Por ejemplo, los
muones (que son partı́culas leptónicas parecidas a los electrones, aunque con mayor masa) son
partı́culas inestables con un semiperiodo de desintegración de 2 µs. Estos muones se pueden
formar en las capas altas de la atmósfera debido a las interacción con los rayos cósmicos. La
velocidad (respecto de la atmósfera) a la que se forman es muy cercana a la velocidad de la
luz v = 0,998c.
13
Si el tiempo fuera universal, el camino medio que recorrerı́an antes de que la mitad de los
muones se desintegrara es de
0,998c × 2 · 10−6 = 600 m (19)
Por lo tanto el camino medio que recorren antes de que sobrevivan la mitad de ellos es de
τ × 0, 998c = 9500 s, lo que explica el gran número de muones que llegan a la superficie de la
Tierra.
¿De qué manera se verá este proceso desde el punto de vista del muón? Para esta partı́cula,
la Tierra se acerca a velocidad 0, 998c. Cuando la Tierra se haya acercado 600 m, habrán
desaparecido la mitad de los muones.
¿Cómo es posible que lleguen tantos a la superficie? La respuesta está en otro fenómeno propio
de la relatividad especial.
Consideremos una barra. Llamamos longitud propia de la barra a la longitud que tiene
la barra medida en el sistema de referencia en la que se encuentra en reposo. Llamemos S ′
a este sistema y consideremos otro sistema de referencia inercial con respecto al cual S ′ se
está moviendo con velocidad v en el sentido positivo del eje x. Supongamos además que la
barra es paralela al eje x′ y que los dos sistemas tienen ejes paralelos.
¿Cuál es la medida de la longitud de la barra que hace S? Es decir, ¿qué longitud tiene la
barra de longitud propia cuando se mueve a velocidad v?
Para poder medir esta longitud tenemos que localizar la posición de la cabeza y la cola en
un mismo instante de tiempo y restar ambas posiciones. No podemos simplemente parar la
barra y medirla, porque no estarı́amos midiendo su longitud en movimiento.
x′ = γ (x − vt) . (21)
14
Ahora bien, en el sistema de referencia S ′ la cabeza de la barra se encuentra a distancia L0
de la cola, aunque las posiciones de ambos puntos las midamos en tiempos distintos (ya que
la barra está en reposo en S ′ ). Por lo tanto x′B − x′A = L0 y obtenemos que la longitud de la
barra en S es r
L0 v2
L = xB − xA = = L0 1 − 2 < L0 . (23)
γ c
Por lo tanto, la longitud de la barra en movimiento es menor que su longitud propia. A este
fenómeno se le conoce como contracción de longitudes. Es un efecto completamente real
y no un defecto de medición. La barra es realmente más corta cuando es observada por un
sistema de referencia en la que está en movimiento.
y queremos conocer qué vale ∆t. Observemos que si ∆t 6= 0, entonces los sucesos no son
simultáneos en S y por lo tanto el concepto de simultaneidad será relativo al sistema de
referencia que lo mida.
15
otro sistema de referencia inercial. Las transformaciones de Lorentz incorporan la propiedad
de que la simultaneidad es un concepto relativo al sistema de referencia, tal y como ya
obtuvimoa a partir de los dos postulados de la relatividad especial.
¿Existe alguna magnitud que tenga el mismo valor en todos los sistemas de referencia? A
magnitudes de este tipo se las llama invariantes Lorentz (o simplemente invariantes).
Sabemos que la velocidad de la luz es la misma en todos los sistemas de referencia. Esto
implica que si tenemos dos sucesos situados sobre la trayectoria de un rayo de luz en el vacı́o
tenemos que sus coordenadas en cualquier sistema de referencia deben satisfacer
entonces sus coordenadas (t′1 , x′1 y1′ , z1′ ) y (t′2 , x′2 , y2′ , z2′ ) en otro sistema de referencia inercial
S ′ también debe satisfacer
Resulta natural preguntarse si esta magnitud también es invariante cuando cuando su valor
no es cero.
16
Si sustituimos las expresiones anteriores
2
2 ′2 ′2 2 v 2
−c ∆t + ∆x = γ − c∆t − ∆x + (∆x − v∆t) =
c
v2
= γ 2 −∆t2 c2 − v 2 + ∆x2 1 − 2 =
c
1 2 2 2
2 v2
= 2 −∆t c − v + ∆x 1 − 2 =
1 − v2 c
c
= −c ∆t2 + ∆x2 .
2
Concluimos que el intervalo espacio-temporal es invariante para todos los sistemas de refe-
rencia inerciales.
Si existe algún sistema de referencia en el que ∆t′ es negativo, entonces no puede haber
una relación de causa-efecto entre A yB. Si, por otro lado, ∆t′ > 0 en cualquier sistema de
referencia entonces a priori podrı́a existir una relación de causalidad entre ambos de manera
que A fuera la causa de B. Vamos a analizar cuando se satisface que ∆t′ > 0 en cualquier
sistema de referencia inercial.
v∆x v
∆t − >0 ⇐⇒ c∆t > ∆x. (35)
c2 c
Como esto tiene que pasar para todo v ∈ (−c, c) (es decir, en todos los sistemas de referencia
inerciales), la condición que hay que imponer es que
que es equivalente a
∆s2 = −c2 ∆t2 + ∆x2 ≤ 0. (37)
Si el intervalo espacio-temporal es negativo entre dos sucesos A y B puede existir una relación
de causa efecto entre ambos.
17
Si el intervalo espacio-temporal es igual a cero, entonces puede haber relación de causa efecto
entre A y B y además emitir un rayo de luz en A que alcance B. Un intervalo de este tipo se
llama luminoso (también nulo).
Notemos que si el intervalo entre dos sucesos es espacial entonces existe un sistema de refe-
rencia en el que los dos sucesos son simultáneos. En efecto:
′ v∆x ∆t
∆t = 0 = γ ∆t − 2 =⇒ v = c2 (38)
c ∆x
Como ∆s2 > 0, tenemos −c2 ∆t2 + ∆x2 > 0 que es equivalente a c|∆t| < |∆x| y el módulo de
la velocidad es
c2 |∆t| c|∆x|
v= < =c (39)
|∆x| |∆x|
Como esta velocidad es menor que la de la luz, existen el sistema de referencia S ′ en el que
los sucesos son simultáneos.
Hemos visto que el relatividad espacial no existe un tiempo absoluto y que las transforma-
ciones de coordenadas involucran tanto al espacio como al tiempo.
Si consideramos todos los sucesos posibles (es decir el conjunto de todos los puntos del espacio
en todos los instantes de tiempo) tenemos un espacio de cuatro dimensiones, de las cuales
tres corresponden a direcciones espaciales y una a una dirección temporal. Este es el llamado
espacio-tiempo de Minkowski.
El vector columna
x0
x1
x2
x3
define el vector de posición del suceso A con respecto al origen del sistema de referencia.
Podemos definir una “longitud” al cuadrado para este vector mediante la definición
0
−1 0 0 0 x
0 1 0 0 x1
−(x0 )2 + (x1 )2 + (x2 )2 + (x2 )2 = x0 , x1 , x2 , x3
0 0 1 0 x2 .
0 0 0 1 x3
18
A la matriz cuadrada que aparece se la denomina métrica de Minkowski y se la denota
por ηµν , donde los ı́ndices griegos toman los valores 0, 1, 2, 3. En otras palabras η00 = −1,
η11 = η22 = η33 = 1 y el resto cero.
La invariancia del intervalo espacio-temporal implica que todos los sistemas de referencia
inerciales con el mismo origen usan la misma fórmula para el módulo al cuadrado de este
vector
∆s2 = ηµν x′µ x′ν . (42)
En otras palabras, si transformamos las cooordenadas mediante una transformación de Lo-
rentz, la forma de la métrica de Minkowski queda invariante.
Los sucesos conectados causalmente con el origen O del sistema de coordenadas son aquellos
que tienen ∆s2 ≤ 0, es decir
Este conjunto de puntos define un cono dentro del espacio-tiempo de Minkowski. Se denomina
cono de luz, porque los puntos en su frontera son los que satisfacen
que son precisamente el conjunto de todos los sucesos por lo que pasan la colección de rayos
de luz emitidos en O en todas la direcciones del espacio (si x0 ≥ 0) o bien recibidos en O
desde todas las direcciones del espacio (si x0 ≤ 0).
Futuro de O
x2 = y
x1 = x Pasado de O
19
5.11 Diagramas espacio-temporales.
Consideremos una partı́cula masiva que siga una trayectoria cualquiera ~r(t). En coordenadas
cartesianas en un sistema inercial, la trayectoria vendrá descrita por xα = (ct, ~x(t)).
En cada instante de tiempo podemos imaginar que la partı́cula lleva consigo un sistema de
referencia. Como sabemos que dos sistemas de referencia no pueden moverse a velocidad
superior a la de la luz, se sigue que la partı́cula no puede viajar a velocidad superior a c.
d~
x d~
x
Dado que dx0
= cdt = ~vc , la condición d~
x
dt < c es equivalente a d~
x
dx0
< 1.
La trayectoria de la partı́cula forma un ángulo α con respecto de la vertical que debe satisfacer
x0 = c t
d~x
α
dx0
x2 = y
x1 = x
|d~x| π
tan α = <1 ⇐⇒ |α| < . (45)
dx0 4
La partı́cula debe avanzar siempre dentro del cono de luz futuro den suceso en el que esté en
ese momento.
20
x0 = c t x0 = c t
x0 = c t
x2 = y x2 = y x2 = y
x1 = x
x1 = x x1 = x
(b) Movimiento rectilı́neo uni- (c) Oscilación periódica a lo lar-
(a) Partı́cula en reposo.
forme. go del eje y.
x0 = c t
x0 = ct
x2 = y
x2 = y x1 = x
x1 = x
Calculemos de qué manera transcurre el tiempo propio para esta partı́cula. En un instante
de tiempo dado t0 , la partı́cula se está moviendo a velocidad
d~x
= ~v0 (46)
dt t=t0
Sabemos que, por la dilatación del tiempo, dos sucesos que ocurran en el mismo sitio en S ′ y
en un intervalo de tiempo ∆t′ , serán observados en S con una diferencia de tiempos
1
∆t = γ∆t′ = q ∆t′ . (47)
~v02
1− c2
21
la teorı́a de la relatividad especial hace una hipótesis adicional que consiste en suponer que
los relojes de S ′ y el reloj que se mueve con la partı́cula marcan exactamente al mismo
ritmo justo en ese momento. Este hipótesis es equivalente a suponer que el ritmo de los
relojes depende de la velocidad de los relojes, pero no de su aceleración. Esta hipótesis se ha
verificado experimentalmente en multitud de ocasiones.
Dado que la coincidencia entre el ritmo de los dos relojes ocurre solamente durante un lapso
de tiempo muy breve, consideremos que miden un intervalo de tiempo infinitesimal. De la
fórmula de dilatación del tiempo, obtenemos que el intervalo de tiempo dt medido por el
sistema de referencia inercial y el intervalo de tiempo dτ medido por el reloj que lleva la
partı́cula están relacionados por
1
dt = q dτ. (48)
2
1 − vc2
El reloj que se mueve con la partı́cula marca el tiempo que está transcurriendo para la
partı́cula y se denomina tiempo propio.
La expresión anterior permite relacionar el intervalo de tiempo propio, con el intervalo espacio-
temporal.
r r
v2 (vdt)2 1p 2 2 1p 2 2
dτ = 1 − 2 dt = dt2 − = c dt − (d~
x ) 2 = c dt − dx2 − dy 2 − dz 2 . (49)
c c2 c c
Dado que el intervalo espacio-temporal entre dos sucesos infinitesimales es
obtenemos finalmente
1p
dτ = −ds2 . (51)
c
En otras palabras, el intervalo espacio-temporal mide directamente el tiempo propio que
transcurre para la trayectoria. Dado que el intervalo espacio-temporal es el mismo en todos
los sistemas de referencia, esta relación indica que todos los sistemas de referencia estarán de
acuerdo en el tiempo propio marcado por el reloj en movimiento. Esta es una condición de
autoconsistencia necesaria e indica que la hipótesis que hace la relatividad especial sobre el
ritmo de los relojes con movimientos arbitrarios es consistente.
22
Para definir vectores debemos dividir por un cantidad en la que todos los sistemas de referencia
estén de acuerdo en su valor (a una magnitud cuyo valor es el mismo en todos los sistemas
de referencia se la llama escalar).
Buscamos un escalar que mida tiempo y que coincida en valor para todos los sistemas de
referencia. Tenemos un candidato completamente natural: el tiempo propio de la trayectoria.
Dada la relación
1p
dτ = −ds2 (52)
c
ya sabemos que todos los sistemas de referencia están de acuerdo en su valor. Además, en un
sistema de referencia concreto tenemos
r
1 v2
dτ = dt = 1 − 2 dt (53)
γ c
p
y 1 − v 2 /c2 6= 0 por lo que la relación entre t y τ es invertible y podemos usar τ para
parametrizar la trayectoria
xα (τ ) = (x0 (τ ), ~x(τ )). (54)
Si calculamos la derivada con respecto al tiempo propio tenemos
dxα dt d~x d~x dt
= c , = cγ, = (cγ, ~v γ) = γ (c, ~v ) := uα (55)
dτ dτ dτ dt dτ
Supongamos por simplicidad que estamos que los dos sistemas de referencia tiene velocidad
relativa v a lo largo de eje x y que lo ejes son paralelos
23
Sabemos que las transformaciones de Lorentz son
t′ = γ t − cv2 x
x′ = γ (x − vt)
y′ = y
z′ = z
Los boost de Lorentz están parametrizados por una cantidad v que toma valores entre v ∈
(−c, c) y recordemos que
1
γ=q . (58)
v2
1 − c2
Una pregunta natural es si podemos encontrar una parametrización distinta que simplifique
la forma del boost de Lorentz.
Además,
v
γ = cosh β tanh β = sinh β (61)
c
24
y el boost de Lorentz toma la siguiente forma, mucho más sencilla
′0 0
x cosh β − sinh β 0 0 x
x′1 − sinh β cosh β 0 0 x1
x′2 = 0 0 1 0 x2
x′3 0 0 0 1 x3
x0 cosh β1 cosh β2 + sinh β1 sinh β2 cosh β2 sinh β1 + sinh β1 cosh β2 x′′0
= .
x1 cosh β2 sinh β1 + sinh β1 cosh β2 cosh β1 cosh β2 + sinh β1 sinh β2 x′′1
25
Usando las relaciones trigonométricas cosh a cosh b+sinh a sinh b = cosh(a+b) y cosh a sinh b+
sinh a cosh b = sinh(a + b) llegamos a
′0 ′′0
x cosh(β1 + β2 ) sinh(β1 + β2 ) x
= .
x′1 sinh(β1 + β2 ) cosh(β1 + β2 ) x′′1
Los boost de Lorentz paralelos se componen simplemente sumando las rapideces de cada
boost.
Notemos que esta ley permite reproducir la ley de adición de velocidades de manera muy
simple. La velocidad de S ′′ respecto de S ′ es v2 y la velocidad de S ′ respecto de S es v1 ,
donde v1 y v2 están relacionadas con β1 y β2 mediante
v1 v2
= tanh β1 , = tanh β2 , (64)
c c
Acabamos de demostrar que la rapidez de S ′′ respecto de S es β1 + β2 . Para calcular la
velocidad V correspondiente
tanh β1 + tanh β1 v1 + v2
V = c tanh(β1 + β2 ) = c = (65)
1 + tanh β1 tanh β2 1 + v1c2v2
tanh a+tanh b
donde hemos usado la igualdad trigonométrica tanh(a + b) = 1+tanh a tanh b .
26
Tema 6. Mecánica Relativista
6.1 Introducción.
En mecánica newtoniana tenemos que el momento P lineal p~ = m~v es un vector y que para un
sistema aislado el momento lineal total del sistema Na=1 p
~a se conserva a lo largo del tiempo.
Por otro lado, en mecánica newtoniana la segunda ley de Newton relaciona la fuerza que
actúa con el cambio del momento lineal de la partı́cula
d~
p
f~ = .
dt
Si actuamos con una fuerza constante (en módulo, dirección y sentido), el momento lineal
aumentará de manera lineal de manera que la velocidad de la partı́cula aumentará sin lı́mite
y eventualmente sobrepasará la velocidad de la luz.
Sabemos que esto es imposible en relatividad espacial, por lo que resulta claro que es necesario
modificar las leyes de la mecánica de Newton para hacerlas compatibles con la relatividad
especial.
Después del choque tenemos un partı́cula de masa 2m y en reposo (porque el momento lineal
total se anula y se conserva en un choque).
Nos situamos ahora en un sistema de referencia S ′ que se mueve con velocidad −v a lo largo
del eje x.
1
La velocidad de las partı́culas 1 y 2 en el sistema S ′ es, por la ley de adición de velocidades,
2v
v1′ = v2
, v2′ = 0,
1+ c2
mientras que la partı́cula saliente tiene velocidad v3′ = v. Se sigue que mv1′ + mv2′ 6= 2mv3′ , y
el momento lineal newtoniano no se conserva en S ′ .
Además p~ tiene que ser un vector bajo rotaciones tridimensionales y debe tener la misma
dirección y sentido que la velocidad, por lo que
p~ = f (~v )~v .
Dado que existe una relación biunı́voca entre v y γ, podemos escribir f (|v|) en la forma
f (|v|) = γg(γ)
g puede depender de la partı́cula en cuestión, pero dos partı́culas idénticas deben tener la
misma función g (de otra forma, las partı́culas podrı́an ser distinguidas y dejarı́an de ser
idénticas).
pi = mui .
2
En mecánica newtoniana la energı́a se define mediante el trabajo que hacen las fuerzas.
La derivada de la energı́a con respecto a tiempo es la potencia aplicada al sistema, que
corresponde a las fuerzas aplicadas por la velocidad de la partı́cula.
dE d~
p
= f~ · ~v = · ~v .
dt dt
En la segunda igualdad hemos usado la ley de Newton. En mecánica relativista, tanto la
definición de momento lineal como las leyes de newton deben ser modificadas No obstante,
podemos intentar preservar la relación
dE d~
p
= · ~v
dt dt
donde p~ es el momento lineal relativista y ver si proporciona una definición razonable de
energı́a.
Tenemos
dE d~
p d(γ~v ) dγ 2 d~v dγ 2 dv v 2 dγ + γvdv
= · ~v = m · ~v = m v + γ ~v =m v + γv =m
dt dt dt dt dt dt dt dt
De la definición de γ tenemos
2 2 1 dγ
v =c 1− 2 =⇒ 2vdv = 2c2 3
γ γ
1 c2
=⇒ v 2 dγ + γvdv = c2 1 − 2 dγ + 2 dγ = c2 dγ
γ γ
y por lo tanto
dE dγ
= mc2 .
dt dt
Integrando obtenemos
E = mc2 γ + K,
donde K es una constante que puede depender de las propiedades de la partı́cula pero no de
su velocidad.
Sabemos que uα es un cuadrivector que tiene componentes uα = (γc, γ~v ). Como E = mc2 γ+K
y p~ = mγv, esto sugiere que la constante de integración debe ser K = 0 de manera que
podamos definir un cuadrivector de momento lineal relativista pα mediante
α α α E
p = mu , p = , p~ .
c
Una propiedad importante de la relatividad especial es que la conservación del momento lineal
en los choque implica necesariamente la conservación de la energı́a. Esta propiedad es muy
distinta en mecánica newtoniana, donde la energı́a no se conserva en general en las colisiones.
3
Por simplicidad lo demostraremos en un choque unidimensional en el que las partı́culas inci-
dentes sean las mismas que las resultantes.
En un sistema de referencia inercial S tenemos una partı́cula de masa inercial m1 con momento
lineal p1 que incide sobre otra partı́cula de masa inercial m2 con momento lineal p2 . Después
de la colisión, la partı́cula 1 sale con momento lineal p̂1 y la partı́cula 2 con momento p̂2 .
Como se ha dicho, vamos a suponer que la colisión no modifica a las partı́culas, de manera
que sus masas inerciales siguen siendo m1 y m2 .
p1 + p2 = p̂1 + p̂2 .
4
La clave está en que el concepto de energı́a en mecánica newtoniana y en mecánica relativista
es distinto. La energı́a no necesariamente conservada en choques newtonianos es la energı́a
cinética, que tiene la propiedad que se anula cuando la velocidad de la partı́cula se anula. Por
otro lado, la energı́a que se conserva en relatividad especial es la energı́a definida por E = mγc2
que no se anula cuando la partı́cula está en reposo. De hecho a la energı́a E0 = mc2 se la
denomina energı́a en reposo de la partı́cula.
Si modifico las condiciones de la partı́cula, por ejemplo la caliento o la comprimo, estaré tam-
bién cambiando su contenido de energı́a interna y, por lo tanto, según la expresión E0 = mc2 ,
también estamos cambiando su masa inercial. De hecho, podemos considerar que la masa
inercial es simplemente una medida de la energı́a interna de la partı́cula. Por lo tanto, si se
absorbe o libera energı́a se estará también cambiando la masa inercial de la partı́cula.
Este hecho conduce a la predicción relativista de que la masa se puede transformar en energı́a.
De hecho la masa no es más que una forma de medir la energı́a interna, por lo que no resulta
en absoluto extraño que pueda transformar parte de esa energı́a en otras formas de energı́a.
Por otro lado, una vez aceptamos que la masa inercial es un medida de la energı́a interna de
la partı́cula ya resulta perfectamente razonable que todos los choques relativistas conserven
la energı́a. En efecto, la energı́a E = mγc2 incorpora tanto la parte de la energı́a debida al
movimiento como aquella almacenada en la propia partı́cula. Por lo tanto, la conservación
de esta energı́a en las colisiones no es más que una manifestación de que la energı́a total no
puede crearse ni destruirse.
Concluimos que la energı́a total se debe conservar en cualquier choque relativista, sea este
elástico o inelástico.
5
las leyes de conservación anteriores se pueden unificar en una que establece que el cuadrimo-
mento lineal se conserva en un choque relativista, es decir
Pµ
pµb
pµa
x2 = y
pµ1 = Pµ
x1 = x
ηµν pµ pν := pµ pµ = m2 uµ uµ = −m2 c2 .
Por lo tanto la masa inercial de una partı́cula se puede obtener directamente del módulo
al cuadrado de su cuadrimomento. Como el cuadrado de un cuadrivector es un invariante
relativista, también lo es la masa inercial de una partı́cula. Todos los sistemas de referencia
están de acuerdo en el mismo valor. Esta propiedad es plenamente consistente con el hecho
de que la masa inercial es un propiedad intrı́nseca de la partı́cula independiente de quien la
observe.
6
Por otro lado, en un sistema inercial S tenemos
µ E
p = , p~
c
y por lo tanto
E2 2 p
pµ pµ = −(p0 )2 +~
p2 = − +p = −m2 c2 ⇐⇒ E 2 = p2 c2 +m2 c4 ⇐⇒ E= p2 c2 + m2 c4
c2
Veamos que esta definición es compatible con la definición newtoniana. Para velocidades
pequeñas
1 1 v2 v4
γ=q =1+ 2
+ O( 4 ),
2
1 − vc2 2c c
de manera que
2 1 v2 v4 1 v4
T = mc + O( ) = mv 2 + O( 4 ).
2 c2 c4 2 c
Veamos que la conservación de la energı́a total implica que la masa inercial no puede conser-
varse en general en las colisiones. Consideremos una desintegración de una partı́cula de masa
inercial M en dos partı́culas de masas inercial m1 y m2 respectivamente
P µ = pµ1 + pµ2
P µ Pµ = (pµ1 + pµ2 ) (p1µ + p2µ ) = pµ1 p1µ + pµ2 p2µ + 2pµ1 p2µ =⇒
−M 2 c2 = −m21 c2 − m22 c2 + 2pµ1 p2µ .
En términos de las cuadrivelocidades uµ1 y uµ2 tenemos pµ1 = m1 uµ1 , pµ2 = m2 uµ2 de manera que
7
Necesitamos calcular el producto escalar uµ1 u2µ . El cuadrivector uµ1 es
donde ~n1 es un vector espacial unitario que indica la dirección y sentido de la velocidad ~v1
en el sistema de referencia S y v1 /c = tanh β! . De manera análoga
−uµ1 u2µ = c2 (cosh β1 cosh β2 − sinh β1 sinh β2~n1~n2 ) ≥ c2 (cosh β1 cosh β2 − sinh β1 sinh β2 )
= c2 cosh (β1 − β2 ) ≥ c2
y, sustituyendo en (1):
Hasta ahora hemos considerado partı́culas masivas. Sabemos que este tipo de partı́culas se
tienen que mover a velocidades inferiores a la de la luz.
No obstante sabemos que hay partı́culas que viajan a la velocidad de la luz, por ejemplo los
fotones.
La conclusión necesaria es que los fotones deben tener masa inercial igual a cero. No obstante
todavı́a debe poseer energı́a y momento lineal y cuadrivector de momento pµ .
De la condición
pµ pµ = −m2 c2 = 0
se sigue que el cuadrivector de momento es luminoso. Dado que, en componentes
µ E
p = , p~
c
tenemos que
E2
− p~ 2 = 0, ⇐⇒ E = |~ p|c.
c2
Para el caso de partı́culas masivas hemos obtenido anteriormente una expresión para la velo-
cidad de la partı́cula en términos del cuadrimonento según
p~c2
~v =
E
8
Esta expresión sigue siendo válida para partı́culas sin masa ya que
p~ c2 p~
~v = =c
|~
p |c |~
p|
El vector ~n = |~pp~ | es unitario, tiene la misma dirección y sentido que ~v y además |~v | = c, como
debe ser para una partı́cula sin masa.
p|~n = Ec ~n obtenemos que el cuadrivector de momento para una partı́cula sin masa
De p~ = |~
adopta la forma
E
P µ = (1, ~n) .
c
Es costumbre denotar al cuadrimomento de un partı́cula sin masa mediante el sı́mbolo K µ ,
es decir
E
K µ = (1, ~n) .
c
Podemos obtener a partir de esta expresión la ley de Doppler si tenemos en cuenta que, según
la mecánica cuántica la energı́a de un fotón está relacionada con su frecuencia ν mediante
E = hν,
donde h es la constante de Planck y ν la frecuencia del fotón. Por lo tanto el cuadrimomento
es
hν
Kµ = (1, ~n) .
c
Supongamos que un fotón tiene frecuencia ν es un sistema de referencia S. Consideremos un
sistema S ′ que se mueve con velocidad ~v respecto del anterior. Si escogemos los ejes de los
sistema de manera que ~v sea paralelo al eje x, la transformación de Lorentz es
γ − γv
c 0 0
− γv γ 0 0
c
0 0 1 0
0 0 0 1
Si aplicamos esta transformación al cuadrivector K µ expresando en el sistema S obtenemos
el mismo cuadrivector expresado en en el sistema S ′ , es decir
hν
hν ′
c γ − γv
c 0 0 c
hν ′ ′ γv
c nx − c γ 0 0 hν nx
c
hν ′ ′ =
c ny 0 0 1 0 hν c ny
′
hν ′ hν
0 0 0 1 c nz
c nz
9
6.7 Efecto Compton
El efecto Compton es el cambio de frecuencia de un fotón cuando es desviado por una partı́cula
cargada, tı́picamente un electrón.
Este efecto no puede ser explicado dentro de la teorı́a ondulatoria de la luz y por lo tanto
proporciona evidencia experimental del comportamiento corpuscular de los fotones en ciertas
condiciones, de acuerdo con la mecánica cuántica.
Tı́picamente la desviación se produce con electrones en átomos, para los que las velocidades
son muy inferiores a c. Podemos por lo tanto considerar el caso en que el fotón incide sobre
un electrón en reposo. Después de la colisión, el electrón se encontrará en movimiento y el
fotón tendrá distinta energı́a (y por lo tanto distinta frecuencia).
Si llamamos θ al ángulo formado entre las direcciones de movimiento del fotón incidente y el
fotón desviado, el efecto Compton establece que la longitud de onda λ′ del fotón desviado y
la longitud de onda λ del fotón incidente satisfacen
h
λ′ − λ = (1 − cos θ)
me c
donde me es la masa del electrón (o, en general, de la partı́cula sobre la que incide el fotón).
Vamos a deducir esta expresión como consecuencia de le ley de conservación del cuadrimo-
mento lineal total en una colisión. El electrón está inicialmente en reposo por lo que su energı́a
es me c2 . La conservación de la energı́a impone
hν + me c2 = hν ′ + Ee′ (2)
donde Ee′ es la energı́a del electrón después de la colisión. Esta energı́a está relacionada con
el momento lineal del electrón después de la colisión mediante
Necesitamos determinar p~e′ 2 . El momento lineal inicial del electrón se anula, por lo que la
conservacion del momento lineal es
p~e′ = p~f − p~f′
donde p~f es el momento lineal del fotón incidente y p~f′ es el momento lineal del fotón resultante.
Si elevamos al cuadrado esta igualdad vectorial obtenemos,
Sustituyendo en (3)
Ee′ 2 = h2 ν 2 + ν ′2 − 2νν ′ cos θ + m2e c4 .
10
Si aislamos Ee′ de la conservación de la energı́a (2) y elevamos al cuadrado obtenemos
2
Ee′ 2 = hν + me c2 − hν ′ = h2 ν 2 + ν ′2 − 2νν ′ + m2e c4 + 2hme c2 ν − ν ′ =
= h2 ν 2 + ν ′2 − 2νν ′ cos θ + m2e c4 .
Cancelando términos tenemos
2hme c2 ν − ν ′ = 2h2 νν ′ (1 − cos θ) .
c
Dividiendo por νν ′ y usando que λ = ν
me c λ′ − λ = h (1 − cos θ) ,
que es la fórmula para el efecto Compton.
11
Al vector tridimensional f~ se le denomina 3−f uerza. No es un vector de Lorentz y ni siquiera
es la parte espacial de un cuadrivector.
Esta expresión covariante nos permite determinar de qué manera se transforma la 3-fuerza
bajo un cambio de sistema de referencia.
dpµ duµ
Fµ = =m
dτ dτ
y si derivamos el modulo al cuadrado de la cuadrivelocidad
d duµ duν duµ
0= (uµ uν ηµν ) = ηµν uν + uµ ηµν = 2 ηµν uν = 2F µ ηµν uν = 0
dτ dτ dτ dτ
es decir, ortogonal a la cuadrivelocidad.
F~ · ~v
−u0 F 0 + ~u · F~ = 0, ⇐⇒ −γcF 0 + γ~v F~ = 0, ⇐⇒ F0 = .
c
Por otro lado , la componente espacial de la cuadrifuerza es
d~
p p dt
d~
F~ = = = γ f~
dτ dt dτ
~
Sustituyendo en F 0 obtenemos F 0 = γ v·cf por lo que la cuadrivelocidad se puede escribir en
términos de la 3-fuerza como
µ f · ~v ~
F =γ ,f
c
Consideremos un sistema de referencia inercial S en el que dos partı́culas idénticas con velo-
cidades iguales y opuestas colisionan. Después de la colisión esas mismas partı́culas salen con
velocidades iguales y opuestas pero en dirección perpendicular a la de incidencia.
12
Si tomamos ejes en S de manera que el eje x vaya a lo largo de la dirección de incidencia y
el eje y a lo largo de la dirección de salida de las partı́culas tenemos que la velocidad de las
partı́culas 1 y 2 antes de la colisión es
~v1 = v~ex , ~v2 = −v~ex
mientras que sus velocidades después de la colisión son
~u1 = v~ey , ~u2 = −v~ey .
Consideremos un sistema de referencia S ′ con ejes paralelos a S y que se mueve con velocidad
−v~ex con respecto a S.
Por la ley de adición de velocidades tenemos que las velocidades de las partı́culas 1 y 2 antes
y después de la colisión en el sistema S ′ son
2v
~v1′ = ~e ,
v2 x
~v2′ = 0,
1+ c2
v v
~u1′ = v~ex + ~ey , ~u1′ = v~ex − ~ey .
γv γv
y por otro
2v 2v 2v
2vγu′ = q =q = v2
.
1− u′2
1− 2v 2
+ v4 1− c2
c2 c2 c2
13