r icc a r d o r i cci
LEZIONI DI SISTEMI
DINAMICI
a cura di
l uigi b a r Le t t i
a ngioL o f a r in a
l oren z o f u s i
f ederic o t a L am u c c i
FIRENZE
UNIVERSITY
PRESS
manuali
scienze
–8–
Riccardo Ricci
Lezioni di Sistemi Dinamici
a cura di
Luigi Barletti
Angiolo Farina
Lorenzo Fusi
Federico Talamucci
Firenze University Press
2016
Lezioni di Sistemi Dinamici / Riccardo Ricci ; a cura di
Luigi Barletti, Angiolo Farina, Lorenzo Fusi, Federico
Talamucci. – Firenze : Firenze University Press, 2016.
(Manuali . Scienze ; 8)
http://digital.casalini.it/9788864534015
ISBN 978-88-6453-400-8 (print)
ISBN 978-88-6453-401-5 (online)
Immagine di copertina: La figura di copertina, gentilmente
concessa dalla famiglia Ricci, rappresenta due trottole in
movimento sopra gli appunti del professor Ricci. Il moto
delle trottole ha un’elegante descrizione matematica che viene
trattata nel capitolo 7 di questo libro.
Certificazione scientifica delle Opere
Tutti i volumi pubblicati sono soggetti ad un processo di referaggio esterno di cui sono
responsabili il Consiglio editoriale della FUP e i Consigli scientifici delle singole collane. Le
opere pubblicate nel catalogo della FUP sono valutate e approvate dal Consiglio editoriale
della casa editrice. Per una descrizione più analitica del processo di referaggio si rimanda
ai documenti ufficiali pubblicati sul catalogo on-line della casa editrice (www.fupress.com).
Consiglio editoriale Firenze University Press
G. Nigro (Coordinatore), M.T. Bartoli, M. Boddi, R. Casalbuoni, C. Ciappei, R. Del Punta,
A. Dolfi, V. Fargion, S. Ferrone, M. Garzaniti, P. Guarnieri, A. Mariani, M. Marini, A.
Novelli, M.C. Torricelli, M. Verga, A. Zorzi.
© 2016 Firenze University Press
Università degli Studi di Firenze
Firenze University Press
via Cittadella, 7, 50144 Firenze, Italy
www.fupress.com
Printed in Italy
RICCARDO RICCI (1953-2013) è stato professore ordinario di Fisica
Matematica nell'Università di Firenze. La sua attività di ricerca si è
svolta prevalentemente nell'ambito dei problemi a frontiera libera
e delle equazioni alle derivate parziali. È stato titolare per numerosi
anni della cattedra di Meccanica Razionale e di Sistemi Dinamici. Per
tutta la sua carriera accademica si è dedicato attivamente alla divulgazione e alla didattica della matematica, anche attraverso dispense
e conferenze, sempre molto apprezzate dagli studenti.
Indice
Introduzione
1
2
1
Spazio affine e vettori applicati
1.1 Spazi vettoriali su R . . . . . . . . . . . . . . . . . . .
1.2 Spazi vettoriali euclidei . . . . . . . . . . . . . . . . .
1.3 Trasformazioni di basi ortonormali . . . . . . . . . . .
1.4 Spazio affine e coordinate curvilinee . . . . . . . . . .
1.5 Prodotto vettoriale e sistemi di vettori applicati . . . .
1.5.1 Il prodotto vettoriale . . . . . . . . . . . . . .
1.5.2 Vettori applicati e momento rispetto ad un polo
1.5.3 Sistemi equivalenti di vettori applicati . . . . .
1.5.4 Sistemi di vettori paralleli . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Equazioni differenziali
2.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Considerazioni generali . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Il problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Equazioni autonome . . . . . . . . . . . . . . . . . . . . . .
2.3.2 Equazioni reversibili . . . . . . . . . . . . . . . . . . . . . .
2.3.3 Equazioni integrabili . . . . . . . . . . . . . . . . . . . . . .
2.4 Equazioni del primo ordine in forma normale . . . . . . . . . . . . .
2.5 Equazioni del secondo ordine in forma normale del tipo q̈ = f (q̇) . .
2.6 Equazioni del secondo ordine del tipo q̈ = f (q): caso conservativo . .
2.6.1 Analisi qualitativa nel caso conservativo . . . . . . . . . . . .
2.6.2 Periodo delle oscillazioni in vicinanza di punti di equilibrio
stabile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.3 Generalizzazione del caso conservativo . . . . . . . . . . . .
2.7 Il piano delle fasi . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.8 Punti di equilibrio, stabilità . . . . . . . . . . . . . . . . . . . . . . .
2.8.1 Il criterio di Lyapunov . . . . . . . . . . . . . . . . . . . . .
2.8.2 Asintotica stabilità . . . . . . . . . . . . . . . . . . . . . . .
2.8.3 Punti di equilibrio per sistemi conservativi: il criterio di Dirichlet
2.9 I potenziali isocroni . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.10 Sistemi lineari bidimensionali . . . . . . . . . . . . . . . . . . . . .
2.11 Moto armonico smorzato . . . . . . . . . . . . . . . . . . . . . . . .
2.12 Moto armonico smorzato con forzante esterna . . . . . . . . . . . . .
v
3
3
7
14
16
21
21
24
27
29
31
31
32
34
35
36
37
37
39
41
43
54
55
56
58
59
60
62
63
67
78
80
2
VIII
LEZIONI DI SISTEMI DINAMICI
capitolo
2.13 6Sistemi
degli Appunti.
lineari n−dimensionali
Nello specifico è. stata
. . . aggiunta
. . . . . tutta
. . .la. sezione
. . . . dedicata
. . . . alla
83
Geometria delle masse (argomento che veniva trattato in dettaglio nelle esercitazioni
3 Equazioni
Lagrange
87
del
corso). Neldicapitolo
dedicato ai Principi Variazionali è stata aggiunta la sezione
Cinematica
delIlpunto
. . .di. minima
. . . . azione
. . . . è. stato
. . . riscritto.
. . . . . .Il .capitolo
. . . 987è
8.3 3.1
mentre
il paragrafo
principio
3.2 essenzialmente
Forze conservative
. . . . . . . . . . . . . . . . . . . . . . . . . . . 92
rimasto
invariato.
3.2.1desiderano
Campi scalari
e gradiente
. . .Annick
. . . . Magnier
. . . . .per
. . aver
. . .messo
. . . a dis92
I curatori
ringraziare
la Prof.ssa
Campi
e campi
. . . . . . . . . .senza
. . . il. quale
94
posizione3.2.2
il materiale
delvettoriali
Prof. Ricci
e pergardiente
il costante. incoraggiamento
3.2.3si sarebbe
Forza posizionale
e forza
. . di
. .quest’opera.
. . . . . . . Un
. . parti97
difficilmente
potuti giungere
al conservativa
completamento
3.3 ringraziamento
Equazioni di Lagrange
un punto Anichini,
materiale Direttore
. . . . . del
. . .Dipartimento
. . . . . 102
colare
va al Prof.perGiuseppe
di
3.3.1
Conservazione
dell’energia,
di ed
Routh103
Matematica
ed Informatica
“U. Dini”,
che ha variabili
accolto ilcicliche
progettoe funzione
con favore
al Prof.
3.4 IlGentili
moto centrale
. . . . suggerimenti.
. . . . . . . . Si. .desidera
. . . . .infine
. . . ringraziare
. . . . . . Il. Dott.
108
Graziano
per i numerosi
3.4.1 Direttore
L’equazione
per r . della
. . . Florence
. . . . . University
. . . . . . .Press,
. . . per
. . il. .prezioso
. 112
Fulvio Guatelli,
editoriale
3.4.2la fase
Il problema
aiuto durante
editoriale.di Keplero . . . . . . . . . . . . . . . . . . . . . 113
3.4.3 L’orbita del problema di Keplero . . . . . . . . . . . . . . . . 118
3.4.4 La terza legge . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4
Sistemi vincolati e coordinate lagrangiane
123
4.1 Sistemi olonomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
4.1.1 Spostamenti virtuali in funzione delle coordinate lagrangiane . 133
4.1.2 Velocità ed energia cinetica . . . . . . . . . . . . . . . . . . 141
4.1.3 Punto vincolato sulla superficie . . . . . . . . . . . . . . . . 145
5
Le equazioni di moto per sistemi vincolati
5.1 Dinamica di un punto vincolato sulla superficie. . . . . . . . . . . . .
5.2 L’equazione simbolica della dinamica . . . . . . . . . . . . . . . . .
5.3 Le equazioni di Lagrange . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Equazioni di Lagrange e statica del punto materiale sulla superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.2 Equazioni di Lagrange di prima specie . . . . . . . . . . . . .
5.4 Risolubilità delle equazioni di Lagrange . . . . . . . . . . . . . . . .
5.5 Invarianza delle equazioni di Lagrange . . . . . . . . . . . . . . . . .
5.6 Coordinate cicliche . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.7 La funzione Hamiltoniana e la conservazione dell’energia . . . . . . .
5.8 Il teorema di Noether . . . . . . . . . . . . . . . . . . . . . . . . . .
5.9 Equilibrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.9.1 Stabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.10 Piccole Oscillazioni . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.10.1 Sistemi con un solo grado di libertà . . . . . . . . . . . . . .
5.10.2 Sistemi con l gradi di libertà . . . . . . . . . . . . . . . . . .
5.10.3 Esempio: la catena di oscillatori . . . . . . . . . . . . . . . .
6
Cinematica dei Sistemi Rigidi
6.1 Introduzione . . . . . . . . . . . . . . . .
6.2 Moti rigidi . . . . . . . . . . . . . . . . .
6.2.1 Primo caso: Ω ≡ O . . . . . . . .
6.2.2 Secondo caso: Ω �= O . . . . . .
6.2.3 Gradi di libertà di un corpo rigido
6.3 Formula fondamentale del moto rigido . .
vi
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
151
152
155
160
162
172
174
175
178
182
190
195
198
199
200
201
211
215
. 215
. 215
. 217
. 224
. 224
. 227
SOMMARIO
6.4
6.5
6.6
6.7
6.8
6.9
7
8
IX
Angoli di Eulero . . . . . . . . . . . . . . . . .
Asse istantaneo di moto, rigate del moto . . . . .
Cinematica relativa: composizione delle velocità
Formula di Poisson . . . . . . . . . . . . . . . .
Composizione di moti rigidi . . . . . . . . . . .
Cinematica relativa: l’accelerazione . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 238
. 242
. 247
. 249
. 251
. 253
Dinamica Sistemi Rigidi
7.1 Il centro di massa . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Il momento angolare . . . . . . . . . . . . . . . . . . . . . . . . . .
7.3 Geometria delle masse . . . . . . . . . . . . . . . . . . . . . . . . .
7.3.1 Momenti d’inerzia . . . . . . . . . . . . . . . . . . . . . . .
7.3.2 Omografia d’inerzia, matrice d’inerzia e terna principale d’inerzia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.3.3 Ellissoide d’inerzia . . . . . . . . . . . . . . . . . . . . . . .
7.3.4 Determinazione della terna principale d’inerzia nel caso di sistemi piani . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.3.5 Esempi e complementi . . . . . . . . . . . . . . . . . . . . .
7.4 Le equazioni cardinali . . . . . . . . . . . . . . . . . . . . . . . . . .
7.5 Le equazioni cardinali sono sufficienti per determinare il moto dei rigidi
7.6 Momento angolare, energia cinetica e seconda equazione cardinale per
i sistemi rigidi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.6.1 Momento angolare per un sistema rigido . . . . . . . . . . . .
7.6.2 Seconda equazione cardinale per i sistemi rigidi . . . . . . . .
7.6.3 Reazioni vincolari applicate all’asse di rotazione . . . . . . .
7.6.4 L’energia cinetica . . . . . . . . . . . . . . . . . . . . . . . .
7.7 Le precessioni per inerzia . . . . . . . . . . . . . . . . . . . . . . . .
7.7.1 Le equazioni di Eulero . . . . . . . . . . . . . . . . . . . . .
7.7.2 Risoluzione dell’equazione di Eulero nel caso di precessioni
per inerzia . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.7.3 Il moto à la Poinsot . . . . . . . . . . . . . . . . . . . . . . .
7.8 Lagrangiana del corpo rigido . . . . . . . . . . . . . . . . . . . . . .
7.9 Il giroscopio pesante . . . . . . . . . . . . . . . . . . . . . . . . . .
Principi variazionali
8.1 La brachistocrona . . . . . . . . . . . . . . . . . . . . . . . . . .
8.1.1 La trattazione moderna . . . . . . . . . . . . . . . . . . .
8.2 L’equazione di Eulero-Lagrange . . . . . . . . . . . . . . . . . .
8.2.1 Un integrale primo e ritorno alla brachistocrona . . . . . .
8.3 Funzionali dipendenti da l funzioni . . . . . . . . . . . . . . . . .
8.3.1 Massimizzazione vincolata . . . . . . . . . . . . . . . . .
8.4 Il principio di Hamilton . . . . . . . . . . . . . . . . . . . . . . .
8.4.1 Sistemi vincolati ed equazioni di Lagrange di prima specie
8.5 Il principio di Jacobi . . . . . . . . . . . . . . . . . . . . . . . .
8.5.1 Coordinate cicliche nell’ambito del principio di Hamilton
8.5.2 Il tempo come variabile . . . . . . . . . . . . . . . . . .
8.5.3 Formulazione del principio di Jacobi . . . . . . . . . . . .
vii
.
.
.
.
.
.
.
.
.
.
.
.
255
256
259
259
260
263
269
270
274
283
286
289
290
291
297
301
306
307
308
313
314
318
325
. 326
. 328
. 329
. 334
. 339
. 341
. 346
. 349
. 351
. 351
. 354
. 356
2
X
LEZIONI DI SISTEMI DINAMICI
9 Il Sistema
capitolo
6 degliCanonico
Appunti. Nello specifico è stata aggiunta tutta la sezione dedicata 361
alla
Geometria
9.1 Il delle
Teorema
masse
di Liouville
(argomento. .che
. .veniva
. . . .trattato
. . . .in. dettaglio
. . . . . nelle
. . . esercitazioni
. . . . 363
del 9.2
corso).
LeNel
parentesi
capitolo
di Poisson
dedicato .ai. Principi
. . . . . Variazionali
. . . . . . .è .stata
. . .aggiunta
. . . . .la. sezione
. 366
8.3 9.3
mentre
Derivazione
il paragrafo
variazionale
Il principiodelle
di minima
equazioni
azione
di Hamilton
è stato riscritto.
. . . . .Il .capitolo
. . . 368
9è
rimasto essenzialmente invariato.
I curatori desiderano ringraziare la Prof.ssa Annick Magnier per aver messo a disposizione il materiale del Prof. Ricci e per il costante incoraggiamento senza il quale
difficilmente si sarebbe potuti giungere al completamento di quest’opera. Un particolare ringraziamento va al Prof. Giuseppe Anichini, Direttore del Dipartimento di
Matematica ed Informatica “U. Dini”, che ha accolto il progetto con favore ed al Prof.
Graziano Gentili per i numerosi suggerimenti. Si desidera infine ringraziare Il Dott.
Fulvio Guatelli, Direttore editoriale della Florence University Press, per il prezioso
aiuto durante la fase editoriale.
viii
Prefazione
Non c’è miglior modo di onorare la memoria di un Collega prematuramente scomparso che quello di dare continuità al suo impegno didattico pubblicando i testi delle
sue lezioni. E bene ha fatto la moglie di Riccardo, Annick, ad affidare il compito di
curarne la pubblicazione ad alcuni dei più giovani componenti del gruppo dei cultori
delle materie che nel tempo di maggior fulgore si chiamavano fisico-matematiche. Ed
è stato per noi – che di quel gruppo abbiamo fatto parte per tanti anni- un onore quello
di ricevere la richiesta di scrivere poche righe di presentazione di questo volume.
Un volume che rispecchia pienamente le capacità didattiche di Riccardo, caratterizzate da una intuizione sicura, chiarezza di vedute e grande comunicativa. Il testo
tiene fede alle sue convinzioni in ordine alla formazione degli studenti di matematica.
Pur essendo un testo destinato agli studenti della laurea triennale e che quindi non
riveste le caratteristiche di un trattato specialistico di livello avanzato, la sua impostazione denota una padronanza degli argomenti di meccanica e degli strumenti - di tipo
geometrico ed analitico - che hanno contraddistinto anche tutta la produzione scientifica di Riccardo, i suoi articoli di ricerca e, in generale, il suo modo di intendere la
matematica applicata.
Infatti gli argomenti di meccanica costituiscono per gli studenti di matematica (ma
non solo per essi) la prima occasione di confrontarsi con il “modello matematico”: un
insieme di oggetti matematici, di leggi e di relazioni che entro certi limiti è in grado di
fornire, proprio attraverso le proprietà matematiche, informazioni sul comportamento
di oggetti che matematici non sono. Per la meccanica si tratterà di corpi, che di volta in
volta saranno descritti e identificati mentalmente con punti, con sistemi indeformabili
di punti, con sistemi continui e così via; ma per altri tipi di modelli si tratterà di cellule,
di popolazioni, di prodotti finanziari ecc.
Costruire – e poi studiare - un modello matematico non è cosa agevole; è necessaria una profonda conoscenza degli oggetti che si vogliono modellizzare ed anche
la sensibilità di capire quali sono (tutte e sole) le grandezze e i parametri che, in un
determinato contesto, devono essere introdotti nel modello per ottenere una adeguata
descrizione del fenomeno che si intende studiare. In altre parole, come diceva Einstein
“a model should be as simple as possible . . . . but not simpler!”
E’ come dire che la grande sfida di fronte alla costruzione di un modello matematico per un problema complesso è la ricerca di un compromesso ottimale che colga le
componenti principali e sacrifichi quelle meno significative. Ciò richiede la capacità di costruire una visione prospettica del fenomeno, cosa che Riccardo possedeva al
massimo grado.
Un altro pregio di questo libro è quello di rendere chiari anche argomenti di per sé
molto complessi, talvolta anche ricorrendo ad esempi di esperienza quotidiana; d’altra
parte rientrava nello stile di Riccardo la ricerca di continui agganci con applicazioni
anche semplici, con i casi-limite più illuminanti, con le considerazioni su possibili
analogie tra situazioni apparentemente diverse.
Però sarebbe molto riduttivo confinare queste considerazioni ad aspetti puramente
tecnici e non menzionare il fatto che Riccardo era una persona dai molteplici interessi e di una cultura vastissima. E soprattutto piace ricordare il suo spirito arguto e
pungente, che rendeva la sua compagnia estremamente piacevole.
iii
2
XII
LEZIONI DI SISTEMI DINAMICI
capitolo
Abbiamo
6 degli
trascorso
Appunti.
tanti
Nello
annispecifico
nello stesso
è stata
luogo
aggiunta
di lavoro,
tuttasiamo
la sezione
stati insieme
dedicata
a tanalla
Geometria
ti congressi,delle
abbiamo
massecondiviso
(argomento
l’emozione
che veniva
intellettuale
trattato indella
dettaglio
ricerca
nelle
e, esercitazioni
nei momenti
del
di svago,
corso).le Nel
escursioni
capitolonella
dedicato
letteratura
ai Principi
e nella
Variazionali
musica di cui
è stata
era aggiunta
appassionatissimo.
la sezione
8.3
La perdita
mentre di
il una
paragrafo
persona
Il principio
così lasciadiunminima
segno indelebile.
azione è stato
Siamo
riscritto.
riconoscenti
Il capitolo
ai cura9è
rimasto
tori di questa
essenzialmente
opera, che,invariato.
a noi che l’abbiamo conosciuto così bene, riporta alla mente
perfino
I curatori
la suadesiderano
voce. E’ bello
ringraziare
che attraverso
la Prof.ssa
questo
Annick
libroMagnier
molti giovani
per aver
possano
messoancora
a disposizione
fruire dellail eredità
materiale
intellettuale
del Prof. di
Ricci
unaemente
per il tanto
costante
brillante.
incoraggiamento senza il quale
difficilmente si sarebbe potuti giungere al completamento di quest’opera. Un particolare
ringraziamento
Antonio
Fasano va al Prof. Giuseppe Anichini, Direttore del Dipartimento di
Matematica
ed Informatica “U. Dini”, che ha accolto il progetto con favore ed al Prof.
Mario Primicerio
Graziano Gentili per i numerosi suggerimenti. Si desidera infine ringraziare Il Dott.
Fulvio Guatelli, Direttore editoriale della Florence University Press, per il prezioso
aiuto durante la fase editoriale.
iv
Introduzione
Quest’opera si basa sugli Appunti per il Corso di Sistemi Dinamici, scritti dal Prof.
Riccardo Ricci. Nonostante la prima versione degli Appunti risalga al 2005, questi
vennero da lui continuamente aggiornati ed ampliati sino 2012. L’anno successivo,
purtroppo, il Prof. Ricci venne a mancare. Gli Appunti erano, e lo sono tuttoggi, il
testo di riferimento per gli studenti del corso annuale di Sistemi Dinamici, secondo
anno Laurea Triennale in Matematica, dell’Università degli Studi di Firenze.
Gli Appunti riflettono non solo i contenuti del corso di Sistemi Dinamici che il Prof.
Ricci ha tenuto sin dal 1999, ma anche il modo con cui egli affrontava la disciplina. Il
Prof. Ricci, pur partendo dai contenuti della classica Meccanica Razionale, sviluppava
un corso che metteva in particolare evidenza gli aspetti analitici, algebrici e geometrici.
In tal modo gli studenti venivamo continuamente chiamati ad applicare (spesso anche in
modo critico) i metodi matematici che gli stessi avevano acquisito nei corsi di Analisi,
Geometria e Algebra. E tale caratteristica è, in sostanza, il motivo per cui gli Appunti
siano sempre stati molto apprezzati dagli studenti.
Alla scomparsa del Prof. Ricci, avvenuta il 19 agosto 2013, è spontaneamente nata l’idea di pubblicare gli Appunti (disponibili sino al 2016 come semplici dispense
del corso di Sistemi Dinamici), aggiungendovi quel materiale che veniva generalmente
presentato agli studenti durante le esercitazioni. Il progetto è stato subito accolto dalla
vedova del Prof. Ricci, La Prof.ssa Annick Magnier, che ha messo a disposizione tutto
il materiale del Prof. Ricci ai curatori di quest’opera, i quali hanno provveduto a riorganizzarlo ed ampliarlo. L’idea era quella di giungere ad un testo che fosse un manuale
per il corso di Sistemi Dinamici basato sugli Appunti e che, soprattutto, seguisse lo
“spirito” con cui il Prof. Ricci aveva scritto i suoi Appunti.
Partendo quindi dall’ultima versione degli Appunti, quella datata 10 aprile 2012,
è stata intrapresa un’opera di rivisitazione ed ampliamento del testo originario che ha
portato al presente manuale. In particolare, rispetto all’originale versione degli Appunti, è stato aggiunto il capitolo 1 dove vengono richiamati alcuni concetti di algebra
lineare e geometria frequentemente utilizzati e viene introdotta la teoria dei momenti
(parte che veniva usualmente illustrata nell’ambito delle esercitazioni). Il materiale del
capitolo 2, pur essendo stato riorganizzato, è rimasto essenzialmente invariato. Sono
stati aggiunti gli esempi e le sezioni 2.6.3 e 2.10. Nel capitolo 3 è stato aggiunto il
paragrafo Forze conservative e la sezione 3.3.1 dedicata alle variabili cicliche ed alla
funzione di Routh. I capitoli 4 e 5 sono stati ampliati introducendo tutta la parte dedicata al punto materiale vincolato su una superficie e la sezione 5.6. Per quanto riguarda
il capitolo 6, i primi quattro paragrafi sono stati riscritti, seguendo però la stessa impostazione degli Appunti. Il capitolo 7 è quello che è stato più modificato rispetto al
2
LEZIONI DI SISTEMI DINAMICI
capitolo 6 degli Appunti. Nello specifico è stata aggiunta tutta la sezione dedicata alla
Geometria delle masse (argomento che veniva trattato in dettaglio nelle esercitazioni
del corso). Nel capitolo dedicato ai Principi Variazionali è stata aggiunta la sezione
8.3 mentre il paragrafo Il principio di minima azione è stato riscritto. Il capitolo 9 è
rimasto essenzialmente invariato.
I curatori desiderano ringraziare la Prof.ssa Annick Magnier per aver messo a disposizione il materiale del Prof. Ricci e per il costante incoraggiamento senza il quale
difficilmente si sarebbe potuti giungere al completamento di quest’opera. Un particolare ringraziamento va al Prof. Giuseppe Anichini, Direttore del Dipartimento di
Matematica ed Informatica “U. Dini”, che ha accolto il progetto con favore ed al Prof.
Graziano Gentili per i numerosi suggerimenti. Si desidera infine ringraziare Il Dott.
Fulvio Guatelli, Direttore editoriale della Florence University Press, per il prezioso
aiuto durante la fase editoriale.
Capitolo 1
Introduzione allo spazio affine,
alle coordinate curvilinee ed ai
sistemi di vettori applicati
In questo capitolo daremo dei brevi richiami di algebra lineare per passare alla definizione di spazio affine, o meglio di spazio affine euclideo. Si postula infatti che lo
spazio che percepiamo, dove appunto si trovano i corpi oggetto della meccanica, sia
uno spazio affine tridimensionale.
1.1 Spazi vettoriali su R
Sia V un insieme i cui elementi saranno chiamati vettori, o vettori liberi, dotato di
due operazioni:
• la somma, denotata con +, che associa a due vettori u, v ∈ V , un terzo vettore
u+v ∈V;
• il prodotto di un vettore per uno scalare (un numero reale), che associa al vettore
v ∈ V e allo scalare λ ∈ R un altro vettore denotato λv.
V si dice uno spazio vettoriale reale o spazio vettoriale sui reali, se le suddette
operazioni verificano le seguenti proprietà:
• u + v = v + u, ∀ u, v ∈ V.
• (u + v) + w = u + (v + w), ∀ u, v, w ∈ V.
• In V esiste un vettore, denotato con 0, detto vettore nullo, tale che v + 0 = v, ∀
v ∈ V.
• Dato un qualsiasi vettore v ∈ V , esiste un unico vettore, denotato con −v, e
detto opposto di v, tale che v + (−v) = 0.
• ∀ v ∈ V , si ha 1v = v, e α (βv) = (αβ) v, ∀ α, β ∈ R.
4
LEZIONI DI SISTEMI DINAMICI
• ∀ u, v ∈ V , e ∀ α, β ∈ R, valgono le seguenti eguaglianze (α + β) v =
αv + βv, e α(u + v) = αu + αv.
Uno spazio vettoriale reale di fondamentale importanza è Rn , cioè l’insieme delle nuple in colonna di numeri reali, dette anche vettori colonna,
x1
x2
n
R = x = . , tali che xi ∈ R, i = 1, 2, .., n ,
..
xn
dotato dell’operazione di somma e prodotto per scalari così definite
y1
x1 + y1
x1
x1
x2
x2 y2 x2 + y2
x+y = . + . =
, λx = λ ..
..
.
.. ..
.
xn
yn
xn + yn
xn
=
λx1
λx2
..
.
λxn
.
Il vettore nullo 0 è la colonna costituita da tutti zero. Talvolta con Rn si intende l’insieme delle n-uple in riga di numeri reali (x1 , x2 , · · · , xn ), dette vettori riga, dove la
somma ed il prodotto per gli scalari sono definite componente per componente. Quando
sarà importante distinguere i due modi di scrittura, specificheremo fra vettore colonna
di Rn , o vettore riga di Rn .
Diamo adesso la definizione di sottospazio vettoriale. Un sottoinsieme W ⊂ V
spazio vettoriale reale, si dice un sottospazio di V se:
• 0 ∈ W.
• ∀ u, w ∈ W , allora u + w ∈ W.
• Se u ∈ W , allora λu ∈ W , ∀ λ ∈ R.
Vediamo adesso la definizione di combinazione lineare. Dati m vettori v 1 , ..., v m di
uno spazio vettoriale V e m scalari α1 , ..., αm , si dice combinazione lineare degli m
vettori con gli m scalari, il vettore w = α1 v 1 + .... + αm v m . I numeri reali α1 , ..., αm
si dicono coefficienti della combinazione lineare.
Diremo che gli m vettori v 1 , ..., v m di V sono linearmente indipendenti se la
combinazione lineare α1 v 1 + .... + αm v m , dà il vettore nullo soltanto quando tutti
i coefficienti della combinazione sono nulli. Se invece accade che la combinazione
lineare α1 v 1 + .... + αm v m si annulla anche se non tutti i coefficienti sono nulli allora
gli m vettori v 1 , ..., v m si dicono linearmente dipendenti.
Si dice che gli n vettori v 1 , ..., v n di V generano lo spazio vettoriale V se
∀ u ∈ V esistono n scalari β1 , ..., βn per cui
u = β1 v 1 + .... + βn v n ,
cioè ogni vettore di V si può esprimere come combinazione lineare di v 1 , ..., v n . I
vettori v 1 , ..., v n vengono detti generatori di V . Lo spazio V viene poi detto finitamente generato se ammette un insieme finito di generatori. E’ evidente che se
SPAZIO AFFINE E VETTORI APPLICATI
5
{v 1 , ..., v n } sono un insieme di generatori, aggiungendo a tale insieme altri vettori
otteniamo sempre un insieme di generatori: infatti non è detto che i generatori siano
tra loro linearmente indipendenti.
Un esempio di spazio finemente generato è Rn , in cui un insieme di generatori è
1
0
0
0
1
0
(1.1)
e1 = . , e2 = . , ... , en = . .
..
..
..
0
0
1
Se {v 1 , ..., v n } sono un insieme di generatori di V e sono linearmente indipendenti
allora si dice base di V . Una proprietà fondamentale è data dal seguente
Teorema 1.1.1 I vettori {v 1 , ..., v n } sono una base di V se e solo se ogni vettore di
V si può esprimere in modo univoco come combinazione lineare di v 1 , ..., v n .
Dim. Se l’insieme {v 1 , ..., v n } costituisce una base allora, dalla definizione di base
sappiamo che, ∀ u ∈ V , possiamo scrivere
u = β1 v 1 + .... + βn v n .
Vediamo che tale rappresentazione è unica. Infatti, se non lo fosse avremo anche
u = α1 v 1 + .... + αn v n ,
con, in generale, αi �= βi , per qualche i. Ma allora avremo anche
(β1 − α1 ) v 1 + .... + (βn − αn ) v n = 0,
che comporta, data la lineare indipendenza dei vettori v 1 , ..., v n , βi = αi , ∀ i =
1, 2, ..., n, che quindi contraddice l’ipotesi αi �= βi , per qualche i.
Supponiamo adesso che dato un qualunque vettore u ∈ V , questo si possa scrivere in modo unico come combinazione lineare di v 1 , ..., v n . Dalla definizione di
generatori deduciamo che {v 1 , ..., v n } costituisce un insieme di generatori di V . Per
mostrare che {v 1 , ..., v n } è un base bisogna provare che v 1 , ..., v n sono linearmente
indipendenti, ovvero che
α1 v 1 + .... + αn v n = 0
=⇒
α1 = α2 = · · · = αn = 0.
Ora, siccome 0 = 0v 1 + .... + 0v n , dall’unicità della rappresentazione ricaviamo
immediatamente
α1 = α2 = · · · = αn = 0.
Una base rappresenta l’insieme minimo per generare V . Infatti, tornando all’insieme
finito di generatori di V , è facile rendersi conto che in tale insieme possono stare anche
vettori che non sono necessari in quanto combinazione lineari di altri vettori di V . Il
seguente teorema (la cui dimostrazione viene omessa) ci garantisce che, se V è finemente generato, ovvero è generato da un numero finito di generatori, allora da essi si
riesce ad escludere i vettori “superflui” fino a giungere ad una base.
6
LEZIONI DI SISTEMI DINAMICI
Teorema 1.1.2 Dato V spazio vettoriale reale finemente generato, allora V ammette
almeno una base.
E’ quindi evidente che ogni insieme di generatori contiene almeno una base. Ora,
uno spazio vettoriale ammette infinite basi, tuttavia ogni base è caratterizzata dallo
stesso numero di vettori. Infatti, supponendo che V sia finemente generato, è possibile
dimostrare il seguente risultato
Teorema 1.1.3 Ogni base di V possiede lo stesso numero di vettori.
Dim. La dimostrazione non è difficile ma abbastanza lunga. La riassumeremo quindi nei suoi punti essenziali. Si comincia col far vedere che se A= {v 1 , ..., v m }
è un insieme di vettori linearmente indipendenti e U= {u1 , ..., up } un insieme di
generatori1 di V , allora p ≥ m. Tale dimostrazione si fa per assurdo supponendo
p < m. Se così fosse allora si identifica un sottoinsieme Ap ⊂A, costituito da p vettori
Ap = {v 1 , ..., v p }, e si esprimono in funzione dei vettori di U. Se si introduce quindi
la matrice A, n×n, dei coefficienti delle combinazioni lineari, risulta chiaro, sfruttando
il teorema di Rouché-Capelli, che det A �= 0, e quindi A è invertibile. Allora possiamo
esprimere i vettori di U come combinazione lineare dei vettori di Ap , dove A−1 sarà la
matrice dei coefficienti delle combinazioni lineari. Ora, per ipotesi, i vettori di U generano tutto V , e quindi anche v p+1 potrà essere espresso come combinazione lineare
di u1 , ..., up , i quali, a loro volta, sono combinazioni lineari v 1 , ..., v p . Quindi v p+1
è combinazione lineare di v 1 , ..., v p , il che è assurdo dato che i vettori di A sono per
ipotesi linearmente indipendenti. Di conseguenza deve essere p ≥ m.
Adesso supponiamo di avere due basi B1 e B2 , di V , tali che B1 ha m vettori mentre
B2 ne ha p, e che m > p, per esempio (il caso m < p è del tutto analogo). Allora,
leggiamo B1 come l’insieme di vettori linearmente indipendenti e B2 come l’insieme
di generatori. Da quanto visto prima deve essere p ≥ m, e quindi assumere m > p
porta ad un assurdo. Si conclude quindi che B1 e B2 hanno necessariamente lo stesso
numero di vettori.
Diamo quindi la definizione di dimensione di uno spazio V finemente generato: la
dimensione di V è il numero di vettori di una qualunque base di V (tale numero è
sempre lo stesso). Se la dimensione di V è n, scriveremo brevemente dim V = n.
L’insieme (1.1) è una base di Rn , ed è usualmente detta base canonica.
Vediamo adesso il concetto di componenti, o coordinate, di un vettore. Sia V uno
spazio vettoriale di dimensione n. Sia {v 1 , ..., v n }, una base di V . Dato un qualunque
vettore u ∈ V , potremo scrivere
u = u1 v 1 + .... + un v n ,
dove i coefficienti della combinazione lineare sono univocamente determinati. Tali
coefficienti sono detti componenti, o coordinate, di u rispetto alla base {v 1 , ..., v n }.
1 Ricordiamo
che stiamo lavorando su spazi finemente generati.
SPAZIO AFFINE E VETTORI APPLICATI
7
Le componenti di u vengono quindi espresse tramite la n-upla
u1
u2
u → . ,
.
.
un
scrivendo anche
u = u1 v 1 + u2 v 2 + ... + un v n .
(1.2)
Quindi, una volta specificata la base di V , ad ogni vettore u possiamo associare una ed
una sola2 n-upla: risulta quindi definita una corrispondenza biunivoca fra lo spazio
V e lo spazio Rn . In tal senso, nel seguito di quest’opera, intenderemo, salvo che
non diversamente specificato, con la stessa lettera in grassetto u sia il vettore dello
spazio vettoriale V sia la n-upla di Rn che lo rappresenta (rispetto ad un data base).
Ovviamente le componenti di un vettore dipendono dalla base scelta, cambiando base
allo stesso vettore u viene associato un diverso vettore colonna. In altri termini, il
vettore u prescinde dalla base mentre la n-upla dipende dalla base scelta. In effetti, la
scrittura (1.2), specificando esplicitamente sia le componenti che la base, mette ben in
luce questo stretto legame fra la n-upla di Rn e la base prescelta.
Le considerazioni appena illustrate mostrano che vale il seguente
Teorema 1.1.4 Tutti gli spazi vettoriali ad n dimensioni (n fissato) su R, sono isomorfi
fra loro e quindi sono isomorfi ad Rn .
In altri termini, il teorema precedente afferma che se V e U sono due spazi vettoriali
su R, aventi la stessa dimensione n, si può stabilire una corrispondenza biunivoca fra
i vettori di V e quelli di U , cioè v ←→ u, se v ∈ V e u ∈ U . Inoltre, se v, v ′ ,
sono vettori V e u, u′ , è la corrispondente coppia di vettori di U , cioè v ←→ u, e
v ′ ←→ u′ , allora v + v ′ ←→ u + u′ , e αv ←→ αu, per ogni α ∈ R. Si può
quindi affermare che, astrattamente, U e V sono lo stesso spazio.
1.2 Spazi vettoriali euclidei
Allo scopo di definire le nozioni di lunghezza di un vettore e di angolo tra vettori
si introduce una nuova operazione tra vettori: il prodotto scalare. Se V è uno spazio vettoriale reale di dimensione finita, definiamo prodotto scalare in V la seguente
operazione
· : V × V −→ R
2 Infatti
se al vettore u si potesse associare due n-uple, cioè
α1 v 1 + .... + αn v n ,
u=
β1 v 1 + .... + βn v n ,
facendo la differenza otterremmo
(α1 − β1 ) v1 + .... + (αn − βn ) v n = 0,
che può essere soddisfatta soltanto se (αi − βi ) = 0, ∀ i = 1, ..., n, dal momento che gli n vettori v i
sono linearmente indipendenti.
8
LEZIONI DI SISTEMI DINAMICI
che gode delle seguenti proprietà:
1. u · v = v · u, ∀ u, v ∈ V.
2. v · v > 0, se v �= 0, ed è zero solo nel caso in cui v = 0.
3.
· è lineare sia nel primo che nel secondo argomento, ovvero
(α1 v 1 + α2 v 2 ) · u =
v · (α1 u1 + α2 u2 ) =
α1 v 1 · u + α2 v 2 · u,
α1 v · u1 + α2 v · u2 .
Lo spazio vettoriale V dotato del prodotto scalare viene detto spazio vettoriale euclideo, che usualmente si denota (V, ·). Talvolta, sfruttando la linearità sul primo e
secondo argomento e la simmetria, si dice anche che il prodotto scalare è una forma
bilineare (proprietà 3) simmetrica (proprietà 1), definita positiva (proprietà 2).
Nel caso in cui V = Rn , l’applicazione · : Rn × Rn −→ R, così definita
y1
x1
y2
x2
(1.3)
x = . , y = . , x · y = x1 y1 + x2 y2 + ... + xn yn ,
..
..
xn
yn
soddisfa le proprietà del prodotto scalare. Dunque (Rn , ·) è uno spazio vettoriale euclideo. Osserviamo inoltre che se leggiamo l’n-upla x come una matrice n× 1, e denotiamo con y T = (y1 , y2 , ... , yn ), ovvero l’n-upla riga che corrisponde ad una matrice
1 × n, il prodotto scalare può anche essere visto come prodotto righe per colonne fra
matrici
x · y = y T x = xT y .
Dato (V, ·) spazio vettoriale euclideo, l’applicazione � � : V −→ R, che opera
così:
√
�v�= v·v,
viene detta modulo, o norma, o lunghezza, del vettore v. Talvolta la norma del vettore
v potrà anche essere denotata con |v| anziché con �v�.
In Rn , la norma (o modulo o lunghezza), associata al prodotto scalare standard dato
dalla (1.3), di una n-upla x è
�
� x � = x21 + x22 + ... + x2n .
Dalla proprietà del prodotto scalare si deducono facilmente le seguenti proprietà:
• � v � > 0, se v �= 0, ed è zero solo nel caso in cui v = 0.
• ∀ λ ∈ R, �λv� = |λ| �v�.
Due importanti risultati sono riassunti nel seguente
SPAZIO AFFINE E VETTORI APPLICATI
9
Teorema 1.2.1 Se (V, ·) è uno spazio vettoriale euclideo (reale), allora ∀ u, v ∈ V ,
si ha:
1. |u · v| ≤ �u� �v�, disuguaglianza di Cauchy-Schwarz.
2. �u + v� ≤ �u� + �v�, disuguaglianza triangolare o di Minkowski.
Dim. Dimostriamo prima la disuguaglianza di Cauchy-Schwarz. E’ chiaro che la
disuguaglianza è verificata se almeno uno dei due vettori è nullo. Supponiamo quindi
che siano entrambi non nulli. Consideriamo w = αu + βv, con α, β ∈ R,
w · w = (αu + βv) · (αu + βv) = α2 �u�2 + β 2 �v�2 + 2αβu · v ≥ 0.
2
Prendendo adesso α = �v� e β = −u · v, si ottiene
4
2
2
2
2
2
2
�v� �u� + (u · v) �v� − 2 �v� (u · v) = �v�
2
2
�v� �u� − (u · v)
2
≥ 0.
Siccome v �= 0, possiamo dividere per �v�2 , ed ottenere così la disuguaglianza
�v�2 �u�2 ≥ (u · v)2 , =⇒ |u · v| ≤ �u� �v� .
Per quanto riguarda la disuguaglianza triangolare, sfruttando la disuguaglianza di
Cauchy-Schwarz abbiamo
2
�u + v�
2
2
=
(u + v) · (u + v) = �u� + �v� + 2u · v
≤
�u� + �v� + 2 �u� �v� = (�u� + �v�) .
2
2
2
2
2
2
Notiamo che se u · v = 0, allora abbiamo �u + v� = �u� + �v� , che altro non è
che il teorema di Pitagora.
A partire dalla disuguaglianza di Cauchy-Schwarz possiamo definire l’angolo compreso fra due vettori . Infatti, se u �= 0 e v �= 0, abbiamo
−1 ≤
u·v
≤ 1.
�u� �v�
Per cui, possiamo definire l’angolo θ ∈ [0, π] fra i vettori u e v come quell’angolo il
cui coseno è dato da
u·v
cos θ =
.
(1.4)
�u� �v�
Dalla (1.4) scaturisce questa importante relazione fra norme dei vettori u e v, prodotto
scalare e angolo compreso
u · v = �u� �v� cos θ.
Da cui segue la definizioni di ortogonalità fra vettori: diremo che u e v sono ortogonali, e scriveremo u ⊥ v, se
u · v = 0,
⇔
l′ angolo θ fra u e v è retto.
10
LEZIONI DI SISTEMI DINAMICI
Diamo adesso la definizione di base ortonormale. Se (V, ·) è uno spazio vettoriale
di dimensione n, una base {e1 , ..., en } si dice ortonormale, o base canonica, se
�ei � = 1, ∀ i = 1, 2, ... , n e
ovvero3
ei · ej = δij =
�
ei · ej = 0, ∀ i �= j ,
1 se i = j ,
0 se i �= j .
(1.5)
I vettori delle basi ortonormali si denotano in genere con la lettera e, e vengono usualmente detti versori. Notiamo che la base (1.1) di Rn è ortonormale se il prodotto
scalare è dato dalla (1.3).
Dato (V, ·) spazio vettoriale euclideo, si può provare che esiste un metodo che permette di determinare sempre una base ortonormale. Ciò prova, in generale, l’esistenza
di una base ortonormale. Tale metodo viene detto procedimento di ortonormalizzazione
di Gram–Schmidt.
Se si scrive l’espressione del prodotto scalare utilizzando le componenti dei vettori
rispetto ad una base ortonormale su uno spazio vettoriale Euclideo di dimensione n,
si ottiene la stessa espressione del prodotto scalare standard su Rn , cioè quello definito
dalla (1.3). In altri termini abbiamo questo
Teorema 1.2.2 Se (V, ·) è uno spazio vettoriale euclideo, e {e1 , ..., en } è una base
ortonormale, allora dati comunque due vettori u e w
u1
u2
u = u1 e1 + ... + un en , ⇒ a u si associa l’n − upla u = . ,
..
un
w1
w2
w = w1 e1 + ... + wn en , ⇒ a w si ssocia l’n − upla w = . ,
..
wn
si ha
u·w =
u ·w
� �� �
= uT w = w T u .
(1.6)
p. scalare
in Rn def inito
dalla (1.3)
Dim. La dimostrazione è facilissima. Infatti, ricordando la (1.5),
� n
� n
n
n �
�
�
�
u i ei ·
wj ej =
ui (ei · ej )wj
u·w =
� �� �
i=1
j=1
i=1 j=1
δij
=
n
�
ui wi .
i=1
3 La
δij è detta δ di Kronecker. Leopold Kronecker (1823 – 1891) è stato un matematico tedesco.
SPAZIO AFFINE E VETTORI APPLICATI
11
Vale anche il viceversa. Se ∀ u, w ∈ V vale la (1.6) allora la base {e1 , ..., en } è
ortonormale. La dimostrazione è lasciata per esercizio.
Due conseguenze di questo risultato sono le seguenti:
• le componenti di un qualunque vettore v rispetto ad una base ortonormale
B = {e1 , ..., en } hanno questa forma particolare
v = (v · e1 ) e1 + (v · e2 ) e2 + ... + (v · en ) en .
In altri termini, se v = v1 e1 + v2 e2 + ... + vn en , allora
v1
v · e1
v2
v · e2
≡
..
.
..
. Se B è
.
ortonormale
vn
v · en
(1.7)
Infatti, se moltiplichiamo scalarmente v per e1 , poi per e2 , e così via otteniamo
v · e1
= (v1 e1 + v2 e2 + ... + vn en ) · e1 = v1 ,
v · e2
= (v1 e1 + v2 e2 + ... + vn en ) · e2 = v2 ,
v · en
..
.
= (v1 e1 + v2 e2 + ... + vn en ) · en = vn .
(1.5)
(1.5)
(1.5)
Gli scalari (v · ei ), i = 1, 2, ... , n, vengono detti proiezioni ortogonali di v sui
vettori della base.
• Alla base ortonormale {e1 , ..., en } di V corrisponde la base canonica (1.1) di
Rn .
Rimarchiamo ancora che la (1.6) vale solo nel caso in cui B sia una base ortonormale. Ci chiediamo dunque: se (V, ·) è uno spazio vettoriale euclideo di dimensione
n, ed in esso è data una base B = {v 1 , ..., v n }, non ortonormale,
come si tradu�
��
n
ui v i , w
ce il prodotto scalare fra vettori nel prodotto fra n-uple? Se u =
i=1
��n
�
=
wi v i , potremo scrivere
i=1
u·w =
=
u1
u2
..
.
un
� n
�
i=1
·
�
� n
n
n �
�
�
ui v i ·
wj v j =
ui (v i · v j ) wj
j=1
i=1 j=1
v1 · v1
v2 · v1
..
.
v 1 · v2
v 2 · v2
..
.
···
···
v1 · vn
v2 · vn
..
.
vn · v1
vn · v2 · · ·
��
vn · vn
G
�
w1
w2
..
.
wn
, (1.8)
12
LEZIONI DI SISTEMI DINAMICI
cioè u · w = u · Gw ≡ uT Gw, dove u, w ∈ Rn . La matrice G viene detta matrice
metrica o matrice associata alla forma bilineare, oppure anche tensore metrico.
Evidentemente, una volta definito il prodotto scalare, G dipende dalla base prescelta:
se infatti {v 1 , ..., v n } fosse ortonormale avremo G ≡ I. Notiamo che la norma di u è
2
�u� = u · Gu ≡ uT Gu.
Le principali proprietà di G sono riassunte nel seguente
Teorema 1.2.3 Se (V, ·) è uno spazio vettoriale euclideo e B = {v 1 , ..., v n }, cui
corrisponde la matrice G, allora:
• G è simmetrica;
• det G �=0, ovvero G è invertibile.
Dim. La simmetria è una conseguenza banale della simmetria del prodotto scalare.
Proviamo che det G �=0. Infatti se fosse det G =0, allora il sistema lineare
G
x1
x2
..
.
xn
= 0,
avrebbe soluzioni non nulle. Se ne consideriamo una qualsiasi e ad essa associamo il
vettore
w = x1 v 1 + x2 v 2 + ... + xn v n ,
2
questo è sicuramente non nullo, w · w = �w� > 0. Del resto
2
�w� = (x1 , x2 , ... , xn ) G
�
che è assurdo.
x1
x2
..
.
= 0,
xn
��
�
=0
Notiamo inoltre che l’identificazione (1.7) non è in generale vera se B non è una base
ortonormale. Supponendo al solito u = u1 v 1 + u2 v 2 + ... + un v n , abbiamo
u · v1 =
u · vn =
�n
i=1
..
�n .
i=1
ui (v 1 · v i ) ,
ui (v n · v i ) ,
u · v1
..
=⇒
= G
.
u · vn
u1
.. .
.
un
(1.9)
SPAZIO AFFINE E VETTORI APPLICATI
13
In altre parole, il generico vettore u è rappresentato, rispetto alla stessa base B, da due
diverse n-uple, cioè
u −→
u1
�n
..
. , tale che u = i=1 ui v i ,
un
u · v1
..
.
.
u · vn
E’ chiaro che se B è ortonormale i due vettori di Rn coincidono. Per passare dall’uno all’altro si deve utilizzare la matrice G che, come abbiamo provato, è invertibile.
Le
due n-uple
si distinguono l’una dall’altra tramite diverse denominazioni: l’n-upla
u · v1
..
viene detta n-upla delle componenti, o coordinate, covarianti di u,
.
u · vn
u1
mentre ... viene detta n-upla delle componenti, o coordinate, controvarianti
un
di u. La relazione che consente di passare dalle componenti controvarianti a quelle
covarianti è la (1.9). L’inversa, cioè
u1
u · v1
..
..
−1
. =G
,
.
u · vn
un
permette invece di calcolare le componenti controvarianti a partire da quelle covarianti.
Nella figura 1.1 sono riportate graficamente sia le componenti controvarianti che
quelle covarianti del medesimo vettore, nel caso particolare in cui i vettori della base v 1 , v 2 siano normalizzati. In tal caso, infatti, le componenti covarianti di un vettore
coincidono con le proiezioni ortogonali del vettore sugli assi della base. Questo però
non è vero se i vettori della base non sono normalizzati. Tuttavia, anche se impropriamente, le componenti covarianti di un vettore sono sovente lette come le “proiezioni”
del vettore sugli assi della base.
Nel corso di quest’opera non staremo quasi mai a distinguere fra componenti covarianti o controvarianti di un vettore. Questo perché molto spesso avremo a che fare
con basi ortonormali. Ovviamente, quando scriveremo
u = u1 v 1 + u2 v 2 + ... + un v n ,
le componenti ui , i = 1, 2, ..., n, sono quelle controvarianti, che, per basi non ortonormali, non coincidono le “proiezioni” di u sui vettori della base.
14
LEZIONI DI SISTEMI DINAMICI
componenti
CONTROVARIANTI di u
u
v2
v1
Se |v1|=| v2 |=1, le
componenti
COVARIANTI di u
coincidono con le proiezioni
ortogonali di u sugli assi
v1 e v2
u
v2
v1
Figura 1.1: L’interpretazione geometrica delle componenti covarianti del vettore u è
semplice nel caso in cui i vettori della base siano normalizzati, cioè |v 1 | = |v 2 | = 1.
Infatti, in tal caso u · v i = |u| cos θi , i = 1, 2, essendo θi l’angolo compreso fra u
e v i . In questo caso quindi le componenti covarianti altro non sono che le proiezioni
ortogonali di u sugli assi v 1 e v 2 . Evidentemente se |v i | �= 1, i = 1, 2, allora u · v i =
|u| |v i | cos θi , e dunque le componenti covarianti u · v i , i = 1, 2, non coincidono con
le proiezioni ortogonali del vettore u sugli assi v i , i = 1, 2.
1.3 Trasformazioni di basi ortonormali
In uno spazio vettoriale euclideo (V, ·) sono date due basi ortonormali B = {e1 , ..., en }
e B′ = {e′1 , ..., e′n }, sì che il generico vettore x è rappresentato da due differenti
n-uple, cioè
x1
x2
x = .. nella base B,
.
xn
x −→
′
x1
x′2
′
x = . nella base B′ .
..
x′n
Vogliamo adesso stabilire che relazione c’è fra la n-upla x e la n-upla x′ . Esprimiamo
ciascun versore di B nella base B′ ,
ei =
N
�
�
j=1
dove
N
�
�
aij e′j ,
ei · e′j e′j =
aij = ei · e′j ,
i = 1, ..., n ,
(1.10)
j=1
i, j = 1, ..., n,
(1.11)
SPAZIO AFFINE E VETTORI APPLICATI
cioè introduciamo la matrice
a11 · · ·
a21 · · ·
A = .
..
a1n
a2n
..
.
···
an1
ann
15
=
e1 · e′1
e2 · e′1
..
.
···
···
e1 · e′n
e2 · e′n
..
.
en · e′1
···
en · e′n
,
(1.12)
detta matrice del cambiamento di base da B′ in B. Esprimiamo ora x nella base B
x=
N
�
i=1
xi ei , con xi = x · ei ,
e nella base B′
x=
N
�
j=1
x′j e′j , con x′j = x · e′j .
Riprendendo la (1.10)
N
N
N
�
�
�
�
�
xi = x · ei = x ·
aij e′j =
aij x · e′j =
aij x′j ,
��
�
�
j=1
j=1
j=1
x′j
otteniamo
xi =
N
�
j=1
aij x′j , ⇒
�
x1
x2
..
.
=
xn
�� �
x
�
a11
a21
..
.
···
···
a1n
a2n
..
.
an1
···
��
ann
A
��
x′1
x′2
..
.
.
x′n
�� �
x′
La proprietà fondamentale di A è quella di essere una matrice ortogonale, cioè
AT A = AAT = I .
Infatti, dal momento che B e B′ sono ortonormali si ha
δkj
= ek · e j =
=
N
N �
�
s=1 i=1
=
N
�
i=1
�N
�
aks e′s
s=1
� �
·
aks aji es · ei =
� �� �
aki aT
ij ,
δsi
N
�
aji e′i
i=1
N
�
i=1
aki aji
�
16
LEZIONI DI SISTEMI DINAMICI
cioè AAT = I. Del resto
δmn
=
=
e′m
·
e′n
N
N
s=1 r=1
=
N
N
=
· es ) es ·
(e′m · er ) er
s=1
r=1
N
(e′n
asn
arm
a s n a r m es · er =
δsr
N
ar n ar m
r=1
aT
n r ar m ,
r=1
e quindi AT A = I.
1.4 Spazio affine e coordinate curvilinee
Definizione 1.4.1 Uno spazio affine è una terna (A, V, F ), dove: A è un insieme
i cui elementi sono detti punti; V è uno spazio vettoriale sul campo reale di dimensione finita (V viene detto spazio vettoriale soggiacente lo spazio affine); F è
un’applicazione
F : A×A
→
V
A×A
∋ (P, Q)
F
→
F (P, Q) = v
∈ V,
il vettore v si denota anche
con (P − Q)
che gode delle seguenti proprietà:
1. ∀ coppia P ∈ A, e v ∈ V, esiste uno ed un solo Q ∈ A, tale che (P − Q) = v.
F (P,Q)
2. Dati comunque tre punti P , Q, S in A, vale
(P − Q) + (Q − S) = (P − S) .
F (P,Q)
F (Q,S)
F (P,S)
La dimensione di uno spazio affine A è quella di V . Il generico vettore v di V viene
anche detto vettore libero, mentre la coppia (P, v) ∈ A×V , viene spesso detta vettore
applicato nel punto P .
Se in A si fissa un punto O, allora A si identifica con V , nel senso che tutti i punti
P di A sono in corrispondenza biunivoca con i vettori F (P, O) = (P − O) ∈ V .
Osserviamo che uno spazio vettoriale può sempre pensarsi come spazio affine. Gli
elementi di A, cioè i punti, sono i vettori. Inoltre, se P corrisponde al vettore v e Q
corrisponde a u, il vettore associato a P − Q è v − u.
Definizione 1.4.2 Un riferimento affine, (detto anche riferimento cartesiano) nello
spazio affine4 A, è costituito da:
4 Con
il termine spazio affine A, si intende sempre la terna (A, V, F ).
SPAZIO AFFINE E VETTORI APPLICATI
17
• un punto O, detto origine;
• una base {w1 , w 2 , ..... , wn }, di vettori di V . Per semplicità la base verrà
denotata nel seguito anche come { wi } .
Il riferimento cartesiano in A, si denota con {O, w1 , w 2 , ..... , wn }, o, più semplicemente, con {O, wi }. Quindi, dato un riferimento cartesiano su A, il generico punto
P ∈ A si identifica con la n-upla di Rn
x1
x2
..
.
xn
che, come sappiamo, rappresenta le componenti del vettore (P − O), o anche coordinate del punto P , rispetto alla base {w i } prescelta,
P − O = x1 w 1 + x2 w2 + ..... + xn wn .
In sostanza, quando parliamo di spazio affine dotato di riferimento cartesiano, intervengono tre spazi:
- Lo spazio affine A, o spazio dei punti P .
- Lo spazio vettoriale V .
- Lo spazio delle coordinate Rn .
L’importanza della teoria degli spazi affini nella meccanica è giustificata dal fatto che
si assume che lo spazio dove ci troviamo, ovvero lo spazio delle nostre percezioni, è
uno spazio affine di dimensione tre.
Definizione 1.4.3 Uno spazio affine (A, V, F ), si dice euclideo se lo spazio vettoriale
V è euclideo, ovvero in esso è definito un prodotto scalare.
Negli spazi affini euclidei si può definire la distanza fra punti P, Q ∈ A, come il
modulo del vettore (P − Q), che spesso si denota con |P − Q|, anziché con �P − Q�.
Consideriamo adesso uno spazio affine euclideo, in cui {O, ei }, è un riferimento
cartesiano ortogonale, cioè la base {ei }, è una base ortonormale. Come detto, ogni
punto P ∈ A è individuato da un n-upla, i cui elementi sono le componenti del vettore
P − O, che, come sappiamo, coincidono anche con le proiezione ortogonali di P − O
sui vettori della base. Se Q è un dominio di Rn , ovvero Q ⊂ Rn , si considera questa
applicazione x : Q → D ⊂ Rn ,
x1 (q1 , q2 , ..., qn )
q1
x2 (q1 , q2 , ..., qn )
q2
x
Q ∋ q = . −→ x (q) =
∈ D ⊂ Rn .
..
..
.
qn
xn (q1 , q2 , ..., qn )
Il codominio D in generale è un sottoinsieme di Rn , e ad esso corrisponderà un dominio
DA nello spazio affine A. Se l’applicazione x (q) gode delle seguenti proprietà:
18
LEZIONI DI SISTEMI DINAMICI
1. x (q) ∈ C 1 (Q) ;
2. ∀ q ∈ Q, l’applicazione è invertibile;
allora si dice che x (q) definisce un nuovo sistema di coordinate su D, dette coordinate
curvilinee.
La condizione 2 è verificata se la matrice n × n,
∂x1 ∂x1
∂x1
···
∂q1
∂q2
∂qn
∂x
∂x2
∂x2
2
···
∂q
∂q
∂q
1
2
n ,
J=
.
.
.
..
..
..
∂xn ∂xn
∂xn
···
∂q1
∂q2
∂qn
ha rango massimo, ovvero ∀ q ∈ Q si ha det J �= 0. In altri termini, le n funzioni
x1 = x1 (q1 , q2 , ..., qn ) ,
x2 = x2 (q1 , q2 , ..., qn ) ,
..
.
xn = xn (q1 , q2 , ..., qn ) ,
rappresentano un sistema di coordinate curvilinee in D, se gli n vettori di V ,
∂x
,
∂q1
∂x
, ···
∂q2
∂x
,
∂qn
le cui componenti rispetto alla base {ei } sono i vettori di Rn
∂x1
∂x1
∂x1
∂qn
∂q1 ∂q2
∂x
∂x ∂x
2
2
2
∂q1 , ∂q2 , · · · ∂qn
.
. .
..
.. ..
∂xn
∂xn ∂xn
∂q1
∂q2
∂qn
,
∂x
, i = 1, 2, ..., n,
∂qi
formano un riferimento associato alle coordinate curvilinee q, e quindi una base
dello spazio vettoriale V soggiacente lo spazio affine A. Tale base però cambia da
punto a punto e perciò viene detta base locale o base puntuale. In generale i vettori
∂x
, i = 1, 2, . . . , n, si denotano con ui , e la base puntuale con {u1 , u2 , ... , un }, o
∂qi
sono linearmente indipendenti5 ∀ q ∈ Q. In tal caso diremo che
5 Infatti,
scrivendo la matrice J come
J=
∂x
∂x ∂x
,
···
∂q1 ∂q2
∂qn
la condizione di rango massimo implica l’indipendenza dei vettori
∂x
.
∂qi
SPAZIO AFFINE E VETTORI APPLICATI
19
semplicemente con {ui }. Diremo poi che le coordinate curvilinee q sono ortogonali
se ui · uj = 0, se i �= j. In tal caso si usano introdurre i versori della base locale
come
�
�
∂x �� ∂x ��
, i = 1, 2, ..., n,
κi =
/�
∂qi ∂qi �
tali che κi · κj = δij .
Una proprietà importante dei vettori ui , è quella di essere punto per punto tangenti
alle rispettive curve coordinate. Infatti, se fissiamo i valori di n − 1 coordinate e lasciamo variare una sola coordinata (per esempio fissiamo (q1 , q2 , ..., qi−1 , qi+1 , ..., qn ) e
lasciamo “libera” la qi ), otteniamo una curva parametrizzata dalla coordinata variabi∂x
le. Il vettore
è tangente alla curva parametrizzata dalla coordinata qi . Da notare
∂qi
che, nel caso specifico della base ortonormale {ei }, il vettore unitario ei è tangente
all’i-esimo asse coordinato.
In particolare, dato un generico vettore v ∈ V , questo si potrà anche esprimere sia
in termini della base {ei }, che in termini della base locale {ui }. Quindi, riferendoci
a quest’ultima, la n-upla
v · u1
v · u2
..
.
v · un
fornisce le componenti covarianti di v rispetto alla base puntuale {ui }, cioè
v = (v · u1 ) u1 + (v · u2 ) u2 + . . . + (v · un ) un .
In accordo con la (1.8) si definisce la matrice metrica associata al sistema di coordinate curvilinee come
u1 · u1 · · · u1 · un
u2 · u1 · · · u2 · un
G=
,
..
..
.
.
un · u1 · · · un · un
le cui componenti variano da punto a punto. Se quindi utilizziamo la base {ui }
per
�n v e w tramite le loro componenti controvarianti, cioè v =
�n esprimere i vettori
v
u
e
w
=
i
i
i=1
i=1 wi ui , avremo
w1
�
�
v1 · · · vn G ...
v·w =
wn
=
�
w1
···
wn
v1
� .
G .. .
vn
Esempio 1.4.1 Consideriamo il piano affine A con un riferimento cartesiano ortogonale {O, ex , ey } . Poniamo Q = (0, +∞) × [0, 2π) ⊂ R2 , q1 = r, q2 = θ, e
20
LEZIONI DI SISTEMI DINAMICI
consideriamo l’applicazione
x (q) =
x (r, θ) = r cos θ
y (r, θ) = r sin θ
∂x
, uθ =
che porta il dominio Q in DA = A − {O}. Determiniamo i vettori ur =
∂r
∂x
, e verifichiamo la loro indipendenza ∀ (r, θ) ∈ Q. Infatti, dando direttamente le
∂θ
loro componenti,
cos θ
−r sin θ
, uθ =
,
ur =
sin θ
r cos θ
abbiamo det J = r �= 0, ∀ (r, θ) ∈ Q. La base locale {ur , uθ } è ortogonale:
ur · uθ = 0. Inoltre uθ è tangente alle linee coordinate r =cost., e θ variabile in
[0, 2π), mentre ur è tangente alle linee coordinate θ =cost., r variabile in (0, ∞). ur
è quindi diretto radialmente.
Esempio 1.4.2 Consideriamo lo spazio tridimensionale con il riferimento cartesiano
ortogonale {O, ex , ey , ez }, e le coordinate sferiche q1 = r, q2 = ϕ longitudine e
q3 = θ, co-latitudine (angolo che il vettore (P − O) forma con l’asse z, vedi figura
1.2), definite nel dominio Q = (0, +∞) × [0, 2π) × (0, π) ⊂ R3 .Consideriamo poi
l’applicazione
x (r, ϕ, θ) = r sin θ cos ϕ
.
y
(r,
ϕ,
θ)
=
r
sin
θ
sin
ϕ
x (q) =
z (r, ϕ, θ) = r cos θ
che porta il dominio Q in DA = A − {asse z}. Si verifica facilmente che det J =
−r2 sin θ �= 0, ∀ (r, ϕ, θ) ∈ Q. La base locale (non normalizzata) è
−r sin θ sin ϕ
r cos θ cos ϕ
sin θ cos ϕ
ur = sin θ sin ϕ , uϕ = r sin θ cos ϕ , uθ = r cos θ sin ϕ
,
0
−r sin θ
cos θ
uϕ
uθ
, κθ =
. E’ facile verificare
r sin θ
r
che la base locale è ortogonale. Possiamo esprimere il vettore (P − O) nella base
locale. Abbiamo
mentre quella normalizzata è κr = ur , κϕ =
(P − O)
= r sin θ cos ϕex + r sin θ sin ϕey + r cos θez
= r (sin θ cos ϕex + sin θ sin ϕey + cos θez ) ,
��
�
�
ur
SPAZIO AFFINE E VETTORI APPLICATI
21
Figura 1.2: Coordinate sferiche.
z
P
θ
y
O
ϕ
x
cioè
(P − O) → x =
xex + yey + zez ,
rκr ,
coordinate cartesiane,
(1.13)
coordinate sferiche.
In particolare, �P − O� = r.
1.5 Prodotto vettoriale e sistemi di vettori applicati
1.5.1 Il prodotto vettoriale
Si comincia con la definizione di prodotto vettoriale fra terne.
Definizione 1.5.1 Se a, b ∈ R3 , si definisce prodotto vettoriale, o prodotto esterno,
delle terne a e b il vettore
a2 b 3 − a3 b 2
a ∧ b = a3 b 1 − a1 b 3 .
(1.14)
a1 b 2 − a2 b 1
Introducendo la base canonica (1.1) e1 , e2 ed e3 , si ha formalmente
�
�
� e1 e2 e3 �
a 2 b 3 − a3 b 2
�
�
a ∧ b = �� a1 a2 a3 �� = a3 b1 − a1 b3 .
� b1 b2 b3 �
a1 b 2 − a2 b 1
(1.15)
E’ facile dimostrare che il prodotto vettoriale così come definito dalla (1.14) gode delle
seguenti proprietà:
22
LEZIONI DI SISTEMI DINAMICI
• a ∧ b = −b ∧ a ;
• ∀ α, β ∈ R, (αa + βb) ∧ c = α (a ∧ c) + β (b ∧ c) ;
• a ∧ b è ortogonale sia ad a che a b. Infatti (a ∧ b) · a = (a ∧ b) · b = 0 ;
• e 1 ∧ e 2 = e3 , e3 ∧ e 1 = e2 , e2 ∧ e 3 = e1 ;
• dati a, b e c qualunque
(1.16)
[a ∧ b] · c = [c ∧ a] · b = [b ∧ c] · a ;
• il prodotto vettoriale soddisfa la cosiddetta identità di Jacobi
a ∧ (b ∧ c) + b ∧ (c ∧ a) + c ∧ (a ∧ b) = 0.
(1.17)
Consideriamo adesso lo spazio affine euclideo A di dimensione 3. Sia {O, w1 , w2 ,
w 3 }, un un riferimento cartesiano ortonormale centrato in O. Diremo che il riferimento è positivamente orientato o che la terna {O, w1 , w2 , w3 } è levogira, o destrorsa, se w1 , w2 , w3 sono orientati come pollice, indice e medio della mano destra.
In altri termini, la terna è levogira se la rotazione di π/2 che porta il primo versore sul
secondo è antioraria se vista dal semispazio verso cui punta il terzo versore. In figura
1.3 sono riportate una terna ortonormale levogira ed una non levogira.
e3
e3
e2
e1
e1
TERNA LEVOGIRA
e2
TERNA NON
LEVOGIRA
Figura 1.3: Terna ortonormale levogira e terna ortonormale non levogira.
Due riferimenti cartesiani ortonormali {O, w1 , w2 , w3 } e {Q, v 1 , v 2 , v 3 } si diranno concordemente orientati se la matrice del cambiamento di base A ha determinante uguale ad 1, det A = 1. I riferimenti {O, w 1 , w2 , w3 } e {Q, v 1 , v 2 , v 3 } non
sono concordemente orientati se det A = −1.
Nota 1.5.1 Con l’introduzione del prodotto vettoriale nello spazio affine di dimensione
3 abbiamo introdotto il concetto di destra e sinistra. Questi sono concetti puramente
SPAZIO AFFINE E VETTORI APPLICATI
23
relativi, almeno nel nostro contesto. Quello che ha un significato assoluto è la differenza fra le due orientazioni. Nel caso della retta, per esempio, è possibile specificare
due versi, ma definirne uno come positivo (perché diretto da “sinistra verso destra”) e
l’altro come negativo si può fare solo se ci riferiamo ad un uomo che osserva la retta.
Prescindendo dall’osservatore concreto quello che si può stabilire è soltanto la differenza dei due versi: dire che uno è positivo e l’altro è negativo è una pura convenzione.
Nello spazio quindi esistono due tipi di riferimento cartesiano ortogonale: quelli di un
tipo sono collegati fra loro da matrici con determinante uguale ad 1, mentre quelli di
tipo diverso sono collegati da trasformazioni con determinante uguale a −1. In astratto non si può quindi dire quali siano gli uni e quali gli altri a meno di non ricorrere ad
un osservatore concreto che confronta la base cartesiana con la sua mano destra.
Consideriamo lo spazio affine euclideo di dimensione 3. In esso vale la seguente interpretazione geometrica del prodotto vettoriale: dati tre punti A, B e C, il prodotto
vettoriale (A − C) ∧ (B − C), ha la direzione ortogonale al piano individuato dai vettori (A − C) e (B − C). Il verso del vettore (A − C)∧(B − C) è tale che la rotazione
(di angolo inferiore a π) che porta (A − C) su (B − C) sia antioraria se vista dal semispazio che contiene il vettore (A − C) ∧ (B − C). Infine, per quel che riguarda il
modulo, vale
|(A − C) ∧ (B − C)| = |(A − C)| |(B − C)| sin ϕ ,
(1.18)
dove ϕ ∈ [0, π], è l’angolo compreso fra i vettori (A − C) e (B − C). Per dimostrare
tali affermazioni, consideriamo
(A − C)
(B − C)
∧
,
|(A − C)| |(B − C)|
cioè il prodotto vettoriale fra versori. Senza perdere di generalità possiamo considerare
la terna ortonormale levogira {A, w1 , w2 , w3 } centrata in A, dove
w1
=
w2
=
(A − C)
,
|(A − C)|
versore del piano individuato dai vettori
(A − C) e (B − C) , ortogonale a w 1 ,
(B − C)
rispetto a tale base
e dove w3 è dato da w3 = w 1 ∧ w 2 . Le componenti di
|(B − C)|
sono
(B − C)
= cos ϕ w1 + sin ϕ w2 , ϕ ∈ [0, 2π) ,
|(B − C)|
per cui
(B − C)
(A − C)
∧
= w 1 ∧ (cos ϕ w1 + sin ϕ w 2 ) = sin ϕ w3 ,
|(A − C)| |(B − C)|
ovvero (A − C) ∧ (B − C) = |(A − C)| |(B − C)| sin ϕw3 . Se adesso ne prendiamo
il modulo otteniamo esattamente la (1.18), dove ϕ ∈ [0, π] indica l’angolo fra i due
vettori.
24
LEZIONI DI SISTEMI DINAMICI
1.5.2 Vettori applicati e momento rispetto ad un polo
Sia, al solitolo, A spazio spazio affine di dimensione 3 nel quale lavoriamo e sia V il
soggiacente spazio vettoriale. Abbiamo già incontrato nella sezione 1.4 la definizione
di vettore applicato: è la coppia (P, v) ∈ A × V .
Definizione 1.5.2 Si dice momento di un vettore applicato (P, v) rispetto ad un punto
O, il vettore
m (O) = (P − O) ∧ v .
Il punto O si dice polo o centro di riduzione.
Ricordando la (1.18) e osservando la figura 1.4, si ha
|m (O)| = |v| |(P − O)| sin ϕ = b |v| ,
b
dove b si dice braccio.
P
v
ϕ
b=|(P-O)|sinϕ
ϕ
O
Figura 1.4: Momento del vettore applicato (P, v) rispetto al polo O.
Il momento ha le seguenti proprietà:
• m (O) = m (O′ ), se (O − O′ ) è parallelo a v. Infatti
m (O′ ) =
=
(P − O′ ) ∧ v = m (O) = [(P − O) + (O − O′ )] ∧ v
(P − O) ∧ v + (O − O′ ) ∧ v = m (O) .
=0 poiché
(O−O′ ) � v
Se si definisce retta d’applicazione del vettore applicato (P, v), la retta passante
per P e parallela a v, il risultato appena illustrato ci dice che il momento di un
vettore applicato rispetto ad un polo O, non cambia se si sposta v lungo la
propria retta di applicazione.
SPAZIO AFFINE E VETTORI APPLICATI
25
• In generale, se (O − O′ ) non è parallelo a v
m (O′ ) = m (O) + (O − O′ ) ∧ v .
(1.19)
La (1.19) è nota come formula di trasposizione dei momenti.
Un sistema di N vettori applicati è un insieme
S = {(Pi , v i ) ∈ A × V : i = 1, ...., N } .
Definizione 1.5.3 Si dice risultante del sistema S il vettore
N
vi ,
mi (O) =
N
R=
i=1
e momento risultate rispetto al centro di riduzione O
m (O) =
N
i=1
i=1
(Pi − O) ∧ v i .
Se cambiamo polo e consideriamo O′ , applicando la (1.19) si ottiene
m (O′ )
=
N
mi (O′ ) =
i=1
N
i=1
[mi (O) + (O − O′ ) ∧ v i ]
= m (O) + (O − O′ ) ∧
N
i=1
v i = m (O) + (O − O′ ) ∧ R . (1.20)
R
Quindi m (O ) = m (O), se R = 0, oppure se (O − O′ ) è parallela ad R. Inoltre,
proprio dalla (1.20) discende una proprietà notevole
′
m (O′ ) · R = m (O) · R + [(O − O′ ) ∧ R] · R = m (O) · R .
=0
Se quindi si introduce la quantità
ℑ = m (O) ·
R
,
|R|
detta invariante scalare, questa è indipendente dal polo O. In particolare, possiamo
R
sempre scomporre m (O) lungo il versore
|R|
R
R
R
=ℑ
,
p = m (O) ·
|R| |R|
|R|
R
e nella rimanente parte n (O) = m (O) − p = m (O) − ℑ |R|
, che risulta ortogonale
a p. Infatti
R
R
R
= ℑ m (O) − ℑ
·
n (O) · p = ℑ n (O) ·
|R|
|R|
|R|
=
ℑ (ℑ − ℑ) = 0 .
26
LEZIONI DI SISTEMI DINAMICI
Il vettore p, detto invariante vettoriale, non dipende dal polo ma soltanto dal sistema
di vettori applicati S (cioè dai vettori v i e dalla loro disposizione geometrica nello
spazio). Inoltre,
m (O) = p + n (O) , ⇒ |m (O)| = |n (O)|2 + ℑ2 .
(1.21)
Quindi, partendo da un generico punto O, si vuole trovare, se esiste, il luogo geometrico dei punti Q per i quali il momento risultante abbia modulo minimo, cioè
|n (Q)| = 0. Applicando la (1.20) ed imponendo m (Q) = p, abbiamo
m (Q) = m (O) + (O − Q) ∧ R = p,
ovvero, supponendo O centro del sistema di riferimento ed indicando con x = (Q − O)
il vettore delle coordinate di Ql,
(1.22)
x ∧ R + p = m (O) ,
che è l’equazione di una retta parallela ad R. Tale retta è detta asse centrale. Quindi,
per tutti i punti Q che soddisfano la (1.22), cioè che giacciono sull’asse centrale, si ha
m (Q) = p (v. figura 1.5).
R
R
m(O)
p
O
O
x
Q
Posto (Q-O)=x, abbiamo che Q giace
sull’asse centrale se
⋀ + = ()
Figura 1.5: Asse centrale.
Un particolare sistema di vettori applicata è la coppia.
Definizione 1.5.4 Una coppia è un sistema di due vettori applicati
S = {(P, v) , (Q, −v) } .
Poiché la risultante di una coppia è nulla, il momento m (O) della coppia non dipende
dal polo O. In particolare, riferendoci alla figura 1.6
|m (O)| = d |v| .
SPAZIO AFFINE E VETTORI APPLICATI
27
v
P
d
Q
-v
Figura 1.6: Schema di una coppia.
1.5.3 Sistemi equivalenti di vettori applicati
Definizione 1.5.5 Consideriamo due sistemi di vettori applicati
S = {(Pi , v i ) , i = 1, ...., N } ,
e
S ′ = {(Aj , uj ) , j = 1, ...., M } ,
di risultanti R e R′ , e momento risultante m (O) e m′ (O), con O fissato. Diremo che
S e S ′ sono equivalenti se
R = R′ ,
m (O) = m′ (O) .
(1.23)
Osserviamo subito che se la (1.23) è vera per un generico punto O, allora è vera per
tutti i punti dello spazio affine. Infatti, applicando la (1.20)
m (Q) =
′
m (Q) =
m (O) + (O − Q) ∧ R,
m′ (O) + (O − Q) ∧ R′ ,
che, in virtù della (1.23), risultano esser ancora uguali.
In particolare, due sistemi di vettori applicati S e S ′ sono equivalenti se possiamo
trasformarli uno nell’altro mediante le seguenti operazioni:
1. rimpiazzare due o più vettori applicati in un punto con la loro risultante;
2. scomporre un vettore nelle somma di più vettori;
3. cancellare due vettori uguali ed opposti che sono applicati nello stesso punto;
4. applicare allo stesso punto due vettori uguali e contrari;
28
LEZIONI DI SISTEMI DINAMICI
5. spostare un vettore lungo la propria retta d’applicazione.
Utilizzando tali operazione è facile mostrare che, dato un vettore applicato (P, v) ed
un qualunque centro di riduzione O, il sistema (P, v) è equivalente, nel senso della
definizione 1.5.5, ad un vettore v applicato in O e ad una coppia di momento m (O) =
(P − O) ∧ v. La dimostrazione è schematicamente riportata nella figura 1.7.
v
=
O
P
-v
=
O
P
v
v
m(O)
v
O
P
Figura 1.7: Un vettore v applicato in P è equivalente allo stesso vettore applicato in O
e ad una coppia.
L’utilità del concetto di equivalenza di due sistemi di vettori è evidente: l’idea infatti
è quella di sostituire un sistema complesso di vettori applicati con uno molto più semplice, costituito da un solo vettore ed una sola coppia. In sostanza, il risultato che ci
accingiamo a dimostrare afferma che, fissato un arbitrario polo O e dato un sistema
di vettori applicati (complesso quanto si vuole) questo è equivalente ad unico vettore
(la risultante) applicato proprio in O ed ad una opportuna coppia, che indicheremo con
m (O). Se quindi si vuole calcolare il momento del sistema rispetto ad un altro centro
di riduzione, per esempio rispetto al punto Q, si può sostituire il sistema con quello
semplice: cioè con la risultante R applicata in O e la coppia m (O), per cui
m (Q) = m (O) + (Q − O) ∧ R .
Teorema 1.5.1 Un qualunque sistema di vettori applicati
S = {(Pi , v i ) , i = 1, ...., N } ,
è equivalente ad un altro sistema S ′ costituito da una coppia e da un solo vettore
applicato.
SPAZIO AFFINE E VETTORI APPLICATI
29
Dimostriamo il teorema considerando, per semplicità, un sistema di soli tre vettori
applicati (la generalizzazione ad N > 3 vettori è banale)
S = {(P1 , v 1 ) , (P2 , v 2 ) , (P3 , v 3 )} .
La dimostrazione è sostanzialmente grafica ed è riportata nella figura 1.8.
v3
v1
P3
P1
O
v2
P3
m2(O)
P1
v2
O
m1(O)
P2
=
P2
=
m3(O)
v3
v1
m(O) = m1(O)+m2(O)+m3(O)
R = v1+ v2+ v3
O
Figura 1.8: Ogni sistema di vettori applicati può essere ridotto ad una coppia e ad un
vettore. Notare che, dapprima si riduce di ogni vettore applicato ad un vettore applicato
in O più una coppia (vedi figura 1.7), dopodiché si considerano le risultanti di tutti i
vettori applicati in O e di tutte le coppie.
In particolare, se O appartiene all’asse centrale, il sistema equivalente è costituito
dalla risultante R (applicata in O), mentre la coppia m (O) coincide con l’invariante
vettoriale p.
1.5.4 Sistemi di vettori paralleli
I vettori applicati del sistema S = {(Pi , v i ) , i = 1, ...., N }, si dicono paralleli, se
esiste un vettore e, per cui
v i = βi e, con fi ∈ R, i = 1, ..., N.
N
In questo caso, ponendo β = i=1 βi , la risultante è R = β e, ed il momento rispetto
ad un qualunque polo O è
N
m (O) =
βi (Pi − O) ∧ e .
i=1
30
LEZIONI DI SISTEMI DINAMICI
E’ banale provare che l’invariante scalare ℑ si annulla. Di conseguenza, ricordando la
scomposizione (1.21), m (O) = n (O), e quindi m (O) = 0, se O appartiene all’asse
centrale. Quindi, applicando il teorema 1.5.1, abbiamo che il sistema è equivalente ad
un unico vettore (la risultante) applicato in un qualunque punto dell’asse centrale. Se
quindi Q è un polo che non giace sull’asse centrale
m (Q) = (Q − O) ∧ R ,
dove O è un qualunque punto dell’asse centrale. Quindi, se vogliamo semplificare un
sistema di vettori applicati paralleli è necessario individuarne l’asse centrale. A tal
proposito, vale il seguente
Teorema 1.5.2 L’asse centrale di un sistema di vettori paralleli è la retta parallela a
e, passante per il punto C definito da
C −O =
N
1
βi (Pi − O) ,
β i=1
(1.24)
detto centro del sistema.
Dim. Per provare che C appartiene all’asse centrale basta dimostrare che m (C) = 0.
Dunque
N
N
m (C) =
(Pi − C) ∧ βi e =
βi (Pi − C) ∧ e = 0.
i=1
i=1
Infatti
N
i=1
βi (Pi − C) =
=
N
i=1
βi ((Pi − O) − (C − O))
β (C − O) −
N
i=1
βi
β
(C − O) = 0 .
Se poi prendiamo un altro punto Q tale che6 (Q − C) = λe, con λ ∈ R, applicando la
(1.20) si ha
m (Q) = m (C) + (C − Q) ∧
R = 0.
=0
−λe
6 Cioè
Q giace sulla retta parallela ad e passate per C.
β e
Capitolo 2
Equazioni differenziali
2.1 Introduzione
Il problema del moto, della sua descrizione e delle sue “cause”, è il punto chiave per la
comprensione di gran parte delle applicazioni della matematica al mondo fisico.
La storia è lunga e va molto indietro nel tempo. In effetti questo problema aveva angustiato i pensatori greci classici (si pensi al famoso paradosso del Achille e la
tartaruga, “risolto” da Zenone con la negazione della possibilità stessa del moto). Già
allora era apparsa la stretta connessione del moto con la continuità, intesa come infinita
(almeno potenzialmente) divisibilità dello spazio e del tempo.
La questione era destinata a trascinarsi per lungo tempo: per una chiara definizione di continuità (con la definizione dei numeri reali) si dovette attendere la metà del
diciannovesimo secolo.
Ciò nonostante gli strumenti concettuali per la descrizione del moto si fecero strada
molto prima, anche se in modo vago (come tutti i concetti degni di questo nome!).
Nell’opera di Galileo la velocità appare come un concetto “primitivo”, una proprietà
dei corpi in movimento, che non viene definita in funzione di altro (si indica però dei
modi per calcolarla, per esempio facendo urtare un corpo contro un altro corpo fermo).
La chiave della “risoluzione” si trova nel lavoro di Newton che dà origine al calcolo
differenziale. La velocità (istantanea) viene identificata con la derivata del moto, inteso
come la funzione che associa la posizione nello spazio al tempo in cui il “mobile” la
occupa1 .
1 Per quanto questo modo di pensare possa apparire molto plausibile, in effetti maschera un bel po’ di
problemi concettuali. Per parlare di velocità si deve identificare ad ogni istante il corpo in moto con un punto
geometrico; ma come facciamo a sapere veramente quando il corpo sta transitando in una data posizione
nello spazio? Chiaramente dobbiamo “illuminare” il corpo e misurare l’intervallo di tempo che lo stesso
impiega per transitare fra due punti dello spazio. La fisica moderna, attraverso la teoria della meccanica
quantistica e la teoria della relatività, ci ha fatto capire che questa procedura concettuale non è corretta
quando si ha a che fare con corpi “realmente” piccoli e veloci. Infatti se “illuminiamo” un corpo piccolo,
quale per esempio un elettrone, perturbiamo significativamente, ed in modo casuale, il suo moto e quindi
non siamo più in grado di misurarne la velocità.
Inoltre, anche restando nell’ambito puramente classico, la definizione di velocità come derivata della
posizione assume che si abbia chiaro cosa si intende per “spazio” e soprattutto per “tempo”: nell’ambito
della meccanica classica lo spazio è rappresentato matematicamente da uno spazio euclideo tridimensionale,
il tempo da un continuo unidimensionale che, come afferma Newton, “scorre uniformemente”: “Tempus
32
LEZIONI DI SISTEMI DINAMICI
L’accelerazione, che è la variazione della velocità rispetto al tempo, appare allora
come la derivata della funzione che ad ogni istante associa la velocità istantanea.
Conoscendo ad ogni istante l’accelerazione è possibilile ricostruire la velocità e
quindi la posizione con l’operazione inversa della derivazione, l’integrazione. Ma questo sembra generare un regresso all’infinito: per conoscere l’accelazione forse dovrei
conoscere la sua variazione (la “derivata terza” del moto) e così via.
Il “miracolo” è che con l’accelerazione si può chiudere il regresso. Una lettura “puramente matematica” della seconda legge2 della dinamica newtoniana è che è sempre
possibile trovare una funzione della posizione del corpo, della sua velocità e del tempo,
che determina la sua accelerazione.
Questo, insieme con le leggi che regolano la struttura delle forze (il principio di
azione-reazione, le specifiche leggi per le varie forze, come la legge del quadrato inverso per la gravitazione), trasforma il problema del moto in un problema matematico ben
definito: la soluzione di un’equazione differenziale, o più in generale, di un sistema
di equazioni differenziali.
2.2 Considerazioni generali
Cominciamo con un caso ben noto: il modello più comune per descrivere una molla
è quello in cui il corpo subisce una forza di richiamo proporzionale a quanto si è allontanato da un punto fissato, il centro di attrazione. Questo si traduce nel modello
matematico
mẍ = −Kx
(2.1)
dove m denota la massa del corpo, K è una costante positiva detta costante elastica, la
funzione del tempo x(t) indica la posizione del corpo e ẍ la sua derivata seconda.
La (2.1) è un esempio di equazione differenziale del secondo ordine, cioè che
contiene la funzione incognita e le sue derivate fino al secondo ordine.
Il problema fondamentale della Meccanica si può enunciare in questi termini: date
le forze, determinare il moto, ovvero espressa la forza in funzione della posizione del
corpo, della sua velocità e del tempo, determinare la posizione in funzione del tempo,
ovvero la funzione x (t), in modo che sia soddisfatta l’equazione
ẍ = F (x, ẋ, t) .
Diamo ora alcune definizioni fondamentali
absolutum, verum et mathematicum in se et natura sua sine relatione ad externum quodvis, aequabiliter
fluit”. Questo è il “modello” di spazio-tempo che fa da “sfondo” alla meccanica newtoniana.
Oggi le nostre idee sono forse un po’ più confuse. Per esempio, secondo Roger Penrose: The temporal
ordering that we ’appear’ to perceive is, I am claiming, something that we impose upon our perceptions
in order to make sense of them in relation to the uniform forward time-progression of an external physical
reality. Si vedano gli articoli su tempo nel sito web di storia della matematica della St.Andrews University
http://www-gap.dcs.st-and.ac.uk/ history/HistTopics/Time_1.html
http://www-gap.dcs.st-and.ac.uk/ history/HistTopics/Time_2.html
2 Mutationem motus proportionalem esse vi motrici impressae et fieri secundum lineam rectam qua vis
illa imprimitur ovvero “la variazione del moto (accelerazione) è proporzionale alla forza applicata ed è nella
direzione di tale forza”. Qui la forza è pensata come una quantità (vettoriale) nota in funzione dello stato
cinematico del corpo (posizione e velocità).
EQUAZIONI DIFFERENZIALI
33
Definizione 2.2.1 Sia data una funzione f : Rn+2 → R. Un’equazione differenziale
(ordinaria) di ordine n è una relazione, che coinvolge una funzione incognita x (t) :
R → R, assieme con le sue derivate fino all’ordine n,
f (x(n) (t), x(n−1) (t), . . . , x′ (t), x(t), t) = 0
dove x(k) indica la derivata k-esima di x, che deve essere soddisfatta per ogni3 valore
della variabile indipendente t. L’equazione è detta in forma normale se ha la forma
x(n) = f (x(n−1) , . . . , x′ , x, t)
L’equazione si dice autonoma se la funzione f non dipende da t.
Accanto alle equazioni scalari possiamo anche considerare le equazioni differenziali
vettoriali (dette anche sistemi di equazioni differenziali),
F (x(n) , x(n−1) , . . . , x′ , x, t) = 0,
(2.2)
dove l’incognita x(t) è ora una funzione vettoriale a valori in Rd e la funzione F :
Rd×(n+1)+1 → Rd . L’equazione vettoriale si dirà in forma normale se (2.2) può essere
scritta come
x(n) = F (x(n−1) , . . . , x′ , x, t).
(2.3)
In effetti basta limitarsi a equazioni differenziali vettoriali del primo ordine. Infatti
qualsiasi equazione di ordine superiore può essere ridotta a un sistema del primo ordine
introducendo un numero opportuno di variabili ausiliarie (cioè nuove funzioni incognite). Per fissare le idee vediamo come si passa da un’equazione scalare del secondo
ordine a un sistema di due equazioni del primo ordine.
Sia quindi data l’equazione
ẍ = f (ẋ, x, t) .
(2.4)
y = ẋ
(2.5)
Poniamo
avremo di conseguenza che ẍ = ẏ e possiamo scrivere la (2.4) e la (2.5) come
ẋ = y,
ẏ = f (y, x, t),
ovvero come
·
x (t) = F (x (t) , t) ,
dove x (t) =
x (t)
y (t)
, F (x (t) , t) =
y
f (x, y, t)
.
La generalizzazione di questa riduzione al primo ordine per sistemi di equazioni differenziali di ordine superiore è ovvia.
3 A voler essere precisi, la definizione che abbiamo dato dovrebbe essere “localizzata”: la funzione f può
essere definita solo in un sottoinsieme aperto di Rn+2 , così come la eventuale soluzione x(t) può essere
definita solo in un certo intervallo (t1 , t2 ). Quest’ultima limitazione è molto importante in quanto, anche
per funzioni f “semplici”, p.e. f (x′ , x) = x′ − x2 , le soluzioni, che pure esistono, non sono definite per
tutti i valori della variabile indipendente t ma solo in intervalli limitati.
34
LEZIONI DI SISTEMI DINAMICI
2.3 Il problema di Cauchy
È quasi immediato rendersi conto che un’equazione differenziale non ha soluzione
unica. Basta prendere la più semplice possibile
ẋ = 0
(2.6)
e verificare che tutte le funzioni costanti sono soluzioni di (2.6).
L’equazione (2.6) ha però una sola soluzione che soddisfa anche la condizione
x(t0 ) = x0
(2.7)
dove t0 è un tempo fissato e x0 un valore fissato (la soluzione è, ovviamente, x(t) = x0
per ogni t).
La condizione (2.7) si dice condizione iniziale, o di Cauchy, e determina, sotto opportune condizioni, in modo univoco la soluzione di un’equazione differenziale
(del primo ordine). Il problema di determinare la soluzione di un’equazione differenziale che soddisfi a una data condizione iniziale è detto problema ai dati iniziali o
problema di Cauchy.
Enunciamo il teorema fondamentale sull’esistenza e unicità delle soluzioni del problema di Cauchy. Esso richiede che l’equazione sia in forma normale (2.3). Enunciamo
il teorema per il semplice caso di una sola equazione differenziale, ovvero
�
ẋ = f (x, t) ,
(2.8)
x (t0 ) = x0 .
Teorema 2.3.1 Sia data una funzione f : R2 → R, continua rispetto alle variabili x e
t e lipschitziana4 rispetto alla variabile x in un intorno di (x0 , t0 ) ∈ R2 .
Esistenza: Esiste un δ > 0 e una funzione x : (t0 − δ, t0 + δ) → R, di classe C 1 in
(t0 − δ, t0 + δ) che soddisfa il problema di Cauchy (2.8).
Unicità: Se δ > 0 e y : (t0 − δ, t0 + δ) → R, un’altra funzione che soddisfa anch’essa
(2.8), allora x (t) ≡ y (t) in (t0 − δm , t0 + δm ), con δm = min{δ, δ}.
Nota 2.3.1 Una prima osservazione è che il teorema ha carattere locale ovvero non
garantisce l’esistenza della soluzione per tutti i tempi t ∈ R. Questo perché per una
funzione f generica, anche molto regolare, la soluzione può “esplodere” in tempo
finito. Come esempio si prenda l’equazione
ẋ = x2
che, se imponiamo la condizione iniziale x(0) = 1, ha per soluzione x(t) = 1/(1 − t).
Questa soluzione è definita solo nell’intervallo t < 1.
Concludiamo osservando che la “lipschitzianità” richiesta alla f non è un “requisito tecnico”, ma è legata alla struttura del problema di Cauchy. Se infatti consideriamo il seguente problema
√
23x
ẋ =
,
x (t ) =3 0 ,
0
4 Una funzione f : R → R, si dice lipschitziana (o Lipschitz continua) se esiste una costante L tale che,
per ogni coppia di punti x e y ∈ R, f soddisfa la diseguaglianza |f (x) − f (y)| ≤ L |x − y|.
EQUAZIONI DIFFERENZIALI
35
è banale rendersi
conto che esso ha due soluzioni: x (t) ≡ 0, e x (t) = t3/2 . E infatti
√
la funzione 3 x non è lipschitziana in x = 0.
Nota 2.3.2 Visto che la soluzione che ci si aspetta è comunque locale, è facile capire
perché le ipotesi sulla regolarità della f sono “localizzate”. Si richiede infatti che la
funzione f sia continua e lipschitziana non per tutti gli (x, t) ∈ R2 , ma solo in un
intorno del punto (x0 , t0 ).
2.3.1 Equazioni autonome
Come abbiamo detto un’equazione differenziale, o un sistema di equazioni differenziali, in cui il tempo non compare esplicitamente si dice autonoma. Queste equazioni hanno una fondamentale proprietà detta invarianza temporale: data una soluzione x(t)
e un valore del tempo T qualsiasi, allora x(t − T ) è ancora soluzione dell’equazione.
Supponiamo infatti di avere il seguente problema di Cauchy
dx
= f (x) ,
(2.9)
dt
x (0) = a ,
la cui soluzione è x
(t). Trasliamo temporalmente di T il problema (2.9), considerando
dy
= f (y) ,
dt
y (T ) = a .
(2.10)
E’ facile provare che y (t) = x
(t − T ) è soluzione di (2.10). Infatti
dy (t)
dx
(t − T )
dx
(t − T ) d (t − T )
=
=
dt
dt
d (t − T )
dt
= f (
x (t − T )) = f (y (t)) ,
(2.9)1
=1
e
(0) = a .
y (T ) = x
(t − T )|t=T = x
Ancora più importante è capire come si interpreta questa proprietà. Supponiamo
che, a partire da un certo istante, venga effettuato un certo esperimento su una quantità
la cui evoluzione nel tempo è descritta da un’equazione differenziale autonoma. Sia
x(t) la soluzione dell’equazione. Supponiamo poi di effettuare lo stesso esperimento
(con le medesime condizioni iniziali) T giorni dopo (si ipotizza che il tempo sia misurato in giorni). Se nulla è cambiato nelle condizioni in cui si svolge l’esperimento5 ,
fisicamente ci aspettiamo che le due evoluzioni siano uguali, ovvero che coincidano
se traslate temporalmente. E infatti, posto y(t) la soluzione ottenuta a partire da T ,
abbiamo
y (t) = x(t − T ).
In pratica, nelle equazioni autonome, il legame tra la funzione x e le sue derivate non dipende dalla variabile indipendente (il tempo) e di conseguenza l’equazione
differenziale non cambia in forma se traslata temporalmente.
5 Qui
supponiamo di poter trascurare gli “errori sperimentali”!
36
LEZIONI DI SISTEMI DINAMICI
Esempio 2.3.1 Consideriamo i seguenti problemi di Cauchy
ẋ = x,
ẋ = tx,
PB :
PA :
x (0) = 1,
x (0) = 1.
Evidentemente PA coinvolge un’equazione autonoma mentre l’equazione di PB non è
autonoma.
La soluzione di PA è la seguente
ẋ
= 1, =⇒
x
t
t
ẋ (t′ ) ′
dt = dt′ , =⇒ x (t) = et .
x (t′ )
0
0
ln
Se adesso consideriamo
t
x(t)
=ln x(t)
x(0)
ẏ = y,
y (T ) = 1,
(2.11)
è banale verificare che la soluzione è y(t) = e(t−T ) . In altri termini, la soluzione
di (2.11) è la soluzione di PA traslata temporalmente di T : cioè y (t) = x (t − T ).
Dunque il problema di Cauchy PA non cambia per traslazioni temporali.
Consideriamo adesso il problema PB la cui soluzione è
ẋ
= t, =⇒
x
2
t
ẋ (t′ ) ′
t
′ ′
dt
,
,
=⇒
x
(t)
=
exp
=
t
dt
x (t′ )
2
0
0
t
ln
da cui x(t − T ) = exp
x(t)
x(0) =ln x(t)
(t−T )2
2
ẏ = ty,
y (T ) = 1.
t2
2
. Risolviamo il problema PB a partire da T
=⇒ y (t) = exp
12
2
t −T
.
2
In questo caso x(t − T ) non è più soluzione: traslando di T la variabile temporale,
otteniamo due diversi problemi di Cauchy.
2.3.2 Equazioni reversibili
Un’altra classe di equazioni differenziali rilevanti nella Meccanica è quella delle equazioni dette reversibili ovvero quelle per cui se x(t) è una soluzione allora lo è anche
x(−t). Questo accade in Meccanica tutte le volte che abbiamo sistemi isolati o anche
in sistemi non isolati ma dove le forze esterne non dipendano dal tempo e gli effetti
delle forze dissipative (dovute, per esempio, agli attriti) siano trascurabili. In questi
casi le equazioni avranno la forma ẍ = f (x) di cui si verifica immediatamente la reversibilità (in effetti: cambiando il segno del tempo la derivata prima cambia di segno,
ma la derivata seconda ritorna del segno di partenza).
EQUAZIONI DIFFERENZIALI
37
2.3.3 Equazioni integrabili
Nonostante il teorema di esistenza e unicità ci garantisca che il problema di Cauchy è
univocamente risolubile (almeno localmente), tuttavia non è possibile, in generale, dare un’espressione analitica della soluzione tramite una combinazione finita di “funzioni
elementari”6 e neppure trovare un algoritmo che permetta di esprimere la soluzione tramite un numero finito di operazioni di integrazione e di inversione di funzioni. Qualora
questo sia possibile diremo che l’equazione differenziale è “integrabile”. Lo studio di
una classe di equazioni del primo ordine (cioè che coinvolgono le sole derivate prime)
integrabile sarà sviluppato nella sezione 2.4. Nei paragrafi 2.5, 2.6 analizzeremo due
classi di equazioni del secondo ordine (che coinvolgono cioè soltanto derivate prime e
seconde) integrabili.
2.4 Equazioni del primo ordine in forma normale
In questo paragrafo analizzeremo la classe più importante delle equazioni del primo ordine in forma normale: le cosiddette equazioni a variabili separabili. Per capire cosa
intendiamo per equazione a variabili separabili consideriamo la seguente equazione
autonoma del primo ordine (in forma normale)
(2.12)
ẏ = g(y) h (t) .
In questo caso l’equazione è integrabile per con il metodo di separazione delle variabili. Riscriviamo infatti (2.12) come
ẏ
g(y)
=
Introduciamo la funzione
H (t) =
(2.13)
dy
,
g(y)
(2.14)
h (t) dt,
(2.15)
G(y) =
1
,e
g (y)
.
espressione
che dipende
da t
espressione
che dipende
da y e ẏ
cioè una primitiva della funzione
h (t)
che è una qualsiasi primitiva della funzione h (t). Basta osservare ora che il primo
membro della (2.13) è la derivata rispetto al tempo della funzione G(y(t))
dG (y (t))
dG dy
1 dy
=
=
,
dt
dy dt
g (y) dt
6 Per “funzione elementare” si intende generalmente una funzione che appartenga al seguente “catalogo”:
polinomi, funzioni razionali, funzioni trigonometriche ed esponenziali, loro inverse e tutte funzioni ottenute
combinando un numero finito di queste funzioni.
38
LEZIONI DI SISTEMI DINAMICI
mentre il secondo membro della (2.13) è la derivata della funzione H (t) rispetto
al tempo. La (2.13) è dunque un’uguaglianza tra le derivate di due funzioni e di
conseguenza le due funzioni possono al più differire per una costante
G (y (t)) = H (t) + costante ,
(2.16)
da cui, indicando con G−1 l’inversa della G, otteniamo
y (t) = G−1 (H (t) + costante ) .
(2.17)
Vediamo adesso il caso “più semplice” delle equazioni a variabili separabili:
ẏ = g(y),
⇔
ẏ
= 1,
g(y)
(2.18)
che corrisponde ad h (t) = 1, =⇒ H (t) = t. La (2.16) dà quindi luogo a
G(y(t)) = t + costante ,
=⇒
y (t) = G−1 (t + costante).
(2.19)
La comparsa di una costante di integrazione non deve meravigliare: sappiamo che
la (2.12) ammette un’unica soluzione soltanto qualora si specifichi il dato iniziale
y(t0 ) = y0 , cosa che non abbiamo fatto quando abbiamo ricavato la (2.17). Vediamo
quindi come si procede quando è noto il dato iniziale. Per semplificare il più possibile
consideriamo l’equazione (2.18) con il dato iniziale y(t0 ) = y0 . Abbiamo quindi il
seguente problema di Cauchy
ẏ = g(y),
(2.20)
y (t0 ) = y0 .
Adesso integriamo fra t0 e t la (2.18), tenendo conto dal dato y (t0 ) = y0 ,
y(t)
t
t
dη
ẏ (s)
ds =
t − t0 =
ds =
g(y
(s))
g(η)
η=y(s)
y(t0 )
t0
t0
= G(y (t)) − G(y (t0 )),
(2.14)
(2.21)
ottenendo
G(y (t)) = G(y (t0 )) + t − t0 .
Possiamo dunque scrivere la soluzione come7
y(t) = G−1 (t − to + G(y0 )) .
(2.22)
Abbiamo quindi espresso la soluzione dell’equazione differenziale tramite il calcolo di un integrale e l’inversione di una funzione: questo è ciò che si intende per
“integrazione” di un’equazione differenziale.
Il calcolo che ha portato alla risoluzione di (2.20), si generalizza al caso in cui
l’equazione sia la (2.12), cioè
ẏ = g(y)h (t) ,
(2.23)
y (t0 ) = y0 .
In questo caso invece della (2.21) abbiamo G(y(t)) − G(y (t0 )) = H(t) − H (t0 ), cioè
7 Notiamo
y(t) = G−1 (H (t) − H (to ) + G(y0 )).
dalla (2.22) è banale verificare y (t)|t=t0 = y0 .
EQUAZIONI DIFFERENZIALI
39
Esempio 2.4.1 Vediamo la soluzione generale della seguente equazione a variabili
separabili
ẏ = λy.
In questo caso, ricordando la (2.14) e la (2.15)
G(y) =
ln y,
H (t) =
λt.
Di conseguenza, dalla (2.16) e (2.17)
ln y = λt + cost., =⇒
λt
y = eλt+cost. = ecost.
e ,
C
per cui la soluzione generale è y = C eλt .
Esempio 2.4.2 Consideriamo l’equazione del tipo
(2.24)
ẏ = λy + f (t) .
Generalizzando quanto visto nell’esempio 2.4.1 si cerca la soluzione del tipo y =
C (t) eλt . Sostituendo nella (2.24)
Ċeλt + Cλeλt = Cλeλt + f (t) , ⇒
Si ha quindi
C (t) =
t
Ċ = e−λt f (t) .
e−λτ f (τ ) dτ + K ,
0
dove K è una generica costante di integrazione. Abbiamo quindi
t
y (t) =
eλ(t−τ ) f (τ ) dτ + Keλt .
0
Analizziamo anche il caso particolare f (t) = Aeλt , che troveremo nel seguito. La
soluzione è
t
t
λ(t−τ ) λτ
λt
λt
y (t) = A
e
e dτ + Ke = Ae
dτ + Keλt = eλt (At + K) .
0
0
2.5 Equazioni del secondo ordine in forma normale del
tipo q̈ = f (q̇)
Una generica equazione del second’ordine, anche autonoma, non può in generale essere
“integrata”. Tuttavia ci sono importanti eccezioni. La prima è quella delle equazioni
della forma
q̈ = f (q̇) ,
(2.25)
che chiaramente sono equazioni del primo ordine a variabili separabili nell’incognita
y (t), una volta posto y = q̇. Possiamo quindi esprimere y (t) come abbiamo fatto nella
(2.18), e quindi integrare ancora rispetto al tempo, ottenendo così la q (t).
40
LEZIONI DI SISTEMI DINAMICI
Esempio 2.5.1 Un esempio significativo di equazione tipo (2.25) è l’equazione che
descrive il moto di un grave soggetto alla forza peso e all’attrito viscoso dell’aria (la
resistenza viscosa è, in prima approssimazione, proporzionale alla velocità stessa del
grave)
η
ḧ = −g − ḣ,
(2.26)
m
dove h rappresenta la quota del grave, g è l’accelerazione di gravità, m la massa del
grave e η, costante, è il coefficiente di attrito viscoso. Ponendo y = ḣ, e µ = η/m, la
(2.26) si trasforma nella seguente equazione del primo ordine a variabili separabili
ẏ
= −1, =⇒
g + µy
1 d
dt
[ln (g + µy)] = − ,
µ dt
dt
da cui otteniamo
� =⇒
ln (g + µy) = −µt + C,
che scriveremo come
y=
�
1�
−g + e−µt+C ,
µ
g
C1 −µt
y (t) = − t +
e
,
µ
µ
dove C1 = eC è la prima costante d’integrazione. Integrando ancora
C1
g
h (t) = − t − 2 e−µt + C2 ,
µ
µ
dove C2 è la seconda costante d’integrazione. In particolare, se consideriamo il
problema di Cauchy
ḧ = −g − µḣ,
ḣ (0) = 0,
h (0) = h0 ,
che corrisponde al caso del grave lasciato cadere da fermo da un altezza h0 , troviamo
la seguente soluzione
h (t) = −
�
gt
g �
+ 2 1 − e−µt + h0 .
µ
µ
Notiamo che, se µt è “piccolo”, ovvero stiamo considerando i primi momenti della
caduta, considerando l’approssimazione
1
e−µt ≈ 1 − µt + µ2 t2 ,
2
1
otteniamo h (t) ≈ h0 − gt2 , che è la formula del moto uniformemente accelerato.
2
Al contrario, se µt è “grande”, si ottiene
h (t) ≈ h0 +
gt
g
− ,
µ2
µ
corrispondente ad un moto di caduta con velocità costante proporzionale alla massa
ed inversamente proporzionale al coefficiente di attrito.
EQUAZIONI DIFFERENZIALI
41
2.6 Equazioni del secondo ordine del tipo q̈ = f (q):
caso conservativo
Un’altra classe di equazioni del secondo ordine integrabili è quella costituita delle
equazioni della forma
q̈ = f (q) .
(2.27)
Tale classe di equazioni è fondamentale per la Meccanica poiché di questa forma sono tutte le equazioni di moto di un sistema conservativo con un solo grado di libertà. La (2.27) è riconducibile a un’equazione del primo ordine tramite la seguente
osservazione: moltiplichiamo ambo i membri della (2.27) per la funzione q̇
(2.28)
q̈ q̇ = f (q)q̇ ,
e indichiamo con
V (q) = −
f (q)dq,
(2.29)
una qualsiasi primitiva, cambiata di segno, della funzione f (q). In particolare, la
(2.27) potrà essere scritta come
q̈ = −
dV (q)
= f (q) .
dq
(2.30)
La funzione V (q) è usualmente detta energia potenziale, anche se, a questo livello,
non c’è corrispondenza fra l’equazione (2.30) ed un reale sistema fisico.
Nel primo membro della (2.28) riconosciamo la derivata rispetto al tempo della
funzione q̇ 2 /2. Il secondo membro è anch’esso una derivata rispetto al tempo, infatti
dV (q) dq
d
dq
dV (q (t))
=−
=−
− f (q)dq
= f (q)q̇.
−
dt
dq dt
dq
dt
Possiamo quindi riscrivere la (2.28) come
d q̇ 2
+ V (q) = 0,
dt 2
e dunque ottenere
q̇ 2
= E − V (q) ,
2
(2.31)
dove abbiamo indicato con E il valore, arbitrario, della costante di integrazione8, che
viene determinato in base alle condizioni iniziali. In genere la costante E viene detta
energia meccanica.
L’equazione (2.31) può essere risolta rispetto a q̇ (purché V (q) ≤ E). Supponiamo
quindi di avere assegnato, per l’equazione differenziale originaria (2.27), condizioni
iniziali con q(t0 ) = q0 e q̇(t0 ) = v0 > 0 (aver fissato positivo il segno di v0 non
8 Il fatto
che si siano usate le lettere V ed E dovrebbe richiamare alla mente la conservazione dell’energia
totale del sistema E =
q̇ 2
2
+ V (q). Infatti, talvolta il termine
q̇ 2
2
è detto energia cinetica.
42
LEZIONI DI SISTEMI DINAMICI
pregiudica la generalità di quanto segue). Possiamo quindi calcolare esplicitamente la
costante di integrazione E
E=
v2
q̇ 2 (t0 )
+ V (q0 ) = 0 + V (q0 ),
2
2
e quindi risolvere algebricamente la (2.31) ottenendo9
q̇ =
2(E − V (q)) , =⇒
q̇
2(E − V (q))
= 1,
(2.32)
che è un’equazione del tipo (2.12) e quindi può essere risolta per separazione delle
variabili
q(t)
dη
t − t0 =
.
(2.33)
2(E − V (η))
q0
Per determinare esplicitamente la soluzione q (t), si deve risolvere l’integrale in (2.33)
ed esplicitare la funzione di q(t) ottenuta dall’integrazione. Questo procedimento può
scontrarsi (molto spesso) con l’impossibilità di esprimere l’integrale a secondo membro
della (2.33) in termini di funzioni elementari. Questo accade, per esempio, per il moto
del pendolo semplice10 . Infatti in questo caso abbiamo l’equazione di moto è
θ̈ +
g
sin θ = 0,
l
(2.34)
la cui soluzione, espressa nella forma (2.33), è
t − t0 =
θ(t)
θ0
dη
.
g
2 η
2 E − 2 sin
l
2
(2.35)
Questo integrale però non può essere esplicitato tramite una combinazione finita di
funzioni elementari11. Torneremo sul moto del pendolo nell’esempio 2.6.3.
Anche nel caso che il processo di integrazione e inversione possa essere portato a
termine, resta il fatto che non sempre un’espressione esplicita della soluzione è particolarmente facile da “decifrare”, ovvero resta il problema di capire come effettivamente
si comporti la soluzione descritta da tale espressione analitica.
Esempio 2.6.1 Consideriamo un punto materiale P di massa m vincolato a scorrere
senza attrito lungo una retta. P è collegato tramite una molla di costante elastica k
(avete massa e lunghezza a riposo trascurabili) ad un punto fisso O della retta. Se q (t)
denota l’ascissa di P lungo la retta (O è l’origine), l’equazione di moto è
mq̈ = −kq,
9 Avendo
=⇒
q̈ = −ω 2 q, con ω 2 =
k
, pulsazione.
m
(2.36)
assunto vo > 0, cioè velocità iniziale positiva, si deve considerare la radice positiva.
posizione del pendolo è univocamente determinata dall’angolo (orientato) θ che il pendolo forma
con la verticale.
11 Le funzioni che provengono da integrali del tipo di quello che compare nella (2.35) sono dette funzioni
ellittiche.
10 La
EQUAZIONI DIFFERENZIALI
43
Tale sistema è detto oscillatore armonico, e la (2.36) è l’equazione caratteristica.
Ricordando la (2.29) introduciamo la funzione V (q)
2
ω2 2
q ,
V (q) = −
−ω q dq =
2
da cui
q̇ 2
ω2 2
ω2 2
+
q = E, =⇒ q̇ 2 = 2 E −
q .
(2.37)
2
2
2
Si osserva dunque che, a meno di considerare la soluzione banale q (t) ≡ 0, l’energia
E è sicuramente
si determina sulla base delle condizioni ini positiva. Quest’ultima
ziali: E = 1/2 q̇ 2 (t0 ) + ω 2 q 2 (t0 ) , se t0 è l’istante iniziale. Procedendo come nella
(2.33) si ottiene
t − t0 =
Siccome
q(t)
q0
1
=
2
2
ω
2E − ω η
dη
q
q0
dη
.
√ 2
2E
− η2
ω
η
dη
, otteniamo
= arcsin
a
a2 − η 2
q (t)
q0
arcsin √
− arcsin √
= ω (t − t0 ) .
2E/ω
2E/ω
Possiamo quindi concludere che la forma generale della soluzione dell’equazione dell’oscillatore armonico è
q (t) = A sin (ωt + φ) ,
(2.38)
dove A e φ dipendono dalle condizioni iniziali mentre ω, definita nella (2.36), dipende
dalle caratteristiche fisiche del sistema. In particolare, la soluzione è periodica di
periodo T = 2π/ω.
Osserviamo infine che la soluzione (2.38) si può anche ottenere con altri metodi (si
rimanda all’esempio 2.10.4).
2.6.1 Analisi qualitativa nel caso conservativo
Molte informazioni sulla soluzione possono essere ottenute tramite una “analisi qualitativa”, che prescinde dal calcolo esplicito della soluzione stessa.
Cominciamo dal caso conservativo, ovvero da un’equazione nella forma (2.27). In
questo caso abbiamo detto che le soluzioni dell’equazione sono tali che, al variare di t
la quantità
q̇ 2
+ V (q) ,
(2.39)
2
resta costante, o, come si dice, è un integrale primo dell’equazione differenziale12.
Abbiamo quindi
q̇ 2 = 2[E − V (q)] ,
(2.40)
12 Data
un’equazione differenziale q̈ = f (q̇, q, t), una funzione g(q̇, q, t) delle variabili q̇, q e t tale che
= 0, per ogni funzione q(t) soluzione dell’equazione differenziale, si dice un integrale
dg(q̇(t),q(t),t)
dt
primo.
44
LEZIONI DI SISTEMI DINAMICI
Figura 2.1: Grafico della funzione energia potenziale e livelli dell’energia.
z
z=E
(3)
z=E
(2)
z=V(q)
z=E
(2)
(1)
qM
qm
q
dove E è un numero che viene fissato dalle condizioni iniziali. Poiché il primo
membro della (2.40) è non negativo, il moto si dovrà svolgere in un intervallo dell’asse
delle q dove è soddisfatta la disuguaglianza
V (q) ≤ E .
(2.41)
In effetti l’insieme delle soluzioni di (2.41) può essere formato da più intervalli disgiunti13 : per continuità il moto potrà svolgersi solo su una componente connessa di
questo insieme. Quindi, dati V (q) ed E, possiamo avere questi casi:
1. il moto si svolge in un intervallo limitato [qm , qM ], e può essere:
a. periodico;
b. aperiodico, ovvero di “periodo” infinito;
2. punti di equilibrio, ovvero q (t) = costante è soluzione;
3. il moto si svolge in un intervallo illimitato della forma [qM , +∞) (oppure del
tipo (−∞, qm ]) o su tutta la retta reale;
4. il moto corrisponde ad una separatrice.
Caso 1.a. Moto limitato e periodico
Nel primo caso abbiamo un moto limitato tra due valori, uno minimo qm e uno massimo
qM , dove qm e qM sono le intersezioni del grafico z = V (q) con la retta z = E, come
mostrato in figura 2.1, ovvero le soluzioni di V (q) = E. Vogliamo mostrare che in
questo caso il moto è periodico e il periodo è determinato da
qM
dη
T =2
,
(2.42)
2(E − V (η))
qm
13 Per essere precisi gli intervalli disgiunti sono gli intervalli aperti delle soluzioni della disuguaglianza
stretta.
EQUAZIONI DIFFERENZIALI
45
se le due radici qm e qM dell’equazione V (q) = E sono semplici. Con il termine
radice semplice intendiamo che la funzione
(2.43)
F (q) = 2(E − V (q)) ≥ 0,
può essere scritta come:
· F (q) = (qM − q) Φ (q), con Φ (q) ≥ α > 0, per q in un intorno di qM ;
· F (q) = (q − qm ) Ψ (q), con Ψ (q) ≥ β > 0, per q in un intorno di qm .
Supponiamo che a un certo istante (che possiamo prendere, senza perdere in generalità, come t = 0) il sistema si trovi nel punto q0 ∈ (qm , qM ). Essendo fissato il valore
dell’energia E, il modulo della velocità |v0 | = |q̇ (0) | è determinato dalla (2.32). Ancora senza perdere di generalità possiamo assumere che v0 > 0. Il sistema si muoverà
quindi verso il punto qM ; quando sarà sufficientemente vicino a qM la sua velocità comincerà a decrescere verso zero. Infatti, quando q → qM , si ha che (E − V (q)) → 0
e quindi, dalla (2.40) si deduce che q̇ → 0. Mostriamo che il sistema raggiunge il punto qM in un tempo finito. Il tempo necessario per “raggiungere” qM si ricava dalla14
(2.33)
qM
qM
dη
dη
tM =
=
.
(2.44)
2(E − V (η)) (2.43) q0
F (η)
q0
Ora la funzione integranda diverge in qM , e quindi l’integrale potrebbe divergere, cosa
che implicherebbe tM → ∞. Ma la convergenza dell’integrale è garantita dal fatto che
qM è una radice semplice. Possiamo quindi scrivere15
qM
qM
qM
dη
dη
dη
1
tM =
< ∞.
=
≤√
α q0
F (η)
(qM − η) Φ (η)
(qM − η)
q0
q0
integrale convergente
Il sistema quindi impiega un tempo finito per raggiungere qM . Per t = tM , abbiamo
q (tM ) = qM , e q̇ (tM ) = 0. Il sistema giunge con velocità nulla in qM , dove il moto
si inverte. Infatti, ricordando la (2.30) e la (2.43) abbiamo
dV (q)
1 dF (q)
1 d
q̈ (tM ) = −
((q
=
=
−
q)
Φ
(q))
M
dq qM
2 dq qM
2 dq
qM
=
1
1
α
[(qM − q) Φ′ (q) − Φ (q)]qM = − Φ (qM ) ≤ − < 0,
2
2
2
che appunto significa inversione del moto. Quindi il sistema “riparte” dalla posizione
q = qM , muovendosi questa volta verso qm . La procedura si ripete per il percorso che
va da q0 verso qm , e quindi otteniamo la (2.42) come formula per il tempo T impiegato
14 Si
ricordi che abbiamo assunto t0 = 0.
che l’integrale qqoM √qdη−η , è convergente, infatti
15 Osserviamo
M
qM
qo
dη
=
√
qM − η
0
qM −q0
√
ds
√ = 2 qM − q0 .
s
46
LEZIONI DI SISTEMI DINAMICI
Figura 2.2: Moto aperiodico.
V(q)
qm
qM
q
dalla soluzione per ritornare al punto di partenza. Poiché l’equazione è autonoma, le
soluzioni sono invarianti per traslazioni temporali16 , ovvero la soluzione che parte da
q0 con velocità v0 al tempo t = T , è ottenuta per traslazione da quella che, al tempo
t = 0, partiva da q0 con la stessa velocità vo : in altri termini q(t) = q(t − T ). Ne segue
che il moto è periodico.
Il periodo T , ad eccezione di particolari forme di V (q) (che verranno studiate
nella sezione 2.9), dipende da E. Ma poiché quest’ultimo è definito dalla posizione e
velocità iniziali, avremo che T , in generale, dipende dalle condizioni iniziali.
Caso 1.b. Moto aperiodico
Consideriamo la figura 2.2, in cui la condizione iniziale q0 appartiene al solito intervallo limitato a sinistra da qm e a destra da qM . La soluzione q(t) non è periodica.
Questo caso è caratterizzato dal fatto che un valore di energia E = V (qM ) corrispondente a un massimo relativo isolato qM . Di conseguenza qM è almeno radice doppia
dell’equazione V (q) = E. Quindi, ricordando la (2.43), per q in un intorno di qM
scriveremo
2
F (q) = (qM − q) Ξ (q) ,
con Ξ (q) ≥ 0.
Vediamo qual’è il comportamento della soluzione quando q si avvicina al valore
qM . Per fissare le idee supponiamo di aver scelto come condizioni iniziali, al tempo
t = 0, q0 < qM e v0 > 0. Possiamo scrivere quindi la soluzione corrispondente usando
la formula implicita (2.33). In particolare, sfruttando la (2.44), possiamo determinare
16 Se
q(t) è soluzione di q̈ = f (q), è facile verificare che anche q(t − T ) è soluzione.
EQUAZIONI DIFFERENZIALI
47
il tempo tM impiegato per “raggiungere” qM . Si ottiene17
tM =
qM
q0
qM
dη
dη
1
≥ √
2
max Ξ q0 qM − η
(qM − η) Ξ (η)
= +∞.
integrale divergente
Ne segue che la soluzione q (t), pur essendo monotona crescente, non raggiunge mai
la posizione qM . Alla stessa conclusione saremmo arrivati se avessimo considerato
v0 < 0. In questo caso la soluzione avrebbe impiegato un tempo finito per raggiungere
qm (supponendo quest’ultima una radice semplice) e ritornare nella posizione q0 con
velocità positiva. Dopo di che si ripete la procedura appena descritta, deducendo che
la soluzione impiega un tempo infinito per giungere sino a qM . Il moto però non è
monotono siccome avviene un’inversione in corrispondenza di qm .
Il moto che abbiamo appena descritto verrà ripreso anche nel Caso 4, dove tratteremo il caso generale del moto lungo le separatrici.
Caso 2. I punti di equilibrio
I valori estremi di E che corrispondono ai valori di minimo o massimo relativo della
funzione V (q) generano delle soluzioni di equilibrio ovvero delle soluzioni che sono
funzioni costanti del tempo. Riferendoci alla figura 2.3 e ricordando la (2.30) abbiamo
dV
che q (t) = qe = costante, è soluzione dell’equazione di moto se
= 0. Infatti
dq qe
in questo caso al sistema competono velocità e accelerazione nulle, e quindi il sistema
resta fermo nel punto di estremo qe .
Se poi il punto di minimo qe , è un minimo isolato (ovvero esiste un intorno q1 <
qe < q2 in cui V (q) > V (qe ) per q �= qe ) allora la posizione di equilibro è stabile:
ogni moto che parte “ sufficientemente vicino” a qe e con velocità “sufficientemente
piccola” resta “vicino” a qe per ogni tempo t (approfondiremo questo concetto nella
sezione 2.8). Questo fatto è di immediata verifica osservando che, se il moto si trova
a un certo istante in un punto q0 vicino a qe , ed ha velocità v0 piccola in modulo, al
valore di energia E1 = 12 v02 + V (q0 ) corrisponde un intervallo E1 ≥ V (q) che è un
intorno “piccolo” di qe . Possiamo quindi concludere che il moto periodico descritto
nel Caso 1.a avviene soltanto in un intorno di un punto di minimo di V (qe ), ovvero di
un punto di stabilità.
I massimi relativi della funzione V (q) corrispondono ancora a posizioni di equilidV
brio: infatti ha ancora
= 0. In questo caso però, per quanto si considerino condq qe
dizioni iniziali (q0 , v0 ) “vicine” a (qe , 0), le corrispondenti soluzioni che non restano
“vicine” a (qe , 0). In tal caso parleremo di equilibrio instabile.
17 L’integrale
qM
q0
dη
qM −η
qM
qo
è divergente. Infatti
dη
=
qM − η
0
qM −q0
(qM − q0 )
ds
= lim ln
= +∞.
s→0
s
s
48
LEZIONI DI SISTEMI DINAMICI
Figura 2.3: Punti di equilibrio e separatrici.
V(q)
(1)
separatrice
separatrice
(1)
(1)
(2)
q
_
q
qe
q^
Caso 3. Moto illimitato
Considerando la figura 2.1, questo caso corrisponde alle rette orizzontali (2) e (3).
L’insieme delle q che soddisfano la (2.41) o è tutto l’asse reale (retta (3) della figura
2.1) o comunque è un intervallo illimitato a destra o a sinistra (retta (2) della figura 2.1).
Nel primo caso q̇ non si annulla mai e quindi a seconda della velocità iniziale il moto si
svolge nel verso delle q positive oppure nel verso di quelle negative: la soluzione q (t)
è strettamente monotona.
Nel secondo caso esistono valori di q (le intersezioni fra V (q) e la retta E) in cui q̇
si annulla. Tali intersezioni corrispondono comunque a radici semplici dell’equazione
E = V (q), e pertanto, se la v0 (velocità iniziale) ha il segno “giusto”, possono venir
raggiunte in un tempo finito. Per esempio, riferendoci alla retta (2) di figura 2.1, se
q (0) = qm , e v0 > 0, la soluzione raggiunge in un tempo finito l’intersezione di
sinistra fra la retta (2) e V (q), dopo di che il moto si inverte e si svolgerà nel verso delle
q negative. Se viceversa avessimo avuto v0 < 0, allora q (t) decresce monotonamente
senza mai invertire il moto.
Per riassumere, in questo caso abbiamo che, comunque si scelgano le condizioni
iniziali, limt→∞ q (t) = ±∞. In particolare, se V (q) è tale che V (q) −→ costante,
allora la (2.40) comporta che anche q̇ −→ costante, quando t → ∞.
|q|→∞
Caso 4. Le separatrici
Volendo caratterizzare questo caso, possiamo dire che, a differenza del precedente, il
moto è (o può essere) limitato (cioè |q| non tende all’infinito per t → ∞) ma non periodico. Il primo tipo di separatrice è quella descritta nel Caso 1.b, moto aperiodico, e
trova rappresentazione nel segmento denotato con (2) di figura 2.3. In questo caso una
EQUAZIONI DIFFERENZIALI
49
Figura 2.4: Punti di massimo relativo di V (q) con lo stesso valore dell’energia.
z
z=E
separatrice
z=V(q)
q1
q2
q
delle due radici di V (q) = E (o anche entrambe) corrisponde ad un massimo isolato
di V (riferendoci alla figura 2.3, la radice corrispondente al massimo è q̄). La soluzione q (t), ancorché limitata, non è periodica in quanto impiega un tempo infinito per
raggiungere l’estremo corrispondente al massimo isolato. Il moto può essere monotono o meno (ovvero presentare un’inversione) a seconda della condizione iniziale sulla
velocità.
Il secondo tipo di separatrice è quello che si ha in corrispondenza delle semirette
indicate con (1) in figura 2.3. In tal caso si considerano gli intervalli illimitati (−∞, q̄),
(−∞, q̂) oppure (q̂, +∞). Quindi se q0 ∈ (−∞, q̄) oppure q0 ∈ (−∞, q̂), e la velocità
iniziale v0 è positiva, la soluzione q (t) è monotona crescente ma impiega un tempo
infinito per raggiungere q̄, oppure q̂. In ogni caso il moto è limitato: q0 ≤ q (t) < q̄,
con limt→∞ q (t) = q̄; oppure q0 ≤ q (t) < q̂, con limt→∞ q (t) = q̂. In altri termini,
abbiamo a che fare con un moto del tutto analogo a quello, privo d’inversioni, descritto
nel Caso 1.b. Viceversa v0 è negativa, q (t) è monotona decrescente e limt→∞ q (t) =
−∞ (se ovviamente V (q) > V (q̄), per ogni q < q̄).
Se q0 ∈ (q̂, ∞), e v0 < 0, allora q (t) è monotona decrescente limt→∞ q (t) = q̂.
Se invece v0 > 0, allora q (t) si allontana indefinitamente da q̂ (ammesso che V (q) >
V (q̂), ∀ q > q̂).
Soluzioni limitate e monotone con limt→∞ q(t) = q̂1 , oppure con limt→∞ q(t) =
q̂2 , si hanno quando q̂1 e q̂2 sono due punti di massimo relativo per i quali V (q̂1 ) =
V (q̂2 ), vedi figura 2.4. In questo particolare caso abbiamo un moto aperiodico privo
d’inversioni indipendentemente dalla velocità iniziale.
Esempio 2.6.2 Calcoliamo il periodo dell’oscillatore armonico. Ricordando l’esemω2 2
q , per cui, per E > 0, l’intervallo [qm , qM ] corpio 2.6.1, abbiamo V (q) =
2 √
√
2E
2E
,
(si veda la figura 2.5). Dalla (2.42)
rispondente a V (q) ≤ E, è −
ω
ω
50
LEZIONI DI SISTEMI DINAMICI
Figura 2.5: V (q) nel caso dell’oscillatore armonico e nel caso del pendolo.
V (q ) =
OSCILLATORE ARMONICO
ω2
2
q2
E
−
2E
2E
ω
ω
PENDOLO
q
V (θ ) = ω 2 (1 − cosθ )
E
θ m = −θ M
θ
θM
otteniamo18
√
2E
ω
T
= 2
−
=
4
ω
√
√
2E
ω
dq
=4
ω2 2
q
2 E−
2
√
2E
ω
√
dq
2
2E
ω
0
− q2
2E
ω
0
dq
2E − ω 2 q 2
√ω2E
q
2π
4
arcsin √
.
=
=
2E
ω
ω
ω
0
Notiamo che T non dipende da E, e quindi è indipendente dalle condizioni iniziali19 .
Osserviamo che q = 0 è un minimo assoluto, isolato, per l’energia potenziale, e quindi
è un equilibrio stabile. Notiamo inoltre che ω = V ′′ (0).
Esempio 2.6.3 Calcoliamo il periodo del pendolo semplice. Ricordando la (2.34),
calcoliamo V (θ) trovando una primitiva qualsiasi di −ω 2 sin θ, dove ω 2 = g/l.
Abbiamo
θ
2
′
θ
′
2
2
2
V (θ) = −
.
−ω sin θ dθ = ω (1 − cos θ) = 2ω sin
2
0
18
dx
a2 −x2
√
19 Questo
= arcsin
x
a
.
fatto è ovvio se si guarda la forma della soluzione generale (2.38); è importante notare però che
il risultato è stato ottenuto senza risolvere l’equazione .
EQUAZIONI DIFFERENZIALI
51
e di conseguenza, se 0 ≤ E < 2ω 2 , il periodo è
T =2
θM
dθ
,
θ
2
2
2 E − 2ω sin
2
−θM
(2.45)
θ
= E. La costante E, che corrispondove θM ∈ [0, π], è la soluzione di 2ω sin
2
de all’energia cinetica più potenziale della massa unitaria, si calcola in base ai dati
iniziali
θ̇2 (0)
θ̇2 (0)
θ (0)
E=
+ V (0) =
+ 2ω 2 sin2
.
2
2
2
2
2
Quindi supponendo
θ̇ (0) = 0, il pendolo parte da fermo, e θ (0) = θ0 , abbiamo E =
2ω 2 sin2 θ20 . Quindi l’intervallo, centrato nell’origine, corrispondente a V (θ) ≤ E,
è [−θ0 , θ0 ]. Possiamo quindi riscrivere la (2.45) come
T
=
2
θ0
−θ0
=
2
ω
dθ
θ0
θ
− 2ω 2 sin2
2 2ω 2 sin2
2
2
θ0
0
sin
θo
2
dθ
1−
sin2
θ
2
2 θ0
sin 2
.
Ponendo β = sin θ2o < 1, ed operando il cambio di variabile y =
che implica
1
cos
dy =
2β
sin θ2
sin θ2o
=
1
sin
β
θ
,
2
θ
1
1
θ
dθ =
dθ =
1 − sin2
1 − β 2 y 2 dθ,
2
2β
2
2β
otteniamo la seguente espressione per il periodo
T =
Siccome βy = sin
4
ω
0
1
dy
.
2
1 − y 1 − β2 y2
θ
< 1, possiamo sviluppare in serie di Taylor 1/ 1 − β 2 y 2 ,
2
1
3
β2 y2
+ β 4 y 4 + ..... ,
=1+
2
8
1 − β2 y2
52
LEZIONI DI SISTEMI DINAMICI
ottenendo così
T
=
=
4
ω
4
ω
1
0
0
1
3
β2y2
+ β 4 y 4 + ..... dy
1+
2
8
1
dy
β2y2
2
dy + ....
+
ω 0
1 − y2
1 − y2
1
1 − y2
β 2 π/4
π/2
β2
2π
1+
+ ..... .
ω
4
Ricordando che ω = g/l, e che β = sin (θ0 /2), abbiamo
1
θ0
l
1 + sin2
+ ..... ,
T = 2π
g
4
2
=
che mette in luce la ben nota non isocronia del pendolo: il periodo del pendolo, a differenza di quello dell’oscillatore armonico, dipende dal punto di partenza. E’ evidente
che se θ0 ≪ 1, ovvero se il pendolo viene lasciato andare da una posizione prossima alla verticale, allora possiamo trascurare sin2 θ20 , e gli ordini superiori giungendo
l
.
all’espressione “classica” T ≈ 2π
g
Osservando la figura 2.5, possiamo dedurre le seguenti proprietà qualitative del
moto: (i) se 0 ≤ E < 2ω 2 , abbiamo un moto periodico e limitato (di cui abbiamo
calcolato il periodo); (ii) se E = 2ω 2 abbiamo la separatrice, un moto limitato ma
aperiodico; (iii) se E > 2ω 2 , il moto è illimitato. In tal caso l’energia iniziale E è
“sufficiente” per far ruotare il pendolo intorno al proprio asse. Il caso (ii) corrisponde, per esempio, al caso limite in cui il pendolo parte praticamente dalla posizione
verticale superiore ed impiega un tempo infinito per ritornarvici.
Esempio 2.6.4 Analizziamo qualitativamente le soluzioni nel caso in cui
V (q) = Vo e−2q − 2e−q , Vo > 0.
(2.46)
Il grafico di V (q) è riportato nella figura 2.6.
Notiamo subito che E < −Vo , non è ammissibile. Per E = −Vo abbiamo un punto
di equilibrio stabile, corrispondente a q = 0, mentre per −Vo < E < 0, abbiamo
soluzioni periodiche limitate. E = 0, dà luogo alla separatrice, che corrisponde ad un
moto illimitato ma anche aperiodico, mentre per E > 0 abbiamo moti illimitati.
Calcoliamo adesso il periodo delle oscillazioni supponendo E = −βVo , con β ∈
(0, 1). Dobbiamo determinare le intersezioni di V (q) con la retta −βVo ,
−βVo = Vo e−2q − 2e−q .
Posto ξ = eq , abbiamo questa equazione da risolvere
ξ2 −
1
2
ξ+ =0
β
β
(2.47)
EQUAZIONI DIFFERENZIALI
53
Figura 2.6: Grafico di V (q), dato dalla 2.46.
V(q)
q
-V0
le cui soluzioni sono
√
1+ 1−β
ξ
,
=
+
β
√
1− 1−β
ξ− =
,
β
=⇒
√
�
�
1+ 1−β
q
,
=
ln
+
β
√
�
�
1− 1−β
q− = ln
.
β
Ricordando che |E| = βVo , il periodo è dunque
T =2
�
q+
q−
dq
2
�
= �
2 [−βVo − Vo (e−2q − 2e−q )]
2 |E|
�
q+
q−
�
dq
2e−q
e−2q
+
−1 −
β
β
Ponendo adesso ξ = eq , e tenendo presente la (2.47), l’integrale si trasforma in
2
T =�
2 |E|
�
ξ+
ξ−
2π
cioè T = �
.
2 |E|
� ξ+
dξ
dξ
2
� �
�
�
=
,
�
2
|E|
(ξ
−
ξ) (ξ − ξ− )
ξ−
+
1
2ξ
��
�
�
+
− ξ2 −
β
β
π (integrale notevole)
.
54
LEZIONI DI SISTEMI DINAMICI
2.6.2 Periodo delle oscillazioni in vicinanza di punti di equilibrio
stabile
Supponiamo che V (q) abbia un minimo isolato in q = qe , che per quanto accennato
nel caso 2 della sezione 2.6.1, è un punto di equilibrio stabile (la definizione rigorosa
di punto di equilibrio stabile sarà illustrata nel paragrafo 2.8).
Il periodo di oscillazione delle soluzioni attorno ad un minimo qe di V (q), dipende, in generale, dal valore di E (e quindi dalle condizioni iniziali). Tuttavia, se E,
benché maggiore di V (qe ), è “vicino” a V (qe ), è possibile trovare un’espressione approssimata del periodo (che sarà tanto più esatta quanto più E − V (qe ) è “piccolo”)
indipendente da E. Considerando un intorno di qe , si approssima V (q) con il suo
sviluppo di Taylor (limitato al secondo ordine)
1
V (q) ≈ V (qe ) + V ′ (qe ) (q − qe ) + V ′′ (qe ) (q − qe )2 ,
� �� �
2
(2.48)
=0
dove V ′′ (qe ) > 0 (si ricordi che qe è un minimo isolato). Gli estremi dell’intervallo
dove si svolge il moto sono dati da
�
2 (E − V (qe ))
qm = qe −
,
V ′′ (qe )
1 ′′
2
V (qe ) + V (qe ) (q − qe ) = E, =⇒
�
2
2 (E − V (qe ))
.
qM = qe +
V ′′ (q )
e
Quindi, introducendo ξ = q − qe , si ha la seguente espressione approssimata di T
T
≈ 2
−
=
2(E−V (qe ))
V ′′ (qe )
�
2(E−V (qe ))
V ′′ (qe )
2
�
V ′′ (qe )
Da cui, ricordando che
�a
−a
−
2(E−V (qe ))
V ′′ (qe )
√ dx
a2 −x2
dξ
� �
�
1
2 E − V (qe ) − V ′′ (qe ) ξ 2
2
�
2(E−V (qe ))
V ′′ (qe )
= arcsin
�
dξ
.
2 (E − V (qe ))
− ξ2
V ′′ (qe )
� x ��a
�
a −a = π, ricaviamo
2π
.
T ≈�
V ′′ (qe )
(2.49)
Quando E → V (qe ) (livello di energia della posizione di equilibrio) il periodo
(approssimato) delle piccole oscillazioni non dipende da E, ma soltanto da V ′′ (qe ). In
pratica, ricordando l’esempio 2.6.2, la (2.49) altro non è che il periodo di un oscillatore
armonico in cui ω = V ′′ (qe ).
EQUAZIONI DIFFERENZIALI
55
2.6.3 Generalizzazione del caso conservativo
In questa sezione vogliamo considerare una forma più generale dell’equazione (2.27),
analizzando le equazioni del tipo
a (q) q̈ +
a′ (q) 2
q̇ = f (q) ,
2
(2.50)
da (q)
. Introduciamo, al
dq
solito, l’energia potenziale V (q) tramite la (2.29), la (2.50) potrà essere riscritta come
dove a (q) è una funzione strettamente positiva, e a′ (q) =
a (q) q̈ +
a′ (q) 2
q̇ = −V ′ (q) ,
2
(2.51)
dV (q)
. Procedendo come nella sezione 2.6, se moltiplichiamo la
dq
(2.51) per q̇, è immediato verificare che
d a (q) 2
a (q) 2
q̇ + V (q) = 0, =⇒
q̇ + V (q) = E,
(2.52)
dt
2
2
essendo V ′ (q) =
dove, al solito, l’energia E è specificata dalle condizioni iniziali q (0), e q̇ (0). Il tera (q) 2
q̇ è detto energia cinetica e viene usualmente indicato con T . Tuttavia,
mine
2
a (q) 2
q̇ , al fine di evitare confusione di
limitatamente a questa sezione, poniamo E =
2
simboli.
Anche in questo caso il moto potrà svolgersi solo in una componente connessa di
V (q) ≤ E, e la (2.33) diventa
q(t)
a (η)
t − t0 =
dη .
2(E − V (η))
q0
L’analisi effettuata per il caso a = 1, sulla periodicità o aperiodicità del moto può
essere ripetuta in maniera analoga.
Come vedremo nella sezione 2.8, i punti di equilibrio stabile dell’equazione (2.51)
risultano essere sempre i minimi isolati di V (q). Vediamo allora come si generalizza
a (q) 2
la formula (2.49) nel caso in cui l’energia cinetica sia
q̇ . Se introduciamo ξ =
2
˙
q − qe , abbiamo ξ = q̇, e sviluppando l’energia cinetica in un intorno di qe , cioè di
ξ = 0, abbiamo
1
1 ′′
′
2 ˙2
a (qe ) + a (qe ) ξ + a (qe ) ξ ξ .
E≈
2
2
·
Ora se vogliamo un’approssimazione limitata ai termini quadratici in ξ, e ξ, come si
dice un’approssimazione al secondo ordine, otteniamo
E≈
1
a (qe ) ξ˙2 .
2
56
LEZIONI DI SISTEMI DINAMICI
Di conseguenza, ricordando la (2.48), la riscrittura approssimata della (2.52) è
1
1
a (qe ) ξ̇ 2 + V ′′ (qe ) ξ 2 = E − V (qe ) ,
2
2
che è esattamente la (2.37) dell’oscillatore armonico, se poniamo
ω2 =
V ′′ (qe )
,
a (qe )
E − V (qe )
è l’energia meccanica. Pertanto, siccome il periodo dell’oscillatore
a (qe )
armonico è 2π/ω, abbiamo che il periodo (approssimato) delle piccole oscillazioni
attorno a qe è
�
ed
T ≈ 2π
a (qe )
.
V ′′ (qe )
2.7 Il piano delle fasi
Abbiamo già visto che ogni equazione differenziale scalare del secondo ordine, q̈ =
f (q̇, q, t) può essere sempre trasformata in un sistema di due equazioni in due incognite, semplicemente definendo v = q̇ e quindi ponendo
�
q̇ = v,
(2.53)
v̇ = f (v, q, t) .
La soluzione di (2.53) è ora una coppia di funzioni (q(t), v(t)). Possiamo rappresentare
la soluzione tramite un punto che si muove in un piano cartesiano di ascissa q e ordinata
v. Questa rappresentazione è particolarmente utile nel caso dei sistemi autonomi, il
piano (q, v) così definito è detto piano delle fasi.
�
q̇ = v,
(2.54)
v̇ = f (v, q) .
Definiamo orbita del sistema il luogo dei punti del piano {(q, v) | q = q(t), v =
v(t), −∞ < t < +∞}, dove (q(t), v(t)) è una soluzione di (2.54). Poiché, in virtù del teorema di esistenza e unicità, nel caso di un sistema autonomo due soluzioni
(q1 (t), v1 (t)) e (q2 (t), v2 (t)) che corrispondono alle stesse condizioni iniziali assunte
a due istanti diversi, t1 e t2 (cioè (q1 (t1 ) = q0 , v1 (t1 ) = v0 ) e (q2 (t2 ) = q0 , v2 (t2 ) =
v0 )) sono l’una la traslata temporale dell’altra, i.e. q1 (t) = q2 (t − (t2 − t1 )), v1 (t) =
v2 (t − (t2 − t1 )), ne risulta che le orbite di queste due soluzioni coincidono, ovvero un
punto (q, v) appartiene all’orbita della prima soluzione se e solo se appartiene all’orbita della seconda. Di conseguenza per ogni punto del piano delle fasi passa una e una
sola orbita.
Nella figura 2.7 abbiamo riportato un esempio delle orbite nel piano delle fasi
dell’equazione (2.27), ovvero del sistema
q̇ = v,
dV (q)
.
v̇ = f (q) = −
dq
EQUAZIONI DIFFERENZIALI
57
V(q)
E CORRISPONDENTE ALLA SEPARATRICE
E CORRISPONDENTE ALLA SEPARATRICE
q
v
q
SEPARATRICE
Figura 2.7: Orbite sul piano delle fasi.
Le orbite corrispondono al V (q) rappresentato nella parte alta della figura. In questo
caso la rappresentazione delle orbite sul piano delle fasi è agevole. Infatti, sfruttando
la (2.40) abbiamo
v = ± 2 (E − V (q)).
Le curve che rappresentano le orbite (come mostrato nella parte inferiore della figura
2.7) sono simmetriche rispetto all’asse q e si ottengono tracciando schematicamente il
grafico di
v = 2 (E − V (q)), e poi di v = − 2 (E − V (q)).
Quest’ultimo poi si ottiene semplicemente ribaltando il primo grafico
rispetto all’as
se q. Evidentemente il dominio dove disegnare il grafico v = 2 (E − V (q)), sarà
individuato, una volta fissato E, da punti q che soddisfano V (q) ≤ E. Inoltre, l’andamento del grafico è facilmente rappresentabile in quanto v è, in prima approssimazione,
“proporzionale” alla differenza fra V (q) ed E: maggiore è tale differenza maggiore
sarà v.
La rappresentazione delle orbite nel caso di equazioni del tipo (2.51) non è, in
generale, fattibile senza l’ausilio di un programma di calcolo. Infatti la (2.52) comporta
v=±
2 (E − V (q))
.
a (q)
Ora, mentre è facile determinare il dominio della funzione (è esattamente lo stesso
procedimento di prima, V (q) ≤ E), non è assolutamente facile tracciare il grafico
di v in funzione di q. In questo caso, infatti, non c’è più “proporzionalità” fra v e la
differenza fra E e V (q), a causa del fattore 1/a (q).
58
LEZIONI DI SISTEMI DINAMICI
2.8 Punti di equilibrio, stabilità
Un punto del piano delle fasi (qe , ve ) si dice punto di equilibrio per il sistema autonomo (2.54) se la coppia di funzioni q(t) = qe ∀ t, e v(t) = ve ∀ t, è soluzione del sistema
(2.54). In virtù della forma del sistema (2.54), si ha immediatamente ve = 0, mentre qe
deve essere una soluzione dell’equazione (non più differenziale) f (qe , 0) = 0. Talvolta
qe viene anche detta configurazione di equilibrio.
Come abbiamo visto nelle precedenti sezioni, nel caso dell’equazione q̈ = f (q) una
configurazione di equilibrio qe è un punto di massimo e minimo relativo della funzione
V (q), siccome f (q) = −V ′ (q). Abbiamo già osservato che i minimi (isolati) della V
sono punti di equilibrio “stabile”. Vogliamo ora precisare questo concetto introducendo
la definizione di stabilità secondo Lyapunov20 .
La definizione si applica in generale ai punti di equilibrio di un sistema di n equazioni differenziali in n incognite, o equazione differenziale in Rn , e quindi la daremo
direttamente in questo caso generale.
Consideriamo adesso un sistema di equazioni differenziali autonomo
ẋ = F (x) ,
(2.55)
dove x : t → x(t) ∈ Rn è la funzione vettoriale incognita e F : x → F (x) ∈ Rn
è una funzione da Rn in Rn . In seguito indicheremo con x(t; x0 , t0 ) la soluzione al
tempo t che al tempo t0 occupava il punto x0 (in altri termini la soluzione del sistema
(2.55) corrispondente ai dati iniziali x(t0 ) = x0 ).
Definizione 2.8.1 Il punto xe ∈ Rn si dice punto, o configurazione, di equilibrio per
il sistema autonomo (2.55), se la funzione x(t) ≡ xe , è soluzione del problema di
Cauchy
ẋ = F (x) ,
x(t0 ) ≡ xe .
E’ immediato constatare che i punti di equilibrio xe sono tutti e soli quelle n-uple che
soddisfano il sistema di equazioni
F1 (x1 , ...., xn ) = 0,
F2 (x1 , ...., xn ) = 0,
F (xe ) = 0 , ⇐⇒
(2.56)
..
.
Fn (x1 , ...., xn ) = 0.
Definizione 2.8.2 Un punto di equilibrio xe si dice stabile se: per ogni t0 e per ogni
r > 0, esiste un r0 > 0 tale che sia verificata la disuguaglianza
�x(t; x0 , t0 ) − xe � < r ,
per ogni t > t0 e per tutti i dati iniziali x0 che soddisfano21
20 Aleksandr
21 Si
�x0 − xe � < r0 .
Mikhailovich Lyapunov, matematico russo, 1857-1918
noti la somiglianza tra questa definizione e la definizione “ε-δ” di limite.
EQUAZIONI DIFFERENZIALI
59
Figura 2.8: Stabilità alla Lyapunov
x2
x (t)
xo
xe
x1
Il concetto di stabilità del punto xe è schematicamente rappresentato dalla figura 2.8. Il
cerchio di raggio maggiore corrisponde alla circonferenza di raggio r. Fissato r, è possibile determinare r0 tale che, una qualunque orbita che “parte” da un punto all’interno
della circonferenza r0 , rimane all’interno della circonferenza di raggio r.
2.8.1 Il criterio di Lyapunov
Una condizione sufficiente per stabilire se una posizione di equilibrio è stabile è data
dal seguente teorema, sempre dovuto a Lyapunov.
Teorema 2.8.1 Se una posizione di equilibrio xe per il sistema (2.55), cioè xe è
soluzione della (2.56), ammette una funzione di Lyapunov, allora è stabile.
Ovviamente per dar senso al teorema bisogna dire cosa è una funzione di Lyapunov.
Definizione 2.8.3 Una funzione Λ definita in un intorno Uxe del punto xe , si dice
funzione di Lyapunov per il punto di equilibrio xe se:
1. Λ : Uxe → R è una funzione di classe C 1 ;
2. Λ(xe ) = 0 e Λ(x) > 0 per ogni x �= xe ;
3. ∇Λ(x) · F (x) ≤ 0 per ogni x ∈ Uxe .
Questa definizione22 necessita di qualche commento. A parte la richiesta “tecnica” di
regolarità, la condizione 2 ci dice che la funzione Λ ha un minimo isolato23 nel punto
di equilibrio, mentre la terza condizione implica che la funzione Λ(x(t)), ottenuta
22 Con
∂Λ
∂Λ
il simbolo ∇ si indica l’operatore gradiente, quindi ∇Λ(x) = ( ∂x
, . . . , ∂x
).
n
1
punto xe è un minimo isolato per una funzione f se esiste un intorno di U di xe tale che f (y) >
f (xe ) per ogni y ∈ U , y �= xe .
23 Un
60
LEZIONI DI SISTEMI DINAMICI
componendo Λ(x) con una soluzione x(t) di (2.55), è una funzione non crescente di t.
Infatti
d
dx
Λ(x(t)) = ∇Λ(x(t)) ·
= ∇Λ(x(t)) · F (x(t)) ≤ 0 .
(2.57)
dt
dt
Dim. Scegliamo24 un numero R > 0 e sia Bxe (R) la sfera, aperta, di centro xe e di
raggio R. Sia inoltre λ = min∂Bxe (R) Λ(x) il valore minimo assunto dalla funzione Λ
sul bordo questa sfera25 ; per le nostre ipotesi si ha λ > 0.
Siccome Λ è di classe C 1 , esiste finito max �∇Λ (x)�, ed è sicuramente posix∈Bxe (R)
tivo26 . Poniamo pertanto
G=
max
x∈Bxe (R)
�∇Λ (x)� > 0.
Dunque, ∀ x ∈ Bxe (R), abbiamo
Λ (x) = Λ (x) − Λ (xe ) ≤ G �x − xe � .
(2.58)
=0
λ R
,
, e l’intorno sferico di xe di raggio r, cioè
Consideriamo adesso r < min
2G 2
27
Bxe (r). E’ chiaro che Bxe (r) ⊂ Bxe (R). Inoltre, in virtù della (2.58), ∀ x ∈
Bxe (r), cioè ∀ x tale che �x − xe � < r, abbiamo
λ GR
λ
λ R
,
= min
,
≤ .
Λ (x) ≤ G �x − xe � < G r < G min
2G 2
2 2
2
In altri termini, abbiamo che Λ (x) < λ/2, ∀ x ∈ Bxe (r). Ora, la coppia R e r soddisfa le condizioni della definizione di equilibrio stabile secondo Lyapunov. Infatti se
prendiamo una condizione iniziale x0 contenuta in Bxe (r), si ha che Λ(x(t; x0 , t0 )) ≤
Λ(x0 ) < λ/2, e quindi, ∀ t > t0 , il punto x(t; x0 , t0 ) deve appartenere a Bxe (r),
e di conseguenza a Bxe (R). Se infatti la soluzione x(t; x0 , t0 ) uscisse da Bxe (R),
28
allora
ad un certo
istante t̂ la soluzione toccherebbe il bordo di Bxe (R), e quindi
Λ x(t̂; x0 , t0 ) ≥ λ. Ma ciò contraddirebbe l’ipotesi di non crescenza della funzione
Λ vista come funzione del tempo dal momento che si avrebbe
Λ (x0 ) = Λ (t0 ) < Λ t̂ = Λ x(t̂; x0 , t0 ) .
2.8.2 Asintotica stabilità
Se xe , oltre a essere un punto di equilibrio stabile, soddisfa la seguente condizione:
esiste un intorno Uxe di xe tale che per ogni t0 e per ogni x0 ∈ Uxe si ha
lim x(t; x0 , t0 ) = xe
t→+∞
24 R
andrà scelto in modo che Bxe (R) ⊂ Uxe
che il minimo esiste perché la funzione Λ è continua e perché ∂Bxe (R) è un compatto.
26 Se infatti max
�∇Λ (x)� = 0, allora ∇Λ (x) ≡ 0, e cioè Λ (x) ≡ 0, ∀x ∈ Bxe (R), in
x∈Bxe (R)
palese contraddizione con l’ipotesi 2.
27 In particolare B
xe (r) è separato dal bordo di Bxe (R).
28 Si ricordi che λ = min
∂Bxe (R) Λ(x).
25 Notiamo
EQUAZIONI DIFFERENZIALI
61
la posizione si dice di equilibrio asintoticamente stabile.
Anche in questo caso abbiamo un criterio sufficiente per l’asintotica stabilità; se
nella terza condizione per la funzione di Lyapunov sostituiamo il segno ≤ con la disuguaglianza stretta <, che deve valere per tutti gli x con l’eccezione di xe (dove
ovviamente abbiamo il segno = poiché sia F che ∇Λ si annullano), allora la posizione
di equilibrio è asintoticamente stabile.
Vediamo la dimostrazione di questa versione del criterio di Lyapunov.
Per prima cosa osserviamo che xe è una posizione di equilibrio stabile: dalla stabilità segue che possiamo scegliere due costanti positive R e r0 in modo che tutte le
soluzioni con dato iniziale in Bxe (r0 ) siano contenute in Bxe (R) per tutti tempi successivi al tempo iniziale. Sia x(t) una tale soluzione. Poiché Λ è una funzione di
Lyapunov, la funzione del tempo Λ(x(t)) è una funzione decrescente e quindi esiste
limt→∞ Λ(x(t)) = λ. Poiché Λ ≥ 0 in Bxe (R), avremo λ ≥ 0.
Se λ = 0, allora necessariamente x(t) → xe , poiché è l’unico punto dove Λ = 0.
Supponiamo invece che sia λ > 0. Se Bxe (δ) denota la sfera di centro xe e raggio
δ, scegliamo δ in modo che Λ (x) < λ/2 per ogni29 x ∈ Bxe (δ). Ora per t sufficientemente grande, x(t) non può appartenere alla sfera Bxe (δ); ovvero, per t sufficientemente grande, x(t) ∈ Bxe (R)\Bxe (δ). Ma la derivata di Λ(x(t)) è strettamente
negativa per la condizione ∇Λ(x)·F (x) < 0. Infatti, poiché ∇Λ(x)·F (x) è una funzione continua30 definita sul compatto Bxe (R)\Bxe (δ), per tutti i t sufficientemente
grandi
d
Λ(x(t)) = ∇Λ(x (t)) · F (x (t)) ≤
max
∇Λ(x) · F (x) = C < 0.
dt
x∈Bxe (R)\Bxe (δ)
Ma questo implica limt→∞ Λ(x(t)) = −∞, il che è assurdo poiché Λ(x(t)) ≥ 0.
Un esempio di configurazione di equilibrio asintoticamente stabile verrà illustrato
nella sezione 2.11. Un criterio sufficiente per l’asintotica stabilità è dato dal seguente
teorema di Lyapunov sulla stabilità linearizzata:
Teorema 2.8.2 Sia xe un punto di equilibrio per il sistema (2.55). Sia A la matrice
delle derivate parziali delle componenti di F calcolate in xe , ovvero
A=
∂F1
∂x1
∂F2
∂x1
∂F1
∂x2
∂F2
∂x2
···
···
∂F1
∂xn
∂F2
∂xn
∂Fn
∂x1
∂Fn
∂x2
···
∂Fn
∂xn
..
.
..
.
..
.
.
Se tutti gli autovalori di A hanno parte reale negativa, la posizione di equilibrio è
asintoticamente stabile. Più precisamente esiste un numero positivo δ tale che per ogni
x0 ∈ Bxe (δ) sia ha
�x(t; t0 , x0 ) − xe � < a�x0 − xe �e−αt ,
con a e α costanti indipendenti da x0 .
29 Notiamo
30 Λ
che la sfera Bxe (δ) esiste per la continuità di Λ.
è di classe C 1 , e, ovviamente, F è continua
62
LEZIONI DI SISTEMI DINAMICI
La dimostrazione di questo teorema è piuttosto complessa (ma non specialmente “difficile”) e viene omessa: si può trovare in molti testi sulle equazioni differenziali ordinarie31 .
2.8.3 Punti di equilibrio per sistemi conservativi: il criterio di Dirichlet
Torniamo alla equazione q̈ = f (q), o meglio al sistema equivalente
�
q̇ = v,
v̇ = f (q) .
(2.59)
In accordo con quanto detto nel paragrafo precedente, un punto di equilibrio è dato,
nel piano (v, q), da (0, qe ), dove qe è tale che f (qe ) = 0, ovvero da V ′ (qe ) = 0, dove
V (q) è l’energia potenziale definita dalla (2.29). Consideriamo la seguente funzione
di v e q
1
Λ(q, v) = v 2 + V (q) − V (qe ) .
(2.60)
2
A questo punto possiamo enunciare il seguente
Criterio di Dirichlet: Una configurazione di equilibrio qe in cui si realizza un minimo
isolato dell’energia potenziale è stabile secondo Lyapunov.
La dimostrazione è elementare. Infatti è sufficiente far vedere che la funzione Λ(q, v)
è una funzione di Lyapunov per il punto di equilibrio (0, qe ) (i dettagli della verifica
sono lasciati per esercizio).
Quello che abbiamo visto per un’equazione scalare può essere generalizzato al caso
vettoriale. Supponiamo di avere un sistema di equazioni del tipo
q̈1 = f1 (q1 , . . . , qn ) ,
q̈2 = f2 (q1 , . . . , qn ) ,
..
.
q̈n = fn (q1 , . . . , qn ) ,
che, scritto in forma compatta, acquista la forma
q̈ = f (q) ,
(2.61)
dove f : Rn → Rn , e dove q (t) : R → Rn è la funzione vettoriale incognita. Diremo
che il sistema è conservativo se la funzione f è il gradiente di una funzione scalare
−V (q), detta sempre energia potenziale. Ovvero
∂V (q1 , . . . , qn )
−
1
f1 (q1 , . . . , qn )
∂V (q ∂q
,
.
.
.
,
q
)
1
n
f2 (q1 , . . . , qn ) −
.
∂q
2
=
f (q) = −∇V (q) , cioè
..
..
.
.
fn (q1 , . . . , qn )
∂V (q , . . . , q )
1
n
−
∂qn
(2.62)
31 Si
veda p.e. L.S. Pontrjagin “Ordinary differential equations”, Reading (Mass.), Addison-Wesley, 1962.
EQUAZIONI DIFFERENZIALI
63
Anche in questo caso è facile dimostrare che la funzione scalare
H(q, q̇) =
1 2
|q̇| + V (q),
2
è un integrale primo, ovvero che la sua derivata lungo la soluzioni è nulla
dH
= q̇ · q̈ + ∇V · q̇ = q̇ · (q̈ + ∇V ) = 0.
dt
q̈−f (q)=0
Come conseguenza possiamo enunciare il principio di Dirichlet anche per i sistemi
conservativi multidimensionali: se il punto q e è un minimo isolato per la funzione
V (q) allora (0, q e ) è un punto di equilibrio stabile. In questo caso la funzione di
Lyapunov è
Λ(q, v) = H(q, v) − V (q e ) =
1 2
|v| + V (q) − V (q e ) .
2
Riprenderemo questo argomento della sezione 5.9 dove studieremo la stabilità dei
sistemi lagrangiani.
2.9 I potenziali isocroni
Abbiamo visto nell’esempio 2.6.2 che le oscillazioni di un sistema soggetto a una
energia potenziale quadratica
ω2
V (q) = − q 2 ,
(2.63)
2
(oscillatore armonico) sono isocrone.
Vogliamo ora dimostrare che (2.63) è, sostanzialmente, l’unica energia potenziale
che possiede questa proprietà. In altri termini dimostriamo il seguente:
Teorema 2.9.1 Se tutti i moti che si svolgono sotto l’azione di una energia potenziale
V (q), simmetrica rispetto al suo minimo, sono periodici e isocroni, allora esistono
k > 0, q0 e U0 tali che V (q) ha la forma
V (q) =
k
(q − q0 )2 + V0
2
(2.64)
Dim32 . La costante V0 è introdotta solo per ragioni di completezza e possiamo supporla nulla senza perdere di generalità. Analogamente, con un’ovvia traslazione delle
coordinate, possiamo anche assumere che q0 = 0. In altri termini, possiamo quindi
limitarci a considerare energie potenziali che soddisfino
V (0) = 0 .
(2.65)
L’ipotesi di simmetria della V (q) significa che l’energia potenziale è una funzione pari,
ovvero
V (q) = V (−q) .
(2.66)
32 La dimostrazione è ripresa, nelle sue linee generali, da G. Gallavotti, Meccanica Elementare, Boringheri,
Torino 1980
64
LEZIONI DI SISTEMI DINAMICI
(vedremo poi cosa cambia quando togliamo questa limitazione).
Possiamo inoltre assumere che
q
dV
(q) > 0 , ∀ q �= 0,
dq
(2.67)
che implica che l’origine q = 0 è un punto di minimo isolato per l’energia potenziale,
e inoltre che valga
lim V (q) = +∞.
(2.68)
|q|→∞
Infatti, se così non fosse, il sistema ammetterebbe o orbite illimitate, o orbite limitate
non periodiche (dimostrarlo).
Fissiamo adesso E > 0 e denotiamo con q(E) la soluzione positiva di V (q) = E.
Ne segue che, in virtù dell’ipotesi fatte, e in particolare della (2.66), il periodo del moto
è dato da
q(E)
dq
T (E) = 4
.
(2.69)
2(E − V (q))
0
La funzione V è una funzione crescente di q per q > 0, e quindi possiamo invertirla
⇔
v = V (q) ,
q = Q (v) .
(2.70)
Possiamo cambiare coordinate in (2.69) ponendo s = V (q), e quindi, sfruttando la
(2.70), dq = Q′ (s) ds. Otteniamo
T (E) = 4
0
E
Q′ (s)ds
.
2(E − s)
(2.71)
Notiamo che la funzione T (E) in (2.71) è ora definita come una “trasformata” della
1
funzione Q′ . A parte questa osservazione, moltiplichiamo la (2.71) per √
, ed
v−E
integriamo in E fra 0 e v
v
v
E
T (E)
1
Q′ (s) ds
√
√
√ √
dE =
4
dE
v−E
v−E
2 E−s
0
0
0
T (E)
=
4
√
2
v
0
0
E
Q′ (s)
√
√
ds dE.
v−E E−s
(2.72)
Riferendoci alla figura 2.9, possiamo valutare l’integrale doppio che appare nella (2.72)
scambiando l’ordine di integrazione: integrando cioè prima in dE fra s e v, e poi in ds
fra 0 e v. Otteniamo così
v
v v
T (E)
Q′ (s)
4
√
√
√
dE = √
dE ds
v−E
v−E E−s
2 0
0
s
v
v
4
dE
′
√
√
= √
ds.
Q (s)
v−E E−s
2 0
s
EQUAZIONI DIFFERENZIALI
65
Figura 2.9: Integrale doppio.
s
s
v
E
v
v (....) dE
ds
∫0 ∫s
E (....) ds
dE
∫0 ∫0
v
v
E
v
dE
√
√
, è un integrale notevole e vale π per ogni v ed s. Abbiamo
v−E E−s
s
quindi33
v
T (E)
4π v ′
4π
√
dE = √
(2.75)
Q (s)dv = √ Q (v) ,
v−E
2 0
2
0
dal momento che Q (0) = 0. Sfruttando adesso l’ipotesi che T (E) = T , ∀ E, ed il
v dE
√
= 2 v, abbiamo
fatto che 0 √
v−E
√
v
4π
dE
2 √
√
T v.
= √ Q (v) , =⇒ Q (v) =
T
2π
v−E
2
0
Ora
√
2 v
Quindi ricordando che q = Q (v) è l’inversa di v = V (q), possiamo scrivere
√
2 √
2π 2
q = Q (v) =
T v, , =⇒ v = V (q) = 2 q 2 .
2π
T
(2.76)
33 La
(2.75) è un caso particolare dell’equazione di Abel
t
ψ(τ )dτ
φ(t) =
(t − τ )
0
la cui soluzione è data da
ψ(t) =
1
π
φ(0)
+
t1/2
0
t
φ′ (τ )dτ
(t − τ )
(2.73)
si veda J.R. Cannon, The one-dimensional heat equation, Addison-Wesley, Menlo Park, CA, 1984.
(2.74)
66
LEZIONI DI SISTEMI DINAMICI
Possiamo ora vedere cosa succede se eliminiamo l’ipotesi (2.66). In questo caso V :
R −→ [0, +∞), non è simmetrica rispetto all’origine e dunque porremo34
+
V (q) , se q ≥ 0,
V (q) =
−
V (q) , se q ≤ 0,
con V + (0) = V − (0) = 0. Dato E > 0, Indichiamo con q + (E) la soluzione
di V + (q) = E, mentre q − (E) denota la soluzione di V − (q) = E. Ovviamente
q + (E) > 0, mentre q − (E) < 0. In generale, q + (E) �= |q − (E)|, dal momento che
la V non è più simmetrica rispetto all’origine. Introduciamo anche le inverse di V + e
V − , ponendo
Q+
Q+ : [0, +∞) −→ [0, +∞), v −→ q = Q+ (v) > 0,
Q−
Q− : [0, +∞) −→ [0, −∞), v −→ q = Q− (v) < 0.
Il periodo è dato da
T (E) =
2
�
q+ (E)
q− (E)
=
2
��
0
q− (E)
=
2
��
dq
�
2(E − V (q))
dq
�
+
2(E − V − (q))
q+ (E)
0
che ci consente di scrivere
dq
�
�
−
2(E − V + (q))
q+ (E)
0
dq
�
2(E − V + (q))
� |q− (E)|
0
ds
�
�
�
(2.77)
,
2(E − V − (−s))
�
�
T (E) = 2 T + (E) − T − (E) ,
dove
T + (E) =
�
0
q+ (E)
dq
�
,
2(E − V + (q))
T − (E) =
� |q− (E)|
0
dq
�
.
2 (E − V − (−q))
Quindi, a parte il fattore 4, T + (E) e T − (E), altro non sono che la (2.69). Ora se
imponiamo che né T + (E) né T − (E) dipendano da E, possiamo procedere esattamente
come prima giungendo a
√
2√
+
−
Q (v) − Q (v) =
v,
(2.78)
π
Quindi abbiamo infinite energie potenziali non simmetriche isocrone, ma ciascuna di
esse è ottenuta “deformando” un’energia della forma (2.76) in modo
√ che, ∀ v > 0, la
differenza fra Q+ (v) e Q− (v) si mantenga sempre proporzionale a v.
34 V +
(q) e V − (q) sono comunque positive e strettamente monotone.
EQUAZIONI DIFFERENZIALI
67
Figura 2.10: Grafico di Q+ (v) e Q− (v), dati dalla (2.79).
Q+(v)
q
v
Q- (v)
Esempio 2.9.1 Se consideriamo
√
v
2√
+
,
Q (v) =
v− 2
2π
v +1
√
v
2√
Q (v) = −
,
v− 2
2π
v +1
−
(2.79)
i cui grafici sono riportati nella figura 2.10, abbiamo che la (2.78) è soddisfatta, ed
inoltre sia Q+ che Q− sono due funzioni monotone e quindi invertibili. Invertendole
otteniamo
√
2√
v
+
q = Q (v) =
, v = V + (q) definita per q > 0,
v− 2
2π
v +1
√
2√
v
, v = V − (q) definita per q < 0,
q = Q− (v) = −
v− 2
2π
v +1
da cui possiamo ricostruire V (q)
2.10 Sistemi lineari bidimensionali
Per lo studio dei sistemi di equazioni differenziali autonome
ẋ = F (x)
è fondamentale la comprensione del caso lineare, cioè del caso in cui la funzione F (x)
è una funzione lineare.
Ci limiteremo al caso di sistemi bidimensionali, in quanto per essi è possibile scrivere delle formule generali per la soluzione ed è possibile visualizzare bene le soluzioni
nel piano delle fasi.
68
LEZIONI DI SISTEMI DINAMICI
Tuttavia il caso bidimensionale non è del tutto rappresentativo di cosa avviene per
dimensioni superiori (già da d = 3). La principale ragione è di ordine topologico.
Ricordiamo che per un sistema autonomo da ogni punto dello spazio delle fasi passa
una e una sola orbita (in virtù del teorema di unicità e dell’invarianza temporale delle
soluzioni). Questo implica che ogni orbita nel piano delle fasi (d = 2) divide il piano
stesso stesso in due regioni (“dentro” e “fuori” per un orbita chiusa, “riva destra” e
“riva sinistra” per una soluzione con orbita illimitata) che non possono essere connesse
da una soluzione del sistema. Questo non è più vero già per d = 3.
Vediamo ora come si trova la soluzione di un sistema di equazioni differenziali
della forma
ẋ = ax + by,
(2.80)
ẏ = cx + dy,
che scriveremo in forma vettoriale
(2.81)
ẋ = Ax,
dove A è la matrice
A=
e x il vettore
x=
a
c
b
d
.
x
y
(2.82)
,
(2.83)
Consideriamo adesso un cambiamento di variabili, dato dalla seguente trasformazione invertibile35
x (t)
α β
ξ (t)
=
,
(2.84)
y (t)
γ δ
η (t)
dove α, β, γ e δ sono costanti. La (2.84) può essere anche scritta nella seguente forma
compatta
x (t) = Vξ (t) , ⇔ ξ (t) = V−1 x (t) .
Siccome i coefficienti della matrice V sono indipendenti dal tempo
ẋ = Vξ̇,
ξ̇ = V−1 ẋ.
⇔
Quindi, moltiplicando a destra per V−1 entrambe i membri della (2.81) si ottiene
−1
−1
−1
V−1 x= V−1 AV V−1 x ,
V ẋ = V Ax = V AV
·
ξ
I
ξ
cioè
ξ̇ = V−1 AV ξ .
(2.85)
Se adesso scegliamo opportunamente la matrice V, potremo, almeno in certi casi, fare
in modo che
V
35 L’invertibilità
−1
AV =
λ1
0
della (2.84) è garantita dal fatto che det
0
λ2
α
γ
β
δ
.
= 0.
EQUAZIONI DIFFERENZIALI
69
Se così fosse, il sistema (2.85) diventa
ξ̇ = λ1 ξ ,
la cui integrazione è immediata36
ξ = C1 eλ1 t ,
(2.86)
η̇ = λ2 η ,
(2.87)
η = C2 eλ2 t ,
dove C1 e C2 sono due opportune costanti di integrazione.
Ora, il fatto che V−1 AV possa, o non possa, esser ricondotta ad una forma diagonale dipende dalla diagonalizzabilità, o meno, della matrice A. Quindi, se λ1 e λ2 sono
i due autovalori di A, e se supponiamo, per il momento, che det A �= 0 (che implica37
λ1 λ2 �= 0), possiamo distinguere quattro casi:
1. la matrice A ha due autovalori reali distinti λ1 e λ2 ;
2. la matrice A ha due autovalori reali coincidenti λ1 = λ2 con molteplicità geometrica due;
3. la matrice A ha due autovalori reali coincidenti λ1 = λ2 con molteplicità geometrica uno;
4. la matrice A ha due autovalori complessi coniugati λ1 = α + iβ e λ2 = α − iβ.
�
�
�
xλ1
xλ2
, xλ2 =
i due autovettori corrispondenti a λ1
Caso 1. Siano xλ1 =
yλ1
yλ2
e λ2 . I due vettori xλ1 , xλ2 sono linearmente indipendenti38 e possiamo considerarli
normalizzati. Introduciamo la matrice V, le cui colonne sono rispettivamente xλ1 e
xλ2
�
�
�
�
xλ1 xλ2
,
V = xλ1 xλ2 =
yλ1 yλ2
�
abbiamo det V �= 0, e quindi V−1 è ben definita. Non solo, ma è facile verificare che
�
�
�
� �
� �
� λ1 0
AV = Axλ1 Axλ2 = λ1 xλ1 λ2 xλ2 = xλ1 xλ2
,
0 λ2
36 Si
veda l’esempio 2.4.1.
sappiamo det A = λ1 λ2 .
38 Se x , x
λ1
λ2 non fossero linearmente indipendenti potremmo supporre xλ1 = βxλ2 . Tuttavia
Axλ1 = λ1 xλ1 , Axλ2 = λ2 xλ2 , comporta λ2 /λ1 = 1, che contraddice l’ipotesi λ1 �= λ2 . Infatti
λ1 xλ1 = Axλ1 = βAxλ2 = βλ2 xλ2 , che confrontata con xλ1 = βxλ2 , implica
λ2
λ2
xλ2 , =⇒
= 1.
xλ1 = β
λ1
λ1
37 Come
=β
Di conseguenza xλ1 , xλ2 sono linearmente indipendenti.
70
LEZIONI DI SISTEMI DINAMICI
cioè
AV = V
e quindi
V−1 AV =
(2.88)
λ1
0
−1
V V
I
0
λ2
λ1
0
(2.88)
,
0
λ2
.
(2.89)
Dunque le nuove variabili dipendenti ξ (t) e η (t) soddisfano il sistema (2.86), la cui
soluzione è (2.87). In pratica il sistema (2.80) è stato disaccoppiato, in quanto l’equazione per ξ̇ dipende solo da ξ, e quella per η̇ solo da η. Per ritornare alle variabili x (t)
e y (t) usiamo la (2.84), ottenendo
C1 eλ1 t
x (t)
= xλ1 xλ2
,
λ t
y (t)
C2 e 2
V
x(t)
ξ(t)
che, scritta in forma più compatta, diventa
x (t) = xλ1 C1 eλ1 t + xλ2 C2 eλ2 t .
(2.90)
E’ facile verificare che (2.90) fornisce, al variare delle costanti C1 e C2 , tutte le soluzioni dell’equazione (2.81). Per dimostrare ciò bisogna infatti far vedere che, per ogni
condizione iniziale x0 , è possibile determinare le costanti C1 e C2 in modo che
C1 xλ1 + C2 xλ2 = x0 .
(2.91)
Ma l’equazione (2.91) nelle incognite C1 e C2 si scrive anche così
C1
= x0 ,
V
C2
ed ha sempre una e una sola soluzione dal momento che det V �= 0.
Caso 2. Adesso consideriamo il caso λ1 = λ2 = λ, a cui corrispondono due autovettori indipendenti x1 e x2 (che costituiscono la base dell’autospazio relativo a λ).
Consideriamo adesso il generico vettore v = αx1 + βx2 ,
Av = A (αx1 + βx2 ) = λ (αx1 + βx2 ) .
Ovvero, ∀ v ∈ R2 abbiamo Av = λv. Pertanto A = λI, la matrice A è un multiplo
dell’identità. Il sistema (2.80) di fatto si scrive così
ẋ = λx,
x = x0 exp {λt} ,
=⇒
y = y0 exp {λt} .
ẏ = λy,
xλ
l’unico (a meno di multipli reali) autovettore corriCaso 3. Sia xλ =
yλ
spondente
λ = λ1 = λ2 . Supponiamo |xλ | = 1, e indichiamo con
all’autovalore
y1
∈ R2 un vettore, di modulo unitario, cioè | y | = 1, ortogonale a xλ ,
y =
y2
EQUAZIONI DIFFERENZIALI
71
xλ · y = 0. Quindi la coppia {xλ , y} costituiscono una base ortonormale di R2 . Al
solito si introduce la matrice
�
�
V = xλ y ,
(2.92)
il cui determinante è ovviamente non nullo perché (xλ e y sono linearmente indipendenti). Introducendo
�
�
�
�
xλ yλ , y T = y1 y2 ,
xT
λ =
è facile vedere che
V−1 =
xT
λ
yT
=
xλ
yλ
y1
y2
.
Infatti, eseguendo il prodotto righe per colonne, si ha
T
xλ · y
xλ · xλ
xλ �
1
�
=
xλ
y =
V−1 V =
yT
y·y
xλ · y
0
0
1
.
Si passa quindi alle variabili ξ (t), η (t) introducendo la solita trasformazione (2.84). Il
sistema nelle nuove variabili è dato da
ξ̇ = V−1 ẋ = V−1 AVξ ,
(2.93)
dove adesso dobbiamo calcolare V−1 AV. Cominciamo con
�
� �
� �
AV = A xλ y = Axλ Ay = λxλ
Ay
�
.
Per quanto riguarda Ay, possiamo esprimerlo sulla base {xλ , y}, scrivendo39
Ay = αxλ + βy,
�
�
dove α e β sono numeri reali. Quindi AV = λxλ αxλ + βy , e di conseguenza
V−1 AV
=
=
�
yT
λ
0
α
β
xT
λ
�
λxλ
�
αxλ + βy
�
=
�
λxλ · xλ
xλ · y
xλ · (αxλ + βy)
y · (αxλ + βy)
�
.
Ora i due autovalori di A sono coincidenti, e quindi det A = λ2 . D’altra parte
�
�
det V−1 AV = det A = λ2 ,
ma anche
�
�
det V−1 AV = det
�
λ
0
α
β
�
= λβ.
39 Notiamo che se fosse α = 0, allora y sarebbe anch’esso un autovettore, linearmente indipendente con
xλ , contro l’ipotesi di molteplicità geometrica uno.
72
LEZIONI DI SISTEMI DINAMICI
Per cui, confrontando, abbiamo β = λ, ed allora40
λ α
V−1 AV =
.
0 λ
Possiamo allora riscrivere il sistema (2.93) nelle nuove variabili ξ (t), η (t)
λ α
ξ
ξ˙
ξ˙ = λξ + αη,
=
, =⇒
0 λ
η
η̇
η̇ = λη,
V−1 AV
e risolverlo nella η (t), cioè η = C2 eλt . L’equazione per la ξ
ξ̇ = λξ + α C2 eλt ,
(2.94)
η(t)
rientra nella classe di quelle analizzate nell’esempio 2.4.2, la cui soluzione è41
ξ (t) = eλt (C1 + C2 αt) .
Tornando alle variabili dipendenti originarie, cioè x (t) e y (t) , abbiamo
eλt (C2 αt + C1 )
x (t)
xλ y
=
y (t)
C2 eλt
V
x(t)
ξ(t)
=
eλt (C2 αt + C1 ) xλ + C2 eλt y.
(2.95)
Caso 4. Analizziamo adesso il caso degli autovalori complessi coniugati. Siano quindi
α + iβ e α − iβ, i due autovalori di A. Poiché sono due autovalori distinti (β �= 0
ovviamente), ad essi corrisponderanno due autovettori linearmente indipendenti una
volta che si consideri la matrice A come matrice complessa 2 × 2. Indichiamo con z
l’autovettore associato a α + iβ: è immediato verificare se z = x + iy, con
x1
y1
x=
, y=
,
x2
y2
vettori reali, allora il vettore z = x − iy è un autovettore associato all’autovettore
α − iβ. Inoltre, analogamente a quanto succede nel caso reale, i due vettori z e z sono
linearmente indipendenti (sul campo complesso). Questo implica che i vettori reali x
e y sono, al loro volta, linearmente indipendenti sul campo reale. Infatti, se così non
40 Questa
forma della matrice V−1 AV viene detta forma canonica di Jordan.
senza “scomodare” l’esempio 2.4.2, siosserva che moltiplicando la (2.94) per e−λt , si ottied ξe−λt
ne ξ̇e−λt − λe−λt ξ = αC2 , ovvero
= αC2 , la cui soluzione si ricava con una semplice
dt
integrazione
ξe−λt = C1 + αC2 t, =⇒ ξ (t) = eλt (C1 + αC2 t) .
41 Anche
EQUAZIONI DIFFERENZIALI
73
fosse avremmo y = γx (si può ovviamente assumere che x �= 0) da cui si ricava
(1 − iγ)
z, in
z = x + iy = (1 + iγ)x, e z = x − iy = (1 − iγ)x e quindi z =
(1 + iγ)
contrasto con l’indipendenza lineare (sui complessi) dei due autovettori di A.
Calcolando Az si ottiene
Az = Ax + iAy = (α + iβ)(x + iy) = (αx − βy) + i(αy + βx),
da cui otteniamo
Ax = αx − βy ,
(2.96)
Ay = αy + βx .
Introduciamo le nuove variabili dipendenti ξ (t) e η (t), tramite la trasformazione (2.84),
dove la matrice V è data da42
�
�
V= x y .
Riscrivendo il sistema (2.81) nelle nuove variabili otteniamo al solito la (2.93), dove,
come nel caso precedente, dobbiamo valutare V−1 AV. Svolgendo i calcoli
�
�
�
�
αx − βy αy + βx
AV = A [x y] = Ax Ay
=
(2.96)
=
e dunque
�
�
x
��
V
y
�
�
�
α
−β
V−1 AV = V−1 V
�
β
α
�
α
−β
,
β
α
�
=
�
α
−β
β
α
�
.
Di conseguenza, nelle nuove variabili ξ ed η, il sistema di equazioni differenziali (2.81)
diventa
� �
��
�
�
�
α β
ξ
ξ˙ = αξ + βη ,
ξ˙
=
(2.97)
ovvero
−β α
η
η̇ = −βξ + αη,
η̇
La soluzione di questo sistema diventa agevole passando alle coordinate polari, ovvero
al sistema di variabili (ρ, θ) tale che ξ = ρ cos θ, η = ρ sin θ. Infatti, moltiplicando la
prima equazione per ξ, la seconda per η e sommando otteniamo
d 2
(ξ + η 2 ) = 2α(ξ 2 + η 2 ),
dt
(2.98)
ovvero
dρ2
= 2αρ2 ,
dt
che si integra immediatamente, ottenendo
ρ(t) = ρ0 eαt = ρ0 exp {(Re λ) t} .
42 Evidentemente
V è invertibile dal momento che x, y sono indipendenti.
(2.99)
(2.100)
74
LEZIONI DI SISTEMI DINAMICI
L’equazione per θ si ottiene invece moltiplicando la (2.97)1 per η, la (2.97)2 per ξ e
sottraendo. Si ottiene in questo modo
˙ − η̇ξ = β (ξ 2 + η 2 ),
ξη
� �� �
(2.101)
ρ2
che possiamo riscrivere come
ξ̇η − η̇ξ
= β.
ρ2
(2.102)
E’ facile verificare che il primo membro della (2.102) è la derivata, cambiata di segno,
di θ(t)
dθ
= −β,
(2.103)
dt
da cui otteniamo
θ(t) = −βt + θ0 = − (Im λ) t + θ0 .
(2.104)
Tornando ora alle variabili ξ (t) e η (t), scriveremo la soluzione come
�
ξ(t) = ρ0 eαt cos(−βt + θ0 ),
η(t) = ρ0 eαt sin(−βt + θ0 ),
dove i coefficienti ρ0 e θ0 sono legati alle condizioni iniziali da
�
η0
ρ0 = ξ02 + η02 , θ0 = arctg
.
ξ0
(2.105)
(2.106)
Infine, per ritornare alle variabili originarie x (t) e y (t), si applica la (2.84) ottenendo
�
�
�
�
�
� ρ0 eαt cos(−βt + θ0 ),
x (t)
x y
=
ρ0 eαt sin(−βt + θ0 ),
y (t)
= ρ0 eαt [cos(−βt + θ0 ) x+ sin(−βt + θ0 )y] .
(2.107)
Vediamo adesso cosa succede nel caso in cui la matrice A abbia determinante nullo.
Il fatto di avere determinante nullo implica che almeno un autovalore della matrice,
diciamo λ1 , sia nullo. Si hanno quindi due casi:
(A). λ1 = 0, λ2 �= 0;
(B). λ1 = 0, è autovalore doppio con molteplicità geometrica pari ad 1.
Caso (A). In questo caso caso possiamo pensare al kernel di A come al sottospazio
associato all’autovettore nullo. Sia quindi xλ1 il relativo autovettore e xλ2 , quello
relativo a λ2 . Introduciamo la trasformazione (2.84) e, operando come nel Caso 1
giungiamo alla (2.86) che adesso si scrive così
ξ (t) = ξ0 ,
ξ˙ = 0,
=⇒
η (t) = η0 eλ2 t .
η̇ = λ2 η .
EQUAZIONI DIFFERENZIALI
75
Ricordando poi la (2.90), la soluzione è
x (t) = xλ1 ξ0 + xλ2 η0 eλ2 t .
Caso (B). Se λ = 0 è un autovettore doppio, abbiamo ancora due possibilità. La prima,
banale, è che A sia la matrice nulla. Ovviamente la soluzione del sistema in questo caso
è x(t) ≡ x0 e y(t) ≡ y0 . L’altra possibilità è che la molteplicità geometrica di λ = 0
sia uno. Questo è ancora una forma particolare del Caso 3 che abbiamo già visto. Infatti
se xλ è l’autovettore unitario relativo a λ = 0, e y è un vettore unitario ortogonale ad
xλ , operando la solita trasformazione (2.84) con V data da (2.92), giungiamo a questo
sistema nelle nuove variabili ξ (t) e η (t)
0 α
ξ
ξ̇ = αη,
ξ˙
=
, =⇒
0 0
η
η̇ = 0,
η̇
la cui soluzione è
ξ (t) = ξ0 + αη0 t,
η (t) = η0 .
Applicando infine la (2.95) con λ = 0, abbiamo la soluzione del sistema (2.90)
x (t) = (η0 αt + ξ0 ) xλ + η0 y.
Esempio 2.10.1 Determiniamo la soluzione generale di
ẋ
1 2
x
=
ẏ
2 1
y
1 2
In questo caso A =
, ed i suoi autovalori sono
2 1
2
det (A − λI) = 0, ⇒ (1 − λ) − 4 = 0, λ =
−1,
3.
Si determinano poi i rispettivi autovettori Ax1 = −x1 , Ax2 = 3x2 , richiedendo
|x1 | = |x2 | = 1. Si ha
1
1
−1
1
, x2 = √
.
x1 = √
1
1
2
2
Si introduce quindi la matrice
V=
x1
x2
1
=√
2
−1
1
1
1
,
e si considera il cambio di variabili ξ =V−1 x, x=Vξ . Nelle nuove variabili ξ (t),
η (t) l’equazione differenziale ẋ=Ax, si riscrive come
·
−1 0
ξ
ξ (t)
C1 e−t
ξ
=
, ⇒
=
.
·
0 3
η
η (t)
C2 e3t
η
76
LEZIONI DI SISTEMI DINAMICI
Quindi, in termini di x (t), la soluzione generale del sistema si può riscrivere come
�
�
��
�
�
�
�
1
1
−1 1
ξ (t)
−C1 e−t + C2 e3t
x (t)
,
=√
= Vξ (t) = √
1 1
η (t)
C1 e−t + C2 e3t
y (t)
2
2
ovvero x (t) = C1 e−t x1 + C2 e3t x2 . Le costanti c1 e c2 si determinano in base alle
condizioni iniziali.
Esempio 2.10.2 Scriviamo la soluzione generale di
�
��
�
�
�
1
5 1
x
ẋ
.
=
−1 3
y
ẏ
2
�
�
1
5 1
, e det (A − λI) = 0, dà λ1 = λ2 = 2. Abbiamo quindi un
Adesso A =
−1 3
2
�
�
1
1
√
solo autovettore x = 2
. Si considera un vettore unitario y ortogonale ad
−1
x,
�
�
1
1
.
y= √
1
2
�
�
�
�
1
1 1
Si introduce la matrice V = x y = √
, la cui inversa è
−1 1
2
�
�
� T �
1
1 −1
x
−1
T
=√
.
V =V =
1 1
yT
2
�
�
ξ (t)
Al solito si introducono le nuove variabili dipendenti ξ (t) =
, come combiη (t)
nazione lineare delle x (t) e y (t), x (t) = Vξ (t), ξ (t) = VT x (t). Nelle variabili
ξ (t), il sistema si riscrive come
�
��
�
2 1
ξ (t)
T
ξ̇ = V AVξ =
.
0 2
η (t)
Quindi, abbiamo questo sistema
ξ˙ (t) = 2ξ (t) + η (t) ,
η̇ (t) = 2η2 (t) ,
⇒
ξ˙ (t) = 2ξ (t) + C2 e2t ,
η (t) = C2 e2t .
Moltiplicando la prima equazione per e−2t , possiamo riscriverla come
d � −2t �
ξe
= C2 , ⇒
dt
ξ (t) = (C1 + C2 t) e2t .
Abbiamo quindi x (t) = (C1 + C2 t) e2t x + C2 e2t y.
Esempio 2.10.3 Analizziamo la soluzione di
�
� �
��
�
ẋ
2 1
x
=
.
ẏ
−1 2
y
(2.108)
EQUAZIONI DIFFERENZIALI
77
2 1
Gli autovalori di A =
, sono λ1 = 2 + i, λ2 = 2 − i, cioe Re λ = 2, e
−1 2
Im λ = 1. Determinando un autovettore complesso, per esempio quello relativo a λ1 ,
A = (2 + i) z , si ottiene
1
1
0
z=
=
+i
.
i
0
1
x
y
1 0
, che quindi coincide con l’iden0 1
tità, cioè ξ (t) ≡ x (t). Passando direttamente alle coordinate polari
x (t)
ρ (t) cos θ (t)
=
,
y (t)
ρ (t) sin θ (t)
Si introduce la matrice V =
x
y
=
otteniamo
ρ (t) = ρo e(Re λ)t = ρo e2t ,
θ (t) = − (Im λ) t + θo = −t + θo .
da cui
x (t)
y (t)
=
ρo e2t cos (−t + θo )
ρo e2t sin (−t + θo )
.
Esempio 2.10.4 Analizziamo adesso, facendo uso del formalismo dei sistemi lineari
2
bidimensionali,l’equazione
dell’oscillatore armonico ẍ = −ω x. Considerando le
x (t)
solite variabili
, l’equazione può essere riscritta come
y (t)
ẋ
x
0
1
=
.
ẏ
y
−ω 2 0
ẋ
x
A
Gli autovalori di A, sono λ1 = −iω, λ2 = iω. In particolare, un autovettore relativo
a −iω è
1
1
0
z=
=
+i
,
−iω
0
−ω
per cui la matrice V è data da
V=
1 0
0 −ω
.
Introducendo le nuove variabili dipendenti ξ (t) e η (t), e ricordando la (2.105), abbiamo
ξ (t)
ρo cos (ωt + θo )
=
.
η (t)
ρo sin (ωt + θo )
Per cui, tornando alle variabili originali
x (t)
1 0
ξ (t)
ξ (t)
=
=
,
y (t)
0 −ω
η (t)
−ωη (t)
78
LEZIONI DI SISTEMI DINAMICI
ossia
x (t) = ρo cos (ωt + θo ) ,
·
y (t) = −ωρo sin (ωt + θo ) = x (t) ,
che è proprio la (2.38).
2.11 Moto armonico smorzato
Consideriamo l’oscillatore armonico dell’esempio 2.6.1 soggetto ad una forza di attrito
viscoso, cioè proporzionale, in prima approssimazione, alla velocità del punto materiale (si veda anche l’esempio 2.5.1). Denotando con x (t) l’ascissa del punto materiale,
l’equazione di moto è
mẍ = (−k x) + (−η ẋ) ,
� �� �
� �� �
molla
attrito
dove η è il coefficiente di attrito viscoso. Seguendo le notazioni degli esempi 2.6.1 e
η
K
2.5.1, si introduce ω 2 = , µ = , e l’equazione si riscrive come
m
m
ẍ + µẋ + ω 2 x = 0,
(2.109)
che poi si trasforma nel seguente sistema lineare
�
�
�
� �
��
ẋ = y
x
ẋ
0
1
.
⇒
=
ẏ = −µy − ω 2 x
y
ẏ
−ω 2 −µ
��
�
�
(2.110)
A
Si determinano gli autovalori di A, λ2 + µλ + ω 2 = 0, ovvero
λ=
Si hanno quindi tre casi.
�
�
1�
−µ ± µ2 − 4ω 2 .
2
Caso I. µ2 − 4ω 2 > 0 (smorzamento forte). I due autovalori, entrambi negativi, sono
λ1 =
�
�
1�
−µ − µ2 − 4ω 2 ,
2
λ2 =
�
�
1�
−µ + µ2 − 4ω 2 .
2
Ricordando la (2.90), x (t) è di questo tipo:
√
√
µ
µ
1
1
2
2
2
2
x (t) = (xλ1 C1 )e− 2 t− 2 µ −4ω t + (xλ2 C2 )e− 2 t+ 2 µ −4ω t
� �� �
� �� �
c1
=
e
−µ
2t
c2
�
√ 2
√ 2
�
1
1
2
2
c1 e− 2 µ −4ω t + c2 e 2 µ −4ω t ,
dove con c1 e c2 sono le costanti di integrazione da determinarsi in base alle condizioni
iniziali. Notiamo che i due autovalori sono negativi e quindi abbiamo due esponenziali
decrescenti: x (t) −→ 0.
t→∞
EQUAZIONI DIFFERENZIALI
79
Caso II. µ2 − 4ω 2 = 0 (smorzamento critico). Questo caso corrisponde al Caso 3 della
sezione 2.10: un solo autovalore con molteplicità geometrica pari a uno. La soluzione
è data dalla (2.95), per cui x (t) è di questo tipo
x (t) =
=
µ
µ
e− 2 t (C2 αt + C1 ) xλ + C2 e− 2 t y1
µ
µ
e− 2 t (C1 xλ + C2 y1 ) + e− 2 t (C2 αxλ ) t
c1
=
e
−µ
2t
c2
[c1 + c2 t] ,
dove al solito c1 e c2 sono le costanti di integrazione. Al solito, limt→∞ x (t) = 0.
Caso III. µ2 − 4ω 2 < 0 (oscillazioni smorzate). Gli autovalori sono complessi
λ1 =
1
1
−µ − i 4ω 2 − µ2 , λ2 =
−µ + i 4ω 2 − µ2 .
2
2
Quindi, rifacendosi al Caso 4 della sezione 2.10, abbiamo
µ
α = Re λ1 = − ,
2
β = Im λ1 = −
1 2
4ω − µ2 .
2
La forma generale della soluzione è data dalla (2.107). Di conseguenza nel nostro caso
abbiamo
µ
1
1
x (t) = ρo e− 2 t x1 cos
4ω 2 − µ2 t + θ0 + y1 sin
4ω 2 − µ2 t + θ0 ,
2
2
che, definendo opportunamente le costanti c1 e c2 , potremo scrivere come
µ
1
1
4ω 2 − µ2 t + c2 sin
4ω 2 − µ2 t .
x (t) = e− 2 t c1 cos
2
2
Notiamo ancora la presenza dell’esponenziale negativo che quindi “smorza” l’ampiezza delle oscillazioni. Di solito ci si riferisce a questo caso come caso periodico in
quanto la soluzione ha un comportamento periodico, ma di ampiezza smorzata dal fattore esponenziale. Per contrapposizione, ci si riferisce al primo e al secondo caso come
casi aperiodici.
Per concludere, rimarchiamo alcune proprietà generali facilmente deducibili dalle forma esplicita della soluzione:
Primo. La soluzione generale della (2.109) è sempre data dalla combinazione lineare
di due soluzioni “fondamentali”, ovvero di due qualsiasi soluzioni linearmente indipendenti43 tra loro.
Secondo. Per t “sufficientemente grande” la soluzione si annulla, e di conseguenza
anche limt→∞ ẋ = 0: il punto materiale tende alla quiete ed alla posizione x = 0, che
rappresenta, nel senso della (2.56), la configurazione di equilibrio del sistema (2.110).
43 Due, o più, funzioni si dicono linearmente indipendenti quando l’unica loro combinazione lineare a
coefficienti costanti identicamente nulla è quella con tutti i coefficienti nulli.
80
LEZIONI DI SISTEMI DINAMICI
Terzo. Se calcoliamo l’energia meccanica E tramite la formula (2.31), otteniamo
E=
ẋ2
+ V (x) ,
2
con V (x) =
ω2 2
x .
2
Derivando quindi E rispetto al tempo si ha
�
�
dE
= ẋ ẍ + ω 2 ẋx = ẋ ẍ + ω 2 x
= −µẋ2 ≤ 0,
dt
(2.109)
l’energia meccanica non si conserva più. In particolare, siccome limt→∞ ẋ = 0, anche l’energia meccanica si annullerà per t → ∞. Concludiamo quindi che l’oscillatore
armonico smorzato non è un sistema conservativo ma dissipativo. Ovviamente l’energia meccanica non viene “distrutta”, ma viene trasformata dall’attrito in calore (cioè in
energia termica).
Quarto. La configurazione di equilibrio (x, y) ≡ (0, 0) del sistema (2.110) è una
configurazione di equilibrio asintoticamente stabile nel senso del criterio di Lyapunov
illustrato nella sezione 2.8.2. Infatti se consideriamo
Λ (x, y)
=
y2
ω 2 2 µ2 2 µ
+
x +
x + xy
2
2
4
2
=
ω2 2 1
y2
2
x + (µx + y) +
,
2
4
4
è banale verificare che Λ > 0, al di fuori di x = 0 e y = 0. Inoltre, siccome
�
�
µ
µ2
2
ω
x
+
y
+
y
2
2
∇Λ · F (x) =
·
µ
−µy − ω 2 x
y+ x
2
�
µ� 2 2
= − ω x + y2 ,
2
abbiamo ∇Λ ·F (x) < 0, ad eccezione del punto di equilibrio. Pertanto (x, y) ≡ (0, 0)
è asintoticamente stabile.
2.12 Moto armonico smorzato con forzante esterna
Consideriamo adesso un’equazione scalare del second’ordine lineare, non omogenea44
ẍ + ν ẋ + ω 2 x = f (t) ,
(2.111)
che corrisponde, dal punto di vista fisico, ad un oscillatore armonico smorzato soggetto
ad una forza f (t) variabile nel tempo, usualmente detta forzante esterna, o termine
forzante. La soluzione generale di (2.111) si ottiene sommando una qualsiasi soluzione di (2.111) alla soluzione generale dell’equazione lineare omogenea (2.109) che
abbiamo analizzato nella sezione 2.11.
44 In
·
questa sezione adottiamo la notazione “standard” in cui il coefficiente di x viene denotato con ν,
anziché con µ.
EQUAZIONI DIFFERENZIALI
81
In questo paragrafo analizzeremo il caso particolare in cui il termine forzante di
tipo sinusoidale f (t) = a cos(ωf t), con ωf pulsazione della forzante. Non occorre
introdurre una fase specifica per il termine forzante, basta considerare t = 0 quando la
forza raggiunge il suo massimo. Riscriviamo quindi la (2.111) nella forma
ẍ + ν ẋ + ω 2 x = a cos(ωf t) .
(2.112)
Il caso speciale ν = 0 corrisponde ad un oscillatore armonico soggetto ad una forza
esterna.
Determiniamo ora una soluzione particolare della (2.112), cercandola nella forma
xP (t) = c1 sin(ωf t) + c2 cos(ωf t) .
Sostituendo xP (t) nella (2.112) otteniamo
ωf2 [−c1 sin(ωf t) − c2 cos(ωf t)] + νωf [c1 cos(ωf t) − c2 sin(ωf t)]
+ω 2 [c1 sin(ωf t) + c2 cos(ωf t)] = a cos(ωf t) ,
che è soddisfatta se e solo se i coefficienti di cos(ωf t) e sin(ωf t) sono nulli, ovvero se
i coefficienti c1 e c2 soddisfano il sistema
(ω 2 − ωf2 )c1 − νωf c2 = 0,
(2.113)
νωf c1 + (ω 2 − ωf2 )c2 = a.
Il sistema (2.113) ha sempre soluzione eccettuato il caso in cui ωf = ω e ν = 0, ovvero
nel caso di un oscillatore armonico privo di attrito a cui sia applicata una forzante della
stessa frequenza delle oscillazioni libere del sistema45 . La soluzione di (2.113) è data
da
c1
=
ν 2 ωf2
c2
=
aνωf
�2 ,
�
+ ω 2 − ωf2
a(ω 2 − ωf2 )
�2 ,
�
ν 2 ωf2 + ω 2 − ωf2
da cui possiamo ricostruire la la soluzione particolare.
E’ tuttavia più interessante riscrivere la soluzione particolare nella forma A cos(ωf t−
β), dove A e detta ampiezza A, e β ritardo di fase. Abbiamo quindi
��
�
�
a
νωf
.
(2.114)
xP (t) = �
�2 cos ωf t − arctan ω 2 − ω 2
�
f
2
2
2
2
ν ωf + ω − ωf
45 Questo
fenomeno viene detto risonanza. In questo caso la soluzione particolare è data da
xP (t) = Ct cos(ωt), C = costante,
ovvero un’oscillazione con ampiezza che cresce linearmente nel tempo.
82
LEZIONI DI SISTEMI DINAMICI
Figura 2.11: Ampiezza A data dalla (2.115) in funzione di ωf , per diversi valori di ν,
considerando ω = 2.
5
ν = 0.1
ν = 0.2
4
ν = 0.6
3
ν=1
2
1
0
1
1.5
2
2.5
3
Di conseguenza
A =
β
=
a
2 ,
2
2
2
2
ν ωf + ω − ωf
arctan
νωf
ω 2 − ωf2
.
(2.115)
(2.116)
E’ importante notare, come abbiamo sottolineato nella sezione 2.11, che la soluzione generale dell’equazione omogenea, che sommata a (2.114) ci fornisce la soluzione generale della (2.112), decade esponenzialmente a zero. Questo significa che dopo un tempo sufficientemente “lungo” (ma in realtà “breve” nella scala dei tempi in
gioco46 , e tanto più breve quanto ν è “grande”) la soluzione che “rimane” (ovvero
quella che è “osservabile”dal punto di vista fisico) è data dalla soluzione particolare,
indipendentemente dalla condizioni iniziali del moto.
Le figure 2.11 e 2.12 mostrano rispettivamente i grafici del rapporto tra l’ampiezza
della soluzione e l’ampiezza del termine forzante e del ritardo di fase al variare della
frequenza forzante ωf per un valore fissato di ω e per diversi valori del coefficiente di
smorzamento ν.
Si osserva
che il valore massimo dell’ampiezza A, data dalla (2.115), viene assunto
per ωf = ω 2 − ν 2 /2 (che è un numero reale se ν è sufficientemente piccolo), e può
superare 1 se è soddisfatta da disuguaglianza
2
1 > ν 2 ωf2 + ω 2 − ωf2 ,
ovvero se ν 2 ω 2 < 1. In questo caso l’ampiezza della “risposta” è maggiore di quella
del termine forzante. In altre parole, il sistema funziona da amplificatore del termi46 Il
tempo caratteristico del fenomeno è dato dal periodo dell’oscillazione forzante, ovvero T = 2π/ωf .
EQUAZIONI DIFFERENZIALI
83
Figura 2.12: Ritardo di fase, per diversi valori di ν, con ω = 2
π
ν = 0.1
ν = 0.2
ν = 0.6
ν=1
ω
f
ω
ne forzante. Questo fenomeno, detto risonanza, è particolarmente interessante nelle applicazioni elettrotecniche. Infatti l’equazione (2.111) è anche l’equazione per
l’intensità di corrente in un circuito RLC soggetto ad una tensione f (t).
2.13 Sistemi lineari n−dimensionali
Nella sezione 2.10 abbiamo visto la soluzione dei sistemi lineari 2 × 2, tuttavia la
“strategia” di risoluzione si estende a sistemi di qualsiasi dimensione
Ẋ = AX
(2.117)
dove X(t) ∈ Rn e A ∈ Rn×n . In questa sezione però affrontiamo la soluzione del
sistema lineare (2.117) con un approccio alternativo, che evidentemente vale anche nel
caso bidimensionale (ovvero nel caso in cui A è una matrice 2 × 2 e X(t) ∈ R2 ).
Sia X 0 il dato iniziale (a t = 0) per il vettore X(t), e integriamo la (2.117) fra 0 e
t, ottenendo
t
X(t) = X 0 +
AX(s) ds.
(2.118)
0
Tentiamo poi di costruire la soluzione di (2.117) “per approssimazioni successive”,
ossia costruendo la successione X n (t) definita per ricorrenza
t
X n+1 (t) = X 0 +
AX n (s) ds,
n = 1, 2, 3, . . .
(2.119)
0
È chiaro che se la successione X n (t) ammette limite, ponendo
X(t) = lim Xn (t),
n→∞
allora, almeno formalmente, la X(t) soddisfa la (2.118). Derivando quest’ultima otteniamo (2.117): il limite X(t) è dunque la soluzione cercata. Dalla (2.119) si ottiene,
84
LEZIONI DI SISTEMI DINAMICI
ricorsivamente,
X 1 (t)
= X0 +
t
AX 0 ds = X 0 + tAX 0 ,
0
X 2 (t)
= X0 +
t
AX 1 (s) ds = X 0 + tAX 0 +
t2 2
A X0 ,
2
AX 2 (s) ds = X 0 + tAX 0 +
t2 2
t3
A X 0 + A3 X 0 ,
2
6
0
X 3 (t)
= X0 +
t
0
···
,
ovvero
X n (t) =
n
tk
k=0
k!
Ak X 0 .
Si può facilmente dimostrare che la serie converge uniformemente (su intervalli di
tempo limitati) e che il suo limite
X(t) =
∞ k
t
k=0
risolve la (2.117). La matrice
viene indicata con etA
∞
k!
tk k
k=0 k! A
etA =
Ak X 0 ,
(2.120)
è detta esponenziale della matrice A e
∞ k
t k
A .
k!
(2.121)
k=0
Dunque possiamo concludere in generale che la soluzione del problema di Cauchy
Ẋ = AX,
X (0) = X 0 ,
è data dalla matrice esponenziale di A applicata al vettore dei dati iniziali:
X(t) = etA X 0 .
(2.122)
Nota 2.13.1 Osserviamo che se X λ è un autovettore di A con autovalore λ allora X λ
è anche autovettore di etA con autovalore etλ . Infatti
etA X λ =
∞ k
t
k=0
k!
Ak X λ =
∞ k
t
k=0
k!
λk X λ = etλ X λ .
È facile ritrovare per questa via le soluzioni ottenute nel caso bidimensionale. In particolare, è istruttivo costruire la matrice esponenziale nel caso in cui A abbia due autovalori complessi coniugati. Sappiamo già che in questo caso, introducendo, tramite la
(2.84), le nuove variabili ξ (t) e η (t), possiamo riscrivere il sistema di partenza nella
forma (2.97). In particolare, denotando con B la matrice V−1 AV, cioè
α β
B=
−β α
EQUAZIONI DIFFERENZIALI
85
abbiamo
B = αI + βJ, dove J =
�
0 1
−1 0
�
, I=
�
1
0
0
1
�
,
e pertanto la soluzione di (2.97) potrà essere scritta come
�
�
�
�
ξo
ξ (t)
tB
,
=e
ηo
η (t)
con
etB = lim
n→∞
n
�
tk
k=0
k!
Bk = lim
n→∞
n
�
tk
k=0
k!
(αI + βJ)k .
Applichiamo adesso la formula del binomio di Newton47
� �
k
�
k
k
(αI + βJ) =
(αI)j (βJ)k−j ,
j
j=0 � �� �
k!
j!(k−j)!
ottenendo
n
�
tk
k=0
k!
Bk
=
n
�
tk
k=0
=
k!
k
�
j=0
n �
k
�
k=0 j=0
=
k!
(αI)j (βJ)k−j
j! (k − j)!
k=j
n
n �
j+r
�
j=0 r=0
n
n
��
tk
tk
(αI)j (βJ)k−j =
(αI)j (βJ)k−j
j! (k − j)!
j!
(k
−
j)!
j=0
t
(αI)j (βJ)r =
j! r!
n
j
�
j=0
n
�
t
tr
(αI)j
(βJ)r ,
j!
r!
r=0
dove si è utilizzato il cambio di indice r = k − j. Dunque, per n → ∞ si ha
etB = eαt I etβJ = eαt etβJ ,
dal momento che
lim
n→∞
n
�
tj
j=0
j!
(αI)j = lim
n→∞
n
�
αj tj
j=0
j!
(2.123)
I =eαt I .
Quindi, per completare il calcolo di etB dobbiamo valutare esplicitamente etβJ . Come
passo preliminare, osserviamo che J2 = −I e dunque
� �k
J2k = J2 = (−1)k I,
J2k+1 = J2k J = (−1)k J,
k = 0, 1, 2, . . . .
����
(−1)k I
47 Si osservi che possiamo applicare la formula del binomio di Newton perché le matrici I e J commutano,
cioè IJ = JI. Infatti, date due matrici qualsiasi P e Q,
(P + Q)2 = P2 + Q2 + PQ + QP.
La classica formula del quadrato del binomio si ha solamente se PQ = QP.
86
LEZIONI DI SISTEMI DINAMICI
Pertanto
2n
(tβ)k
k!
k=0
Jk
=
n
(tβ)2k
k=0
=
(2k)!
J2k +
somma sugli
indici pari
n
(−1)k
k=0
n−1
k=0
(tβ)(2k+1) (2k+1)
J
(2k + 1)!
somma sugli
indici dispari
n−1
(tβ)(2k)
(tβ)(2k+1)
I+
J.
(−1)k
(2k)!
(2k + 1)!
k=0
Consideriamo adesso il limite per n → ∞, ricordando gli sviluppi in serie di Taylor
delle funzioni sin tβ e cos tβ. Abbiamo
∞
∞
∞
(2n)
(2n+1)
(tβ)k k
n (tβ)
n (tβ)
J =
(−1)
I+
(−1)
J,
k!
(2n)!
(2n + 1)!
n=0
n=0
k=0
etβJ
sin tβ
ovvero
e
tβJ
= cos(tβ)I + sin(tβ)J =
cos tβ
cos(tβ)
− sin(tβ)
sin(tβ)
cos(tβ)
Sostituendo quest’ultima nella (2.123) abbiamo
cos(tβ) sin(tβ)
tB
αt
,
e =e
− sin(tβ) cos(tβ)
.
che ci fa ritrovare la soluzione data dalla (2.105) (a meno delle costanti ρ0 e θ0 che
sono legate ai dati iniziali, ovvero a X 0 ).
Capitolo 3
Le Equazioni di Lagrange
Questo capitolo è dedicato all’introduzione della formulazione lagrangiana della meccanica che di fatto è un formalismo “potente” per ottenere le equazioni di moto di
sistemi meccanici anche molto complessi1 . In tutto questo capitolo considereremo un
solo punto materiale non soggetto ad alcun vincolo. Prima di introdurre le equazioni di
Lagrange, discuteremo la cinematica del punto materiale quando i vettori velocità ed
accelerazione vengono espressi rispetto ad una base locale. Passeremo poi alle forze,
introducendo il concetto di forze conservative e quindi vedremo il metodo di Lagrange per giungere alle equazioni di moto. Come applicazione illustreremo il moto di un
punto materiale libero soggetto ad una forza di tipo centrale, quale, per esempio, quella
di attrazione gravitazionale.
3.1 Cinematica del punto
Consideriamo uno spazio affine euclideo2 A con dimensione 3 in cui è definito un
riferimento cartesiano ortogonale. Il moto di un punto viene rappresentato da una
curva parametrizzata dal tempo t, ovvero I ∋ t → P (t) ∈ A, dove I ⊂ R, è
un intervallo temporale. Ad ogni istante t corrisponde un punto dello spazio affine.
L’immagine in A di questa applicazione si chiama traiettoria, o orbita, di P . Ad ogni
istante t ∈ I corrisponde un vettore (P (t) − O), che denoteremo semplicemente con
x (t). Se {ex , ey , ez }, è una base ortogonale di V , x (t) è individuato dal seguente
vettore3 di R3
x (t)
y (t) , ⇔ x (t) = x (t) ex + y (t) ey + z (t) ez .
z (t)
1 Tale formalismo fu introdotto da J. L. Lagrange (Torino 1736 – Parigi 1813), matematico e astronomo
italiano, che svolse la sua attività scientifica a Berlino e a Parigi. Infatti, nell’introduzione del suo trattato
Méchanique analytique, pubblicato nel 1788, Lagrange scrive: Je me suis proposé de réduire la théorie de
cette Science, et l’art de résoudre le problèmes qui s’y rapportent, à des formules générales, dont le simple
développement donne toute les équations nécessaires pour la solution de chaque problème.
2 Più precisamente con A intenderemo sempre la terna (A, V, F ) dove A è l’insieme dei punti, V è lo
spazio vettoriale soggiacente lo spazio affine e F è l’applicazione che alla coppie di punti associa i rispettivi
vettori di V . In A è definito il prodotto scalare · .
3 Si assume che le funzioni x (t), y (t) e z (t) siano almeno C 2 ( I ).
88
LEZIONI DI SISTEMI DINAMICI
La velocità e l’accelerazione del punto P , sono definite come i vettori
·
dx (t)
= ẋ (t) ex + ẏ (t) ey + ż (t) ez ,
dt
··
d 2 x (t)
(P (t) − O) =
= ẍ (t) ex + ÿ (t) ey + z̈ (t) ez .
dt2
Supponiamo adesso che sia definito, in un dominio DA ⊂ A, un sistema di coordinate curvilinee
q1
x
R3 ⊃ Q ∋ q = q2 −→ x (q) .
q3
(P (t) − O)
=
Quindi il moto del punto, fino a quando avvine in DA , potrà anche essere rappresentato
dando le tre funzioni (q1 (t) , q2 (t) , q3 (t)), ovvero q (t). Avremo pertanto
x = x (q (t)) = x (q1 (t) , q2 (t) , q3 (t))
y = y (q (t)) = y (q1 (t) , q2 (t) , q3 (t))
P − O = x (q (t)) , ⇔
z = z (q (t)) = z (q1 (t) , q2 (t) , q3 (t))
Il vettore velocità si potrà anche scrivere come segue
ẋ =
∂x
∂x
∂x
q̇1 +
q̇2 +
q̇3 ,
∂q1
∂q2
∂q3
����
����
����
u1
u2
(3.1)
u3
dove {u1 , u2 , u3 } è la base locale (v. capitolo 1, sezione 1.4). Quindi, rispetto alla
base locale, il vettore velocità è rappresentato dalla terna
q̇1 (t)
q̇2 (t) .
q̇3 (t)
Per esser più precisi, riferendoci sempre alla sezione 1.4, la terna delle q̇i , i = 1, 2, 3,
è la terna delle componenti controvarianti del vettore velocità rispetto alla base locale
(evidentemente se la base locale è ortonormale questa precisazione è inutile).
Definizione 3.1.1 Se il punto P ha massa m, si definisce energia cinetica di P
�
�2
�
m�
� dx (t) � .
T =
�
2
dt �
Calcoliamo adesso l’energia cinetica di P considerando le coordinate curvilinee q (t).
Otteniamo
� 3
� � 3
�
�
m �
T =
uh q̇h ·
uk q̇k
2
h=1
=
m
2
3
�
h,k = 1
k=1
(uh · uk ) q̇h q̇k ,
EQUAZIONI DI LAGRANGE
89
che viene anche scritta come4
T =
3
1 �
ahk q̇h q̇k , dove ahk = m uh · uk .
2
(3.2)
h,k = 1
In particolare, se la base locale è ortogonale, avremo5
T =
�2
3 �
�
m ��
� ∂x � q̇h2 .
�
2
∂qh �
h=1
In generale abbiamo6 ahk = ahk (q), e, introducendo la matrice simmetrica7 A, le cui
componenti aij , sono definite nella (3.2),
u1 · u1 u1 · u2 u1 · u3
A (q) =m u2 · u1 u2 · u2 u2 · u3 ,
(3.3)
u3 · u1 u3 · u2 u3 · u3
potremo scrivere
T =
1 T
q̇ A (q) q̇,
2
con
q̇ T =
�
q̇1
q̇2
q̇3
�
, e
(3.4)
q̇1
q̇ = q̇2 .
q̇3
Per quanto riguarda l’accelerzione, abbiamo questo risultato fondamentale che cond 2 x (t)
nella base locale {u1 , u2 ,
sente di esprimere le componenti8 del vettore m
dt2
u3 }.
Teorema 3.1.1 Se T è l’energia cinetica di P , allora
�
�
∂T
d ∂T
d 2 x (t)
−
·
u
=
,
m
k
dt2
dt ∂ q̇k
∂qk
i = 1, 2, 3.
(3.5)
L’espressione di destra nella (3.5) viene usualmente detta binomio di Lagrange.
Dim. Prima di iniziare la dimostrazione è interessante osservare che la (3.5) ha una
struttura completamente diversa dalla (3.1). Infatti, per calcolare nella base puntuale
4 Evidentemente
ahk = akh .
∂x
, i = 1, 2, 3, siano normalizzati.
∂qi
6a
hk (q) è una scrittura sintetica per esprimere ahk = ahk (q1 , q2 , q3 ).
7 Osserviamo che la matrice A è, a parte il coeficiente m, la matrice metrica G della base locale, definita,
nel capitolo 1, dalla (1.8).
5 Ricordiamo
8 Per
che, in generale, non è detto che ui =
la precisione la formula (3.5) dà le componenti covarianti di m
ovvero fornisce le proiezioni ortogonali del vettore m d
sezione 1.4).
2
x(t)
dt
d2 x(t)
dt
rispetto alla base locale,
sui vettori della base locale (v. capitolo 1,
90
LEZIONI DI SISTEMI DINAMICI
d 2 x (t)
dobbiamo tener presente che i vettori della base locale cambiano da punto a
dt2
punto e quindi cambieranno durante il moto. Abbiamo
3
�
∂T
∂ ẋ
∂
q̇j uj · ẋ .
= m
· ẋ = m
∂ q̇k
∂ q̇k
∂ q̇k j=1
(3.1)
=
per cui
d
dt
Adesso calcoliamo
∂T
∂qk
muk · ẋ ,
�
∂T
∂ q̇k
=
=
�
=m
duk
· ẋ + muk · ẍ .
dt
� �
dx
∂ ẋ
∂
· ẋ
· ẋ = m
∂qk
∂qk dt
�
�
d ∂x
duk
m
· ẋ .
· ẋ = m
dt ∂qk
dt
� �� �
(3.6)
m
(3.7)
uk
Da un semplice confronto delle (3.6) e (3.7), si ricava
�
�
d ∂T
∂T
=
+ muk · ẍ ,
dt ∂ q̇k
∂qk
da cui la (3.5) discende banalmente.
Esempio 3.1.1 Vediamo che la (3.5) fornisce le componenti del vettore accelerazione
anche rispetto al riferiemento cartesiamo ortonormale {O, ex , ey , ez }. Infatti
x (t) = x (t) ex + y (t) ey + z (t) ez , ⇒ ẋ (t) = ẋ (t) ex + ẏ (t) ey + ż (t) ez ,
�
m� 2
per cui T =
ẋ + ẏ 2 + ż 2 , ovvero
2
m 0 0
ẋ
�
�
1
ẋ ẏ ż 0 m 0 ẏ ,
T =
2
0 0 m
ż
�
��
�
A=mI
da cui otteniamo
mẍ · ex
=
mẍ · ey
=
mẍ · ez
=
�
∂T
∂ ẋ
�
−
∂T
= mẍ,
∂x
�
�
d ∂T
−
dt ∂ ẏ
�
�
d ∂T
−
dt ∂ ż
∂T
= mÿ,
∂y
∂T
= mz̈.
∂z
d
dt
EQUAZIONI DI LAGRANGE
91
Esempio 3.1.2 Riferendoci all’esempio 1.4.1 del capitolo 1, consideriamo le coordinate polari nel piano
cos θ
−r sin θ
x (r, θ) = r cos θ
, uθ =
.
, ⇒ ur =
x (q) =
sin θ
r cos θ
y (r, θ) = r sin θ
Supponiamo adesso che P = P (t), ovvero r = r (t), θ = θ (t). Il vettore velocità
·
ẋ = (P − O), può essere espresso sia rispetto alla base {ex , ey },
�
�
�
�
ẋ = ṙ cos θ − rθ̇ sin θ ex + ṙ sin θ + rθ̇ cos θ ey ,
sia rispetto alla base locale {ur , uθ }
ẋ = ṙur + θ̇uθ .
In particolare, introducendo la base locale normalizzata, κr = ur , e uθ = rκθ ,
avremo
ẋ = ṙκr + rθ̇κθ .
Quindi, se m è la massa di P , l’energia cinetica sarà
T =
�2
�
m� 2
m�
ṙκr + rθ̇κθ =
ṙ + r2 θ̇2 ,
2
2
ovvero, ricordando la (3.3) e la (3.4)
1�
T =
ṙ
2
θ̇
�
�
�
m
0
� � �
ṙ
0
.
mr2
θ̇
��
�
A
Possiamo quindi determinare la componente dell’accelerazione lungo ur , ovvero la
componente radiale, e quella tangenziale
�
�
�
�
∂T
d ∂T
mẍ · ur =
−
= m r̈ − rθ̇2 ,
dt ∂ ṙ
∂r
�
�
d ∂T
∂T
= mr2 θ̈ + 2mrṙ θ̇ .
mẍ · uθ =
−
dt ∂ θ̇
∂θ
Esempio 3.1.3 Consideriamo adesso l’esempio 1.4.2 delle coordinate sferiche
x (r, ϕ, θ) = r sin θ cos ϕ
,
y
(r,
ϕ,
θ)
=
r
sin
θ
sin
ϕ
x (q) =
z (r, ϕ, θ) = r cos θ
92
LEZIONI DI SISTEMI DINAMICI
la cui base locale (ortogonale ma non normalizzata) è
sin θ cos ϕ
−r sin θ sin ϕ
r cos θ cos ϕ
ur =
sin θ sin ϕ , uϕ = r sin θ cos ϕ , uθ = r cos θ sin ϕ
cos θ
0
−r sin θ
,
uθ
uϕ
mentre quella normalizzata è κr = ur , κϕ =
, κθ =
. Se r, ϕ, e θ
r sin θ
r
dipendono dal tempo t, esprimendo il vettore velocità di P nella base locale abbiamo
ẋ = ṙur + ϕ̇uϕ + θ̇uθ = ṙκr + rϕ̇ sin θ κϕ + rθ̇κθ ,
da cui otteniamo la seguente espressione dell’energia cinetica
ṙ
m
0
0
�
�
1
T =
0 ϕ̇
ṙ ϕ̇ θ̇ 0 mr2 sin2 θ
2
0
0
mr2
θ̇
��
�
�
(3.8)
A
=
m�
2
�
ṙ2 + r2 ϕ̇2 sin2 θ + r2 θ̇2 .
(3.9)
Valutando adesso le componenti di mẍ rispetto alla base locale {ur , uϕ , uθ }, si ha
�
�
�
�
��
∂T
d ∂T
−
= m r̈ − r ϕ̇2 sin2 θ + θ̇2 ,
mẍ · ur =
dt ∂ ṙ
∂r
�
�
∂T
d � 2 2 �
d ∂T
−
=m
r sin θϕ̇ ,
mẍ · uϕ =
dt ∂ ϕ̇
∂ϕ
dt
�
� � �
�
�
d
d ∂T
∂T
2
2 2
=m
r θ̇ − r ϕ̇ sin θ cos θ .
mẍ · uθ =
−
dt ∂ θ̇
∂θ
dt
3.2 Forze conservative
3.2.1 Campi scalari e gradiente
Cominciamo con l’introdurre i concetti di campi scalari, campi vettoriali e campi gradiente. Si lavora in uno spazio affine euclideo (A, V, F ) dove A è l’insieme dei punti,
V è lo spazio vettoriale soggiacente lo spazio affine e F è l’applicazione che alla coppie
di punti associa i rispettivi vettori di V . In A è definito il prodotto scalare “ · ”.
Definizione 3.2.1 Dato uno spazio affine euclideo di dimensione n si dice campo
scalare su A un’applicazione f da A in R, f : A → R, che opera così
f
P −→ f (P ) ∈ R.
EQUAZIONI DI LAGRANGE
93
In generale un campo scalare f è una funzione di x, ossia delle coordinate cartesiane.
Quando sono definite coordinate curvilinee q = (q1 , q2 , ..., qn ), f può essere visto
come funzione delle q, vale a dire fˆ (q) = f (x (q)). Il campo si dice di classe C k se
ammette derivate parziali continue fino all’ordine k.
Definizione 3.2.2 Sia dato un campo scalare f di calsse C 1 , e un riferimento cartesiano ortogonormale {O, ei }. Si dice gradiente del campo scalare f , o semplicemente
gradiente, il vettore ∇f , le cui componenti rispetto alla base {O, ei } sono
∇f =
∂f
∂f
∂f
e1 +
e2 + .... +
en .
∂x1
∂x2
∂xn
(3.10)
La derivata di f lungo la direzione n, è la proizione ortogonale di ∇f lungo n, cioè
∂f
= ∇f · n.
∂n
∂x ∂x
,
i
=
1,
2,
...,
n
una base locale (normalizSia adesso κi = ui / |ui | = ∂q
/
∂qi
i
zata) associata alle coordinate curvilinee q, ci chiediamo: come può essere generalizzata la definizione (3.10) alla base locale {κi }? O meglio: quali sono
nle coponenti del
vettore ∇f nella base {κi }? Certamente potremo scrivere ∇f = i=1 (∇f · κi ) κi ,
cioè
n
n
n
ui
1
∇f =
κi =
(∇f · ui ) κi .
∇f ·
(∇f · κi ) κi =
�ui �
�ui �
i=1
i=1
i=1
Ma se fˆ (q) = f (x (q)), si ha
∂ fˆ (q1 , q2 , ..., qn )
∂qi
=
∂
f (x1 (q1 , q2 , ..., qn ) , ... , xn (q1 , q2 , ..., qn ))
∂qi
=
∂f ∂x2
∂f ∂xn
∂f ∂x1
+
+ ... +
∂x1 ∂qi
∂x2 ∂qi
∂xn ∂qi
(3.11)
= ∇f · ui ,
e quindi9
1 ∂ fˆ
∇f =
κi .
�ui � ∂qi
i=1
n
(3.12)
∇f ·κi
Esempio 3.2.1 Consideriamo il piano con le coordinate polari, la cui base locale nor1
malizzata è κr = ur , e κϕ = uϕ . Sia f (x, y) un campo scalare, che espresr
so rispetto alle coordinate polari, si scriverà come fˆ (r, ϕ) = f (x (r, ϕ) , y (r, ϕ)).
L’espressione del gradiente di f rispetto alla base locale è
∇f =
∂ fˆ
1 ∂ fˆ
κr +
κϕ ,
∂r
r ∂ϕ
9 Osserviamo che la (3.12) fornisce un’espressione delle componenti covarianti del gradiente ∇f rispetto
alla base locale (cioè delle proiezioni ortogonali del vettore ∇f sui vettori della base κi ).
94
dove
κϕ .
LEZIONI DI SISTEMI DINAMICI
∂ fˆ
∂r ,
e
1 ∂ fˆ
r ∂ϕ
rappresentano le proiezioni ortogonali di ∇f rispettivamente su κr e
Esempio 3.2.2 Consideriamo le coordinate sferiche x = r sin θ cos ϕ, y = r sin θ sin ϕ,
uϕ
uθ
, κθ =
. Al
z = r cos θ, la cui base locale normalizzata è κr = ur , κϕ =
r sin θ
r
solito, se f (x, y, z) è un campo scalare, fˆ (r, θ, ϕ) = f (x (r, θ, ϕ) , y (r, θ, ϕ) , y (r, θ, ϕ))
è la sua espressione in termini delle coordinate sferiche, si ha
∇f =
∂ fˆ
1 ∂ fˆ
1 ∂ fˆ
κr +
κθ +
κϕ
∂r
r ∂θ
r sin θ ∂ϕ
(3.13)
3.2.2 Campi vettoriali e campi gardiente
Definizione 3.2.3 Un campo vettoriale su uno spazio affine A è un’applicazione χ :
A → V , che ad ogni punto P ∈ A, associa un vettore χ (P ) ∈ V , applicato in P .
Se in A è dato un riferimento {O, ui }, il campo χ può essere così rappresentato
χ = χ1 u1 + χ2 u2 + ..... + χn un ,
dove ciascuna χi è un campo scalare, ovvero χi = χi (x), i = 1, 2, ..., n. In altri
termini il campo vettoriale χ è rappresentato dalla seguente funzione vettoriale
χ1 (x1 , x2 , ... , xn )
χ1 (x)
χ2 (x) χ2 (x1 , x2 , ... , xn )
χ (P ) −→ χ (x) =
.
=
..
..
.
.
χn (x1 , x2 , ... , xn )
χn (x)
Il campo si dirà di classe C k se ogni componente χi è almeno di classe C k .
Nello spazio affine A una curva Γ è un’applicazione Γ : I ⊂ R → A, che al
generico η ∈ I, associa un punto P (η) ∈ A. Se in A è dato un sistema cartesiano
{O, ei }, la curva si rappresenta come un’applicazione da I ⊂ R → Rn , cioè
Γ
η −→ x (η) = x1 (η) e1 + x2 (η) e2 + ... + xn (η) en ,
intendendo con x (η), la n-upla di funzioni xi (η), i = 1, ..., n, che rappresentano le
componenti del vettore (P (η) − O). La funzione x (η) a valori in Rn viene anche detta parametrizzazione della curva Γ. La curva si dice regolare se xi (η), i = 1, 2, .., n,
è derivabile e �x′ (η)� �= 0, dove x′ (η) = x′1 (η) e1 + x′2 (η) e2 + ... + x′n (η) en .
Definizione 3.2.4 Data una curva regolare10 Γ ed un campo vettoriale χ , si definisce
integrale curvilineo del campo lungo la curva Γ
�
�
χ=
χ (x (η)) · x′ (η) dη.
(3.14)
Γ
I
10 E’ sufficiente richiedere che Γ sia regolare a tratti, ossia regolare eccetto che in un numero finito di
punti.
EQUAZIONI DI LAGRANGE
E’ facile provare che
della curva.
�
Γ
95
χ è indipendente dalla parametrizzazione (a meno del segno)
Definizione 3.2.5 Un campo vettoriale χ si dice campo gradiente se esiste un campo
scalare f di classe C 1 , tale che χ = ∇f . f viene usualmente detta potenziale del
campo vettoriale χ.
Evidentemente non tutti i campi vettoriali sono anche campi gardienti. Le condizioni
che caratterizzano i campi gradienti sono riassunte nel seguente
Teorema 3.2.1 Sia χ un campo vettoriale continuo definito in un aperto connesso
U ⊆ A. Le seguenti affermazioni sono equivalenti:
(a) χ è un campo gradiente.
(b) L’integrale curvilineo lungo una qualunque curva che collega i punti P0 e P1 è
indipendente dalla curva, ma dipende soltanto dagli estremi.
(c) L’integrale curvilineo lungo una qualunque curva chiusa regolare a tratti è nullo.
Dim. Dimostriamo solo l’implicazione (a) ⇒ (b), da cui poi discende (c). Sia infatti
x (η) , η ∈ (ηo , η1 ), la parametrizzazione di una curva regolare Γ che collega P0 con
P1 . Abbiamo
�
χ
=
Γ
=
�
�
η1
ηo
η1
ηo
χ (x (η)) · x′ (η) dη =
n
�
i=1
η1
ηo
∂f (x (η)) ′
· xi (η) dη =
∂xi
= f (x (η1 )) − f (x (ηo )) .
� �� � � �� �
f (P1 )
�
∇f (x (η)) · x′ (η) dη
�
η1
ηo
df
dη
dη
(3.15)
f (P1 )
Vediamo una caratteristica dei campi vettoriali gradiente. Supponiamo di fissare un
riferimento cartesiano ortogonale {O, ex , ey , ez }, in cui χ si possa scrivere come
χ = χx (x, y, z) ex + χy (x, y, z) ey + χz (x, y, z) ez . Se f (x, y, z) è il potenziale
abbiamo
∂f
= χx (x, y, z) ,
∂x
∂f
= χy (x, y, z) ,
(3.16)
∂y
∂f = χ (x, y, z) .
z
∂z
96
LEZIONI DI SISTEMI DINAMICI
Ora, se χ è di classe C 1 , applicando il Teorema di Schwarz, si ha
∂χy
∂ ∂f
∂ ∂f
∂χx
=
=
, ⇔
∂y ∂x
∂x ∂y
∂y
∂x
χx
∂
∂z
∂
∂z
χy
∂f
=
∂x
χx
∂f
=
∂y
χy
∂ ∂f
, ⇔
∂x ∂z
∂χz
∂χx
=
∂z
∂x
χz
∂
∂y
∂f
, ⇔
∂z
∂χz
∂χy
=
∂z
∂y
χz
Ma allora, definendo il rotore del campo χ come
∂χy
∂χz
∂χx
∂χz
∂χx
∂χy
−
e1 +
−
e2 +
−
e3 ,
∇∧χ =
∂y
∂z
∂z
∂x
∂x
∂y
che può essere ottenuto formalmente tramite il seguente “determinate simbolico”
e1 e2 e3
∂
∂
∂
∇∧χ=
,
∂x ∂y ∂z
χ
χ
χ
x
y
z
si ha
Proposizione 3.2.1 Se χ è un campo gradiente allora ∇ ∧ χ = 0, ovvero, come si
usa spesso dire, χ è irrotazionale
In generale il viceversa non è vero. Non è vero cioè che se ∇ ∧ χ = 0, allora χ è un
campo gradiente. La prova di questo fatto è data dal seguente
Esempio 3.2.3 Consideriamo il campo vettoriale
−y
x
χ=
e
e2 .
+
1
x2 + y 2
x2 + y 2
definito ovunque eccetto che in x = 0, y = 0. E’ facile verificareche ∇ ∧ χ = 0,
ma che non è un campo gradiente. E’ infatti sufficiente calcolare Γ χ dove Γ è la
circonferenza centrata nell’origine di raggio R
Γ : [0, 2π) −→ A, x (η) = R cos η e1 + R sin η e2 ,
e rendesi conto che Γ χ �= 0. Infatti
2π
χ =
χ (x (η)) · x′ (η) dη
Γ
0
=
2π
0
=
0
sin η
cos η
e1 +
e2 · (−R sin η e1 + R cos η e2 ) dη
−
R
R
2π
dη = 2π .
EQUAZIONI DI LAGRANGE
97
Allora χ non soddisfa il punto (c) del teorema 3.2.1, e quindi non è un campo gradiente.
In effetti, la possibilità di invertire la proposizione
χ campo gradiente =⇒
∇ ∧ χ = 0,
risiede nelle caratteristiche del dominio dove è definito χ . A tal proposito abbiamo il
seguente
Teorema. Sia χ un campo vettoriale definito in un dominio semplicemente connnesso11 e sia ∇ ∧ χ = 0. Allora χ è un campo gradiente, ovvero esiste un potenziale f
definito in tutto il dominio per cui χ = ∇f .
Dunque in un dominio semplicemente connesso
campo gradiente ⇔ campo irrotazionale.
In generale, per determinare la funzione potenziale f di un campo gradiente (alternativamente alla risoluzione di (3.16)) conviene scegliere un percorso regolare a tratti Γ
particolarmente semplice che unisca un punto P0 ≡ (xo , yo , zo ), fissato una volta per
tutte, con il generico punto P ≡ (x, y, z).
3.2.3 Forza posizionale e forza conservativa
Dato uno spazio affine A, una forza posizionale, o campo di forza, è un campo vettoriale definito su un aperto connesso U ⊆ A, ovvero un’applicazione F : U → V , che
alla posizione P associa la forza F (P ) . Un punto materiale che si trova nella posizione P è dunque soggetto alla forza F (P ). Se {O, ei } è un riferimento cartesiano A,
scriveremo
F = F1 (x) e1 + F2 (x) e2 + F3 (x) e3 ,
dove, al solito, con x indichiamo le coordinate del punto12 P . Se F è un campo gradiente allora, ricordando la definizione 3.2.5, esiste un campo scalare V (x),
usualmente detto energia potenziale, per cui13
F = −∇V.
(3.17)
Una forza posizionale F di tipo campo gradiente, viene detta forza conservativa.
Adesso, sfruttando il teorema 3.2.1 vogliamo leggere le proprietà dei campi gradienti in termini più fisici. A tal scopo introduciamo il concetto di lavoro compiuto da
una forza F su un punto materiale ad essa soggetto.
11 Un aperto connesso C di uno spazio topologico si dice semplicemente connesso se, fissati comunque
due punti A, B in C e scelte arbitrariamente due curve Γ1 (λ), Γ2 (λ), con λ ∈ [λ− , λ+ ], che collegano
A = Γ1 (λ− ) = Γ2 (λ− ) con B = Γ1 (λ+ ) = Γ2 (λ+ ), esiste una trasformazione continua (omotopia)
di una curva nell’altra. Formalmente, deve esistere una funzione continua ψ : [λ− , λ+ ] × [0, 1] → C, tale
che ψ (λ, 0) = Γ1 (λ), ψ (λ, 1) = Γ2 (λ), ψ (λ− , ν) = A, ψ (λ+ , ν) = B, per ogni λ ∈ [λ+ , λ− ],
ν ∈ [0, 1].
12 Vale a dire le componenti del vettore (P − O).
13 L’energia potenziale V (x) corrisponde al potenziale, cambiato di segno, della definizione 3.2.5.
98
LEZIONI DI SISTEMI DINAMICI
Definizione 3.2.6 Data una forza14 F , il lavoro compiuto da F nell’unità di tempo su
punto materiale, ovvero la potenza, è definito come
W = F · ẋ,
dove ẋ è la velocità del punto materiale. Il lavoro compiuto da F nell’intervallo di
tempo (t0 , t1 ) è dato da15
t1
L (t0 , t1 ) =
F (x (τ )) · ẋ (τ ) dτ .
(3.18)
t0
Nella formula (3.18) si riconosce l’integrale curvilineo di F lungo la traiettoria parametrizzata col tempo. Quindi, considerando le forze posizionali ed applicando semplicemente il teorema 3.2.1, abbiamo la ben nota caratterizzazione delle forze conservative
Teorema 3.2.2 Una forza posizionale F definita in U ⊆ A, U aperto connesso, è
conservativa se e sole se il lavoro compiuto da F in un qualsiasi intervallo di tempo
(t0 , t1 ) è indipendente dalla traiettoria.
Sia ora F una forza conservativa che, per semplicità, supponiamo definita su tutto lo
spazio, ci chiediamo: come possiamo determinarne la relativa energia potenziale? Se
F = −∇V (x), si fissa un punto Po , le cui coordinate sono identificate dal vettore xo ,
dopo di che si considera il generico punto P le cui coordinate sono date dal vettore x.
Sia poi Γ(Po ,P ) una generica curva regolare a tratti che connette Po con P , cioè
[ηo , η1 ]
Abbiamo
Γ(P,Po )
F
Γ(Po ,P )
−→
= −
= −
e quindi V (x) = −
x (η) , tale che x (ηo ) = xo , x (η1 ) = x .
Γ(P,Po )
η1
ηo
∇V
= −
(3.14)
η1
ηo
∇V (x (η)) · x′ (η) dη
dV (x (η))
dη = −[ V (x (ηo )) − V (x (η1 )) ],
dη
xo
x
F + V (xo ). Chiaramente V (xo ) è una costante che
Γ(P,Po )
quindi possiamo porre uaguale a zero (l’energia potenziale è definita a meno di una
costante). Pertanto, se Γ (P, Po ) è una qualsiasi curva regolare a tratti che, partendo da
Po giunge sino al punto P , si ha
F .
(3.19)
V (x) = −
Γ(P,Po )
14 Osserviamo che la definzione di lavoro prescinde dal fatto che la forza F sia o meno posizionale: la
definizione si applica a qualsiasi forza.
15 E’ ovviamente sottinteso che x (t) ∈ U , ∀ t ∈ [t , t ], essendo U il dominio dove è definta F .
0 1
EQUAZIONI DI LAGRANGE
99
Concludiamo questa sezione osservando come il senso fisico della definizione 3.2.6
può essere chiarito pensando a cosa succede quando solleviamo un corpo pesante (di
massa m). Supponiamo di sollevare il peso di una altezza h lungo la verticale e supponiamo di farlo in modo da mantenere la velocità del peso costante per la maggior parte
della ascesa. Questo significa che dovremo applicare, nell’intervallo di tempo in cui
il corpo sale con velocità costante, una forza F uguale e opposta alla forza peso mg
agente sul corpo (la forza dovrà essere inizialmente maggiore del peso per mettere in
moto il corpo, e sarà poi minore del peso se riportiamo il corpo allo stato di quiete alla
nuova quota). In questo caso, se T è il tempo impiegato per sollevare il peso, il lavoro
effettuato dalla forza F sarà
T
L=
F · ẋdt = �F � �ẋ� T = �F � h,
0
h
dove h è proprio l’innalzamento subito dal corpo (forza e velocità costante sono paralleli e concordi). Il lavoro misura in questo caso “quanta fatica si è dovuta fare per
alzare il peso”.
La definizione di lavoro è strettamente legata allo studio delle macchine semplici
(la leva, il piano inclinato, le pulegge). Vediamo cosa succede se solleviamo il solito
peso servendoci di un piano inclinato. Supponendo di poter trascurare l’attrito del peso con il piano inclinato, abbiamo ora che la forza necessaria per sollevare il peso (se
esercitata nella direzione parallela al piano inclinato stesso) deve compensare la sola
componente del peso parallela al piano: la componente normale verrà fornita “gratuitamente” dalla reazione di appoggio sul piano inclinato. Questo fa sì che la forza
necessaria per sollevare il peso sia minore di quella necessaria per sollevarlo lungo la
verticale. In compenso il cammino compiuto sarà maggiore. E’ facile vedere che nei
due casi è uguale il lavoro compiuto (e quindi la “fatica spesa”).
Esempio 3.2.4 Vediamo alcuni esempi di forze posizionali conservative nello spazio
affine tridimensionale.
Forza uniforme, F = p, campo vettoriale costante. Questo è il caso della forza
peso che è data da mg , dove m è la massa del corpo e g l’accelerazione di gravità definita su tutto lo spazio. Consideriamo un riferimento cartesiano ortogonale
{O, ex , ey , ez }, e supponiamo che p = pez , con p costante. Sia x : [to , t1 ] −→ R3 ,
(3.20)
x (t) = x (t) ex + y (t) ey + z (t) ez ,
una generica curva regolare che connette i punti Po e P , cioè
x (to ) = xo = xo ex + yo ey + zo ez ,
x (t1 ) = x = xex + yey + zez .
Applichiamo la (3.18) e calcoliamo il lavoro F = pez , lungo la curva
t1
pez · (ẋ (t) ex + ẏ (t) ey + ż (t) ez ) dt = p
L (t0 , t1 ) =
t0
=
p (z − zo ) .
Dal teorema 3.2.2 segue che F è conservativa.
(3.21)
t1
ż (t) dt
t0
(3.22)
100
LEZIONI DI SISTEMI DINAMICI
Per calcolarne l’energia potenziale è sufficiente considerare ∇V (x) = −F = −pez ,
cioè
∂V
= 0,
∂x
∂V
V (x, y, z) = −pz + C,
= 0,
∂y
∂V
= −p,
∂z
dove C è una qualsiasi costante che, per semplicità, poniamo uguale a zero. Otteniamo
dunque V (x, y, z) = −p z. Notiamo che saremmo potuti giungere allo stesso risultato
ricorrendo alla (3.19) e sfruttando la (3.22). Infatti
V (x, y, z) − V (xo , yo , zo ) = −L (t0 , t1 ) = −p (z − zo ) ,
(3.19)
(3.22)
da cui, ponendo V (xo , yo , zo ) = 0 e scegliendo il punto Po in modo che zo = 0,
otteniamo di nuovo V (x, y, z) = −p z. In particolare, se F = −mgez , cioè se
p = −mg, l’energia potenziale dovuta alla forza peso è
V = mgz.
Forza di richiamo elastica verso il punto O, F = −k (P − O). Tale forza è quella
dovuta ad una molla di lunghezza a riposo trascurabile, rigidezza (o costante elastica)
k, con un estremo fisso nel punto O. F è definita su tutto lo spazio e, scrivendola in
componenti, abbiamo
F = −kx = −k (xex + yey + zez ) ,
Si dimostra che la forza è conservativa applicando il teorema 3.2.2. Infatti, se x (t) è
la curva (3.20) che connette i punti Po e P1 , dati da (3.21), si ha
� t1
L (t0 , t1 ) =
F (x (t)) · ẋdt
t0
�
�
k t1 d � 2
x + y 2 + z 2 dt
= −k
(xẋ + y ẏ + z ż) dt = −
2
dt
t0
t0
�
�
k
2
2
|x1 | − |xo | .
= −
2
Il lavoro è pertanto indipendente dalla curva che connette Po e P1 . La relativa energia
potenziale può essere calcolata come nel caso precedente ottenendo
�
t1
V (x, y, z) =
�
k� 2
x + y2 + z 2 .
2
k
L’espressione di V in coordinate sferiche è banalmente V (r) = r2 . In particolare,
2
ricordando la (3.13) abbiamo
F =−
∂V (r)
κr = −krκr .
∂r
EQUAZIONI DI LAGRANGE
101
Forza centrale di tipo F (P ) = f (| �P − O�) vers(P − O), dove O è un punto fisso
dello spazio. Tale forza è analoga, in forma, a quella di richiamo elastica, ma adesso
la costante elastica non è uniforme, dipendendo dalla distanza di P dall’origine. In
più, la funzione f potrebbe non essere definita nell’origine: questo è il caso, per esempio, della forza di attrazione gravitazionale o della forza elettrostatica. In ogni caso,
anche escludendo l’origine, il dominio dove la forza è definita è comunque semplicemente connesso. Per mostrare che la F è conservativa facciamo vedere che F soddisfa
il punto (c) del teorema 3.2.1. Infatti, ricordando la (1.13) dell’esempio 1.4.2, possiamo scrivere F = f (r) κr . Fissiamo quindi un punto Po , cioè (Po − O) = ro κr , e
consideriamo un generico (P − O) = rκr . Adesso, lavorando in coordinate polari
sferiche, consideriamo una generica curva Γ(Po ,P ) regolare a tratti che connette Po e
P , cioè
x (η) = r (η) sin θ (η) cos φ (η) ex + r (η) sin θ (η) sin φ (η) ey + r (η) cos θ (η) ez .
Dalla (3.14) abbiamo
F =
Γ(Po ,P )
η1
ηo
F (x (η)) · x′ (η) dη.
Siccome x′ (η) = r′ (η) κr + θ′ (η) uθ + φ′ (η) uφ , il precedente integrale diventa
η1
η1
d
′
[V (r (η))] ds,
F =
f (r (η)) r (η) dη = −
Γ(Po ,P )
ηo
ηo dη
dove
V (r) = −
r
f (s) ds.
(3.23)
ro
Per cui, se la curva è chiusa, cioè r = ro , si ha Γ(Po ,Po ) F = 0, e dunque la forza
è conservativa. Si noti che la (3.23) è l’espressione per l’energia potenziale V (che
dipende soltanto dalla coordinata radiale r). In particolare, ricordando la (3.13),
abbiamo
r
∂
∇V (r) =
−
f (s) ds κr = −f (r) κr , ⇒ −∇V (r) = F .
∂r
ro
Nel caso della forza di attrazione gravitazionale, la forza con cui il punto materiale
P1 di massa m1 , attrae il punto materiale P2 di massa m2 è
m1 m2
F = −G 2 κr ,
r
dove G è la costante di gravitazione universale, G = 6.67 × 10−11 N m2 /kg 2 . Quindi
focalizzandoci sul punto P2 , la forza cui lo stesso è soggetto è scrivibile come F =
m2 K
− 2 κr , dove K = Gm1 , la cui energia potenziale, in coordinate polari sferiche, è
r
r
mK
mK
mK
+
− 2 ds = −
.
V (r) = −
s
r
ro
ro
Considerando ro → ∞, abbiamo V (r) = −
mK
.
r
102
LEZIONI DI SISTEMI DINAMICI
3.3 Equazioni di Lagrange per un punto materiale
Consideriamo adesso il moto di un punto materiale che si muove nello spazio soggetto
ad una forza posizionale conservativa F , la cui energia potenziale è V . Il moto, in
accordo con la seconda legge di Newton, è descritto dall’equazione
m ẍ = F = −∇V (x) .
(3.24)
L’equazione vettoriale (3.24) si può scrivere in un sistema di coordinate cartesiane
ortogonali e da essa si ottiene il sistema
ẍi = Fi (x1 , x2 , x3 ) = −
∂V
,
∂xi
i = 1, 2, 3 ,
(3.25)
In molti casi è però preferibile usare un sistema di coordinate locali, per esempio le
coordinate sferiche se il campo di forza ha una simmetria centrale rispetto a un punto
fisso dello spazio.
La riscrittura di (3.24) in un diverso sistema di coordinate locali richiede una scomposizione diversa dalla (3.25). Vediamo come sia possibile costruire una “ricetta” per la
scrittura “automatica” di un sistema di equazioni scalari di moto equivalente alla (3.25)
in un qualsiasi sistema di coordinate. Tale procedura inoltre si generalizza a sistemi
meccanici composti da un numero qualsiasi di punti materiali interagenti tra loro e con
l’esterno ed eventulamente soggetti a limitazioni al loro moto “naturale” espresse da
“vincoli olonomi lisci” (il senso esatto di queste espressioni verrà chiarito nel capitolo
4).
Supponiamo che siano date le coordinate curvilinee q = (q1 , q2 , q3 ),
x = x (q1 , q2 , q3 ) ,
y = y (q1 , q2 , q3 ) ,
x = x (q) , ⇔
z = z (q1 , q2 , q3 ) ,
e che {u1 , u2 , u3 } sia la relativa base locale. Sia inoltre
V̂ (q1 , q2 , q3 ) = V (x (q1 , q2 , q3 ) , y (q1 , q2 , q3 ) , z (q1 , q2 , q3 )) .
Adesso proiettiamo16 la (3.24) lungo i vettori della base locale
m ẍ · ui = −∇V (x) · ui , i = 1, 2, 3.
(3.26)
Ricordando (3.11) abbiamo
∂ V̂ (q1 , q2 , q3 )
= ∇V · ui ,
∂qi
mentre dal teorema 3.1.1 otteniamo
mẍ · ui =
d
dt
�
∂T
∂ q̇i
�
−
i = 1, 2, 3,
∂T
, i = 1, 2, 3.
∂qi
16 Proiettare l’equazione (3.24) lungo {u , u , u } significa determinare le componenti covarianti
1
2
3
dell’accelerazione e della forza rispetto alla base locale.
EQUAZIONI DI LAGRANGE
103
Quindi la (3.26) si riscrive così
d
dt
�
∂T
·
∂ qi
�
−
∂T
∂ V̂ (q1 , q2 , q3 )
=
,
∂qi
∂qi
i = 1, 2, 3,
o anche come
�
�
�
�
∂
T
−
V̂
∂
T
−
V̂
d
−
= 0,
·
dt
∂qi
∂ qi
i = 1, 2, 3,
dal momento che V̂ non dipende dalle q̇i . Ma allora, se introduciamo la funzione di
Lagrange, o semplicemente Lagrangiana,
L (q, q̇) = T (q, q̇) − V̂ (q) ,
(3.27)
la scrittura dell’equzione mẍ = F rispetto alla base locale diventa
d
dt
�
∂L
∂ q̇i
�
−
∂L
= 0,
∂qi
i = 1, 2, 3.
(3.28)
A questo punto dovrebbe essere chiara la ricetta “automatica”: si scelgono le variabili (q1 , q2 , q3 ), dette anche coordinate lagrangiane, si esprime la velocità v, e quindi
l’energia cinetica T e l’energia potenziale V rispetto a queste variabili, si somma T a
−V e si inserisce la funzione Lagrangiana così ottenuta nella (3.28). Il risultato sono
le equazioni di moto nel sistema di coordinate scelto.
Notiamo infine che, ricordando l’espressione di T tramite la (3.4), con A data dalla
(3.3), possiamo riscrivere la Lagrangiana (3.27) nella seguente forma “compatta”
L (q, q̇) =
1 T
q̇ A (q) q̇ − V̂ (q) .
2
3.3.1 Conservazione dell’energia, variabili cicliche e funzione di
Routh
Si definisce funzione di Hamilton17 , o semplicemente Hamiltoniana,
H (q, q̇) =
3
�
i=1
q̇i
∂L
−L.
∂ q̇i
(3.29)
17 Sir William Rowan Hamilton (Dublino 1805 - Dublino 1865). Fisico matematico e professore di
astronomia al Trinity College di Dublino.
104
LEZIONI DI SISTEMI DINAMICI
Ricordando la (3.2) abbiamo18
3
�
∂L
q̇i
∂ q̇i
i=1
=
=
=
=
3
3
�
∂T
∂ 1 �
q̇i
=
q̇i
ah k (q) q̇h q̇k
∂ q̇i
∂ q̇i 2
i=1
i=1
3
�
h,k = 1
�
�
3
�
∂
q̇
1
∂
q̇
h
k
ah k (q)
q̇k + q̇h
q̇i
2
∂
q̇
∂
q̇
i
i
i=1
3
�
h,k = 1
3
�
1
q̇i
ah k (q) (δhi q̇k + q̇h δki )
2
i=1
3
�
h,k = 1
3
3
3
3
1� �
1� �
ai k (q) q̇i q̇k +
ah i (q) q̇i q̇h = 2T,
2 i=1
2 i=1
k=1
h=1
�
��
�
�
��
�
T
per cui
T
H (q, q̇) = 2T − L = T + V̂ .
(3.27)
(3.30)
L’Hamiltoniana di un punto materiale soggetto soltanto a forze conservative del tipo (3.17) è la somma dell’energia cinetica di quella potenziale: coincide quindi con
l’energia meccanica totale del punto materiale.
Proposizione 3.3.1 L’Hamiltoniana H (q, q̇) è costante durante il moto o, come si usa
dire, è un’integrale primo del moto.
Dim. Dobbiamo provare che
dH
dt
=
dH
= 0. Infatti dalla (3.29)
dt
3
�
q̈i
3
�
q̈i
i=1
=
i=1
∂L
·
∂ qi
+ q̇i
�
�
d ∂L
dL (q (t) , q̇ (t))
−
dt ∂ q̇i
dt
� �� �
∂L
= ∂q
i
v. formula
(3.28)
∂L
·
∂ qi
3
+ q̇i
∂L � ∂L
∂L
−
q̈j +
q̇j = 0 .
∂qi j=1 ∂ q̇j
∂qj
18 Il
risulatato
n-esimo grado f
3
·
q ∂T
=
·
i=1 i ∂ q i
(x1 , x2 , ..., xk ),
2T , altro non è che il teorema di Eulero per una funzione omogenea di
k
∂f
xi = n f .
∂xi
i=1
EQUAZIONI DI LAGRANGE
105
La proposizione appena illustrata mette in luce, dato il significato energetico della
H, una proprietà molto importante: in particolari condizioni (punto materiale non
vincolato e soggetto soltanto a forze conservative) l’energia meccanica si conserva.
In particolare, nella sezione 5.7 daremo la definizione di Hamiltoniana per un sistema di N punti materiali, soggetto a m vincoli e vedremo che la relazione H = T + V̂ ,
non è vera in generale, lo è soltanto nel caso di vincoli fissi. Analizzeremo inoltre i
dH
casi in cui
= 0.
dt
Oltre all’energia può accadere che esistano anche altre quantità che rimangono
costanti durante il moto: è il caso, per esempio, delle variabili cicliche o ignorabili.
Definizione 3.3.1 La variabile qi si dice ciclica19 , o ignorabile, se
∂L
= 0,
∂qi
cioè qi non compare esplicitamente nella Lagrangiana L, mentre compare la q̇i .
E’ immediato vedere che se qi è ciclica e il moto è governato dalle equazioni (3.28),
allora
d ∂L
∂L
= 0, =⇒
= costante.
dt ∂ q̇i
∂ q̇i
Definizione 3.3.2 Si dice momento coniugato o momento generalizzato, la quantità
pi =
∂L
.
∂ q̇i
(3.31)
Abbiamo quindi la seguente
Proposizione 3.3.2 Se qi è ciclica e il moto è goveranto dal sistema (3.28), allora pi è
costante durante il moto ed è quindi un integrale primo.
Il punto adesso è il seguente: se sono presenti variabili cicliche come possono essere
utilizzate per semplificare le equazioni di moto (3.28)? Una possibilità evidentemente
è questa: si scrivono esplicitamente quelle equazioni del sistema (3.28) non relative
alle variabili cicliche e si cerca di semplificarle sfruttando il fatto che pi = costante.
Questo, per esempio, è il metodo che adotteremo nel paragrafo 3.4.1, quando studieremo l’equazione che regola il moto di un punto materiale dall’origine sotto l’azione di
una forza conservativa di tipo centrale.
Tuttavia questa non è la sola possibilità: si possono infatti utilizzare le variabili cicliche per “semplificare” la funzione Lagrangiana. La procedura però è delicata e merita qualche commento. Infatti, supponiamo che la q1 sia ciclica, cioè
L (q̇1 , q̇2 , q̇3 , q2 , q3 ). Se siamo in grado di invertire la (3.31), scriveremo
q̇1 =
q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) ,
19 L’espressione coordinate cicliche fu coniata da Helmholtz; come sinonimo si trova spesso l’espressione
variabili ignorabili e nel testo del Lanczos si parla di kinosthenic coordinates che non osiamo tradurre.
106
LEZIONI DI SISTEMI DINAMICI
dove sappiamo che p1 è costante (e quindi è determinata dalle condizioni iniziali).
Quindi, sostituendo nella L otteniamo
L
q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 = L̂ (p1 , q̇2 , q̇3 , q2 , q3 ) ,
dove, lo rammentiamo ancora, p1 è una costante e non una variabile. Parrebbe quindi di aver eliminato una variabile e, di conseguenza, di aver semplificato il sistema.
Tuttavia la Lagrangiana L̂ così ottenuta non conduce alle equazioni del moto corrette:
cioè
d ∂ L̂
∂ L̂
−
= 0, i = 2, 3,
dt ∂ q̇i
∂qi
non sono le giuste equazioni di moto. Infatti
∂ L̂
∂ q̇2
=
∂ L̂
∂q2
=
q̇ 1
∂
q̇
∂L ∂
∂L
∂L
+
= p1 1 +
,
∂
q̇
∂
q̇
∂
q̇
∂
q̇2
2
2
2
∂ q̇1
q̇ 1
∂
q̇
∂L ∂
∂L
∂L
+
= p1 1 +
,
∂q2
∂q2
∂q2
∂ q̇1 ∂q2
·
e analoghe equazioni si trovano per q 3 , e q3 . Di conseguenza
d ∂ L̂
q̇1
∂ L̂
d ∂
∂
q̇ 1
d ∂L
∂L
−
−
+
−
= p1
dt ∂ q̇2
∂q2
dt ∂ q̇2
∂q2
dt ∂ q̇2
∂q2
=0
=
p1
d
dt
∂
q̇1
∂ q̇2
−
∂
q̇ 1
,
∂q2
ed analogamente per q3 . Si conclude quindi che L̂ non è la Lagrangiana effettiva del
sistema semplificato. La funzione che invece soddisfa le equazioni di moto, poste nella
∂
d ∂
20
forma dt
∂ q̇i − ∂qi = 0, i = 2, 3, è la funzione di Routh , o Routhiana
R (q̇2 , q̇3 , q2 , q3 )
= L̂ (p1 , q̇2 , q̇3 , q2 , q3 ) − p1
q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 )
= L
q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 −
q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) .
p1
Proposizione 3.3.3 La funzione Routhiana soddisfa le equazioni
d ∂R
∂R
−
= 0, i = 2, 3.
dt ∂ q̇i
∂qi
Dim. La dimostrazione è una semplice riscrittura dei passaggi sopra illustrati.
20 Edward
John Routh (Québec, 1831 – Cambridge, 1907) è stato un matematico inglese.
(3.32)
(3.33)
EQUAZIONI DI LAGRANGE
107
Generalizzando la procedura21 al caso in cui ci siano due variabili cicliche, per esempio
q1 e q2 (cioè al caso in cui né q1 né q2 compaiono esplicitamente nella Lagrangiana L)
si procede introducendo i momenti coniugati pi , i = 1, 2, tramite
∂L (q̇1 , q̇2 , q̇3 , q3 )
p =
,
1
∂ q̇1
p2 = ∂L (q̇1 , q̇2 , q̇3 , q3 ) ,
∂ q̇2
che si sfruttatano per esprimere q̇1 e q̇2 , in funzione di p1 , p2 , q̇3 e q3 ,
q̇i = �
q̇ i (p1 , p2 , q̇3 , q3 ) ,
i = 1, 2.
La funzione Routhina è dunque
R (q̇3 , q3 ) = L̂ (p1 , p2 , q̇3 , q3 ) −
�
i=1,2
pi �
q̇ i (p1 , p2 , q̇3 , q3 ) ,
(3.34)
�
�
q̇ 1 (p1 , p2 , q̇3 , q3 ) , �
q̇ 2 (p1 , p2 , q̇3 , q3 ) , q̇3 , q3 .
dove L̂ (p1 , p2 , q̇3 , q3 ) = L �
Concludiamo la sezione osservando che la presenza di una, o più variabili cicliche
non ha alcun effetto sulla funzione Hamiltoniana. Infatti, se per esempio la variabile q1
non compare nella L (cioè è ciclica), data la definizione (3.29), non comparirà neppure
nell’Hamiltoniana H, cioè H = H (q̇1 , q̇2 , q̇3 , q2 , q3 ). Di conseguenza se introduciamo
�
�
� (p1 , q̇2 , q̇3 , q2 , q3 ) = H �
H
q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 ,
(3.35)
è facile vedere che
� (p1 , q̇2 , q̇3 , q2 , q3 ) =
H
3
�
∂R
i=2
∂ q̇i
q̇i − R ,
dove R è data dalla (3.34). Svolgendo i calcoli sul membro di destra si ottiene
∂R
∂ q̇i
=
=
�
�
∂ � ��
L q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 − p1 �
q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 )
∂ q̇i
q̇ 1
∂�
q̇
∂L
∂L
∂L ∂�
+
− p1 1 =
,
∂ q̇i
∂ q̇i
∂ q̇i
∂�
q̇1 ∂ q̇i
����
i = 2, 3,
(3.36)
p1
21 Per ulteriori approfondimenti si rimanda al capitolo 3, del testo: P. Biscari, C. Poggi, E. G. Virga,
Mechanics Notebook, Liguori Editore, Napoli 1999.
108
LEZIONI DI SISTEMI DINAMICI
da cui
3
3
∂R
∂L
q̇i − R =
q̇i − L + p1 q̇1
∂ q̇i
∂ q̇i
(3.34)
i=2
i=2
∂L
∂ q̇1
=
3 ∂L
q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3
∂ q̇i
i=1
q̇i −
L
q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3
(p1 , q̇2 , q̇3 , q2 , q3 ) .
= H
q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 = H
Quindi per ottenere una versione “semplificata” dell’energia meccanica è sufficiente
inserire direttamente l’espressione di q1 =
q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) nella Hamiltoniana H,
come mostrato dalla (3.35).
La generalizzazione al caso di N punti materiali sarà illustrata nella sezione 5.6,
dove considereremo l variabili q, cioè (q1 , ..., ql ), di cui v ≤ l, cicliche.
Nota 3.3.1 Come già osservato la sostituzione di una variabile ciclica nella funzione
di Lagrange conduce ad una L non “corretta”, cioè una Lagrangiana che genera
equazioni di moto non corrette. Per rendere ancor più evidente questo fatto, tentiamo
di sfruttare la conservazione dell’energia meccanica. Ricordando la (3.30) e la proposizione 3.3.1, abbiamo H = T + V = E, con E costante. Pertanto, sfruttando tale
relazione nella Lagrangiana, potremmo scrivere
L = T − V = T − (E − T ) = 2T − E,
e le equazioni di Lagrange (3.28) si ridurrebbero a
d ∂T
∂T
−
= 0, i = 1, 2, 3,
dt ∂ q·
∂qi
i
ovviamente non corrette (basti pensare al semplice oscillatore armonico). Se, nell’ambito del formalismo lagrangiano, si vuole tener conto del fatto che T + V = costante,
bisogna introdurre una opportuna funzione di Routh. Tale problema verrà discusso
nella sezione 8.5: l’ambito naturale dove sviluppare questo tema è infatti quello dei
metodi variazionali.
3.4 Il moto centrale
Vediamo ora un’applicazione importante delle equazioni di Lagrange: il moto di un
punto materiale di massa m sotto la sola azione di una forza centrale del tipo
F = f (�P − O�) vers(P − O), ⇔
F = f (r)ur ,
(3.37)
come quella già vista nell’esempio 3.2.4. Introduciamo il sistema di coordinate sferiche
(r, θ, ϕ) (ovviamente centrate in O). Sappiamo che una forza della forma (3.37) è
EQUAZIONI DI LAGRANGE
109
conservativa e che la sua energia potenziale è data dalla (3.23). Per scrivere la funzione
Lagrangiana basta quindi ricordare l’esempio 3.1.3, dove si trova l’espressione esplicita
dell’energia cinetica del punto materiale (v. formula (3.9)). La funzione di Lagrange è
quindi
r
1 2
2
2 2
2
2
L = T − V (r) = m ṙ + r θ̇ + r sin θ ϕ̇ +
f (s) ds .
2
ro
Si noti che la ϕ è una coordinata ciclica (v. definizione 3.3.1). Questo implica, in virtù
della proposizione 3.3.2, che il momento coniugato
pϕ =
∂L
·
∂ϕ
= m r2 sin2 θ ϕ̇ ,
è costante durante il moto, ovvero un suo integrale primo.
Per integrare le equazioni è bene scegliere in modo opportuno il sistema di riferimento (si noti che le equazioni che abbiamo scritto valgono per qualsiasi riferimento
purché abbia origine in O; ci resta quindi la libertà di ruotare gli assi come più ci fa
comodo). Posizioniamo quindi l’asse delle x in modo che P si trovi, all’istante iniziale, su questo asse. Ciò significa che al tempo iniziale (che possiamo prendere, senza
π
perdere in generalità, come t = 0) si ha ϕ(0) = 0 e θ(0) =
(la prima condizione
2
iniziale è ovvia, per la seconda si osservi che l’asse delle x appartiene al piano z = 0
comunque siano posizionati gli assi). Ora ruotiamo il sistema di riferimento attorno
all’asse x finchè la velocità iniziale v 0 si trovi nel piano z = 0. Questa scelta è univoca se la velocità iniziale non è parallela al vettore P0 − O che individua la posizione
iniziale, P (t = 0) = P0 , ovvero se v 0 ∧ (P0 − O) �= 0. Questa è detta condizione
di non degenerazione del problema del moto in un campo centrale. E’ facile vedere
che se questa condizione è violata, il moto si riduce a un moto unidimensionale sulla
retta individuata dai punti P0 e O. Notiamo poi che la condizione P0 ≡ O deve essere
eslcusa in molti casi perché la forza non è definita in O. Inoltre se P0 ≡ O, il sistema
di coordinate lagrangiane non è definito22 .
Con questa scelta degli assi si ha che, nel punto P0 , ur = e1 , uθ = −e3 , uϕ = e2 ,
dove e1 , e2 , e3 , sono i versori degli assi x, y e z, rispettivamente. Di conseguenza
abbiamo θ̇(0) = 0.
π
Vogliamo ora far vedere che θ(t) ≡
è compatibile con le equazioni di moto.
2
Scriviamo infatti l’equazione di Lagrange per la variabile θ
d ∂L
∂L
= mθ̈ + 2mr ṙ θ̇2 − mr2 ϕ̇2 cos θ sin θ = 0,
−
dt ∂ θ̇
∂θ
π
ed osserviamo che è sempre soddisfatta prendendo θ(t) = costantemente23, qualun2
que siano le funzioni (incognite) r(t) e ϕ(t). Ne segue che il moto avviene nel piano
22 Si
ricordi l’esempio 1.4.2, det J = − r 2 sin θ, si annulla per r = 0.
fatto che l’angolo θ(t) sia sempre uguale a π2 implica che il moto avviene nel piano z = 0, con la
nostra scelta degli assi. La cosa fisicamente significativa è che il moto avviene su un piano, non che questo
sia il piano z = 0! Ma questo potevamo dedurlo a priori senza far intervenire alcun sistema di coordinate:
··
infatti poiché il moto è centrale, abbiamo sempre x ∧ (P − O) = 0 (la forza, e quindi l’accelerazione, è
diretta come la congiungente di P con O) da cui si deduce che v ∧ (P − O) = L, è un vettore costante. Di
conseguenza il moto avviene nel piano (fisso) passante per O e perpendicolare a L.
23 Il
110
LEZIONI DI SISTEMI DINAMICI
z
y
z’
vo
y’
Po
x
Figura 3.1: Posizionamento del piano coordinato
θ = π/2, ovvero dal piano determinato dal centro del moto O, dalla posizione iniziale P0 e dalla direzione della velocità iniziale v 0 . Inoltre, posto θ = π/2 nelle altre
due equazioni, otteniamo un sistema di due equazioni differenziali per le sole r e ϕ,
che possiamo risolvere con le opportune condizioni iniziali, ottenendo la soluzione del
sistema nella forma r = r(t), θ = π/2 e ϕ = ϕ(t).
Riscriviamo quindi la Lagrangiana del problema tenendo conto del fatto che θ ≡
π/2 (cioè del fatto che il moto avviene su di un piano)
L=
1 2
m ṙ + r2 ϕ̇2 − V (r) .
2
Ricordando che ϕ è ciclica, cioè che
pϕ = m r2 ϕ̇ = costante ,
(3.38)
possiamo introdurre la quantità
Ȧ =
1 2
r ϕ̇ ,
2
⇔
pϕ = 2mȦ,
(3.39)
detta velocità areolare, e immediatamente dedurre che
mȦ = cost.
=⇒
Ȧ = cost.
Tale risultato, cioè la conservazione della quantità Ȧ, si può interpretare osservando
che 12 r2 ϕ̇ rappresenta la variazione rispetto al tempo dell’area spazzata dal raggio
vettore P − O, ovvero dell’area del settore di piano compreso tra i vettori P (t1 ) − O
e P (t0 ) − O e la traiettoria sul piano del punto P (t) per t ∈ [t0 , t1 ]. Abbiamo così
EQUAZIONI DI LAGRANGE
111
dimostrato la seconda legge di Keplero24 (che vale per qualsiasi forza centrale del tipo
(3.37)):
Il raggio vettore spazza aree uguali in tempi uguali.
Nota 3.4.1 Ricordando la definizione (3.29), o meglio la (3.30), calcoliamo l’Hamiltoniana del sistema
H=T +V =
1 2
m ṙ + r2 ϕ̇2 + V (r).
2
Adesso, tenendo conto del fatto che la ϕ è ciclica, l’Hamiltoniana “semplificata” è
2
2
= m ṙ + m 2Ȧ + V (r),
H
2
r2
(3.40)
2
p2
= m ṙ + 1 ϕ + V (r).
ovvero H
2
2r2 m
Esempio 3.4.1 Vediamo come si giunge alla conservazione della velocità areolere per
punti materiali in campi centrali tramite il metodo del momento angolare del punto
materiale rispetto ad O, definito come
LO = x∧ mẋ.
Se l’unica forza agente sul punto materiale P è di tipo centrale come la (3.37), è facile
provare che L̇O = 0. Infatti
˙
L̇O = x∧
mẋ + x∧ mẍ
=0
= x∧ f (r)ur = 0,
(3.37)
dal momento che, in coordinate sferiche, x = rur . Pertanto LO (t) = LO (0), ∀ t ≥
0. Ci sono quindi due possibilità:
1. LO (0) �= 0 .
2. LO (0) = 0 .
Nel primo caso il punto materiale non transita mai per l’origine (se infatti P transitasse per O si avrebbe LO (0) = 0). Il moto inoltre avvine su di un piano che
contiene il punto O, dal momento che, ∀ t ≥ 0, x · LO (t) = x · LO (0) = 0. Ma
x · LO (0) = 0, scritta in coordinate cartesiane, è proprio l’equazione di un piano
che passa per l’origine O, ed è perpendicolare al vettore LO (0). Quindi, operando
in coordinate sferiche, orientiamo il sistema di riferimento affinchè il piano del moto coincida con θ = π/2. Ricordando la (3.8), scriviamo il momento angolare in
coordinate sferiche
LO (0) = mrκr ∧ (ṙκr + rϕ̇ sin θ κϕ ) = mr2 ϕ̇κr ∧ κϕ ,
e quindi
�LO � = costante, =⇒
mr2 ϕ̇ = costante,
24 Johannes von Kepler (Weil der Stadt, 1571 – Ratisbona, 1630) fu un astronomo, matematico e musicista
tedesco.
112
LEZIONI DI SISTEMI DINAMICI
che è esattamente la (3.38).
Nel secondo caso abbiamo che x (t) e ẋ (t) sono costantemente paralleli. Utilizzando ancora le coordinate sferiche si ottien
mrϕ̇ur ∧ uϕ = 0, ⇒ ϕ̇ = 0,
0 = mrur ∧ ṙur + ϕ̇uϕ + θ̇uθ , =⇒
⇒ θ̇ = 0,
mrθ̇ur ∧ uθ = 0,
e quindi ϕ (t) = ϕo , θ (t) = θo . Il moto avviene quindi sulla retta che passa per
l’origine ed è caratterizzata dagli angoli ϕo , e θo .
3.4.1 L’equazione per r
Scriviamo ora l’equazione per la variabile r (t) tenendo conto del fatto che θ ≡ π/2,
d ∂L
∂L
∂V (r)
−
= mr̈ − mrϕ̇2 +
= 0.
(3.41)
dt ∂ ṙ
∂r
∂r
Possiamo ora riscrivere la (3.41) eliminando la dipendenza da ϕ̇ tramite la (3.39). Si
ha quindi
(2Ȧ)2
∂
(2Ȧ)2
∂V (r)
mr̈ − m 3 +
= 0, ⇒ mr̈ = −
m
+ V (r)
(3.42)
r
∂r
∂r
2r2
che ci dice che, in un moto centrale, il raggio evolve come la posizione di un punto
materiale che si muove su una retta sotto l’azione di una energia potenziale (spesso
detta energia potenziale efficace) data da
2
2Ȧ
V (r) = m 2 + V (r) .
(3.43)
r
Possiamo quindi studiare l’evoluzione di r(t) usando le tecniche sviluppate per i moti
unidimensionali nella sezione 2.6 del capitolo 2. Infatti moltiplicando la (3.42) per ṙ,
si ottiene
d m 2
m 2
ṙ + V (r) = 0, =⇒
ṙ + V (r) = E,
(3.44)
dt 2
2
dove E è l’energia, che si mantiene costante durante il moto. Notiamo che tale risultato
2
discende dalla proposizione 3.3.1, dal momento che m
2 ṙ + V (r) , altro non è che
data dalla (3.40).
l’Hamiltoniana “semplificata” H
Nota 3.4.2 Possiamo ricavare l’equazione (3.42) anche col metodo della funzione di
Routh illustrato nella sezione 3.3.1. Dalla (3.38) abbiamo
pϕ
ϕ̇ (pϕ , r) =
,
m r2
per cui
R (ṙ, r)
=
L (ϕ̇ (pϕ , r) , ṙ, r) − pϕ ϕ̇
ϕ ,ṙ,r)
L(p
=
=
p2ϕ
m 2
m 2 pϕ 2
ṙ +
r
−
V
(r)
−
2
2
m r2
m r2
2
m 2
1 pϕ
ṙ − 2
− V (r).
2
2r m
EQUAZIONI DI LAGRANGE
113
Dalla formula (3.33) deduciamo
2
2Ȧ
∂V
∂V
1 p2ϕ
+
= 0, ⇔ mr̈ − m
= 0,
+
mr̈ − 3
3
r m
∂r
r
∂r
che è proprio l’equazione (3.42).
3.4.2 Il problema di Keplero
Il problema di Keplero è il moto di una massa m l’azione di una forza centrale di questo
tipo
mK
F =−
2 vers (P − O) , con K = costante > 0.
�P − O�
che scritta in coordinate sferiche diventa
F =−
mK
ur .
r2
L’energia potenziale è dunque (si veda l’esempio 3.2.4)
V (r) = −
mK
.
r
(3.45)
L’energia potenziale efficace per r è quindi data da
2Ȧ2
mK
V (r) = m 2 −
,
r
r
(3.46)
il cui grafico (v. figura 3.2) presenta un asintoto verticale in r = 0 (limr→0 Ṽ = +∞),
Ȧ)2
ha limite 0− per r → +∞ ed ha un minimo negativo per r = (2K
, con valore
dell’energia
1 mK 2
(2Ȧ)2
E0 = Ṽ
=−
< 0.
(3.47)
K
2 (2Ȧ)2
Si noti che il valore E0 dipende da Ȧ
Al livello di energia minimo corrisponde un’orbita circolare, in quanto r resta costante durante il moto. La risultante soluzione (r(t), ϕ(t)) del problema di Keplero
è dunque periodica nel tempo poiché, dalla (3.38), anche ϕ̇ = cost., cioè il punto
materiale ruota con velocità angolare costante attorno al centro d’attrazione O.
Ai livelli di energia E compresi tra E0 e 0 corrispondono intervalli rm ≤ r (t) ≤
rM , limitati di soluzioni della diseguaglianza Ṽ < E, quindi soluzioni r(t) periodiche
rispetto a t. Ricordiamo poi che, fissato E ∈ (E0 , 0), i limiti rm , rM dell’intervallo
dove varia r (t) si trovano risolvendo l’equazione algebrica25
25 Nota
V (r) = E, =⇒
E=
mK
2mȦ2
,
−
r2
r
che E < 0 e quindi le due radici della (3.48) sono positive.
(3.48)
114
LEZIONI DI SISTEMI DINAMICI
0
Figura 3.2: Grafico della funzione energia potenziale efficace V (r) per il problema di
Keplero.
mentre il periodo di “oscillazione” di r (t) (distanza dal centro di attrazione), che è dato
da (v. sezione 2.6.1, formula (2.42))
rM
dr
.
T =2
rm
(2Ȧ)2
E
2K
2 −
+
m
r2
r
Ora, il fatto che r (t) sia periodica non è sufficiente per affermare che la soluzione
(r(t), ϕ(t)) dell’intero problema sia periodica. Infatti durante il periodo l’angolo
subisce una variazione ∆ϕ che può essere calcolata a partire dalla conservazione della
velocità angolare espressa dalla (3.39)
T
2Ȧ
2Ȧ
ϕ̇ (t) = 2 , ⇒ ϕ (T ) − ϕ (0) =
dt.
(3.49)
2 (t)
r (t)
r
0
∆ϕ
Il moto risulterà periodico solo se l’incremento ∆ϕ subito dall’angolo nel singolo periodo T (che lo ricordiamo ancora è il periodo di oscillazione della distanza r dal
centro) è un multiplo razionale di 2 π. Infatti se
∆ϕ =
2k
π,
N
allora dopo un tempo N T (cioè dopo N periodi) abbiamo r(N T ) = r(0) e
ϕ(N T ) = ϕ(0) + N ∆ϕ = ϕ(0) + 2 k π,
ovvero il punto materiale ha compiuto k giri attorno ad O. Il punto si trova nella stessa
posizione (e con la stessa velocità) che aveva al tempo t = 0.
EQUAZIONI DI LAGRANGE
115
L’integrale (3.49) tramite cui si calcola ∆ϕ ha il difetto di essere un integrale nella
variabile temporale, e quindi per calcolarlo si deve conoscere l’espressione esplicita di
r (t), che però non abbiamo. Quindi, anziché ∆ϕ calcoliamo ∆ϕ/2
T /2
∆ϕ
2Ȧ
=
dt,
(3.50)
2
2
r (t)
0
e nell’integrale e operiamo la seguente sostituzione di variabile
ρ = r (t) , ⇒ dρ = ṙ (t) dt.
Se sfruttiamo la (3.44) per esprimere ṙdt in termini di r (t), e di conseguenza in termini
di ρ
dρ
2
E − V (ρ) dt, ⇒ dt =
dρ =
.
m
(3.44)
2
E − V (ρ)
ṙ
m
26
la (3.50) può essere così riscritta
rM
rM
∆ϕ
2Ȧ
dρ
2Ȧ
dρ
=
=
. (3.51)
2
2
2
ρ
ρ
2
rm
rm
2E
(2Ȧ)2
2K
E − V (ρ)
−
+
m
m
ρ2
ρ
L’integrale (3.51) si calcola facilmente cambiando variabile z =
2Ȧ
rm
∆ϕ = 2
2Ȧ
rM
2Ȧ
, da cui si ottiene
ρ
dz
,
2E
K
2
−z + z
m
Ȧ
(3.52)
2Ȧ 2Ȧ
e
) sono le due radici del trirM rm
nomio che compare a denominatore. Infatti, siccome rM e rm sono le due radici della
(3.48), abbiamo
2
E
2Ȧ2
2Ȧ
2E
K
K 2Ȧ
2
− 2 −
−
= 0, =⇒
= 0,
−
m
rm
rm
m
rm
Ȧ rm
Osserviamo che i limiti di integrazione (ovvero
e analogamente
2
2Ȧ2
2Ȧ
2E
K
K 2Ȧ
E
− 2 −
−
= 0, =⇒
= 0.
−
2
m
rM
rM
m
rM
Ȧ rM
Pertanto, ponendo zM =
(3.52)
2Ȧ
2Ȧ
, e zm =
, con zM < zm , possiamo così riscrivere la
rM
rm
∆ϕ = 2
z
m
zM
26 Ovviamente
dz
.
(zm − z) (z − zM )
r (0) = rm , mentre r (T /2) = rM .
116
LEZIONI DI SISTEMI DINAMICI
Ora, come già osservato nella sezione 2.9,
notevole e vale π. Quindi
�
zm
zM
√
dz
√
, è un integrale
zm − z z − zM
(3.53)
∆ϕ = 2π ,
Possiamo quindi affermare che il moto, per valori negativi di E, è un moto periodico, e
che la traiettoria è una curva semplice (senza auto-intersezioni) che contiene il centro
del moto al suo interno27.
Esempio 3.4.2 Consideriamo il caso di una forza di richiamo elastica del tipo F =
k
−krur , dove k è la costante elastica. L’energia potenziale è V (r) = − r2 , mentre,
2
ricordando la (3.43), il potenziale efficace
2Ȧ2
ω2 2
k
r , dove, al solito, ω 2 = .
V� (r) = m 2 + m
r
2
m
(3.54)
�
In figura 3.3 è riportato l’andamento di V� (r). Si può
� notare che V (r) ha un asintoto
� � �2
�
� �
4
2Ȧ
�
� �
verticale per r = 0, e presenta un minimo in re =
,
dove
vale
V
=
2
�Ȧ� ω.
e
ω2
Quindi se E > Ve il moto in r è periodico e si svolge all’interno dell’intervallo
[rm , rM ], dove rm e rM sono le due soluzioni di
cioè
�
�
2 E − V� (r) = 0, =⇒
rm
rM
=
=
2E
−
m
�
�2
2Ȧ
r2
− ω 2 r2 = 0,
(3.55)
�
�
�
�2
�
�
�
�
� E
2Ȧω
�
�
� mω 2 1 − 1 − E/m ,
�
�
�
�2
�
�
�
�
� E
2Ȧω
�
�
� mω 2 1 + 1 − E/m .
27 Nel dimostrare questo risultato abbiamo usato lo stesso argomento che ci aveva permesso di dimostre
l’isocronia del moto armonico. In quel caso avevamo anche mostrato un risultato di “unicità” dei potenziali
isocroni: il solo potenziale (simmetrico) isocrono è quello elastico.
Anche per i moti centrali vale un teorema analogo, noto come Teorema di Bertrand che afferma che i soli
potenziali centrali che ammettano moti periodici per ogni condizione iniziale sono quello elastico e quello
kepleriano (in questo caso soltanto per E < 0). Per la dimostrazione, se ci limitiamo ad energie potenziali
della forma V (r) = −k r α , α �= 0 e kα < 0 (per avere una foza attrattiva) oppure V (r) = −k ln r,
k > 0, basta osservare che il caso α = −1 e α = 2 sono i soli in cui si possa riportare l’integrale
rM
2Ȧ
dr
∆ϕ = 2
r2
(2Ȧ)2
2
rm
2E/m − r 2 − m
V (r)
alla forma (3.53) tramite un opportuno cambiamento di variabile.
EQUAZIONI DI LAGRANGE
117
V( r )
r
Figura 3.3: Grafico di V (r), data dalla (3.54).
Calcoliamo adesso, sfruttando la (3.51), la variazione dell’angolo ϕ in un semiperiodo
rM
∆ϕ
2Ȧ
dρ
=
.
2
2
2
ρ
rm
2Ȧ
2E
−
− ω 2 ρ2
m
ρ2
Introducendo al solito z =
2Ȧ
, otteniamo
ρ
2Ȧ
∆ϕ
=
2
rm
2Ȧ
rM
zdz
2 ,
2E 2
z − z 4 − ω 2 2Ȧ
m
che a sua volta, ponendo u = z 2 /2, si riscrive così
um
du
∆ϕ
=
2 ,
2
4E
uM
2
2
u − 4u − ω 2Ȧ
m
2
2
1 2Ȧ
1 2Ȧ
, um =
. E’ facile vedere che quest’ultimi sono le
dove uM =
2 rM
2 rm
radici del trinomio che appare sotto radice. Infatti sostituendo si ottiene proprio la
118
LEZIONI DI SISTEMI DINAMICI
(3.55). Quindi possiamo scrivere
um
du
= 2π,
∆ϕ = 2
(u
−
u
uM
m ) (uM − u)
π
e dunque concludere che il moto del punto materiale è periodico.
3.4.3 L’orbita del problema di Keplero
Vogliamo adesso determinare l’equazione dell’orbita del punto materiale. Cerchimo
quindi di esprimere r in funzione dell’angolo ϕ, cioè r = r (ϕ). La conservazione
della velocità areolare ci permette di eliminare il tempo dalle due equazioni del moto
·
(la (3.42) e la (3.39)). Infatti abbiamo che ϕ è sempre diversa da zero e quindi la ϕ è
una funzione monotona del tempo. Possiamo quindi invertire ϕ = ϕ(t) ed esprimere
il tempo, e tutte le funzioni del tempo, e quindi la stessa r (t), come funzioni di ϕ.
Cominciando con r, cerchiamo r = r (t (ϕ))
e
d2 r
d
=
dt2
dt
1
,
r
dr
dr dϕ
=
dt
dϕ dt
(3.39)
d 1
(2Ȧ)2 d2
1
−2Ȧ
=− 2
.
dϕ r
r dϕ2 r
dr
dt
=
d
dt
2Ȧ dr
d
= −2Ȧ
r2 dϕ
dϕ
=
Sostituendo nella (3.42) dove V (r) è data dalla (3.45), otteniamo, dopo ovvie semplificazioni,
d2
1
K
1
+ −
= 0,
(3.56)
2
dϕ
r
r
(2Ȧ)2
cioè
d2
dϕ2
K
1
−
r
(2Ȧ)2
=−
K
1
−
r
(2Ȧ)2
,
che, posto
y (ϕ) =
1
K
−
,
r (ϕ) (2Ȧ)2
è un equazione del tipo y ′′ = −y: l’equazione dell’oscillatore armonico, la cui generica
soluzione è
y (ϕ) = y0 cos(ϕ + β).
In particolare, ponendo y0 =
K
e, avremo
(2Ȧ)2
K
1
=
[1 + e cos(ϕ + β)] ,
r (ϕ)
(2Ȧ)2
(3.57)
dove e > 0 e β ∈ [0, 2π) sono due costanti determinate dalle condizioni inziali
r (t = 0) = r0 e ṙ (0) = ṙ0 . Per quanto riguarda ϕ ricordiamo che abbiamo già
EQUAZIONI DI LAGRANGE
119
scelto ϕ(t = 0) = 0, quindi ϕ = 0, sarà l’angolo iniziale. Inserendo quindi le condir2 ϕ̇0
e la definizione di E data dalla (3.48), cioè
zioni iniziali ϕ0 = 0, r0 , ṙ0 e Ȧ = 0
2
2
2mȦ
mK
E=
, otteniamo
−
2
r0
r0
tan β
=
e =
ṙ0
1
,
2Ȧ 1 − K
r0
(2Ȧ)2
�
E (2Ȧ)2
1+2
.
m K2
(3.58)
(3.59)
Osserviamo poi che possiamo sempre orientare l’asse x in maniera da avere β = 0.
Pertanto, ponendo
1
K
=
,
(3.60)
p
(2Ȧ)2
l’equazione dell’orbita (3.57) si riscrive così
p
= 1 + e cos ϕ.
r (ϕ)
(3.61)
Al variare di e > 0, abbiamo tre possibili casi.
Primo caso. 0 < e < 1.
Riscrivendo la (3.61) otteniamo
r (ϕ) =
p
,
1 + e cos ϕ
(3.62)
che implica rm ≤ r ≤ rM , dove
1
rm
=
,
p
1+e
rM
1
=
.
p
1−e
(3.63)
E’ facile convincersi che, ricordando la sezione 3.4.2, questo caso corrisponde al caso
− |E0 | < E < 0, dove E0 è dato dalla (3.47). Infatti dalla (3.59) e dalla (3.47)
otteniamo28
�
|E|
< 1.
(3.64)
e= 1−
|E0 |
Notiamo inoltre che risolvendo la (3.48), si ottengono rm e rM , cioè
�
�
�
�
1
1
1
K
|E| (2Ȧ)2
|E|
1+ 1−
=
(1 − e) ,
=
1+ 1−2
=
2
2
rm
m
K
(3.47)
p
|E
|
(3.64)
p
(2Ȧ)
0
(3.60)
1
K
=
1−
rM
(2Ȧ)2
�
�
�
�
1
1
|E| (2Ȧ)2
|E|
1− 1−
=
(1 + e) ,
1−2
=
(3.47) p
m K2
|E0 | (3.64) p
(3.60)
120
LEZIONI DI SISTEMI DINAMICI
y
P
F
ϕ
2δ
O
H
x
Figura 3.4: Ellisse in coordinate polari.
che coincidono esattamente con (3.63).
Vediamo adesso che l’equazione (3.62), nel caso e < 1, rappresenta un’ellisse in
cui il punto O, centro attrattore, occupa uno dei due fuochi. Infatti, osservando la figura
3.4, l’ellisse con fuochi F e O è il luogo dei punti P tali che29
(3.65)
P F + P O = 2d,
dove d è un parametro fissato maggior di δ, distanza fra i fuochi. Ora dalla figura 3.4
deduciamo
2
2
2
PF =
F O + OH + P H = (2δ + r cos ϕ) + r2 sin2 ϕ
4δ 2 + 4δr cos ϕ + r2 .
=
Quindi sostinutendo nella (3.65)
4δ 2 + 4δr cos ϕ + r2 = 2d − r,
ed elevando al quadrato si ha
r (d + δ cos ϕ) = d2 − δ 2 , ⇒ r =
28 Si
p
,
1 + e cos ϕ
ricordi che E < 0.
con questo calcolo otteniamo un’ellisse il cui asse maggiore coincide con l’asse polare.
Quindi l’afelio, ovvero il punto più distante dall’origine, corrisponde all’angolo ϕ = π, come nella figura,
oppure ϕ = 0 se invertiamo i fuochi. In altre parole questa rappresentazione corrisponde a un angolo β = π
(β = 0) nella (3.57). Questo in generale non sarà vero per il moto in quanto, avendo scelto ϕ(0) = 0, non
possiamo anche assumere che ṙ(0) = 0 come si ha nei punti di massima distanza dal centro del moto
29 Ovviamente
EQUAZIONI DI LAGRANGE
se poniamo e = δ/d, e p =
prima legge di Keplero:
121
1
d2 − δ 2
=
1 − e2 . Possiamo quindi enunciare la
d
d
Il pianeta percorre un orbita ellittica di cui il Sole occupa uno dei fuochi.
Secondo caso. e = 1.
Ricordando la (3.64), e = 1 ⇒ E = 0, e quindi un’orbita aperta, rM → ∞ (v. figura
3.2). In questo caso l’orbita è una parabola. Infatti dalla (3.62) si deduce
r + r cos ϕ = p.
(3.66)
Se adesso si passa a coordinate cartesiane, cioè
P − O = xe1 + ye2 , =⇒ r = x2 + y 2 , e r cos ϕ = x.
Quindi elevando al quadrato la (3.66) si ottiene
x=−
y2
p
+ ,
2p 2
cioè una parabola il cui asse coincide con l’asse x e vertice in x = p/2. E’ abbastanza
semplice verificare che la (3.57) è l’equazione di una conica (basta esprimere r e cos ϕ,
sin ϕ in coordinate cartesiane e razionalizzare).
Terzo caso. e > 1.
Ricordando la (3.59), questo caso corrisponde ad E > 0, e quindi ad orbite aperte. Se
e > 1, esistono angolo “proibiti” che sono tutti quelli che soddisfano la disuguaglianza
1
cos ϕ > − .
e
L’orbita (3.62) si riduce ad un ramo di iperbole (la dimostrazione viene lasciata per
esercizio).
3.4.4 La terza legge
A partire dall’equazione per l’orbita possiamo calcolare le lunghezze dei semiassi maggiore a e minore b dell’ellisse nel caso e < 1. Abbiamo infatti, posto rm e rM il
minimo e il massimo raggio,
a
=
b
=
1
1
p
(rm + rM ) =
,
2
(3.63) 2 (1 − e2 )
a 1 − e2 .
(3.67)
(3.68)
Possiamo ora calcolare in termini dei parametri fisici l’area spazzata dal raggio vettore
in una rivoluzione, ovvero l’area dell’ellisse
T
area ellisse = πab =
Ȧ dt = ȦT,
(3.69)
0
122
LEZIONI DI SISTEMI DINAMICI
siccome la velocità areolare è costante. Nella (3.69) possiamo eliminare b
πa2 1 − e2 = Ȧ T ,
da cui elevando al quadrato
T2 =
cioè
π2 3 p
π2 4
a 1 − e2 =
a
(3.67) Ȧ2
2
Ȧ2
= a3
(3.60)
4π 2
,
K
T2
4π 2
=
,
a3
K
che è la terza legge di Keplero:
I quadrati dei periodi di rivoluzione dei pianeti stanno tra loro nel rapporto dei cubi
dei semiassi maggiori delle orbite.
Notiamo infine che la terza legge afferma (indirettamente) che il rapporto
pendente dal pianeta considerato e dalle condizioni iniziali.
T2
a3
è indi-
Capitolo 4
Sistemi vincolati e coordinate
lagrangiane
Molti esempi di sistemi meccanici quali il moto di un punto su una traiettoria assegnata,
il moto di un pendolo semplice, etc. prevedono una descrizione in questi termini: il
“corpo” è rappresentato tramite un punto materiale; ad esso sono applicate delle forze
specificate in funzione della sua posizione e velocità; si richiede infine che il moto
soddisfi a delle limitazioni a priori sulle sue possibili posizioni e velocità. Per esempio,
nel caso del pendolo semplice, il moto deve avvenire in modo che il punto mantenga
invariata la sua distanza da un punto fisso.
Nel caso dei sistemi rigidi le limitazioni al moto consistono nell’assumere che le
mutue distanze dei punti restino costanti durante il moto del corpo.
Vogliamo qui dare uno schema matematico per il trattamento di un sistema (finito)
di punti materiali soggetti a tali limitazioni, che chiameremo vincoli. Per questo è
necessario iniziare dallo studio della cinematica.
4.1 Sistemi olonomi
Consideriamo uno spazio affine euclideo A di dimensione 3 in cui è definito un riferimento cartesiano ortogonale {O, ex , ey , ez }. E’ poi dato un sistema di N punti
materiali {Pi , i = 1, 2, .... N } i cui vettori posizione sono xi , i = 1, . . . , N ,
xi = xi ex + yi ey + zi ez .
·
Al solito indichiamo con xi =
dxi
il vettore velocità del punto Pi .
dt
Definizione 4.1.1 Si dice vincolo cinematico per il sistema una qualsiasi relazione tra
le posizioni, le velocità e il tempo del tipo
·
·
F (x1 , . . . , xN , x1 , . . . , xN , t) = 0 ,
che chiameremo equazione vincolare.
(4.1)
124
LEZIONI DI SISTEMI DINAMICI
Definizione 4.1.2 Diremo che un sistema di punti è vincolato se i vettori posizione e
velocità dei punti che lo compongono sono soggetti a uno o più vincoli della forma
(4.1), ovvero sono assegnate m equazioni vincolari
·
·
gk (x1 , . . . , xN , x1 , . . . , xN , t) = 0 ,
(4.2)
k = 1, . . . , m .
Nella quasi totalità dei sistemi di interesse fisico, le equazioni in (4.2) hanno una forma
semplificata in quanto le velocità compaiono linearmente nelle funzioni gk ,
·
·
gk (x1 , . . . , xN , x1 , . . . , xN , t) = hk (x1 , . . . , xN , t)
+
n
�
i=1
·
bi (x1 , . . . , xN , t) · xi .
(4.3)
In molti casi, poi, è possibile integrare queste equazioni vincolari, determinando un
insieme di funzioni fk , k = 1, . . . , m, per cui sia abbia
f1 (x1 , . . . , xN , t) = 0,
f2 (x1 , . . . , xN , t) = 0,
..
.
fm (x1 , . . . , xN , t) = 0,
(4.4)
e le equazioni (4.3) siano conseguenza (tramite una semplice derivazione rispetto al
tempo) delle (4.4). Un esempio di vincolo imposto sulla velocità, che però può essere
“integrato” e quindi si traduce in un vincolo sulle coordinate, è il vincolo di rotolamento
puro che verrà analizzato nell’esempio 4.1.2.
Definizione 4.1.3 Se tutti gli m vincoli cui il sistema è soggetto sono espressi nella
forma (4.4) allora diremo che il sistema è olonomo. Quando invece i vincoli sono nella
forma generale (4.2) e non possono esser tutti ricondotti alla forma (4.4), parleremo
di vincoli anolonomi.
Diremo infine che un vincolo è fisso se il vincolo non dipende dal tempo1 , cioè se la
funzione vincolare non dipende esplicitamente dal tempo
fk (x1 , . . . , xN ) = 0, ∀ k = 1, . . . , m.
Da ora in poi ci limitiamo a trattare di sistemi di vincoli olonomi, ovvero del tipo
(4.4), eventualmente dipendenti dal tempo.
1 I vincoli fissi sono di gran lunga i più comuni. Inoltre la dipendenza esplicita delle equazioni vincolari
dal tempo complica un po’ la trattazione: si consiglia di “leggere” tutto questa trattazione almeno una volta
supponendo i vincoli fissi, ovvero eliminando le dipendenze esplicite dal tempo.
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
125
R3N
C(t1)
C(t2)
Figura 4.1: Rappresentazione schematica dello spazio delle configurazioni C(t), a due
diversi istanti di tempo t1 e t2 .
la 3N -upla costituita dalle
Nel seguito, per ragioni di brevità, denoteremo con x
coordinate degli N punti, cioè
= (x1 , . . . , xN ) = (x1 , y1 , z1 , ... , xN , yN , zN ) ∈ R3N .
x
x1
(4.5)
xN
Iniziamo con il formulare alcune richieste sulle funzioni fk :
1. Il sistema (4.4), inteso appunto come sistema di m equazioni in 3N incognite, (le
coordinate dei punti Pi ), abbia soluzioni per ogni tempo t, o in altri termini, che
∈ R3N , per cui (4.4) è soddisfatto, sia non
ad ogni istante t, l’insieme delle x
vuoto. Questa è l’ovvia richiesta che il sistema di punti “possa stare da qualche
parte!”. Indicheremo con C(t) ⊂ R3N , l’insieme delle soluzioni del sistema
(4.4), e lo chiameremo spazio delle configurazioni all’istante t
∈ R3N : x
è soluzione di (4.4) al tempo t .
C(t) = x
Gli elementi di C(t), ovvero le 3N -uple soluzioni di (4.4), vengono detti configurazioni.
Ovviamente l’insieme C(t) evolve nel tempo poiché i vincoli variano in t. Se i
vincoli sono tutti fissi, allora C è un insieme fissato indipendente dal tempo.
2. Le funzioni fk siano “abbastanza” regolari in C(t) ⊂ R3N , per ogni t, e altrettanto come funzioni di t. In pratica, chiederemo tutte le fk abbiano derivate
seconde continue.
126
LEZIONI DI SISTEMI DINAMICI
3. I vincoli che abbiamo imposto siano tutti effettivi, ovvero che non ci siano nel
sistema (4.4) equazioni vincolari implicate da altre (per esempio, non ci siano
equazioni che sono combinazioni lineari di altre). Il teorema della funzione
implicita (o teorema del Dini2 ) ci fornisce la condizione per cui tale richiesta è soddisfatta. Costruiamo la matrice jacobiana delle derivate prime delle fk rispetto a tutte le 3N variabili (che possiamo pensare di aver ordinato
(x1 , y1 , z1 , ... , xN , yN , zN )). Abbiamo una matrice di m righe e 3N colonne
∂f1
∂f1
∂f1
∂f1
∂f1
∂f1
. . . ∂x
∂x1
∂y1
∂z1
∂yN
∂zN
N
...
...
... ... ...
...
...
.
(4.6)
...
...
... ... ...
...
...
∂fm
∂fm
∂fm
∂fm
∂fm
∂fm
. . . ∂x
∂x1
∂y1
∂z1
∂yN
∂zN
N
I vincoli saranno tutti effettivi se, per ogni tempo t, il rango di questa matrice è
massimo3 .
Denotiamo, d’ora in poi, con
∂fk
=
∂xj
�
∂fk ∂fk ∂fk
,
,
∂xj ∂yj ∂zj
�
,
(4.7)
il vettore gradiente di fk rispetto alle coordinate (xj , yj , zj ), coordinate del j-esimo
punto materiale ed introduciamo, in R3N , i vettori gradiente
�
�
∂fk
∂fk
�
, ··· ,
∇fk =
∂x1
∂xN
� ∂f ∂f ∂f
∂fk ∂fk ∂fk �
k
k
k
, k = 1, 2, ..., m.(4.8)
, ··· ,
,
,
,
,
=
∂x1 ∂y1 ∂z1
∂xN ∂yN ∂zN
�
��
�
�
��
�
∂fk
∂x1
∂fk
∂xN
Osserviamo quindi che la condizione di rango massimo, ovvero la condizione 3, equivale ad affermare che gli m vettori gradiente
� 1 , ∇f
� 2 , . . . , ∇f
� m,
∇f
sono linearmente indipendenti per ogni punto di C(t) e per ogni tempo t.
Se le condizioni 1, 2 e 3 sono soddisfatte, il teorema della funzione implicita ci
� 0 ∈ C(t0 ), possiagarantisce che fissato un tempo t0 ed una generica configurazione x
� 0 , e un intervallo I contenente t0 , tale che,
mo trovare un intorno B (�
x0 ) ∈ C(t0 ), di x
limitatamente a B (�
x0 ) e all’intervallo I, è possibile isolare
l = 3N − m,
(4.9)
coordinate indipendenti ed esprimere tutte le altre in termini di tali l coordinate. Per
� ∈
essere più precisi, è possibile, almeno per t ∈ I, esprimere le configurazioni x
2 Ulisse
Dini (Pisa 1845 – Pisa 1918) è stato un matematico italiano.
il rango non può essere maggiore del massimo tra m e 3N , quindi abbiamo implicitamente
assunto che m ≤ 3N . Se m = 3N la condizione di rango massimo implica che C si riduce a un insieme di
punti isolati di R3N e di conseguenza il sistema non possiede libertà di movimento. Nel seguito assumeremo
sempre che m < 3N .
3 Ovviamente
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
127
B (
x0 ) soltanto in funzione di l variabili indipendenti, le quali, a loro volta, variano
in un opportuno aperto U ⊂ Rl , e non necessariamente coincidono con le coordinate
cartesiane.
Quindi, in generale, il teorema della funzione implicita garantisce l’esistenza di un
aperto U ⊂ Rl , di un intervallo I contenente t0 , e di un’applicazione differenziabile da
U × I in R3N che, fissato t ∈ I, opera così4
( q1 , q2 , · · · , ql ,
t )
∈U
ovvero
∈I
−→
=x
(q1 , q2 , · · · , ql , t) ,
x
(q1 , q2 , · · · , ql , t) −→ (x1 (q1 , q2 , · · · , ql , t) , . . . , xN (q1 , q2 , · · · , ql , t)) , (4.10)
∈ U ×I
e gode delle seguenti proprietà:
• per ogni t ∈ I, l’applicazione tra U e B (
x0 ) ∩ C(t) è biunivoca;
• le 3N funzioni
xi (q1 , · · · , ql , t) = (xi (q1 , · · · , ql , t) , yi (q1 , · · · , ql , t) , zi (q1 , · · · , ql , t)) ,
i = 1, ..., N , sono di classe C 1 nelle variabili q1 , q2 , · · · , ql , e t;
• ∀ (q1 , q2 , · · · , ql ) ∈ U , e ∀ t ∈ I ,
fk (x1 (q1 , · · · , ql , t) , . . . , xN (q1 , · · · , ql , t) , t) = 0 , ∀ k = 1, 2, ..., m .
Diremo che le (q1 , . . . , qn ) sono un sistema di coordinate locali adattate a C(t), e le
chiameremo coordinate lagrangiane, o parametri lagrangiani. Per brevità denote la l-upla costituita dalle coordinate lagrangiane, cioè
remo con q
= (q1 , q2 , · · · , ql ) .
q
Il numero l di parametri lagrangiani viene anche detto numero di gradi di libertà del
sistema.
stiano in un aperto U di Rl significa che le
Nota 4.1.1 Il fatto che le coordinate q
stesse possono variare arbitrariamente in U mantenendo, al tempo stesso, i punti
x1 (q1 , q2 , · · · , ql , t), . . . , xN (q1 , q2 , · · · , ql , t), nello spazio delle configurazioni C(t)
∈ U , si ha
per ogni t ∈ I. In altri termini, avviene che, ∀ t ∈ I, comunque si scelga q
4 La notazione x
(q1 , ..., ql , t) sta ad indicare che le coordinate x
degli N punti materiale dipendono sia
dai parametri lagrangiani (q1 , ..., ql ) (i quali a loro volta dipenderanno dal tempo) sia esplicitamente dal
tempo t, a causa del moto dei vincoli. Infatti, anche se le coordinate lagrangiane (q1 , ..., ql ) rimangono
costanti nel tempo, le posizioni x1 , . . . , xN , dei punti materiali possono evolvere a causa del moto dei
vincoli.
128
LEZIONI DI SISTEMI DINAMICI
che il sistema di vincoli (4.4) è soddisfatto, cioè
f1 (�
x (�
q , t) , t) = 0,
x (�
q , t) , t) = 0,
f2 (�
..
.
fm (�
x (�
q , t) , t) = 0.
Nota 4.1.2 E’ importante rimarcare il fatto che l’applicazione che consente di esprime
� (�
le coordinate x1 , ..., xN , in termini dei parametri lagrangiani q1 , ..., ql , cioè x
q , t),
è locale. Non è detto, in generale, che esista un’unica applicazione che permetta di
� ∈ C(t), in funzione delle stesse q
�.
esprimere tutte le configurazioni x
Nota 4.1.3 E’ opportuno osservare che le coordinate lagrangiane q1 , ..., ql , sono indipendenti, cioè possono variare ad arbitrio all’interno dell’aperto U ⊂ Rl . Non
sarebbe così se, per esempio, il sistema fosse soggetto ad un ulteriore vincolo olonomo
del tipo fm+1 (x1 , ..., xl ) = 0. E’ evidente che potremmo sempre utilizzare tale ulteriore vincolo per ridurre i parametri lagrangiani5, portandoli ad (l − 1), tuttavia in
talune circostanze (che, per esempio, vedremo nella sezioni 5.3.2 e 8.4.1) questa strada
può non essere la migliore. In questo caso allora le q1 , ..., ql , variabili lagrangiane
non sono indipendenti, ma devono soddisfare una condizione del tipo
(4.11)
Φ (q1 , ..., ql ) = fm+1 (x1 (�
q ) , ..., xl (�
q )) = 0.
Dunque q1 , ..., ql , non possono variare ad arbitrio nell’aperto U ⊂ Rl , dovendo essere
soddisfatta la (4.11).
Esempio 4.1.1 Sono dati due punti materiali P1 e P2 . Il primo punto materiale P1 è
vincolato sull’asse z, mentre il secondo sulla circonferenza giacente sul piano (x, y),
centrata nell’origine, il cui raggio r varia nel tempo secondo la legge r (t) = αt. Si
vuole determinare l’equazione dei vincoli, il numero dei gradi di libertà e selezionare
i parametri lagrangiani.
Cominciando dalla (4.5), abbiamo N = 2 punti materiali
� = (x1 , x2 ) = (x1 , y1 , z1 , x2 , y2 , z2 ) .
x
Quindi, prescindendo dai vincoli, abbiamo bisogno di 3N = 6 parametri per individuare la posizione dei due punti materiali rispetto al sistema di riferimento prescelto.
Adesso consideriamo i vincoli che, nello stile della (4.21), scriveremo come
x, t) = f1 (x1 , x2 , t) = 0, =⇒ x1 = 0,
f1 (�
P1 vincolato
asse z
x, t) = f2 (x1 , x2 , t) = 0, =⇒ y1 = 0,
f2 (�
x, t) = f4 (x1 , x2 , t) = 0, =⇒ x22 + y22 − α2 t2 = 0,
f3 (�
x, t) = f3 (x1 , x2 , t) = 0, =⇒ z2 = 0,
f4 (�
5 Si
P2 vincolato
circonferenza
piano (x, y)
sottintende che gli m + 1 vincoli soddisfino sempre le sopraelencate proprietà 1, 2 e 3.
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
129
I vincoli dunque sono 4, e banalmente soddisfano i requisiti 1, 2. Dobbiamo verificare
se i vincoli sono effettivi, cioè se il requisito 3 è soddisfatto. In questo caso la matrice
(4.6) è
� 1
∇f
1 0 0 0
0
0 0
�
0 1 0 0
0
0 0
∇f2
,
�
=
0 0 0 0 2x2 2y2 0
∇f3
0 0 0 0
0
0 1
� 4
∇f
il cui rango è 4. Infatti, poiché x22 + y22 = α2 t2 , sicuramente uno fra x2 e y2 , è non
nullo. Supponendo che x2 �= 0, dalla matrice 4 × 6, possiamo estrarre il minore 4 × 4
1 0 0
0
0 1 0
0
0 0 2x2 0 ,
0 0 0
1
il cui determinante è non nullo. I 4 vincoli sono dunque effettivi e allora, applicando
(4.9), possiamo individuare
l = ����
3N − ����
m = 2,
6
4
coordinate lagrangiane. Quindi, come parametri lagrangiani, possiamo utilizzare:
( i ) z1 = q1 ∈ R, e x2 = q2 , con q ∈ (−αt, αt) , da cui
� �
α2 t2 − q22 ,
nel semipiano y2 > 0,
�
y2 =
2
2
2
− α t − q2 nel semipiano y2 < 0.
Osserviamo, come rimarcato nella nota 4.1.2, la parametrizzazione non è globale. Infatti non abbiamo un’unica espressione per y2 in funzione x2 , ma ne
abbiamo due che si applicano “localmente”.
( ii ) z1 = q1 ∈ R, e y2 = q2 , con q2 ∈ (−αt, αt) , da cui
� �
α2 t2 − q22 ,
nel semipiano x2 > 0,
�
x2 =
2
2
2
− α t − q2 nel semipiano x2 < 0.
( iii ) z1 = q1 ∈ R, e l’angolo q2 ∈ [0, 2π), che il vettore (P2 − O) forma con l’asse
delle ascisse. In tal caso
x2
=
αt cos q2 ,
y2
=
αt sin q2 .
Pertanto, utilizzando la parametrizzazione (iii), quando scriviamo esplicitamente la
(4.10) abbiamo U = R× [0, 2π), I = (0, +∞),
� (q1 , q2 , t) = (x1 (q1 , q2 , t) , x2 (q1 , q2 , t)) ,
(q1 , q2 , t) −→ x
� �� �
∈ U ×I
130
LEZIONI DI SISTEMI DINAMICI
che nello specifico vuol dire
x1 (q1 , q2 , t) =
=
x2 (q1 , q2 , t) =
=
(x1 (q1 , q2 , t) , y1 (q1 , q2 , t) , z1 (q1 , q2 , t))
(0, 0, q1 ) ,
(x2 (q1 , q2 , t) , y2 (q1 , q2 , t) , z2 (q1 , q2 , t))
(αt cos q2 , αt sin q2 , 0) .
= (q1 , q2 ), si ha
E quindi, se q
(4.12)
(
x
q , t) = (0, 0, q1 , αt cos q2 , αt sin q2 , 0) .
Esempio 4.1.2 Un esempio di vincolo (4.3) che coinvolge le derivate rispetto al tempo ma che si può integrare è il vincolo di rotolamento puro. Consideriamo un disco
di raggio R che rotola lungo una guida rettilinea. Il sistema, a priori, ha solo due
gradi di libertà: l’ascissa x del centro O, e l’angolo di rotolamento ϕ. Quest’ultimo,
y
S
ϕ
O
ey
Ω
ex
C
x
Figura 4.2: Disco di raggio R che rotola senza strisciare (rotolamento puro) sulla guida
orizzontale x.
riferendoci alla figura 4.2, si misura così: si fissa sul bordo del disco un punto S (identificandolo, per esempio, con un “puntino di vernice”). L’angolo ϕ è quello formato
dal raggio SO con una retta fissata (per esempio la retta verticale). In particolare ϕ
sarà positivo se corrisponde a rotazioni antiorarie, negativo altrimenti (è il caso dell’angolo rappresentato in figura). Se C denota il punto di contatto fra disco e guida,
diremo che il disco rotola senza strisciare o rotola di rotolamento puro, se v C = 0,
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
131
cioè se, ad ogni istante, la velocità del punto di contatto è nulla. Per calcolare v C ,
applichiamo la formula dei moti rigidi (6.32) del paragrafo 6.3
·
·
vC
vO
(C − Ω) = (O − Ω) + ω ∧ (C − O) .
� �� �
� �� �
Ora, (O − Ω) = xex + Rey , =⇒ v O = ẋex , (C − O) = −Rey , e ω = ϕ̇ez , da cui,
imponendo v C = 0, otteniamo
(ẋ + Rϕ̇) ex = 0, =⇒
ẋ = −Rϕ̇,
(4.13)
cioè una relazione vincolare che coinvolge le derivate rispetto al tempo dei due gradi
di libertà. La (4.13) può però essere integrata,
x = xo − R (ϕ − ϕo ) ,
dove xo è l’ascissa di O che corrisponde all’angolo di rotolamento iniziale ϕo . Siccome possiamo sempre scegliere la configurazione iniziale in modo che xo = 0 e ϕo = 0,
abbiamo
x = −Rϕ,
(4.14)
che è una relazione che lega l’ascissa x del centro O e l’angolo di rotazione ϕ. E’
quindi sufficiente un solo parametro ad identificare le configurazioni del disco.
Notiamo che la (4.14) è coerente dal punto di vista dei segni: se ϕ < 0, il disco
ruota un senso orario e x > 0. Se invece il disco ruota in senso antiorario l’ascissa
x è negativa. Non solo ma la (4.14) ha anche un chiaro significato fisico: infatti,
prescindendo dal segno, Rϕ rappresenta la lunghezza dell’arco CS, che è uguale alla
lunghezza del segmento CΩ.
Ricaviamo infine la curva x (ϕ (t)), y (ϕ (t)) descritta dal punto S nel suo moto.
Sfruttando ancora formula dei moti rigidi (6.32) abbiamo
vS
=
v O + ϕ̇ez ∧ (S − O)
=
−Rϕ̇ex + ϕ̇ez ∧ (R sin ϕex − R cos ϕey ) ,
da cui, supponendo ϕ (0) = 0, otteniamo
dx (ϕ (t))
= −Rϕ̇ + Rϕ̇ cos ϕ,
dt
⇒ x (ϕ (t)) = −R [ϕ (t) − sin ϕ (t)] , (4.15)
x (0) = 0,
dy (ϕ (t))
= Rϕ̇ sin ϕ,
dt
⇒ y (ϕ (t)) = R [1 − cos ϕ (t)] .
(4.16)
y (0) = 0,
Notiamo infine che, ponendo ψ = −ϕ (t) e considerando −π ≤ ψ ≤ π, la curva
descritta dal sistema (4.15), (4.16) può scriversi come
x (ψ) = R(ψ + sin ψ) ,
Tale curva viene detta cicloide.
z (ψ) = R(1 − cos ψ), −π ≤ ψ ≤ π .
(4.17)
132
LEZIONI DI SISTEMI DINAMICI
Esempio 4.1.3 Consideriamo un disco di raggio r che, come in figura 4.3, si mantiene verticale e rotola senza strisciare sulla circonferenza del piano x, y, centrata in
O e avente raggio R . Il sistema, a priori, possiede due gradi di libertà identificati
z
y
O’
Q
O
r
θ
ϕ
C
R
x
Figura 4.3: Disco di raggio r che, mantenendosi verticale rotola senza strisciare sulla
circonferenza di raggio R.
dall’angolo θ, e dall’angolo di rotolamento ϕ. Le coordinate del centro del disco sono
Q − O = R cos θ ex + R sin θ ey + Rez ,
si che
v Q = −Rθ̇ sin θ ex + Rθ̇ cos θ ey .
(4.18)
ω = ϕ̇ cos θ ex + ϕ̇ sin θ ey + θ̇ez ,
(4.19)
Le componenti della velocità angolare nel SdR della figura 4.3, sono6
dove ϕ è l’angolo di rotolamento (misurato come nell’esempio 4.1.2). Applicando
(6.32) (vedi sezione 6.3) ed imponendo v C = 0 (vincolo di rotolamento puro) si ottiene
0
cioè
= v C = v Q + ω ∧ (C − Q)
=
−Rθ̇ − rϕ̇ sin θex + Rθ̇ + rϕ̇ cos θey ,
θ̇ = −
6 La
r
ϕ̇, =⇒
R
formula (4.19) viene dimostrata nell’esempio 6.8.1.
θ=−
r
ϕ,
R
(4.20)
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
133
dove, al solito, abbiamo orientato gli assi x e y e in modo che θo = ϕo = 0. Ancora
una volta, quindi, un vincolo che coinvolge derivate rispetto al tempo si traduce in un
vincolo olonomo.
4.1.1 Spostamenti virtuali in funzione delle coordinate lagrangiane
Nella formulazione della meccanica dei sistemi vincolati è essenziale caratterizzare
tutte le possibili variazioni di configurazione che un sistema di punti può effettuare a
partire da una configurazione data. Per fissare le idee supponiamo per il momento che
il sistema sia soggetto soltanto a m vincoli fissi
f1 (x1 , . . . , xN ) = 0,
f2 (x1 , . . . , xN ) = 0,
..
.
fm (x1 , . . . , xN ) = 0.
(4.21)
Sia C ⊂ R3N , lo spazio delle configurazioni. Sia B ⊆ C, un sottoinsieme di C, tale
che le coordinate di ogni suo punto possano essere espresse univocamente in termini
� = (q1 , q2 , · · · , ql ) parametri lagrangiani, i quali, a loro volta, variano nell’aperto
di q
U ⊂ Rl . Quindi, ricordando quando visto nella sezione 1.4 del capitolo 1, abbiamo
che l’applicazione
�=
U ∋q
q1
q2
..
.
ql
� (�
q) =
−→ x
x1 (q1 , q2 , ..., ql )
x2 (q1 , q2 , ..., ql )
∈ B ⊆ C ⊂ R3N ,
..
.
xN (q1 , q2 , ..., ql )
gode delle seguenti proprietà:
� (�
1. x
q ) ∈ C 1 (U ) .
� ∈ U , l’applicazione è invertibile.
2. ∀ q
� (�
Sappiamo allora che x
q ) definisce un sistema di coordinate curvilinee su B, e vale
il seguente
134
LEZIONI DI SISTEMI DINAMICI
Teorema 4.1.1 Gli l vettori di R3N ,
�
∂x
�1 =
u
=
∂q1
∂x1
(q1 , q2 , ..., ql )
∂q1
∂x2
(q1 , q2 , ..., ql )
∂q1
..
.
∂xN
(q1 , q2 , ..., ql )
∂q1
..
.
∂x1
(q1 , q2 , ..., ql )
∂ql
∂x2
(q1 , q2 , ..., ql )
∂q1
..
.
∂xN
(q1 , q2 , ..., ql )
∂ql
�
∂x
�l =
u
=
∂ql
(4.22)
,
sono linearmente indipendenti e costituiscono quindi la base locale relativa alle varia� i è ortogonale ad ogni vettore gradiente
bili q1 , q2 , ..., ql . Non solo, ma ogni vettore u
� k , cioè ∀ i = 1, 2, ... , l, e ∀ k = 1, 2, ..., m, vale7
∇f
� k
� i • ∇f
u
=
N
�
∂xs
s=1
=
∂qi
·
∂fk
∂xs
N �
�
∂xs ∂fk
s=1
∂ys ∂fk
∂zs ∂fk
+
+
∂qi ∂xs
∂qi ∂ys
∂qi ∂zs
�
= 0.
(4.23)
� i , i = 1, 2, ... , l, sono linearmente indiDim. Cominciamo col provare che i vettori u
pendenti. Supponiamo per semplicità che l sia multiplo di 3 e, sempre per semplicità,
supponiamo che, applicando il teorema di funzione implicita, le coordinate lagrangiane
7 Con
R3 .
“ • ” indichiamo il prodotto scalare in R3N , che è appunto la somma di N prodotti scalari “ · ” in
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
135
q1 , ... , ql , siano le prime l coordinate cartesiane dei primi l/3 punti materiali, cioè
x1
=
q1 ,
y1
=
yl/3
=
q2 ,
..
.
ql−1 ,
zl/3
xl/3+1
=
=
ql
xl/3+1 (q1 , q2 , ..., ql ) ,
yl/3+2
=
yl/3+2 (q1 , q2 , ..., ql ) ,
..
.
zN
=
zN (q1 , q2 , ..., ql ) .
Consideriamo adesso la matrice l × 3N , le cui righe sono le componenti dei vettori
�
∂x
�i =
u
, i = 1, ..., l,
∂qi
�
∂x
∂q1
∂x
�
∂q2
=
=
.
.
.
∂x
�
M
∂ql
=
∂x1
∂q1
∂y1
∂q1
∂z1
∂q1
···
∂zl/3
∂q1
∂xl/3+1
∂q1
···
∂x1
∂q2
∂y1
∂q2
∂z1
∂q2
···
∂zl/3
∂q2
∂xl/3+1
∂q2
···
..
.
..
.
..
.
..
.
..
.
∂x1
∂ql
∂y1
∂ql
∂z1
∂ql
∂zl/3
∂ql
∂xl/3+1
∂ql
1
0 0
···
0
∂xl/3+1
∂q1
···
0
1 0
···
0
∂xl/3+1
∂q2
···
..
.
..
.
0
0 0
∂xl/3+1
∂ql
···
..
.
..
.
···
1
···
∂zN
∂q1
∂zN
∂q2
.
..
.
∂z
···
∂zN
∂q1
∂zN
∂q2
..
.
∂z
N
∂ql
N
∂ql
Siccome è immediato verificare che le prime l colonne corrispondono alla matrice identità deduciamo che matrice ha rango massimo, cioè l. Ma questo vuol dire che gli l
�
�
∂x
∂x
� 1 , ...., u
� l , sono linearmente indipendenti.
vettori
, ...,
, ovvero u
∂q1
∂ql
Questo si estende anche al caso, più generale, in cui le variabili lagrangiane non
coincidano con le prime l coordinate dei primi l/3 punti
esi� materiali, ma comunque
�
sta una corrispondenza biunivoca fra (q1 , q2 , ...., ql ) e x1 , y1 , ...., zl/3 . Questo, per
136
LEZIONI DI SISTEMI DINAMICI
esempio, accade se (q1 , q2 , ...., ql ) sono le coordinate polari sferiche dei primi l/3
punti. In tal caso la matrice jacobiana l × l
∂yl/3 ∂zl/3
∂x1 ∂y1 ∂z1
···
∂q1 ∂q1 ∂q1
∂q1
∂q1
∂x
∂yl/3 ∂zl/3
∂y1 ∂z1
1
···
∂q2 ∂q2 ∂q2
∂q2
∂q2
J=
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
∂x
∂yl/3 ∂zl/3
∂y1 ∂z1
1
···
∂ql
∂ql ∂ql
∂ql
∂ql
è invertibile, ovvero det J �= 0. E’ quindi immediato rendersi conto che le prime l
colonne della matrice M coincidono con J. Siamo allora di nuovo in grado di isolare
in M un minore l × l con determinante non nullo e pertanto concludere che gli l vettori
� 1 , ...., u
� l , sono linearmente indipendenti. Evidentemente tutto ciò si genedi R3N , u
ralizza anche al caso in cui l non sia multiplo di 3 e le coordinate (q1 , ..., ql ) non siano
le l coordinate cartesiane dei primi punti materiali.
Proviamo adesso la (4.23). Partendo dalla k-esima equazione vincolare (4.21),
abbiamo
fk (x1 (�
q ) , . . . , xN (�
q )) = fk (x1 (q1 , q2 , ..., ql ) , . . . , xN (q1 , q2 , ..., ql )) = 0,
� = (q1 , q2 , ..., ql ) ∈ U . Ma allora se deriviamo rispetto alla generica qi
per ogni q
otteniamo
N
0=
∂fk (x1 (q1 , q2 , ..., ql ) , . . . , xN (q1 , q2 , ..., ql )) � ∂fk ∂xs
� k •u
�i .
=
·
= ∇f
∂qi
∂xs ∂qi
s=1
Il precedente teorema si estende con facilità anche al caso di vincoli mobili. In tal caso,
�1, u
� 2 , ...., u
� l , variano nel tempo ma, ad ogni istante
fissata la configurazione, i vettori u
t, sono linearmente indipendenti.
Definizione 4.1.4 Si dice spostamento virtuale8 del sistema di N punti materiale re-
8 Una piccola divagazione storica per spiegare l’origine del nome “spostamenti virtuali”. Il nome è legato
al cosiddetto Principio dei lavori virtuali, condizione per caratterizzare le configurazioni di equilibrio di un
sistema vincolato; ecco come lo riassume Lagrange nella Méchanique Analytique: Se un sistema qualsiasi
di corpi o punti soggetti a delle forze qualsiasi, è in equilibrio, e si impone a questo sistema un piccolo
spostamento qualsiasi, in virtù del quale ogni punto percorre uno spazio infinitamente piccolo che sarà
espresso dal suo spostamento virtuale, la somma delle forze, ognuna moltiplicata per lo spazio su cui essa
è applicata, percorso secondo la direzione stessa della forza, sarà sempre uguale a zero, prendendo per
positivi gli spazi percorsi nel senso della forza per negativi quelli percorsi nel senso opposto. (ovviamente
possiamo semplificare la frase di Lagrange usando i prodotti scalari tra le forze e gli spostamenti, ovvero il
lavoro delle forze.) L’idea che c’è sotto è che si “saggia” una posizione di equilibrio “provando a spostare” il
sistema dall’equilibrio stesso, in modo “infinitesimo”. Questo è ciò che si fa quando vogliamo farsi un idea
di quanto pesi una valigia: la si “prova a sollevare” da terra di un’altezza impercettibile, lo sforzo esercitato
dal nostro braccio dovrà equilibrare quello esercitato dalla forza peso.
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
137
lativo alla generica configurazione x, un qualsiasi vettore δ
x ∈ R3N
δ
x
= (δx1 , . . . , δxN )
= (δx1 , δy1 , δz1 , ...., δxN , δyN , δzN ),
δx1
tale che9
k=
δ
x • ∇f
N
s=1
δxs ·
δxN
∂fk
= 0, ∀ k = 1, 2, ...., m,
∂xs
(4.24)
k , k = 1, ..., m, il gradiente calcolato nella configurazione x. Il vettore di
essendo ∇f
3
R , δxi , i = 1, ...., N , viene detto spostamento virtuale del i-esimo punto materiale
Pi .
1 , ..., ∇f
m.
Indichiamo con10 N , il sottospazio di R3N generato dagli m gradienti ∇f
Diremo dunque che il vettore δx ∈ R3N è spostamento virtuale se δx appartiene al
sottospazio ortogonale ad N , cioè se δx ∈ N⊥ . Abbiamo quindi il seguente
Teorema 4.1.2 Ogni spostamento virtuale può esprimersi come combinazione lineare
1 , ..., u
l , cioè
degli l vettori u
δ
x=
l
s=1
s , con δqs ∈ R.
δqs u
(4.25)
In particolare, lo spostamento virtuale dell’i-esimo punto materiale è
δxi =
l
∂xi
s=1
∂qs
δqs ,
i = 1, 2, ...., N.
(4.26)
Dim. Dalla definizione 4.1.4 sappiamo che se δ
x è spostamento virtuale allora soddisfa
k , k = 1, ...., m, sono
la (4.24) per ogni k = 1, 2, ...., m. Ora, siccome i gradienti ∇f
linearmente indipendenti, ne deduciamo che il vettore δ
x = (δx1 , . . . , δxN ) deve
appartenere al sottospazio N⊥ , la cui dimensione è l = 3N − m di R3N . Siccome una
l } (vedi teorema 4.1.1), avremo la (4.25).
base di N⊥ è {
u1 , ..., u
Volendo far riferimento alla sezione 1.4, la l-upla (δq1 , ..., δql ), rappresenta la l-upla
delle componenti controvarianti del vettore δ
x rispetto alla base locale.
9 Attenzione ancora una volta alla notazione: nella formula che segue, e nel resto del capitolo, abbiamo
usato la (4.7) per indicare il gradiente
(tridimensionale)
della funzione fk rispetto alle coordinate del punto
∂fk
k , ∂fk , ∂fk
è un vettore di R3 e possiamo farne il prodotto scalare
= ∂f
materiale Ps . Quindi ∂x
∂x
∂y
∂z
s
s
s
s
con δxs ∈ R3 . Ricordiamo poi che • denota il prodotto scalare in R3N , ovvero la somma degli N prodotti
scalari di R3 .
10 Il significato geometrico di N verrà chiarito nella definizione 4.1.6.
138
LEZIONI DI SISTEMI DINAMICI
Nota 4.1.4 Osserviamo che la definizione 4.1.4 scaturisce da semplici considerazioni
fisiche. Un cambiamento di configurazione xi → x̂i , i = 1, 2, ..., N , sarà compatibile
con i vincoli se anche le nuove posizioni x̂i , i = 1, 2, ..., N , soddisfano le equazioni
vincolari, ovvero
fk (x̂1 , . . . , x̂N ) = 0 , ∀ k = 1, . . . , m .
(4.27)
Qui però siamo interessati a variazioni infinitesime delle configurazioni, ovvero a
“tendenze al moto” più che al moto effettivo: useremo la notazione δxi per indicare queste variazioni. Esse possono essere caratterizzate matematicamente chiedendo
che le configurazioni “variate” xi + δxi soddisfino le equazioni vincolari al prim’ordine nel loro sviluppo di Taylor attorno alla configurazione (x1 , . . . , xN ). Avremo
quindi una caratterizzazione per i δxi , cioè
0
=
fk (x̂1 , . . . , x̂N ) = fk (x1 + δx1 , . . . , xN + δxN )
=
fk (x1 , . . . , xN ) +
�
��
�
=0
N
�
∂fk
i=1
∂xi
· δxi ,
e quindi otteniamo la (4.24).
Nota 4.1.5 Riprendendo l’osservazione 4.1.3, vogliamo puntualizzare meglio la tesi
del teorema 4.1.2. La (4.25) è vera soltanto se le variabili lagrangiane q1 , ..., ql sono
indipendenti, cioè non soggette ad alcun ulteriore vincolo (come, ad esempio, quello
dato dalla (4.11)). Se le variabili (q1 , ..., ql ) sono vincolate (e non si vuole “eliminare”
tale vincolo passando ad (l − 1) coordinate lagrangiane) la (4.25) non rappresenta
più il generico spostamento virtuale del sistema soggetto ad (m + 1) vincoli. Infatti,
applicando la definizione 4.1.4, i vettori δ�
x ∈ R3N sono spostamenti virtuali soltanto
� m+1 = 0. Detto
se, oltre alla condizione (4.24), soddisfano anche la condizione δ�
x • ∇f
3N
in altri termini, se N denota il sottospazio di R generato dagli (m + 1) gradienti
� m , ∇f
� m+1 , δ�
� 1 , ..., ∇f
x ∈ R3N è spostamento virtuale se δ�
x ∈ N⊥ . Il punto è
∇f
� 1 , ..., u
� l , non coincide più con N⊥ . Infatti
che adesso il sottospazio generato da u
� l } = 3N − m, mentre dim N⊥ = 3N − (m + 1). Quindi la generica
dim {�
u1 , ..., u
�l
� s non individua più uno spostamento virtuale.
combinazione lineare s=1 δqs u
La procedura fin qui analizzata si estende anche al
� 1 , ...., u
� l , definiti adesso come
t ∈ I, i vettori u
∂x
1
(q1 , q2 , ..., ql , t)
∂qj
∂x
2
(q1 , q2 , ..., ql , t)
�
∂x
∂q
j
�j =
u
=
∂qi
..
.
∂x
N
(q1 , q2 , ..., ql , t)
∂qj
caso di vincoli mobili. Per ogni
, j = 1, 2, ..., l,
formano ancora la base locale relativa alle variabili (q1 , q2 , ..., ql ). Adesso però, fissata
una qualsiasi configurazione, la base locale cambia da un istante all’altro. In ogni
istante però vale sempre la (4.23), cioè
� k = 0, ∀ j = 1, ..., l; ∀ k = 1, .., m; e ∀ t ∈ I.
� j • ∇f
u
(4.28)
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
139
Quindi nel caso dei vincoli mobili, lo spazio degli spostamenti virtuali varierà non solo
da posizione a posizione ma anche al variare del tempo.
Esempio 4.1.4 E’ dato un solo punto materiale P di massa m vincolato su una circonferenza verticale centrata in O, di raggio R, che ruota attorno all’asse z. Si vogliono
determinare le equazioni vincolari, assumendo un sistema di riferimento fisso in cui
l’asse delle z è la verticale ascendente passante per O.
Il sistema è costituito da un solo punto materiale P soggetto a due vincoli: (1) P deve
stare a distanza fissata R da un punto fisso O; (2) P appartiene a un piano verticale
che ruota attorno alla verticale condotta per il punto O. La circonferenza ruotante può quindi essere vista come l’intersezione di due vincoli indipendenti (v. figura
5.1): (i) una sfera fissa di raggio R centrata nell’origine, la cui equazione implicita è
f1 (x, y, z) = x2 + y 2 + z 2 − R2 = 0; (ii) un piano ortogonale al piano x, y che ruota
attorno all’asse z, la cui equazione è f2 (x, y, z) = −x sin ϕ (t) + y cos ϕ (t) = 0,
essendo ϕ (t) l’angolo di rotazione che è una funzione assegnata del tempo. In questo
caso lo spazio delle configurazioni C(t) è la circonferenza ruotante
C(t) = {f1 (x, y, z) = 0} ∩ {f2 (x, y, z) = 0} .
E’ facile verificare che ∇f1 , e ∇f2 , sono indipendenti e quindi il teorema di funzione implicita consente di individuare un solo parametro per descrivere (almeno localmente) C(t). Ovviamente varie scelte sono possibile, ma quella forse più conveniente
consiste nel prendere come coordinata lagrangiana l’angolo θ ∈ (−π, π] formato dal
vettore (P − O) con l’asse z, (v. ancora figura 5.1). Operando così abbiamo
x (θ, t) = x (θ, t) ex + y (θ, t) ey + x (θ, t) ez ,
dove
x (θ, t) = R sin θ cos ϕ (t) ,
y (θ, t) = R sin θ sin ϕ (t) ,
z (θ, t) = −R cos θ.
(4.29)
E’ banale verificare che f1 (x (θ, t)) = 0, come del resto f2 (x (θ, t)) = 0. Il vettore
che costituisce la base locale di C(t) è
uθ =
∂x
= R cos θ cos ϕ (t) ex + R cos θ sin ϕ (t) ey + R sin θez ,
∂θ
che, chiaramente, fissato θ, varia nel tempo. Lo spostamento virtuale è δx = uθ δθ.
Viene infine lasciata come esercizio la verifica che uθ · ∇f1 = uθ · ∇f2 = 0.
�2 e
� 1, e u
Esempio 4.1.5 Riprendendo l’esempio 4.1.1, vogliamo adesso determinare u
gli spostamenti virtuali δx1 e δx2 dei due punti materiali nell’ipotesi che si faccia uso
della parametrizzazione (iii). Dalle (4.22) e (4.12), abbiamo
�1
u
�2
u
=
=
�
∂x
= (0, 0, 1, 0, 0, 0) ,
∂q1
�
∂x
= (0, 0, 0, −αt sin q2 , αt cos q2 , 0) .
∂q2
140
LEZIONI DI SISTEMI DINAMICI
Figura 4.4: Sfera di raggio R e piano ruotante. L’angolo di rotazione ϕ (t) è assegnato.
2 sono linearmente indipendenti dal momento che
1 e u
E’ facile rendersi conto che u
la matrice 2 × 6
0 0 1
0
0
0
0 0 0 −αt sin q2 αt cos q2 0
ha sempre un minore 2 × 2 con determinante non nullo. Inoltre è facile provare che
k = 0, ∀ i = 1, 2, e ∀ k = 1, ..., 4. Gli spostamenti virtuali dei punti materiali
i • ∇f
u
P1 e P2 sono dati dalla (4.26), cioè
δx1
=
∂x1
∂x1
δq1 +
δq2
∂q1
∂q2
=
∂
[x1 (q1 , q2 , t) ex + y1 (q1 , q2 , t) ey + z1 (q1 , q2 , t) ez ] δq1 +
∂q1
+
δx2
∂
[x1 (q1 , q2 , t) ex + y1 (q1 , q2 , t) ey + z1 (q1 , q2 , t) ez ] δq2
∂q2
=
ez δq1
=
∂
[x2 (q1 , q2 , t) ex + y2 (q1 , q2 , t) ey + z2 (q1 , q2 , t) ez ] δq1 +
∂q1
+
=
∂
[x2 (q1 , q2 , t) ex + y2 (q1 , q2 , t) ey + z2 (q1 , q2 , t) ez ] δq2
∂q2
(−αt sin q2 ex + αt cos q2 ey ) δq2 .
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
141
Se invece vogliamo lo spostamento virtuale come vettore di R6 , ricordando la (4.25),
abbiamo
δ�
x
� 1 δq1 + u
� 2 δq2
= u
= ( 0, 0, δq1 , −δq2 αt sin q2 , δq2 αt cos q2 , 0 ).
� �� � �
��
�
δx1
δx2
4.1.2 Velocità ed energia cinetica
Un moto qualsiasi del sistema degli N punti materiali, compatibile con i vincoli, è
determinato dall’assegnazione delle funzioni del tempo q1 (t), . . . , ql (t), e quindi dalle
relazioni
xi (t) = xi (q1 (t), . . . , ql (t), t) , i = 1, 2, ... , N.
(4.30)
Derivando la (4.30) rispetto al tempo, determineremo quindi il legame tra le velocità
dei punti del sistema e le coordinate lagrangiane11
ẋi (t) =
l
�
∂xi
s=1
∂qs
(q1 (t), . . . , ql (t), t)q̇s +
∂xi
(q1 (t), . . . , ql (t), t),
∂t
i = 1, ... , N.
(4.31)
In particolare, possiamo introdurre la velocità come vettore di R3N
ẋ1
ẋ2
� =
ẋ
.. ,
.
ẋN
e, ricordando le definizioni (4.22), scrivere
∂x
1
ẋ1
∂qs
l
.. �
..
. =
.
s=1 ∂xN
ẋN
∂qs
cioè
� =
ẋ
l
�
s=1
La velocità ha dunque due componenti:
•
•
�l
s=1
q̇s +
� s q̇s +
u
�
∂x
.
∂t
∂x1
∂t
..
.
∂xN
∂t
,
(4.32)
� s q̇s , che rappresenta la velocità dei punti materiali rispetto ai vincoli.
u
�
∂x
, detta velocità di trascinamento. Tale componente è dovuta al moto dei
∂t
vincoli.
11 Fare attenzione alla somiglianza formale tra la (4.31) e la (4.26): c’è però una sostanziale differenza tra
queste formule e non si dovrebbe procedere oltre senza averla capita!
142
LEZIONI DI SISTEMI DINAMICI
Possiamo ora utilizzare la (4.31) per esprimere l’energia cinetica T in funzione delle
coordinate lagrangiane. Avremo
T
=
N
l
1 �
1�
mi ẋ2i = T2 + T1 + T0 =
ahk (q1 (t), . . . , ql (t), t)q̇h q̇k +
2 i=1
2
h,k=1
�
��
�
T2
l
�
bh (q1 (t), . . . , ql (t), t)q̇h +
h=1
�
��
�
T1
=
N
�
mi
∂xi ∂xi
·
,
∂qh ∂qk
(4.34)
N
�
mi
∂xi ∂xi
,
·
∂qh ∂t
(4.35)
N
�
mi
∂xi ∂xi
·
.
∂t
∂t
(4.36)
i=1
bh
=
i=1
c
=
(4.33)
T0
dove i termini ahk , bh e c sono dati da12
ahk
1
c(q1 (t), . . . , ql (t), t) ,
�2
��
�
i=1
Per quanto riguarda T1 , introducendo
b1 (q1 , ..., ql , t)
b2 (q1 , ..., ql , t)
�
b (�
q , t) =
..
.
bl (q1 , ..., ql , t)
possiamo anche scrivere
,
·
�.
T1 = �
b•q
(4.37)
La parte T2 può anche essere scritta come
T2 =
dove
1� T �
q̇ Aq̇ ,
2
� =
q̇
q̇1
q̇2
..
.
q̇l
,
e A = A (q1 (t), . . . , ql (t), t), è una matrice simmetrica l × l, le cui componenti
ahk = ahk (q1 , . . . , ql , t) ,
h, k = 1, ...., l
sono date dalla (4.34).
12 Si
raccomanda di fare il calcolo delle (4.34)-(4.36), e non procedere oltre se non lo si sa fare!
(4.38)
(4.39)
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
143
Teorema 4.1.3 La forma bilineare (4.38) è definita positiva, cioè T2 > 0, e T2 = 0
� = 0.
soltanto se q̇
Dim. Facciamo vedere che det A �= 0. Infatti se per assurdo det A = 0, deve esi� ∈ Rl , w
� �= 0 il relativo
stere almeno un autovalore nullo, per cui, denotando con w
autovettore (non nullo), abbiamo
� =0
Aw
l
�
=⇒
akh wh = 0, k = 1, 2, ...., l.
h=1
Tuttavia, ricordando la (4.34), possiamo anche scrivere
0
T
� Aw
� =
= w
=
akh wk wh
h=1 k=1
�N
l
l �
�
�
∂xi ∂xi
mi
·
∂qh ∂qk
i=1
h=1 k=1
=
l �
l
�
N
�
mi
i=1
��
l
�
h=1
∂xi
wh
∂qh
�
� �
·
wk wh
l
�
k=1
∂xi
wk
∂qk
Ma allora, per ogni i = 1, 2, ...., N , il vettore
0
=
�
=
�
l
�
∂xi
wh
∂qh
�2
l
�
∂xi
wh
∂qh
�2
h=1
h=1
+
�
l
�
h=1
��
�l
h=1
∂yi
wh
∂qh
=
mi
i=1
wh
�2
N
�
�
l
�
h=1
∂xi
wh
∂qh
∂xi
è nullo, cioè
∂qh
+
�
l
�
h=1
∂zi
wh
∂qh
�2
Dunque tutti gli N vettori, i = 1, ...., N ,
l
�
∂xi
wh
∂qh
h=1
=
�
l
�
h=1
+
�
∂xi
wh
∂qh
l
�
h=1
�
∂yi
wh
∂qh
ex
�
ey +
�
l
�
h=1
devono essere nulli. Esiste quindi una l-upla non nulla
w1
� = ... =
w
�
wl
0
.. ,
.
0
∂zi
wh
∂qh
�
ez ,
.
�2
.
144
LEZIONI DI SISTEMI DINAMICI
per cui
� 1 + .... + wl u
�l
w1 u
∂x1
∂q1
∂x
2
∂q1 + .... + wl
= w1
.
..
∂xN
∂q1
�l
∂x1
wh
h=1 ∂qh
0
�l
∂x2
0
wh
h=1 ∂qh
=
=
..
..
.
.
0
�l
∂xN
wh
h=1 ∂qh
∂x1
∂ql
∂x2
∂ql
..
.
∂xN
∂ql
.
� j , j = 1, 2, ..., l, non sono linearmente inIn altri termini, gli l vettori di R3N , u
dipendenti e ciò contraddice il teorema 4.1.1. Abbiamo quindi provato che la forma
bilineare (4.38) non può essere degenere. Il fatto che sia definita positiva discende
banalmente dalla definizione di energia cinetica. Infatti, supponendo di “congelare” i
� T Aq̇
� > 0, se per q̇
�
vincoli13 , si deduce, dall’espressione di T (4.33), che la matrice q̇
non nullo. La forma quadratica (4.38) è dunque definita positiva.
Osserviamo infine che, sfruttando la (4.37) e la (4.38) possiamo riscrivere l’energia
cinetica nella seguente forma compatta
1� T � � �
(4.40)
q̇ Aq̇ + b • q̇ + T0.
2
Esempio 4.1.6 Riferendoci all’esempio 4.1.4, vogliamo adesso determinare la velocità e l’energia cinetica del punto materiale. La velocità del punto materiale P discende
dalla (4.29)
∂x
ẋ = θ̇uθ +
,
∂t
dove
∂x
dϕ (t)
dϕ (t)
= −R
sin θ sin ϕ (t) ex + R
sin θ cos ϕ (t) ey ,
∂t
dt
dt
rappresenta la velocità di trascinamento, mentre θ̇uθ è la velocità rispetto al vincolo.
dϕ
è la velocità assegnata
Lo ricordiamo ancora: ϕ (t) è una funzione nota, e dunque
dt
di rotazione del vincolo.
L’energia cinetica del punto materiale è
�
�
� �2
�
� m
dϕ
mR2
2
2
2
T θ, θ̇, t =
|ẋ| =
θ̇ +
sin θ .
(4.41)
2
2
dt
T =
13 Per
“congelare”, o meglio, immobilizzare i vincoli è sufficiente considerare nulla la velocità di
∂x
= 0.
trascinamento, cioè porre
∂t
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
145
2
mR2
dϕ
2
dove
sin θ è la parte di energia cinetica dovuta al moto del vincolo.
2
dt
In particolare, confrontando la (4.41) con la (4.33), abbiamo
mR2 2 mR2
T θ, θ̇, t =
θ̇ +
2 2
T2
4.1.3 Punto vincolato sulla superficie
dϕ
dt
2
T0
sin2 θ .
(4.42)
Come primo esempio di cinematica di un sistema vincolato vediamo, in dettaglio, il
caso di un solo punto materiale vincolato a una superficie fissa (quindi non dipendente
dal tempo) che viene assegnata come insieme di livello di una funzione. Pertanto,
data f : W → R, funzione (o campo scalare) definita su un sottoinsieme aperto W
di A, spazio tridimensionale affine euclideo, la superficie è l’insieme dei punti P ∈
W , tali che f (P ) = 0. In simboli {P ∈ U : f (P ) = 0} . Supponiamo che in A sia
dato un riferimento cartesiano ortonormale {O, ex , ey , ez }, sì che ogni punto P è
identificato dal vettore
(P − O) = x, con x = xex + yey + zez .
La superficie allora si identifica come14
C = x ∈ R3 : f (x) = 0 .
(4.43)
L’insieme C ⊂ R3 , la superficie appunto, è dunque lo spazio delle configurazioni, che
ovviamente assumiamo non vuoto15. In particolare, se f è di classe16 C 2 la superficie
si dice regolare (o non singolare) in x0 ∈ C, se17 ∇f (x0 ) �= 0, ovvero se
2
|∇f (x0 )| =
∂f (x0 )
∂x
2
+
∂f (x0 )
∂y
2
+
∂f (x0 )
∂z
2
�= 0.
(4.44)
La superficie si dirà poi globalmente regolare (o globalmente non singolare) se è
regolare in ogni punto di C. Supponiamo quindi di aver a che fare con una superficie
globalmente regolare. Tale potesi consente l’applicazione del teorema della funzione
implicita per ogni x ∈ C. In base a tale teorema f (x, y, z) = 0 è localmente il
∂f
grafico di una funzione. Se, ad esempio,
�= 0, in x0 , allora, sul piano (x, y)
∂z
esiste un intorno aperto U di (xo , yo ), per cui la superficie può localmente scriversi
come grafico, z = z (x, y). In altri termini, il teorema del Dini consente di individuare
un’applicazione che ai parametri (q1 , q2 ) ∈ U , con U ⊂ R2 , intorno aperto di (xo , yo ),
14 Anche
adesso con x intendiamo la terna (x, y, z). Quindi f (x) = f (x, y, z).
1 del paragrafo 4.1. Infatti, se per esempio avessimo
15 Richiesta
f (x, y, z) = x2 + y 2 + z 2 + 16,
è chiaro che l’insieme C ⊂ R3 , costituito dei punti (x, y, z) tali che f (x, y, z) = 0, sarebbe vuoto.
16 Proprietà di regolarità del vincolo (richiesta 2 del paragrafo 4.1).
17 Richiesta 3 del paragrafo 4.1.
146
LEZIONI DI SISTEMI DINAMICI
associa il vettore x (q1 , q2 )
(q1 , q2 ) → x (q1 , q2 ) = q1 ex + q2 ey + z (q1 , q2 ) ez
x = q1 ,
y = q2 ,
⇔
z = z (q1 , q2 ) .
Questo significa che, localmente18 , la superficie può essere espressa in forma parametrica mediante i parametri19 (q1 , q2 ).
Si introducono i due vettori
ui =
∂x
∂x
∂y
∂z (q1 , q2 )
=
ex +
ey +
ez ,
∂qi
∂qi
∂qi
∂qi
i = 1, 2,
(4.45)
detti vettori tangenti alla superficie. Nel caso specifico essi sono
u1 = ex +
∂z (q1 , q2 )
∂z (q1 , q2 )
ez , u 2 = ey +
ez ,
∂q1
∂q2
dove, sfruttando ancora il teorema della funzione implicita,
� �
� �
∂f
∂f
∂z (q1 , q2 )
∂z (q1 , q2 )
∂x
∂y
= −� �,
= −� �.
∂f
∂f
∂q1
∂q2
∂z
∂z
E’ facile provare che u1 , u2 sono linearmente indipendenti. Infatti, la matrice 2 × 3
formata delle componenti di u1 , u2 ,
ha rango massimo
1 0
0 1
∂z
∂q1
,
∂z
∂q2
Nota 4.1.6 Allo stesso risultato saremmo potuti giungere anche mostrando che u1 ∧
u2 �= 0. Infatti,
u1 ∧ u2
∂z
∂z
ex −
e y + ez
∂q1
∂q2
�
�
∂f
1
1
∂f
∂f
� �
ex +
ey +
ez = � � ∇f .
∂f
∂f
∂x
∂y
∂z
∂z
∂z
= −
=
Pertanto u1 ∧ u2 è parallelo a ∇f , che è non nullo dal momento che la superficie è
regolare.
18 E’
importante osservare che, in generale, la parametrizzazione non è globale.
a questo livello, q1 e q2 altro non sono che le variabili x, y.
19 Ovviamente,
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
Inoltre abbiamo
147
�
∂f
�
�
∂f
∂f
∂f
∂x
�
�
e
e
e
e
e
−
+
+
u1 · ∇f =
·
z
x
y
z = 0,
x
∂f
∂x
∂y
∂z
∂z
�
ed analogamente u2 · ∇f = 0.
Quindi, volendo generalizzare, il teorema della funzione implicita garantisce che,
per ogni punto della superficie regolare, esiste un intorno in cui la superficie è rappresentabile come l’immagine di un aperto U di R2 . Ovvero esistono tre funzioni
x(q1 , q2 ), y(q1 , q2 ) e z(q1 , q2 ) di due variabili (le variabili lagrangane o parametri
lagrangani) (q1 , q2 ) ∈ U ⊂ R2 , tali che
Le curve
f (x(q1 , q2 ), y(q1 , q2 ), z(q1 , q2 )) = 0 , per ogni (q1 , q2 ) ∈ U.
q1 → (x(q1 , q2 ), y(q1 , q2 ), z(q1 , q2 )) , q2 = costante,
e
q2 → (x(q1 , q2 ), y(q1 , q2 ), z(q1 , q2 )) , q1 = costante.
formano il reticolo di linee coordinate sulla superficie f = 0. Introducendo poi i vettori
tangenti alla superficie
ui =
∂x (q1 , q2 )
∂y (q1 , q2 )
∂z (q1 , q2 )
ex +
ey +
ez ,
∂qi
∂qi
∂qi
i = 1, 2,
(4.46)
è facile provare che sono linearmente indipendenti e che ui · ∇f = 0, i = 1, 2.
Nota 4.1.7 E’ opportuno rimarcare ancora che la parametrizzazione della superficie
non è univoca. Per intendersi, anziché usare i parametri (q1 , q2 ) ∈ U ⊂ R2 , potremmo
descrivere la superficie utilizzando i parametri (s1 , s2 ) ∈ W ⊂ R2 , ammesso che
esista un’applicazione biunivoca che ci consenta di scrivere
q1 = q1 (s1 , s2 ) ,
q2 = q2 (s1 , s2 ) ,
(4.47)
e le loro inverse: s1 = s1 (q1 , q2 ), s2 = s2 (q1 , q2 ). Utilizzando le variabili (s1 , s2 ),
la superficie viene vista come l’immagine dell’aperto W , attraverso le tre funzioni
x(s1 , s2 ), y(s1 , s2 ) e z(s1 , s2 ). L’invertibilità della trasformazione (4.47) è garantita
dalla condizione det J �= 0, dove, in questo caso, J è la matrice jacobiana
∂q1
∂q1
∂s1
∂s2
(4.48)
J=
.
∂q2
∂q2
∂s1
∂s2
Definizione 4.1.5 Si definisce piano tangente, Π (P0 ) , alla superficie nel punto20
P0 , il piano per P0 i cui punti sono ortogonali a ∇f (P0 ). In simboli
Π (P0 ) = {Q ∈ A : (Q − P0 ) · ∇f (P0 ) = 0} .
20 La
superficie è regolare in P.
(4.49)
148
LEZIONI DI SISTEMI DINAMICI
Definizione 4.1.6 Si definisce spazio normale alla superficie S nel punto P0 , e lo
si denota con N (P0 ), il complemento ortogonale dello spazio tangente, ovvero il
sottospazio di21 V formato da tutti i vettori ortogonali a Π (P0 ) ,
N (P0 ) = {v ∈ V, : v = λ∇f, con λ ∈ R} .
(4.50)
In particolare se il punto P0 è identificato dal vettore (P0 − O) = x0 , avremo che il
punto Q, identificato dal vettore (Q − O) = x, giace sul piano tangente se (x − x0 ) ·
∇f (x0 ) = 0. Evidentemente, una definizione equivalente di piano tangente può essere
anche data in termini dei due vettori u1 e u2 ,
Π (P0 ) = {Q ∈ A : (Q − P0 ) = α1 u1 + α2 u2 , con αi ∈ R, i = 1, 2} ,
mentre una definizione equivalente di spazio normale è
N (P0 ) = {v ∈ V, : v = λ (u1 (P0 ) ∧ u2 (P0 )) , con λ ∈ R} .
Possiamo quindi concludere che ogni spostamento virtuale relativo alla generica
configurazione x è un vettore del piano tangente, cioè
δx = u1 δq1 + u2 δq2 ,
(4.51)
dove δq1 , δq2 sono numeri reali qualsiasi.
Definiamo poi, in ogni punto della superficie, la matrice simmetrica i cui elementi
sono i prodotti scalari dei vettori tangenti (4.46)
u1 · u1
u2 · u1
,
A=
(4.52)
u1 · u2
u2 · u2
�
�
E F
22
, che viene detta prima forma quadratica fondausualmente denotata
F G
mentale della superficie. Osserviamo che la matrice A non è altro che la matrice
metrica (1.8) relativa alla base {u1 , u2 }. Infatti, la restrizione del prodotto scalare al
piano tangente dà luogo ad una forma bilineare simmetrica definita positiva. In altre
parole, se π 1 = α1 u1 + α2 u2 , e π2 = β1 u1 + β2 u2 , sono due vettori del piano
tangente, allora
π1 · π2
=
=
=
21 Ricordiamo
(α1 u1 + α2 u2 ) · (β1 u1 + β2 u2 ) =
�
�
��
�
� E F
β1
α1 α2
F G
β2
�
�
��
�
� E F
α1
β1 β 2
.
F G
α2
(4.53)
che V è lo spazio vettoriale che soggiace allo spazio affine euclideo A.
faccia attenzione al fatto che le componenti della matrice E, F e G sono, in generale, funzioni di
(q1 , q2 ), ovvero E = E (q1 , q2 ), F = F (q1 , q2 ) e G = G (q1 , q2 ).
22 Si
SISTEMI VINCOLATI E COORDINATE LAGRANGIANE
149
La forma è definita positiva proprio perché il prodotto scalare è definito positivo. Infatti, per ogni vettore π = α1 u1 + α2 u2 �= 0 del piano tangente potremo scrivere
(assumendo, per esempio, α2 �= 0)
�
�
α1
π · π = α22 Eξ 2 + 2F ξ + G , con ξ =
.
α2
Ora il trinomio in ξ è sempre positivo dal momento che il discriminante è
�
�
F 2 − GE = − |u1 ∧ u2 |2 < 0,
(v. formula (4.57)).
Nota 4.1.8 Osserviamo che la forma bilineare (4.53) è indipendente dalla parametrizzazione della superficie. Infatti, rifacendoci alla nota 4.1.7, se al posto di (q1 , q2 )
∂x
∂x
facciamo uso della coppia (s1 , s2 ), i cui vettori tangenti sono h1 =
, h2 =
,
∂s1
∂s2
la matrice della forma bilineare, rispetto alla nuova base h1 , h2 , è data da
M̂ =
�
Ê
F̂
F̂
Ĝ
�
F̂
Ĝ
�
=
�
h1 · h1
h1 · h2
h1 · h2
h1 · h2
�
.
Si può facilmente dimostrare che
�
Ê
F̂
=J
T
�
E
F
F
G
�
(4.54)
J,
dove J è data dalla (4.48). In particolare, dati due vettori π 1 , π 2 sullo spazio tangente,
tali che
�
�
�
�
α1 u1 + α2 u2
δ1
α1
π1 →
=J
,
con
α2
δ2
δ1 h1 + δ2 h2
π2 →
β1 u1 + β2 u2
γ1 h1 + γ2 h2
con
�
β1
β2
�
=J
�
γ1
γ2
�
,
mostriamo che π1 · π 2 è indipendente dalla base prescelta. Infatti, indicando con
(π 1 · π 2 )(u1 ,u2 ) , la forma bilineare espressa nella base u1 , u2 , e con (π1 · π2 )(h1 ,h2 ) ,
l’espressione della forma rispetto a h1 , h2 , proviamo che
(π1 · π 2 )(u1 ,u2 ) = (π 1 · π2 )(h1 ,h2 ) .
150
LEZIONI DI SISTEMI DINAMICI
Dalla23 (4.53)
(π1 · π2 )(u1 ,u2 ) =
=
=
δ1
(4.54)
δ2
δ1
JT
δ2
α2
α1
E
F
Ê
F̂
E
F
F
G
β1
β2
γ1
J
γ2
F̂
γ1
= (π 1 · π 2 )(h1 ,h2 ) .
γ2
Ĝ
F
G
Ora, i parametri lagrangiani (q1 , q2 ) saranno, in generale, funzioni del tempo. Scriveremo pertanto
x (t) = x (q1 (t) , q2 (t)) ex + y (q1 (t) , q2 (t)) ey + z (q1 (t) , q2 (t)) ez .
Il vettore velocità del punto materiale è
∂x
∂y
∂z
ex +
ey +
ez q̇i (t)
ẋ (t) =
∂qi
∂qi
∂qi
i=1,2
ui
= q̇1 (t) u1 + q̇2 (t) u2 .
(4.55)
·
tangente e le sue componenti, rispetto alla base
Quindi x (t) è un vettore dello spazio
q̇1
.
u1 , u2 , sono date dalla coppia
q̇2
m
·
2
|ẋ| . Siccome x è un vettore del piano
L’energia cinetica del punto è T =
2
tangente facciamo uso della forma bilineare (4.53) per calcolarne la norma, cioè
E F
m 2
m
q̇1
q̇1 q̇2
|ẋ| =
T =
F G
q̇2
2
2
m 2
E q̇1 + 2F q̇1 q̇2 + Gq̇22 .
(4.56)
=
2
Concludiamo mostrando come, nel caso di un solo punto materiale vincolato su
una superficie regolare, il teorema 4.1.3 sia facilmente dimostrabile. Infatti
det A
=
=
2
2
2
EG − F 2 = |u1 | |u2 | − (u2 · u1 )
(4.57)
2
2
2
2
2
|u1 | |u2 | 1 − cos2 θ = |u1 | |u2 | sin2 θ = |u1 ∧ u2 | > 0,
dal momento che u1 e u2 non sono paralleli.
23 Ricordiamo
che
T
α1
=
α2
α1 α2
T
δ1
JT
δ2
δ1 δ2
Capitolo 5
Le equazioni di moto per sistemi
vincolati
Sia {Pi , mi , i = 1, . . . , N }, un sistema di punti materiali, che supponiamo soggetto a
un sistema di m vincoli olonomi
fk (x1 , ...., xN , t) = 0 , k = 1, . . . , m .
(5.1)
Supponiamo poi che il sistema di punti materiali sia soggetto a delle forze, indipendentemente dal fatto che il suo moto debba risultare a priori vincolato. Indicheremo con F i
la risultate delle forze applicate al punto Pi . Chiameremo queste forze direttamente
applicate.
Sotto l’azione di tali forze il moto del sistema retto dalle equazioni mi ẍi = F i ,
i = 1, ...., N , non risulterà in genere incompatibile con le equazioni vincolari (5.1).
Per esempio si pensi a un punto appoggiato su un piano orizzontale: in questo caso la
forza direttamente applicata è la forza peso, e il punto abbandonerà il piano orizzontale
durante il moto sotto l’azione di questa forza, violando così il vincolo che gli impone
a rimanere sul piano orizzontale. Se vogliamo salvaguardare i vincoli e le equazioni
di Newton, dobbiamo supporre che i vincoli “esercitino” delle forze Ri sui punti del
sistema in modo che le soluzione delle equazioni
mi ẍi = F i + Ri ,
i = 1, . . . , N ,
(5.2)
risultino compatibili con le equazioni vincolari (5.1). Chiameremo le forze Ri , dovute
ai vincoli, reazioni vincolari.
Le (5.1) assieme alle (5.2) formano un sistema di 3N + m equazioni da cui dovremmo ricavare sia le incognite di moto (le 3N coordinate dei punti Pi ) sia le 3N
componenti delle reazioni vincolari Ri . Poiché m < 3N , il sistema risulta indeterminato, ovvero non possiamo da queste sole “informazioni” determinare la soluzione
completa del problema del moto vincolato (a meno di non caratterizzare maggiormente
le reazioni Ri ).
152
LEZIONI DI SISTEMI DINAMICI
5.1 Dinamica di un punto vincolato sulla superficie.
Iniziamo esaminando il caso più semplice di un solo punto materiale (P, m) vincolato
a muoversi su una superficie fissa regolare (vincolo olonomo fisso) data dalla (4.43).
Come abbiamo già detto le equazioni di moto
(5.3)
m ẍ = F + R ,
dovranno contenere la forza R incognita, il cui scopo è quello di far sì che la soluzione
di (5.3) soddisfi, ad ogni istante t, la condizione vincolare f (x, y, z) = 0. Ciò ci dà un
sistema indeterminato, avendo solo quattro equazioni per determinare sei incognite, le
coordinate di P e le componenti di R.
L’indeterminatezza del problema così formulato è dovuta al fatto che non abbiamo
specificato “come” il vincolo, nella sua realizzazione fisica, intervenga per assicurarci
il soddisfacimento della condizione f (x, y, z) = 0. Pensiamo per esempio, ad un
oggetto appoggiato su di un tavolo: il piano del tavolo impedisce all’oggetto di cadere,
in termini più formali, genera quella forza necessaria a contrastare l’effetto della forza
peso. Quindi una componente della forza vincolare R è tale da impedire al corpo di
abbandonare il vincolo. Ma cosa succede se tentiamo di muovere l’oggetto sul piano
stesso? Ogni vincolo “reale” si opporrà a tale moto: è l’effetto che va sotto il nome
di attrito. Questo effetto viene schematizzato tramite una componente di R che ha
sempre direzione e verso opposti alla velocità del corpo. Ora, siccome la velocità del
punto materiale giace sul piano tangente, la componente di R dovuta all’attrito starà
sul piano tangente. Potremo quindi effettuare questa scomposizione
(5.4)
R = R � + R⊥ ,
dove R� giace nel piano tangente (e dunque sarà esprimibile come combinazione
lineare di u1 e u2 ) mentre R⊥ giace nello spazio tangente, per cui, ricordando la
(4.50),
R⊥ = λ∇f,
(5.5)
dove λ ∈ R, è un parametro incognito, detto moltiplicatore di Lagrange, il cui valore
dipenderà dalla posizione e dalla velocità del punto.
La forza R� è causata dell’attrito. Essa viene generalmente espressa in termini di
altre quantità dinamiche (es. velocità, R⊥ , etc.) e di parametri fisici (coefficienti di
attrito, etc.). Ovviamente, per R� esistono vari modelli di attrito1 o, come si usa dire
in meccanica, varie equazioni costitutive. Una volta selezionato il modello il vettore
R� viene espressa (in maniera più o meno complicata) in funzione di altre quantità.
La forza R⊥ rappresenta la componente della forza vincolare che la superficie (il
vincolo) esercita sulla particella per mantenerlo su di essa. Notiamo che, in generale,
R⊥ è incognita (cioè, data la (5.5), λ è incognito). Infatti, a differenza di R� , non esiste
alcuna espressione costitutiva per R⊥ , dal momento che essa deve poter assumere
qualunque valore necessario per non far allontanare il punto materiale dalla superficie.
In molti casi possiamo ridurre l’intensità di R� (componente di R dovuta all’attrito), e pensare ad un modello ideale in cui questa resistenza al moto viene a mancare
1 Ad
·
esempio, il modello di attrito viscoso prevede che R� = −ηx, dove η viene detto coefficiente di
attrito viscoso.
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
153
del tutto. Chiameremo ideale o liscio un vincolo per cui
(5.6)
R = 0.
La caratterizzazione del vincolo liscio è immediata. Poiché, come detto, il vettore
R giace, istante per istante, sul piano tangente, avremo che il vincolo è liscio se e solo
se
R · δx = 0 , per ogni δx ∈ Π (P ) ,
(5.7)
e di conseguenza2, ricordando la definizione 4.1.6,
R ∈ N (P )
⇔
R = λ∇f .
(5.8)
Nota 5.1.1 E’ opportuno chiarire il significato fisico della (5.7). Se consideriamo
un intervallo di tempo δt “molto piccolo”, il lavoro δL infinitesimo, detto anche lavoro virtuale, fatto dalla forza R durante tale intervallo temporale è (si ricordi la
definizione 3.2.6)
δL = W δt = R · ẋδt .
Se adesso applichiamo la (4.55) si ottiene
δL
= R · [u1 q̇1 (t) δt + u2 q̇2 (t) δt ]
� �� �
� �� �
δq1
δq2
= R · [u1 δq1 + u2 δq2 ] = R · δx .
Dunque, in termini fisici la (5.7) può esprimersi così: il lavoro della forza vincolare
R è nullo per ogni spostamento virtuale.
Quindi, nel caso in cui la superficie sia liscia, l’equazione di moto (5.3) e l’equazione del vincolo danno luogo ad un sistema, dette equazioni di Lagrange di prima
specie,
m ẍ = F + λ∇f,
(5.9)
f (x) = 0,
di quattro equazioni nelle quattro incognite x = (x, y, z) e λ.
Vediamo adesso come si determina λ nel caso del singolo punto materiale vincolato
su una superficie regolare. Partendo dalla (5.9)1 , si ha
2
λ |∇f | = (mẍ − F ) · ∇f,
da cui
λ=
(mẍ − F ) · ∇f
|∇f |2
(5.10)
,
dove il termine ẍ · ∇f può essere ulteriormente elaborato. Considerando il vettore
posizione x come funzione del tempo3 x = x (t), avremo
f (x (t)) = 0, ⇒
2 Se
d
df (x (t))
= 0, ⇔
f (x (t) , y (t) , z (t)) = 0,
dt
dt
vogliamo anche la (5.8) è un’assunzione costitutiva: si dà a priori la forma della forza vincolare.
pur sapendo che x = x (q1 (t) , q2 (t)), considerare x = x (t) significa “dimenticarci”
della “mediazione” di q1 e q2 e leggere x direttamente come funzione del tempo.
3 In altri termini,
154
LEZIONI DI SISTEMI DINAMICI
da cui, ricordando la regola di derivazione di funzione composta,
∂f
∂f
∂f
d
ẋ +
ẏ +
ż = 0, ⇔ ∇f · ẋ = 0 ⇒
(∇f · ẋ) = 0.
∂x
∂y
∂z
dt
Svolgendo la derivata rispetto al tempo si ottiene
�
�
�
�
d ∇f
d ∇f
∇f · ẍ +
· ẋ = 0, ⇒ ∇f · ẍ = −
· ẋ.
dt
dt
∇f
Dobbiamo quindi calcolare d dt
�
d ∇f
d ∂f (x (t) , y (t) , z (t))
=
ex
dt
dt
∂x
=
∂f (x (t) , y (t) , z (t))
∂f (x (t) , y (t) , z (t))
ey +
ex
+
∂y
∂z
� 2
�
∂2f
∂2f
∂ f
ẋ +
ẏ +
ż ex +
∂x2
∂y∂x
∂z∂x
� 2
�
∂ f
∂2f
∂2f
ẋ +
ż
ey +
ẏ
+
∂x∂y
∂y 2
∂z∂y
� 2
�
∂ f
∂2f
∂2f
ẋ +
ẏ + 2 ż ez .
∂x∂z
∂y∂z
∂z
(5.11)
�
Per cui, introducendo la matrice H ( f ) delle derivate seconde della f , detta matrice
hessiana,
∂2f
∂2f
∂2f
∂x2
∂y∂x ∂z∂x
∂2f
∂2f
∂2f
,
(5.12)
H( f ) =
∂y 2
∂z∂y
∂x∂y
2
2
2
∂ f
∂ f
∂ f
∂x∂z
si ottiene
d ∇f
=
dt
�
∂2f
∂x2
∂2f
∂x∂y
∂2f
∂x∂z
∂y∂z
∂2f
∂y∂x
∂2f
∂y 2
∂2f
∂y∂z
��
∂2f
∂z∂x
∂2f
∂z∂y
∂2f
∂z 2
H( f )
Di conseguenza
�
�
d ∇f
· ẋ = (H ( f ) ẋ) · ẋ,
dt
∂z 2
⇒
(5.11)
�
�
·
x
·
y .
·
z
�� �
·
x
∇f · ẍ = −ẋ · H ( f ) ẋ.
Abbiamo quindi determinato λ
λ=−
mẋ · H ( f ) ẋ + F · ∇f
|∇f |
2
,
(5.13)
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
155
in termini della forza F , della velocità ẋ, e delle caratteristiche geometriche del vincolo.
L’estensione al caso di una superficie mobile (e quindi dipendente dal tempo) è
immediata. Anche in questo caso la definizione di vincolo liscio è data dalla (5.6) o,
equivalentemente, dalla (5.7). Ma, anche se il “lavoro virtuale”, ovvero il prodotto
scalare della reazione con un qualsiasi δx del piano tangente è nullo, la forza vincolare
R può effettuare un lavoro effettivo non nullo.
Per chiarire questo punto si pensi a un corpo che si muova sul piano di un ascensore in movimento. Ovviamente la condizione di “vincolo liscio” deve solo tener conto
che tra il piano dell’ascensore e il corpo in moto non c’è attrito, indipendentemente dal
fatto che l’ascensore stia salendo, scendendo o sia fermo. Quindi la reazione vincolare deve risultare ortogonale al piano dell’ascensore (condizione garantita dalla (5.7)).
Tuttavia, quando l’ascensore sta salendo (o scendendo) la reazione vincolare compierà
un lavoro “effettivo” non nullo (un ascensore che sale fa aumentare l’energia potenziale
del punto, anche se questo sta fermo sul piano dell’ascensore).
Questo, come vedremo, ha per conseguenza che, nel caso dei vincoli mobili, non si
ha, in generale, la conservazione dell’energia meccanica anche in presenza di forze di
tipo conservativo.
5.2 L’equazione simbolica della dinamica
La generalizzazione della definizione di vincolo liscio si ottiene in analogia con la
(5.7). Sia, al solito, {Pi , mi }, i = 1, . . . N , un sistema di punti materiali soggetti
� ∈ R3N , il vettore delle N reazioni
agli m vincoli olonomi (5.1). Indichiamo con R
vincolari
R1
.
� =
R
(5.14)
.. ,
RN
intendendo con Ri , i = 1, 2, ..., N , la forza vincolare (o meglio reazione vincolare)
che agisce sull’i-esimo punto generata al complesso degli m vincoli. Anche in questo caso, il sistema formato dalle (5.2) e (5.1) è indeterminato, contando 6N incognite
contro le 3N + m equazioni, a meno che non si facciano ipotesi costitutive sulle reazioni vincolari. L’ipotesi più semplice è quella di vincoli lisci, che così definiamo in
generale:
� • δ�
Definizione 5.2.1 Diremo che i vincoli sono lisci quando R
x = 0, per ogni
spostamento virtuale δ�
x, cioè quando le reazioni vincolari Ri soddisfano la condizione
N
�
i=1
Ri · δxi = 0 , per ogni sistema di (δx1 , .... , δxN ) .
(5.15)
Riferendoci alla nota 5.1.1, esprimeremo la (5.15) dicendo che il lavoro virtuale delle
reazioni vincolari è nullo per ogni sistema di spostamenti virtuali.
Vediamo come l’assunzione di vincoli lisci ci permetta di ridurre ad m il numero delle
� ∈ N , dove,
incognite dovute alle reazioni vincolari. Infatti, la (5.15)) implica che R
156
LEZIONI DI SISTEMI DINAMICI
�
�
� 1 , ∇f
� 2 , . . . , ∇f
� m , cioè
lo ricordiamo, N è il sottospazio la cui base è ∇f
� =
R
m
�
k=1
� k,
λk ∇f
� significa
che, tradotta nelle singole “componenti” di R
Ri =
m
�
k=1
λk
∂fk
,
∂xi
i = 1, ...., N ,
(5.16)
(5.17)
∂fk
è definito dalla (4.7) e dove λk , k = 1, . . . , m, sono parametri arbitrari
∂xi
(moltiplicatori di Lagrange).
Sostituendo le espressioni (5.17) nelle equazioni di moto (5.2) e considerando anche le (5.1), otteniamo il seguente sistema, dette ancora equazioni di Lagrange di
prima specie,
�m
∂fk
λk
, i = 1, . . . , N ,
mi ẍi = F i +
k=1
∂xi
(5.18)
k = 1, . . . , m .
fk (x1 , ...., xN , t) = 0,
dove
Lo ribadiamo ancora: le N equazioni (5.18)1 sono valide solo nell’ipotesi di vincoli
lisci.
Il processo di eliminazione delle λk in (5.18), possibile in linea di principio, è,
nel caso di N > 1 punti materiali, algebricamente molto complesso. Torneremo sulla
questione delle equazione di Lagrange di prima specie nella sezione 5.3.2.
Vediamo adesso come sia possibile percorrere un’altra strada che conduce direttamente ad un sistema di tante equazioni quanti sono i gradi di libertà. Prima di sviluppare tale procedura è opportuno analizzare più in dettaglio F i , i = 1, .... , N , risultante
di tutte le forze, non vincolari, che agiscono sull’i-esimo punto materiale. Dividiamo
quindi le forze che agiscono sull’i-esimo punto materiale in due categorie:
1. Forze conservative (o di tipo gradiente), la cui risultante indicheremo con F i, cons .
In tal caso sappiamo che esiste una funzione, detta energia potenziale,
V = V (x1 , ...., xN ) ,
che, per brevità di notazione indicheremo anche con V = V (�
x), per cui
F i, cons = −
∂V (x1 , ...., xN )
,
∂xi
(5.19)
∂
, rappresenta il gradiente rispetto alle coordinate (xi , yi , zi ), come
∂xi
espresso dalla (4.7).
dove
2. Tutte le altre forze che non sono né conservative né dovute all’interazione coi
vincoli. La loro risultante viene denotata con S i .
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
157
Ritornando alle (5.18)1 ed applicando la suddivisione appena illustrata
F i = F i, cons + S i = −
∂V
+ Si,
∂xi
(5.20)
scriveremo
mi ẍi = −
�m
∂V (�
x)
∂fk
+ Si +
λk
,
k=1
∂xi
∂xi
i = 1, . . . , N .
(5.21)
Moltiplichiamo ora scalarmente, in R3 , ognuna delle equazioni per lo spostamento virtuale δxi dell’i-esimo punto materiale e sommiamo le N equazioni scalari così ottenute. In virtù della assunzione di vincoli lisci, ovvero della (5.15), le reazioni vincolari
“scompaiono” dalla somma, e abbiamo
�
N �
�
∂V (�
x)
mi ẍi +
−S i · δxi = 0 , ∀ (δx1 , ...., δxN ) ,
∂xi
i=1
(5.22)
che è nota con il nome di equazione simbolica della dinamica.
E’ interessante scrivere la (5.22) nel formalismo compatto di R3N . Infatti introducendo
S1
.
� =
S
.. ,
SN
e, ricordando la (5.19) e la (4.8),
� cons
F
=
F 1, cons
..
=
.
F N, cons
−
∂V (�
x)
∂x1
..
.
� (�
= −∇V
x) ,
∂V (�
x)
−
∂xN
il sistema (5.21) di N equazioni vettoriali (e quindi 3N equazioni scalari) può esser
scritto come
m1 ẍ1
m
�
�
..
�−
� k = 0,
+
∇V
(�
x
)
−
S
λk ∇f
(5.23)
.
mN ẍN
k=1
� Se adesso
dove abbiamo sfruttato la (5.17) per esprimere le reazioni vincolari R.
3N
moltiplichiamo scalarmente in R la (5.23) per il generico spostamento virtuale δ�
x∈
R3N , cioè
m1 ẍ1
m
�
�
..
� k • δ�
�
λk ∇f
x = 0,
(5.24)
+
∇V
(�
x
)
−
S
•
δ�
x
−
.
k=1
mN ẍN
�
��
�
=0
otteniamo, sviluppando il prodotto scalare • di R3N in somma di N prodotti scalari ·
di R3 , l’equazione simbolica della dinamica (5.22).
158
LEZIONI DI SISTEMI DINAMICI
Nota 5.2.1 Osserviamo che�
la (5.24) si presta ad un’interessante lettura “energetica”.
l
� i , con δqi , i = 1, ...., l, “infinitesimi”, sappiamo
Infatti, considerando δ�
x = i=1 δqi u
che δ�
x rappresenta di fatto uno “spostamento infinitesimo” del sistema degli N punti
materiali compatibile con i vincoli. Ricordando la nota 5.1.1, il lavoro virtuale δL
compiuto da tutte le forze (comprese le forze d’inerzia, ovvero −mi ẍi , i = 1, ...., N )
durante lo spostamento virtuale δ�
x, è
m1 ẍ1
�
..
� −S
�
δL =
x.
+ ∇V − R
• δ�
.
mN ẍN
La (5.24) comporta dunque δL = 0. Ciò significa che il lavoro virtuale compiuto da
tutte le forze su un qualsiasi spostamento virtuale del sistema degli N punti materiali
è nullo, ovvero i lavori compiuti dalle singole forze si bilanciamo perfettamente sì che
δL si annulla. L’equazione δL = 0, prende il nome di principio dei lavori virtuali.
Osserviamo adesso che la (5.24) vale per ogni δ�
x. Avremo pertanto
m1 ẍ1
�
..
�
� j = 0, ∀ j = 1, 2, ..., l ,
x) − S
•u
+ ∇V (�
.
mN ẍN
(5.25)
dal momento che, in virtù del teorema 4.1.2, o meglio della (4.25), ogni spostamento
� 1, u
�2,
virtuale può essere espresso come combinazione degli l vettori indipendenti u
� N . Quindi, in definitiva, l’equazione simbolica della dinamica (5.24) si tra....., u
duce nel sistema di l equazioni indipendenti (5.25), che sono le proiezioni di (5.23)
� N }.
lungo i vettori della base locale {�
u1 , ..., u
Nella sezione 5.3 vedremo come esprimere il prodotto scalare (in R3N )
m1 ẍ1
..
�j ,
•u
.
mN ẍN
in termini dell’energia cinetica del sistema di punti materiali. In altri termini dimostreremo una generalizzazione del teorema 3.1.1 illustrato nel capitolo 3. Per far ciò
utilizzeremo l’energia cinetica del sistema espressa tramite le coordinate lagrangiane.
Esempio 5.2.1 Mostriamo che il vincolo di rigidità che lega due punti è un vincolo
liscio nel senso della definizione 5.2.1. Consideriamo due punti materiali P1 e P2 , le
cui coordinate sono rispettivamente date da x1 e x2 , vincolati a mantenere costante la
loro distanza d, cioè
2
f (x1 , x2 ) = |x1 − x2 | − d2 = 0,
che scriveremo esplicitamente come
2
2
2
f (x1 , x2 ) = (x1 − x2 ) + (y1 − y2 ) + (z1 − z2 ) − d2 .
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
159
Indichiamo poi con d, il vettore (P1 − P2 ), cioè
d = (x1 − x2 ) ex + (y1 − y2 ) ey + (z1 − z2 ) ez ,
mentre il vettore (P2 − P1 ) sarà −d. Abbiamo poi
∂f
2d
∂x1
� =
,
∇f
=
∂f
−2d
∂x2
dal momento che
∂f
= 2 (x1 − x2 ) ex + 2 (y1 − y2 ) ey + 2 (z1 − z2 ) ez , e analoga∂x1
∂f
. Denotiamo adesso con R1 la forza vincolare che agisce su P1 , mentre
∂x2
quella che agisce su P2 è R2 . Ora la forza R1 è dovuta al punto P2 , mentre R2 , forza
che agisce su P2 , è originata da P1 . Di conseguenza R1 e R2 sono forze interne, l’una
l’opposta dell’altra per il principio di azione e reazione, e, sempre per la terza legge
di Newton, sono parallele al vettore (P1 − P2 ). Scriveremo dunque
mente per
R1 = αd, e R2 = −R1 = −αd,
con α ∈ R, per cui
� =
R
R1
R2
=
αd
−αd
.
Consideriamo adesso un qualsiasi spostamento virtuale
δx1
.
δ�
x=
δx2
In virtù della definizione 4.1.4 abbiamo
2d
δx1
•
= 2 (δx1 − δx2 ) · d.
0=
δx2
−2d
� �� � � �� �
δ
x
∇f
Ma allora
� • δ�
R
x=
αd
−αd
•
δx1
δx2
= α (δx1 − δx2 ) · d = 0,
� soddisfa la (5.15): il vincolo è liscio. Tale risultato è estendibile anche a sistemi
cioè R
di N > 2 punti, a due a due vincolati dal vincolo di rigidità.
160
LEZIONI DI SISTEMI DINAMICI
5.3 Le equazioni di Lagrange
Consideriamo il solito sistema di N punti materiali vincolato4, le cui configurazioni
siano descritte tramite un insieme di coordinate lagrangiane (q1 , ...., ql ). Come abbiamo già visto, il legame tra le coordinate cartesiane dei punti e le coordinate lagrangiane
sarà espresso dalle relazioni
xi = xi (q1 , . . . , ql , t) ,
(5.26)
i = 1, 2, ...., N ,
nelle quali, come sappiamo, il tempo potrà comparire esplicitamente quando i vincoli
sono mobili.
Teorema 5.3.1 Per ogni j = 1, 2, ...., l vale la seguente relazione
m1 ẍ1
�
�
∂T
d ∂T
..
�j =
−
,
•u
.
dt ∂ q̇j
∂qj
mN ẍN
(5.27)
essendo T l’energia cinetica del sistema di N punti materiali data dalla (4.33).
Dim. Partendo dalla (4.33) abbiamo
N
�
∂ ẋi
∂T
=
mi ẋi ·
.
∂ q̇j
∂ q̇j
i=1
Dalla (4.31) ricaviamo
come
∂xi
∂ ẋi
=
, e quindi riscriviamo la precedente uguaglianza
∂ q̇j
∂q j
N
�
∂xi
∂T
=
mi ẋi ·
.
∂ q̇j
∂q j
i=1
(5.28)
Se deriviamo adesso la (5.28) rispetto al tempo si ottiene
d
dt
�
∂T
∂ q̇j
�
N
�
N
∂xi �
d
=
mi ẍi ·
mi ẋi ·
+
∂q
dt
j
i=1
i=1
�
∂xi
∂q j
�
.
Chiaramente il primo addendo è il termine di sinistra nella (5.27)
∂x1
∂qj
m1 ẍ1
N
�
∂xi
.
.
..
=
mi ẍi ·
• .. ,
∂q j
i=1
∂xN
mN ẍN
∂qj
�
��
�
j
u
mentre, per quel che riguarda il secondo addendo, possiamo ricorrere al fatto che nell’espressione di xi , in funzione delle coordinate lagrangiane, le variabili qj hanno un ruolo
4 Le
considerazioni ovviamente valgono anche per un sistema libero, ovvero non soggetto a vincoli
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
161
di variabili indipendenti rispetto al tempo. E’ dunque possibile scambiare
la derivata
�
�
∂xi
∂ ẋi
5 d
=
.
rispetto a tempo con la derivata parziale rispetto a qj e ottenere
dt ∂q j
∂qj
Abbiamo quindi
N
�
i=1
mi ẋi ·
d
dt
�
∂xi
∂q j
�
=
N
�
i=1
=
mi ẋi ·
∂ ẋi
∂qj
N
�
∂ ẋ 2
∂
mi i =
∂q
∂q
j
j
i=1
�
N
�
mi ẋ2i
i=1
�
=
∂T
. (5.29)
∂qj
Quindi, riunendo tutti i termini otteniamo
m1 ẍ1
�
�
d ∂T
∂T
..
�j +
=
,
•u
.
dt ∂ q̇j
∂qj
mN ẍN
da cui la (5.27) discende banalmente.
La (5.27) viene usualmente detta identità di Lagrange, mentre il secondo membro è
generalmente noto con il nome di binomio di Lagrange.
Torniamo adesso al sistema di l equazioni (5.25) ed applichiamo la (5.27). Otteniamo
�
�
d ∂T
∂T
� (�
� •u
�j − S
� j = 0, j = 1, 2, ...., l .
−
+ ∇V
x) • u
(5.30)
dt ∂ q̇j
∂qj
Ora, consideriamo l’energia potenziale come funzione delle variabili lagrangiane q1 ,
..., ql , cioè
V̂ (�
q , t) = V (�
x (�
q , t)) = V (x1 (q1 , . . . , ql , t), ...., xN (q1 , . . . , ql , t)) ,
e deriviamo rispetto a qj . Troviamo
N
�
∂V ∂xi
∂ V̂
=
·
=
∂qj
∂xi ∂qj
i=1
Introduciamo inoltre
5 Questo
�
� •u
�j =
Ξj = S
∂V
∂x1
..
.
∂V
∂xN
��
(
∇V
x)
N
�
i=1
∂x
1
∂q
j
..
•
.
∂x
N
∂qj
� �
��
Si ·
j
u
.
(5.31)
�
∂xi
,
∂qj
passaggio è stato ampiamente illustrato nella dimostrazione del teorema 3.1.1.
(5.32)
162
LEZIONI DI SISTEMI DINAMICI
detta componente Lagrangiana della forza S.
Possiamo dunque riscrivere il sistema (5.30) nella forma nota sotto il nome di equazioni di Lagrange di seconda specie o, più semplicemente, equazioni di Lagrange
∂ T − V̂
d ∂T
−
= Ξj , j = 1, 2, ...., l .
(5.33)
dt ∂ q̇j
∂qj
La funzione energia potenziale V non dipende da q̇i , i = 1, ..., N . Si introduce quindi,
come nella sezione 3.3, la funzione di Lagrange o Lagrangiana del sistema
L(q1 , . . . , ql , q̇1 , . . . , q̇l , t) = T (q1 , . . . , ql , q̇1 , . . . , q̇l , t) − V̂ (q1 , . . . , ql , t) , (5.34)
e si riscrivono le equazioni di Lagrange nella forma compatta
d ∂L
∂L
−
= Ξj , j = 1, 2, ...., l ,
dt ∂ q̇j
∂qj
(5.35)
che, lo ricordiamo ancora, valgono nel caso in cui tutti i vincoli siano olonomi e lisci.
Se poi le forze cui è sottoposto il sistema sono soltanto quelle vincolari, del tipo
= 0, oppure se S
•u
j = 0, ∀ j = 1, ..., l, allora il
(5.16), e conservative, cioè S
sistema (5.35) si semplifica in
∂L
d ∂L
−
= 0, j = 1, 2, ...., l .
(5.36)
dt ∂ q̇j
∂qj
Nota 5.3.1 Rimarchiamo ancora che le equazioni di Lagrange (5.35) discendono dalla
(5.25). Ma allora, riferendoci alla sezione 1.4, le l equazioni (5.35) possono essere lette
come le componenti covarianti di F = ma, rispetto alla base locale.
Nota 5.3.2 Ricordando la scomposizione (4.33) dell’energia
cinetica T come T =
T2 + T1 + T0 , osserviamo che la componente T1 = li=1 bi q̇i , è completamente ininfluente ai fini delle equazioni di moto se: (i) se tutti i bi = bi (q1 , ...ql ), i = 1, ..., l, non
∂b
∂bi
, ∀ i, j = 1, ..., l. Nelle equazioni
dipendono esplicitamente dal tempo; (ii) ∂qji = ∂q
j
∂T
d
1
1
− ∂T
di moto il termine T1 dà luogo all’espressione dt
∂ q̇j
∂qj , che si annulla. Infatti
d
dt
∂T1
∂ q̇j
−
∂T1
∂qj
l
dbj (q1 (t) , ...ql (t)) ∂bi
−
q̇i
dt
∂qj
i=1
l
l
∂bj
∂bi
q̇i −
=
q̇i = 0.
∂qi
∂q
i=1
i=1 j
=
5.3.1 Equazioni di Lagrange e statica del punto materiale sulla
superficie
Continuiamo con l’esempio di un solo punto materiale vincolato a muoversi una superficie fissa, riscrivendo la (5.3), nella quale teniamo conto della scomposizione (5.20),
cioè
mẍ = F cons + R + S .
(5.37)
−∇V
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
163
Se adesso proiettiamo la (5.37) nello spazio tangente, otteniamo due equazioni
m ẍ · ui = −∇V · ui + R · ui + S · ui ,
i = 1, 2.
(5.38)
Se adesso la superficie è liscia, cioè vale la (5.8), sfruttando
∂T
d ∂T
m ẍ · ui =
−
, i = 1, 2,
dt ∂ q̇i
∂qi
e
∇V · ui =
abbiamo
∂ V̂
,
∂qi
d
dt
i = 1, 2, con V̂ (q1 , q2 ) = V (x (q1 , q2 )) ,
∂L
∂ q̇i
−
∂L
= Ξi ,
∂qi
(5.39)
i = 1, 2.
dove Ξi = S · ui , i = 1, 2, e dove
L = L (q1 , q2 , q̇1 , q̇2 ) = T (q1 , q2 , q̇1 , q̇2 ) − V̂ (q1 , q2 ) .
Le due equazioni (5.39) rappresentano quindi le equazioni di moto (5.35) per un punto
materiale vincolato su una superficie regolare liscia.
Nota 5.3.3 Notiamo che nelle due equazioni di moto (5.39) intervengono le componenti di R e di S rispetto alla base {u1 , u2 } dello spazio tangente. L’equazione (5.37)
può essere infatti scomposta nella parte ortogonale al piano tangente ed in quella che
giace sul piano tangente
−mẍ� + (F cons )� + R� + S � + [−mẍ⊥ + (F cons )⊥ + R⊥ + S ⊥ ] = 0,
dove, ẍ = ẍ� + ẍ⊥ , con ẍ� ∈ Π (P ) e ẍ⊥ ∈ N (P ). Perciò moltiplicando scalarmente la (5.37) per ui , i = 1, 2, si isola la parte [· · · ] e si ottengono, sotto l’ipotesi
(5.8), le equazioni di moto (5.39). Questa è una notevole semplificazione dal momento
che si “elimina” tutta la parte [· · · ]⊥ . Rimane quindi da analizzare la parte [· · · ]⊥ .
Per far ciò, assumendo R⊥ = λ∇f , è sufficiente moltiplicare scalarmente la (5.37)
per ∇f
(−mẍ + F cons + λ∇f + S) · ∇f = 0,
(5.40)
da cui discende la (5.10). La (5.40) è, come illustrato nella sezione 5.1, il punto di
partenza per la determinazione di λ, ossia di R.
Le equazioni (5.38) possono essere anche raggruppate in un’unica equazione
2
i=1
(−m ẍ − ∇V + R + S) · ui = 0,
da cui discende l’equazione simbolica della dinamica
(
−m ẍ
forza inerzia
−
∇V
forza conservativa
+
R
reazione vincolare
+
S
altre forze
) · δx = 0,
(5.41)
164
LEZIONI DI SISTEMI DINAMICI
nel momento in cui si considera il generico spostamento virtuale (4.51).
Analizziamo adesso la statica del punto materiale. Se, ∀ t > 0, ẍ ≡ ẋ ≡ 0, la
(5.37) diventa
F cons + R + S = 0,
(5.42)
� ��
�
−∇V
e le (5.38) si riducono a
(−∇V + R + S) · u1 = 0,
(5.43)
(−∇V + R + S) · u2 = 0,
che, assumendo al solito la superficie priva di attrito, si traducono in
∂ V̂
−
+ S · u1 = 0,
∂q1
∂ V̂
−
+ S · u2 = 0.
∂q2
(5.44)
Quindi, data S, le soluzioni (q̄1 , q̄2 ), ammesso che esistano6 , del sistema (5.44) rappresentano le configurazioni di equilibrio del punto materiale sulla superficie. La (5.44)
può anche essere utilizzata come formula per determinare la forza S che deve essere
applicata al punto materiale affinché esso sia in equilibrio in (q̄1 , q̄2 ). In tal caso le
incognite sono le due componenti di S nel piano tangente, cioè
u2
u1
S = S1 κ1 + S2 κ2 , dove, al solito, κ1 =
, κ2 =
.
|u1 |
|u2 |
Siccome κi · ui =
ui · ui
= |ui |, i = 1, 2, la (5.44) equivale al seguente sistema
|ui |
∂ V̂
−
+ S1 |u1 | = 0,
∂q1
(5.45)
∂
V̂
−
+ S2 |u2 | = 0.
∂q2
Si noti che in presenza di sole forze conservative, ovvero nel caso in cui S = 0, le
posizioni di equilibrio sono date dalle soluzioni di
∂ V̂
∂ V̂
= 0, e
= 0,
∂q1
∂q2
che quindi corrispondono ai punto di estremo locale dell’energia potenziale. Le configurazioni stabili corrisponderanno ai minimi isolati dell’energia potenziale (criterio di
Dirichlet), come proveremo nella sezione 5.9.1.
Sempre assumendo la superficie liscia, dalla (5.42), si ricava
R = −S − F cons .
����
λ∇f
6 In
generale, il sistema (5.44) può avere più di una soluzione, ma anche non averne.
(5.46)
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
165
Moltiplicando scalarmente la (5.46) per ∇f otteniamo
λ=−
(F cons + S) · ∇f
|∇f |
2
che, nel caso in cui S = 0, si semplifica in λ = −
,
F cons · ∇f
|∇f |
2
.
Esempio 5.3.1 Consideriamo il moto di un punto materiale di massa m su una sfera
liscia di raggio R, soggetto alla sola forza peso.
La sfera è definita implicitamente da f (x, y, z) = x2 + y 2 + z 2 − R2 = 0.
Escludendo i poli7 , può essere così parametrizzata
x = R sin θ cos φ,
y = R sin θ sin φ,
z = R cos θ,
dove i parametri sono la colatitudine θ ∈ (0, π), e la longitudine φ ∈ (0, 2π], come
mostrato nella figura 5.1. I vettori tangenti sono
uθ
=
R cos θ cos φex + R cos θ sin φey − R sin θez ,
uφ
=
−R sin θ sin φex + R sin θ cos φey .
Si verifica facilmente che |uθ ∧ uφ | = R4 sin2 θ. Quindi la parametrizzazione è
regolare ovunque eccetto ai poli. Calcolando la matrice A data dalla (4.52) si ha
�
� � 2
�
R
0
E F
=
F G
0 R2 sin2 θ
e pertanto, sfruttando la (4.56), l’energia cinetica del punto materiale è
�
��
�
�
� R2
m�
mR2 � 2
0
θ̇
θ̇ + φ̇2 sin2 θ .
T =
=
θ̇ φ̇
2
2
0 R sin θ
φ̇
2
2
La forza peso è F peso = −mgez , la cui energia potenziale è V (z) = mgz, e quindi
V̂ (θ, φ) = mgR cos θ. La funzione di Lagrange è
�
m �
L = T − V̂ = R2 θ̇2 + φ̇2 sin2 θ − mgR cos θ
2
e le equazioni del moto sono
�
� 2
�
�
·
d ∂L
g
∂L
= 0, ⇒ θ̈ − φ sin θ cos θ + sin θ = 0, (5.47)
−
dt ∂ θ̇
∂θ
R
�
�
�
�
d ∂L
d
∂L
= 0, ⇒
mR2 φ̇ sin2 θ = 0.
(5.48)
−
dt ∂ φ̇
∂φ
dt
7 Una rappresentazione regolare della sfera necessita di due parametrizzazioni come quelle fornite dalla
cosiddetta proiezione stereografica.
166
LEZIONI DI SISTEMI DINAMICI
Figura 5.1: Sfera di raggio R.
Se vogliamo, la (5.48) è ovvia dal momento che la φ è coordinata ciclica. Abbiamo
quindi
∂L
(5.49)
= mR2 φ̇ sin2 θ = Ao ,
∂ φ̇
dove Ao è una costante indipendente dal tempo. Dalla (5.49) ricaviamo subito che se
φ̇ = 0, allora Ao = 0, e la (5.47) si riduce all’equazione del pendolo di lunghezza R,
g
θ̈ − sin θ = 0.
R
Ao
Utilizzando la (5.49) per esprimere φ̇ =
, e sostituirlo nella (5.47)
2
mR sin2 θ
otteniamo
2
cos θ
g
Ao
+ sin θ,
θ̈ =
3
2
mR
sin θ R
che possiamo anche scrivere come
θ̈ = −
dVeff (θ)
1
, con Veff (θ) =
dθ
2
Ao
mR2
2
g
1
+ cos θ,
2
sin θ R
(5.50)
energia potenziale efficace. Il grafico di Veff (θ) per θ ∈ (0, π) è riportato in figura
5.2, e mostra due asintoti verticali ed un minimo in corrispondenza di θ̄, soluzione
2
Ao
cos θ̄
g
di
+ sin θ̄ = 0. Se θ (t) = θ̄, la particella percorre un’orbita
3
2
mR
R
sin θ̄
circolare che risulta stabile (in quanto θ̄ è minimo di Veff ) In particolare, moltiplicando
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
167
la (5.50) per θ̇, è facile ottenere
d
dt
θ̇2
+ Veff (θ)
2
= 0, ⇒
θ̇ = ±
2 (E − Veff (θ)),
(5.51)
con E costante corrispondente all’energia meccanica.
Figura 5.2: Energia potenziale Veff (θ).
Dall’analisi qualitativa si deduce che θ (t) è periodica e, fissato il livello energetico
E, il moto si svolge fra θm e θM . Il periodo di oscillazione è
T =2
θM
θm
du
.
2 (E − Veff (u))
Il moto complessivo non è necessariamente periodico. Ponendo φ = φ (θ), si ha
168
φ̇ =
LEZIONI DI SISTEMI DINAMICI
dφ
θ̇, da cui
dθ
dφ
φ̇
=
dθ
θ̇
Ao
1
�
.
mR2 sin2 θ 2 (E − Veff (θ))
=
(5.51)
Il moto sarà effettivamente periodico se, durante l’oscillazione compiuta fra θm e
θM (andata e ritorno) la coordinata angolare φ ha subito una variazione pari ad un
frazione di π, ovvero
2 (φ (θM ) − φ (θm )) =
�
��
�
2
θM
dφ
dθ
dθ
θm
∆φ
=
�
2Ao
mR2
�
θM
θm
1
dθ
r
�
= 2π,
2
s
sin θ 2 (E − Veff (θ))
con r, s ∈ N. Se è così allora, dopo s oscillazioni la traiettoria si chiude dal momento
che l’angolo ∆φ “spazzato” è 2πr.
Lasciamo infine come esercizio la dimostrazione che Ao è, a parte il segno, la
componente lungo l’asse z del momento angolare della particella calcolato rispetto ad
O.
Esempio 5.3.2 Consideriamo il moto di un punto materiale su un cono liscio soggetto
z2
alla sola forza peso. L’equazione implicita del cono è x2 + y 2 = 2 . Il cono quindi
c
è regolare ovunque, eccetto che nell’origine. Possiamo esprimere la superficie nella
seguente forma parametrica (si considera solo z > 0)
x = r cos φ,
y = r sin φ,
φ ∈ (0, 2π] , r ∈ (0, +∞) .
z = cr,
I vettori che costituiscono la base del piano tangente sono
ur
= cos φex + sin φey + cez ,
uφ
= −r sin φex + r cos φey .
L’energia cinetica del punto è
m�
T =
ṙ
2
φ̇
�
�
1 + c2
0
0
r2
��
ṙ
φ̇
�
=
�
�
m ��
1 + c2 ṙ2 + r2 φ̇2 .
2
L’unica forza “attiva” - cioè non dovuta al vincolo - che agisce sulla particella è il
peso la cui energia potenziale è V (x, y, z) = mgz, per cui V̂ (r, φ) = mgcr. La
funzione Lagrangiana è dunque
�
�
m ��
1 + c2 ṙ2 + r2 φ̇2 − mgcr.
L = T − V̂ =
2
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
169
Scriviamo adesso le equazioni del moto tenendo costo del fatto che φ è coordinata
ciclica, cioè ∂L
∂φ = 0,
∂L
= Ao = costante,
∂ φ̇
mr 2 φ̇
d
dt
∂L
∂ ṙ
−
∂L
= 0,
∂r
⇒
che possiamo anche scrivere così
r̈ =
1 + c2 r̈ − rφ̇2 + gc = 0,
2a
dVeff (r)
−b=−
r3
dr
dove
Veff (r) =
a
+ br.
r2
2
1
gc
Ao
, b =
. Il grafico di Veff (r), riportato in figura
con 2a =
m
1 + c2
1 + c2
5.3, evidenzia la presenza di un minimo che corrisponde ad un orbita circolare stabile. In generale il moto è periodico e si può trovare un’espressione del periodo T
corrispondente al livello energetico E.
Figura 5.3: Energia potenziale Veff (r) nel caso di una particella, soggetta soltanto alla
forza peso, vincolata su un cono.
170
LEZIONI DI SISTEMI DINAMICI
Esempio 5.3.3 E’ dato un punto materiale, soggetto alla sola forza peso, posto su un
cilindro liscio il cui asse è orizzontale. Si vuol determinare:
1. le equazioni di moto;
2. la reazione vincolare in condizioni dinamiche;
3. la forza S che deve essere applicata al punto materiale affinché la configurazione (xo , θo ) sia posizione di equilibrio. Si vuole calcolare anche la corrispondente
reazione vincolare.
1. La forma implicita dell’equazione del cilindro è f (x, y, z) = y 2 + z 2 − R2 = 0,
dove R è il raggio. Una parametrizzazione della superficie è dunque la seguente
x ∈ R,
y = R cos θ, con − π < θ ≤ π.
z = R sin θ,
Figura 5.4: Cilindro orizzontale di raggio R.
Abbiamo poi
ux = e1 ,
uθ = −R sin θe2 + R cos θe3 .
(5.52)
L’energia cinetica della particella è
T =
�
m� 2
ẋ + R2 θ̇2 ,
2
mentre l’energia potenziale relativa alla forza peso è V̂ = mgR sin θ. La Lagrangiana
è
�
m� 2
L=
ẋ + R2 θ̇2 − mgR sin θ,
2
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
171
da cui si nota immediatamente che la x è ciclica, cioè
�
�
d ∂L
∂L
= 0, ⇒
= 0, ⇒ ẋ = cost. .
∂x
dt ∂ ẋ
Per quanto riguarda l’equazione per θ, abbiamo
�
�
d ∂L
g
∂L
= 0, ⇒ θ̈ = − cos θ,
−
dt ∂ θ̇
∂θ
R
la cui interpretazione fisica è immediata: la particella trasla con velocità longitudinale
costante e contemporaneamente oscilla come un pendolo di lunghezza R. In particoπ
lare, se ẋ = 0, la posizione θ = − , che corrisponde al punto materiale nella parte
2
bassa del cilindro, è posizione di equilibrio stabile.
2. Si parte dalla formula (5.13). Siccome
�
�
2
∇f = 2yey + 2zez , | ∇f | = 4 y 2 + z 2 = 4R2 ,
abbiamo ∇f · F = (2yey + 2zez ) · (−mgez ) = −2zmg = −2mgR sin θ, mentre la
matrice (5.12) è data da
0 0 0
H( f ) = 0 2 0
0 0 2
Dobbiamo quindi esprimere ẋ rispetto alla base ortonormale {e1 , e2 , e3 },
ẋ
=
ẋux + θ̇uθ =
=
ẋex + θ̇ (−R sin θey + R cos θez ) .
(5.52)
Quindi
mẋ · H ( f ) ẋ = 2mR2 θ̇2 ,
mRθ̇2 − mg sin θ
,e
2R
�
�
R = −λ∇f = − mRθ̇2 − mg sin θ (cos θey + sin θez ) .
da cui λ = −
3. L’incognita adesso è S, o meglio, le componenti di S sul piano tangente
S = Sx κx + Sθ κθ , con κx =
uθ
ux
uθ
= ex , κ θ =
=
.
|ux |
|uθ |
R
Dalla (5.45) abbiamo
∂ V̂
− ∂x + Sx = 0
− ∂ V̂ + S R = 0
θ
∂θ
⇒
Sx = 0
Sθ = mg cos θo
(5.53)
172
LEZIONI DI SISTEMI DINAMICI
Volendo esprimere S rispetto alla base cartesiana {ex , ey , ez } si ha
S = mg cos θo
uθ
R
= mg cos θo (− sin θo ey + cos θo ez ) .
(5.52)
π
Notiamo che S si annulla se θo = ± . Per quanto riguarda la reazione vincolare R,
2
F cons · ∇f
sfruttando λ = −
, abbiamo
|∇f |2
λ=
mg sin θ
, ⇒ R = mg sin θ (cos θey + sin θez )
2R
che coincide con la (5.53) in caso θ̇ = 0.
5.3.2 Equazioni di Lagrange di prima specie
Riprendiamo quanto visto nell’osservazione 4.1.3 della sezione 4.1, supponendo che
il sistema meccanico con l gradi di libertà sia soggetto all’ulteriore vincolo olonomo
(4.11), che per brevità indicheremo anche con Φ (�
q ) = 0. Evidentemente, come già
osservato, si può procedere come nella sezione 4.1 e sfruttare l’equazione vincolare per
ridurre i gradi di libertà passando così da l ad (l − 1). Tuttavia si può evitare tale strada
(che, in taluni casi, può essere estremamente complicata), tenendo conto del vincolo in
un altro modo.
Assumendo che il nuovo vincolo sia liscio, consideriamo le forze vincolari agenti sui punti materiali. Queste, riprendendo la notazione della (5.14), verranno così
indicate
�T = R
� +R
� nv ,
R
� ∈ R3N è dato dalla (5.14) e rappresenta le forze (o meglio le rezioni) vincolari
dove R
dovute agli m vincoli olonomi (4.4), mentre
R1, nv
..
� nv =
R
,
.
RN, nv
rappresenta le forze vincolari dovute al nuovo vincolo Φ (�
q ) = 0. Siccome tutti i vin� T deve appartenere al
coli sono lisci, applicando la definizione 5.2.1, deduciamo che R
3N
�
�
�
�
sottospazio di R la cui base è { ∇f1 , ∇f2 , ..., ∇fm , ∇fm+1 }. Pertanto, ricordando
la (5.16), scriveremo
m
�
�T =
� m+1 .
� k + λ∇f
R
λk ∇f
k=1
La (5.23) diventa quindi
�
�m
m1 ẍ1
�
�
..
� m+1 = 0.
� k + λ∇f
�−
λk ∇f
x) − S
+ ∇V (�
.
mN ẍN
�
k=1
��
T
R
�
(5.54)
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
173
k , k = 1, ..., l, e applichiamo la
Se adesso moltiplichiamo scalarmente la (5.54) per u
(5.27), la (5.31), la (5.32) e la (4.23) otteniamo l equazioni del tipo
d ∂T
∂T
∂ V
m+1 • u
k = 0.
−
+
− Ξk − λ∇f
(5.55)
dt ∂ q̇k
∂qk
∂qk
In particolare, ricordando sia la definizione (5.34) sia l’espressione (4.11) del nuovo
vincolo, che consente di scrivere
N
∂fm+1 ∂xi
∂Φ
m+1 • u
k ,
=
·
= ∇f
∂qk
∂x
∂q
i
k
i=1
abbiamo che il sistema (5.55) può essere posto nella seguente forma
∂L
d ∂L
∂Φ
−
= Ξk + λ
, k = 1, ..., l .
dt ∂ q̇k
∂qk
∂qk
(5.56)
anche dette equazioni di Lagrange di prima specie. La (5.56) è un sistema di l
equazioni differenziali a cui va aggiunta l’equazione del vincolo Φ (
q ) = 0, nelle
(l + 1) incognite q1 (t), ..., ql (t) e λ (t).
k , avremmo potuto
Osserviamo che anziché moltiplicare scalarmente la (5.54) per u
l
s , e poi selezionare, di
moltiplicarla per la generica combinazione lineare s=1 δqs u
s ai singoli vettori u
k,
volta in volta, i coefficienti δqs in modo da ridurre ls=1 δqs u
l
s è, come rimarcato
k = 1, ..., l. La peculiarità della combinazione lineare s=1 δqs u
nella nota 4.1.5, che questa non rappresenta
uno
spostamento
virtuale del sistema
l
soggetto agli (m + 1) vincoli. Pertanto
•
R
u
δq
,
s s
T non si annulla, ma
s=1
genera il contributo
l
l
l
∂Φ
nv = λ
m+1 = λ
s • R
s • ∇f
δqs u
δqs u
δqs
.
∂qs
s=1
s=1
s=1
La procedura illustrata si estende facilmente anche al caso in cui si abbiamo n > 1
vincoli olonomi lisci supplementari del tipo (4.11), ed anche al caso in questi dipendano
dal tempo, cioè
Φj (q1 , ...., ql , t) = 0,
j = 1, ..., n.
(5.57)
In tal caso il sistema di equazioni di Lagrange di prima specie diventa
n
d ∂L
∂Φj
∂L
−
= Ξk +
λj
, k = 1, ..., l ,
dt ∂ q̇k
∂qk
∂qk
j=1
(5.58)
ovvero un sistema di l equazioni differenziali accoppiato con le n equazioni vincolari
(5.57). Abbiamo così un sistema di (l + n) equazioni nelle (l + n) incognite q1 (t), ...,
ql (t) e λ1 (t), ... , λn (t).
Rimandiamo alla sezione 8.4.1 per l’illustrazione di un esempio di applicazione
delle equazioni di Lagrange di prima specie.
n
∂Φ
Si conclude con un’osservazione sul significato dei termini j=1 λj ∂qkj che appaiono nella (5.58). In tal senso proprio la forma della (5.58) è illuminante: i termini
n
∂Φj
j=1 λj ∂qk si assimilano, seguendo la definizione (5.32), alle componenti Lagran nv dovuta all’ulteriore vincolo.
giane della forza R
174
LEZIONI DI SISTEMI DINAMICI
5.4 Risolubilità delle equazioni di Lagrange
Abbiamo annunciato che le equazioni di Lagrange, che sono equivalenti all’equazione
simbolica della dinamica, sono sufficienti per determinare la dinamica di un sistema
meccanico8. Questo significa che possiamo determinare, almeno per un tempo “piccolo” in accordo con la teoria delle equazioni differenziali, le quantità qj (t), j = 1, ....,
l, una volta assegnate delle condizioni iniziali qj (t0 ) e q̇j (t0 ), j = 1, ...., l .
Osserviamo per prima cosa che le (5.35) sono un sistema di equazioni differenziali
ordinarie del secondo ordine, in quanto le derivate di ordine massimo che
� compaiono
�
d ∂L
quando si sviluppa la derivata totale rispetto al tempo nel termine
sono
dt ∂ q̇k
9
derivate seconde. Per la forma di T (vedi la (4.33)), abbiamo
�
�
�
�
d ∂L
d ∂T
=
dt ∂ q̇k
dt ∂ q̇k
� l
�
d �
=
ahk (q1 (t), . . . , ql (t), t)q̇k + bk (q1 (t), . . . , ql (t), t) .
dt
h=1
Eseguendo quindi la derivazione rispetto al tempo compaiono le derivate seconde
l
�
ahk (q1 (t), . . . , ql (t), t)q̈h ,
h=1
e il sistema di equazioni di Lagrange ha dunque la forma
l
�
ahk q̈h = Gk (q1 (t), . . . , ql (t), q̇1 (t), . . . , q̇l (t), t) ,
k = 1, ..., l,
(5.59)
h=1
che, in forma matriciale compatta, si scriverà
�
G1 (�
a11 · · · a1l
q (t) , q̇(t),
t)
q̈1
..
.. .. =
..
.
. .
.
�
q̈l
al1 · · · all
q (t) , q̇(t),
t)
Gl (�
�
��
� � �� �
�
��
A
q̈
(
G
q (t),
q̇(t),t)
.
�
Ricordando il teorema 4.1.3, che la matrice A è definita positiva e quindi invertibile.
Possiamo pertanto risolvere algebricamente le (5.59) rispetto alle derivate seconde q̈h ,
h = 1, ..., l, ottenendo un sistema di equazioni differenziali ordinarie in forma normale
corredate con dati iniziali
� = A−1 G
� (�
�
q̈
q (t) , q̇(t),
t),
� 0 ) = q̇
�0 ,
(5.60)
q̇(t
�0 .
� (t0 ) = q
q
8 Purché
soggetto a vincoli lisci.
consiglia di non procedere oltre se non si ha chiara questa prima derivazione rispetto a q̇k . Si noti in
particolare che il fattore 21 scompare per la simmetria della matrice ahk .
9 Si
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
175
Il problema (5.60) è un tipico problema di Cauchy al quale possiamo applicare la teoria
� godono delle opporsviluppata nella sezione 2.3, e così affermare che, se le funzioni G
tune regolarità, per ogni insieme di dati iniziali q1 (t0 ), . . . , ql (t0 ), q̇1 (t0 ), . . . , q̇l (t0 ),
esiste un’unica soluzione (locale) del sistema.
5.5 Invarianza delle equazioni di Lagrange
Supponiamo che (q1 , ... , ql ) siano le l coordinate lagrangiane utilizzate per descrivere
il sistema di N punti materiali soggetto a m vincoli lisci. Sia L (q1 , ... , ql , q̇1 , ... , q̇l , t)
la relativa funzione di Lagrange. Supponiamo adesso di individuare altri l parametri
lagrangiani (η1 , ... , ηl ), legati alle (q1 , ... , ql ) tramite la trasformazione
qi = qi (η1 , ... , ηl ) , i = 1, 2, ..., l,
(5.61)
ηj = ηj (q1 , ... , ql ) , j = 1, 2, ..., l,
(5.62)
e
tale che det J�=0, dove
J=
∂q1
∂η1
∂q1
∂η2
..
.
∂q1
∂ηl
∂q2
∂η1
∂q2
∂η2
..
.
∂q2
∂ηl
...
...
...
∂ql
∂η1
∂ql
∂η2
..
.
∂ql
∂ηl
.
Le coordinate xi dell’i-esimo punto sono date da10 xi = xi (�
q , t), oppure xi =
xi (�
η , t), dove
xi (�
η , t) = xi (�
q (�
η ) , t) ,
e viceversa. Avremo poi
q̇i =
l
�
∂qi
η̇κ ,
∂ηk
i = 1, ...., l,
(5.63)
i = 1, ...., l,
(5.64)
k=1
η̇i =
l
�
∂ηi
q̇κ ,
∂qk
k=1
·
·
·
= (η1 , η2 , ....., ηl ), e
= (q1 , q2 , ...., ql ) e
q = q 1 , ...., q l , poniamo adesso η
che q
·
·
·
(
= η1 , ....., η l . Inoltre con q
η ) intendiamo
q (
η ) = (q1 (η1 , ... , ηl ) , ... , ql (η1 , ... , ηl )).
η
10 Ricordando
176
LEZIONI DI SISTEMI DINAMICI
e
l
�
∂xi ·
q
∂qs s
s=1
=
l
l
�
∂xi � ∂qs ·
η
∂qs
∂ηk κ
s=1
k=1
=
l
�
k=1
=
l
�
k=1
�
l
�
s=1
∂xi ∂qs
∂qs ∂ηk
�
·
ηκ
∂xi ·
η ,
∂ηk k
·
per cui xi potrà essere espressa sia in termini delle coordinate q che in termini delle η,
�l
∂xi
∂xi
,
q̇s +
s=1 ∂qs
∂t
ẋi =
�l
∂xi
∂xi
,
η̇k +
k=1 ∂ηk
∂t
Notiamo poi che dalla (5.63) discende11
l
� ∂qi ∂ η̇κ
∂ q̇i
∂qi
=
=
.
∂ η̇j
∂ηk ∂ η̇j
∂ηj
k=1
� �� �
(5.65)
δkj
La funzione di Lagrange nelle variabili η si ottiene a partire dalla L, ovvero12
l
l
�
�
�
�
∂q1
∂ql
� , t = L q
�
� , η̇
(�
η
)
,
L η
η̇
,
...
,
η̇
,
t
κ
κ .
∂ηk
∂ηk
k=1
k=1
� �� �
� �� �
q̇1
(5.66)
q̇l
Dimostriamo adesso che L, data dalla (5.66), soddisfa le equazioni di Lagrange
�
�
d ∂L
∂L
−
= 0, i = 1, 2, ... , l,
(5.67)
dt ∂ η̇i
∂ηi
se L soddisfa le (5.36), Si comincia col valutare
l
�
∂L
=
∂ηk
i=1
11 Si
ricorda ancora che δkj =
�
∂L ∂qi
∂L ∂ q̇i
+
∂qi ∂ηk
∂ q̇i ∂ηk
1 se k = j
�
,
0 se k �= j
che questo ci dice che le funzioni L e L sono funzionalmente diverse: l’uguaglianza L = L deve
essere intesa come uguaglianza dei valori delle due funzioni quando sono calcolate rispettivamente nelle
coordinate che rappresentano lo stesso stato cinematico.
12 Si noti
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
177
e poi
l
� ∂L ∂ q̇i
∂L
=
∂ η̇k
∂ q̇i ∂ η̇k
i=1
l
�
∂L ∂qi
.
(5.65)
∂ q̇i ∂ηk
i=1
=
Abbiamo quindi
d
dt
�
∂L
∂ η̇k
�
=
�
�
�
��
l �
�
∂L d ∂qi
d ∂L ∂qi
+
dt ∂ q̇i ∂ηk
∂ q̇i dt ∂ηk
i=1
�
�
�
l �
�
∂L ∂ q̇i
d ∂L ∂qi
,
+
=
dt ∂ q̇i ∂ηk
∂ q̇i ∂ηk
i=1
da cui si ricava facilmente la tesi. Infatti
d
dt
�
∂L
∂ η̇k
�
−
� �
�
�
l
�
∂qi d ∂L
∂L
∂L
−
=
= 0,
∂ηk
∂ηk dt ∂ q̇i
∂qi
i=1
�
��
�
k = 1, 2, ..., l.
=0
Non solo, ma abbiamo ottenuto anche
∂q1
∂η1
∂q1
∂η2
..
.
∂q1
∂ηl
∂q2
∂η1
∂q2
∂η2
..
.
∂q2
∂ηl
...
...
...
∂ql
∂η1
∂ql
∂η2
..
.
∂ql
∂ηl
�
�
d ∂L
−
dt � ∂ q̇1 �
d ∂L
−
dt ∂ q̇2
..
� .�
d ∂L
−
dt ∂ q̇l
∂L
∂q1
∂L
∂q2
=
∂L
∂ql
�
�
d ∂L
−
dt � ∂ η̇1 �
d ∂L
−
dt ∂ η̇2
..
� .�
d ∂L
−
dt ∂ η̇l
∂L
∂η1
∂L
∂η2
.
∂L
∂ηl
Per cui se uno dei due vettori colonna è nullo lo è anche l’altro dal momento che
det J �= 0. Vale dunque il seguente
Teorema 5.5.1 Le soluzioni di (5.67) si ottengono dalle soluzioni di (5.36) tramite le
trasformazioni (5.62), (5.64).
Questo risultato è, in un certo qual senso, ovvio: il moto è lo stesso, indipendentemente
dal sistema di coordinate scelto. Di più, tutto il formalismo lagrangiano è stato, fin
dall’inizio, concepito per scrivere le equazioni di moto con la stessa ricetta in qualsiasi
sistema di coordinate. Quindi tale teorema è, se vogliamo, una verifica a posteriori della
correttezza del formalismo stesso. Tuttavia questa invarianza “analitica” è importante
quando si voglia introdurre un nuovo sistema di coordinate a partire da un preesistente
sistema, senza “ritornare” al sistema meccanico, cioè senza tornare a ricalcolare la
funzione di Lagrange dalla sua definizione meccanica.
Questo risultato si enuncia anche dicendo che le equazioni di Lagrange sono
invarianti per cambiamento di coordinate.
178
LEZIONI DI SISTEMI DINAMICI
5.6 Coordinate cicliche
In questa sezione vogliamo generalizzare al caso di N punti materiali i concetti già
introdotti nel paragrafo 3.3.1. Come già visto, sappiamo che in certi casi una delle coordinate lagrangiane, diciamo qi , non compaia esplicitamente nella funzione di
Lagrange L (ma la q̇i deve comparire), cioè
∂L
= 0.
∂qi
(5.68)
Se ciò accade, ricordando la (5.35), si ha
d ∂L
= 0,
dt ∂ q̇j
≡ 0). Quindi,
se Ξj ≡ 0, per ogni j = 1, 2, ...., l (il che avviene, per esempio, se S
riprendendo la definizione 3.3.1 del capitolo 3, diremo che la coordinata qi è ciclica, se
≡ 0, abbiamo
(5.68) è verificata. Ricordando la proposizione 3.3.2 ed assumendo S
∂L
che la funzione · è una costante del moto13 (o integrale primo),
∂ qi
∂L
= costante ,
∂ q̇i
dove “costante” significa costante rispetto al tempo. In accordo con la definizione 3.3.2
∂L
(ovvero con la definizione 9.0.1),
è detta momento coniugato alla variabile qi .
∂ q̇i
Il punto che adesso vogliamo approfondire è una procedura, definita nell’ambito
generale di sistemi con l gradi di libertà, che consenta di sfruttare efficacemente le
variabili cicliche al fine di semplificare le equazioni di Lagrange (5.36). Ovviamente la strada è già stata tracciata nelle sezione 3.3.1. Adesso vogliamo generalizzarla
supponendo che esistano 0 < ν ≤ l, variabili cicliche. Assumiamo quindi che:
• qα , α = 1, ...., ν, siano variabili cicliche. Ciò implica che L non dipende
esplicitamente dalle qα , cioè
L = L (q̇1 , ..., q̇l , qν+1 , ...., ql , t) .
• qi , i = ν + 1, ....., l, siano non cicliche.
Abbiamo quindi ν momenti coniugati
pα =
∂L (q̇1 , ..., q̇l , qν+1 , ...., ql , t)
,
∂ q̇α
α = 1, ...., ν,
(5.69)
che sono costanti. Vale questa importante
Proposizione 5.6.1 Le ν relazioni (5.69) possono essere invertite e da esse si possono
ricavare le q̇α , α = 1, ...., ν, in funzione:
13 Stiamo
assumendo di aver a che fare con un sistema di N punti materiali soggetto a vincoli olonomi
≡ 0).
lisci e sottoposto all’azione di forze puramente conservative (per intenderci, S
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
179
• dei ν momenti coniugati pα , α = 1, ...., ν;
• delle rimanenti l − ν, q̇i , cioè delle q̇i , i = ν + 1, ....., l;
• di tutte le qi non cicliche, cioè di qi , i = ν + 1, ...., l;
• del tempo t.
Dim. Scriviamo le (5.69) in forma estesa
p1 = Φ1 (q̇1 , ..., q̇ν , q̇ν+1 , ..., q̇l , qν+1 , ...ql , t) ,
p2 = Φ2 (q̇1 , ..., q̇ν , q̇ν+1 , ..., q̇l , qν+1 , ...ql , t) ,
..
.
pν = Φν (q̇1 , ..., q̇ν , q̇ν+1 , ..., q̇l , qν+1 , ...ql , t) ,
(5.70)
∂L
, α = 1, ...., ν. Adesso guardiamo al sistema (5.70) come ad una
∂ q̇α
relazione fra la ν-upla (p1 , ..., pν ) e la ν-upla (q̇1 , ..., q̇ν ). Evidentemente tale relazione
sarà biunivoca, e quindi invertibile, se la relativa matrice jacobiana
dove Φα =
∂Φ
1
∂ q̇1
.
J=
..
∂Φ
1
∂ q̇ν
···
···
∂Φν
∂ q̇1
..
.
∂Φν
∂ q̇ν
,
è invertibile, ovvero se det J �= 0. Ora, ricordando l’espressione delle Φα , si ha
∂2L
∂L
···
∂ q̇ 2
∂ q̇1 ∂ q̇ν
1
..
.
..
J=
,
.
2
∂2L
∂ L
···
∂ q̇ν ∂ q̇1
∂ q̇ν2
da cui, data la (5.34) con T espressa dalla (4.33), ricaviamo
a11 · · · a1ν
.. ,
J = ...
.
aν1
···
aνν
cioè J coincide con un minore di ordine ν della matrice dell’energia cinetica A, le cui
componenti sono definite dalla (4.34). Ora il teorema 4.1.3 garantisce che det A �=0, e
di conseguenza anche14 det J �= 0.
14 Ricordiamo
che se con Aj denotiamo il minore di ordirne j di una matrice A, vale il seguente:
Teorema. Sia A una matrice simmetrica di ordine n. La forma quadratica relativa alla matrice A è definita
positiva se e solo se det Aj > 0, per ogni j ≤ n.
180
LEZIONI DI SISTEMI DINAMICI
Applicando quindi tale proposizione, potremo scrivere
q̇ α (p1 , ..., pν , q̇ν+1 , ..., q̇l , qν+1 , ...ql , t) ,
q̇α =
α = 1, ...., ν,
(5.71)
e, ricordando la definizione (3.34) della sezione 3.3.1, introdurre la funzione di Routh15
R = L −
ν
α=1
pα
q̇ α ,
(5.72)
dove, in analogia con la sezione 3.3.1, L denota la funzione di Lagrange L, in cui, al
posto delle ν variabili q̇α , α = 1, ...., ν, sono state sostituite le espressioni (5.71)
q̇ (p1 , ., pν , q̇ν+1 , ., q̇l , qν+1 , ., ql , t)
L
q̇ 1 (p1 , ., pν , q̇ν+1 , ., q̇l , qν+1 , ., ql , t) , .,
ν
q̇α viste come funzioni delle rimanenti q̇, delle p e di tutte le q non cicliche
q̇ν+1 , ....., q̇l , qν+1 , ....., ql , t .
rimanenti q̇
(5.73)
tutte le q
non cicliche
Di conseguenza
R = R (p1 , ..., pν , q̇ν+1 , .., q̇l , qν+1 , ...ql , t) .
(5.74)
Lo ricordiamo ancora, p1 , ..., pν , sono costanti il cui valore è stabilito dalle condizioni
iniziali.
In particolare abbiamo che le equazioni per le l − ν, coordinate non cicliche sono
d
dt
∂R
∂ q̇i
−
∂R
= 0,
∂qi
i = ν + 1, ...., l .
(5.75)
Infatti, come già provato nella proposizione 3.3.3, considerando i > ν, abbiamo
ν
ν
∂ L ∂
q̇
q̇α
∂ L̂
∂ L ∂
∂ L
pα α +
=
+ · =
,
∂ q̇i α=1 ∂
∂ q̇i
∂ q̇i
q̇α ∂ q̇i
∂ q i α=1
pα
ν
ν
ν
∂ L̂
∂ L ∂
q̇α
q̇
∂ L ∂
∂ L
=
+
=
pα α +
,
∂qi α=1 α=1 ∂
∂ q̇i α=1
∂qi
∂qi
q̇α ∂qi
pα
15 Osserviamo
Routh, ovvero
che se qα è ciclica per la Lagrangiana, cioè
∂R
∂qα
∂L
∂qα
= 0, cioè R non dipende esplicitamente da qα .
= 0, è ciclica anche per la funzione di
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
181
e quindi16
d
dt
∂ L̂
·
∂ qi
∂ L̂
−
∂qi
ν
=
pα
α=1
=
d
dt
=
d
dt
∂
q̇ α
·
∂ qi
∂
q̇ α
+
−
∂qi
∂ L̂
∂ L̂
−
∂ q̇i
∂qi
=0
ν
∂
q̇α
∂
q̇
−
pα
pα α
∂
q̇
∂q
i
i
α=1
α=1
ν
ν
∂
∂
d
−
pα
pα
q̇ α
q̇ α .
dt ∂ q̇i α=1
∂qi α=1
d
dt
ν
Pertanto, per ogni i = ν + 1, ...., l, cioè per ogni coordinata non ciclica, possiamo
scrivere
ν
ν
d
∂
∂
L̂ −
−
L̂ −
pα q̇ α
pα q̇ α = 0,
dt ∂ q̇i
∂qi
α=1
α=1
cioè le (5.75). Si può provare, seguendo essenzialmente lo stesso procedimento illustrato nella sezione 5.4, che il sistema di l − ν equazioni differenziali (5.75) ammette
(almeno localmente) un’unica soluzione. Possiamo quindi, almeno in linea di principio, risolverlo e determinare le qi non cicliche, cioè qi = qi (t), i = ν + 1, ....,
l.
Rimane ancora da determinare l’evoluzione delle ν coordinate cicliche. Possiamo
utilizzare le ν equazioni (5.71) che costituiscono un sistema del prim’ordine in forma
normale per le ν variabili qα . Non solo, ma siccome la parte di destra della (5.71) non
dipende dalle coordinate cicliche qα , α = 1, ..., ν, possiamo integrarla e così, per ogni
α = 1, ..., l, ottenere
qα (t) = qα (0) +
0
t
q̇ α (p1 , ..., pν , q̇ν+1 (τ ) , .., q̇l (τ ) , qν+1 (τ ) , ...ql (τ ) , τ ) dτ.
(5.76)
E’ infine interessante notare che le funzioni
q̇ α , α = 1, ...., ν, si possono derivare
direttamente dalla funzione R. Infatti, tenendo conto delle (5.71) e (5.73), derivando
la (5.72) rispetto a pα , abbiamo
−
∂R
∂pα
=
q̇ α +
=
q̇ α +
16 Si
ricordi che pα è costante, per cui
ν
pβ
ν
pβ
β=1
β=1
dpα
dt
∂
q̇ β
∂ L
−
∂pα
∂pα
ν
∂
q̇ β
q̇ β
∂ L ∂
−
=
q̇ α .
∂pα
∂p
α
q̇
β=1 β
pβ
= 0, e
∂pα
∂qi
= 0.
182
LEZIONI DI SISTEMI DINAMICI
Quindi
∂R
,
q̇α = −
∂pα
α = 1, ...., ν .
(5.77)
q̇α
In definitiva, se il sistema presenta ν ≤ l, variabili cicliche, il problema della
determinazione del moto diminuisce di complessità. Infatti, introducendo la funzione
di Routh (5.72), abbiamo l − ν (anziché l) equazioni di tipo lagrangiano, cioè le (5.75),
che governano l’evoluzione delle l − ν variabili non cicliche, mentre l’evoluzione delle
ν variabili cicliche è data dalla (5.76), che, sfruttando la (5.77), può anche essere così
riscritta
t
∂R
qα (t) = qα (0) −
dτ , α = 1, ...., ν.
∂p
α
0
5.7 La funzione Hamiltoniana e la conservazione dell’energia
Proseguiamo nella generalizzazione dei risultati della sezione 3.3.1 considerando un
sistema caratterizzato da l parametri lagrangiani. Introduciamo la funzione Hamiltoniana la cui definizione, nel caso di un singolo punto materiale è data dalla (3.29),
mentre per un sistema con l gradi di libertà è
H(q1 , ..., ql , q̇1 , ..., q̇l , t) =
l
∂L
q̇i − L.
∂ q̇i
i=1
(5.78)
Calcolando la derivata totale di H si ottiene
l
l
l
l
∂L dq̇i ∂L dq̇i ∂L
dH d ∂L
∂L
=
−
−
. (5.79)
q̇i +
q̇i −
dt
dt
∂
q̇
∂
q̇
dt
∂
q̇
dt
∂q
∂t
i
i
i
i
i=1
i=1
i=1
i=1
Il secondo e terzo addendo si elidono a vicenda mentre il primo e il quarto termine
generano, in virtù delle equazioni di Lagrange (5.35),
l
l
∂L
d ∂L
−
q̇i =
Ξi q̇i .
dt ∂ q̇i
∂qi
i=1
i=1
Ne segue che, se qi (t), i = 1, ..., l, soddisfano il sistema (5.35), allora
l
dH
∂L
=
,
Ξi q̇i −
dt
∂t
i=1
e di conseguenza
(5.80)
dH
= 0,
(5.81)
dt
l
se la funzione Lagrangiana non dipende esplicitamente dal tempo e se i=1 Ξi q̇i = 0.
In particolare, dalla (5.32) otteniamo
l
l
l
i q̇i ,
i q̇i = S •
u
Ξi q̇i =
S • u
i=1
i=1
i=1
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
183
dove, al solito • è il prodotto scalare in R3N . Ora, ricordando la formula (4.32) e le
l
i q̇i rappresenta la velocità del sistema degli
considerazioni ad essa successive, i=1 u
N punti materiali rispetto ai vincoli. Quindi, denotando con
vcl =
ẋ
l
i=1
i q̇i ,
u
la velocità del sistema rispetto ai vincoli, possiamo riscrivere la (5.80) in questa forma
più compatta
dH
• ẋ
vcl − ∂L ,
=S
(5.82)
dt
∂t
la cui interpretazione fisica sarà evidente una volta chiarita l’interpretazione fisica di
H. Vogliamo quindi dare, come nella sezione 3.3.1, un’interpretazione fisica della
funzione H. Partendo dalla definizione (5.34) e ricordando la (4.33), abbiamo
L = T2 + T1 + T0 − V.
Eseguendo passaggi analoghi a quelli sviluppati nella sezione 3.3.1, è facile provare
che17
l
l
∂L
∂ (T2 + T1 + T0 )
q̇i =
q̇i = 2T2 + T1 ,
(5.83)
∂
q̇
∂ q̇i
i
i=1
i=1
per cui,
H = 2T2 + T1 − (T2 + T1 + T0 − V ) = T2 + V − T0 .
(5.84)
In particolare, se T0 ≡ 0, la funzione H corrisponde alla somma dell’energia cinetica
e dell’energia potenziale. Abbiamo quindi questa semplice
Proposizione 5.7.1 Nel caso di un sistema olonomo a vincoli fissi, la funzione H,
corrisponde all’energia meccanica totale, cioè
H = T + V.
(5.85)
Dim. Nel caso in cui la Lagrangiana provenga da un sistema meccanico soggetto a
vincoli fissi, abbiamo L = T2 − V , cioè T ≡ T2 , da cui discende immediatamente la
(5.85).
La (5.85) è stata già incontrata nel paragrafo 3.3.1, dove avevamo a che fare con un
solo punto materiale libero, cioè privo di vincoli. Tuttavia sottolineiamo ancora che,
in generale, H =
� T + V , l’uguaglianza vale soltanto se T ≡ T2 .
Prima di continuare, confrontando la (5.84) con la (5.85), viene naturale introdurre
la cosiddetta energia potenziale efficace
Veff = V − T0 ,
(5.86)
17 Questo calcolo è un caso particolare di un teorema sulle forme quadratiche (detto “di Eulero” ) che
n
dice che, data la forma quadratica A( ξ, ξ) =
i,j=i aij ξi ξj con (aij ) matrice simmetrica, allora
n
∂A
k=i ∂ξ ξk = 2 A( ξ, ξ).
k
184
LEZIONI DI SISTEMI DINAMICI
ed interpretare la (5.84) come
(5.87)
H = T2 + Veff ,
cioè come energia meccanica totale di un sistema soggetto a forze la cui energia
potenziale è (5.86).
Prima di procedere è tuttavia necessario rimarcare la differenza fra i due termini che
compongono Veff . Infatti V è proprio l’energia potenziale dovuta a forze conservative
prodotte da ben precisi agenti fisici (il peso, una o più molle, interazioni elettrostatiche,
etc.), −T0 non è invece generata da nessun agente fisico se non dal moto dei vincoli.
Questi, trascinando con il loro moto il sistema di punti materiali, sono i responsabili
delle forze d’inerzia (rappresentate nell’Hamiltoniana H proprio da −T0 ).
Tornando alla (5.82), la conseguenza “fisica” di tale formula è evidente: la variazione nell’unità di tempo dell’energia meccanica di un sistema è imputabile a due
termini:
• ẋ
vcl , lavoro fatto, nell’unità di tempo (e quindi la potenza) dalle forze che
(i) S
non sono conservative18 (e che quindi che non ammettono energia potenziale);
(ii)
∂L
, che, in generale, è non nullo nel caso di vincoli mobili (anche se in taluni
∂t
casi particolari può annullarsi pur avendo a che fare con vincoli in movimento).
Quindi, tornando all’energia meccanica totale espressa dalla (5.87) possiamo conclu∂L
• ẋ
vcl = 0.
dere che essa si conserva se
= 0, e se S
∂t
Nota 5.7.1 Osserviamo che il termine T1 , cioè il termine omogeneo di primo grado
·
nelle q i , non ha alcuna influenza sull’Hamiltoniana H. Nella nota 5.3.2 abbiamo
osservato che T1 non influisce nelle equazioni di Lagrange soltanto se non dipende
∂b
∂bi
esplicitamente dal tempo e se ∂qji = ∂q
, ∀ i, j = 1, ..., l. Invece, per quel che
j
riguarda la H, T1 è sempre ininfluente, indipendentemente dalla sua forma.
Proseguendo il confronto con la sezione 3.3.1, concludiamo il paragrafo illustrando
come sfruttare le eventuali coordinate cicliche anche nell’Hamiltoniana. Supponiamo,
come nella sezione 5.6, di aver a che fare con un sistema olonomo a vincoli lisci sog ≡ 0, e che qα , α = 1, ...., ν, siano cicliche
getto soltanto a forze conservative, cioè S
∂L
(cioè ∂q
=
0,
∀
α
=
1,
....,
ν).
Deduciamo
allora che le qα , α = 1, ...., ν, sono
α
19
cicliche anche per la funzione Hamiltoniana . Infatti, dalla definizione (5.78),
l
∂
∂H
=
∂qα
∂qα
i=1
∂L
∂ q̇i
l
∂
∂L
∂L
q̇i −
=
q̇i = 0.
∂qα
∂ q̇i ∂qα
i=1
=0
=0
18 Osserviamo che le forze di attrito possono essere inserite in S.
Si tratta soltanto definire come reazioni
quella componente delle forze vincolari per cui R
• δ
vincolari R
x = 0, per ogni spostamento virtuale δ
x.
insieme a tutte
In tale “riclassificazione” delle forze le forze vincolari dovute all’attrito si inseriscono in S,
le altre (eventuali) forze che non sono conservative.
19 Come del resto lo sono anche per la funzione di Routh R (vedi nota 15) a piè di pagina.
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
185
Procediamo quindi come nella sezione 3.3.1, introducendo
(p1 , ., pν , q̇ν+1 , ., q̇l , qν+1 , ., ql , t) = H
H
q̇ 1 (p1 , ., pν , q̇ν+1 , ., q̇l , q1 , ., ql , t) ,
...,
q̇ ν (p1 , ..., pν , q̇ν+1 , .., q̇l , q1 , ...ql , t) , q̇ν+1 , .., q̇l , qν+1 , ...ql , t .
(5.88)
Dimostriamo che
(p1 , ..., pν , q̇ν+1 , .., q̇l , qν+1 , ...ql , t) =
H
l
∂R
q̇i − R ,
∂ q̇i
i=ν+1
dove R è la funzione di Routh, data dalla (5.72), che dipende da pα , α = 1, ...., ν, e
dalle variabili non cicliche (si veda la (5.74)). Con gli stessi passaggi illustrati nella
formula (3.36), si prova che
∂R
∂ L
=
,
∂ q̇i
∂ q̇i
i = ν + 1, ...., l,
dove L è data dalla (5.73). Quindi, osservando che
ν
l
l
∂L
∂L
∂L
q̇i − L =
q̇α +
q̇i − L
H =
∂ q̇i
∂ q̇α
∂ q̇i
α=1
i=1
i=ν+1
=
ν
α=1
pα q̇α +
l
∂L
q̇i − L,
∂
q̇i
i=ν+1
abbiamo
l
∂ L
q̇i − L
∂
q̇
i
α=1
i=ν+1
ν
l
∂L
=
q̇i − L −
pα
q̇ α
∂
q̇
i
α=1
i=ν+1
∂R
(p1 , ..., pν , q̇ν+1 , .., q̇l , qν+1 , ...ql , t) =
H
ν
pα
q̇ α +
∂ q̇i
R
La versione “semplificata” dell’energia meccanica si ottiene inserendo
q̇ α , α = 1,
che
...., ν, nella Hamiltoniana H. Così facendo si ottiene la nuova Hamiltoniana H,
dipende soltanto dalle l − ν variabili non cicliche e dalle ν costanti pα , α = 1, ...., ν.
Esempio 5.7.1 Proseguiamo con lo studio del moto di un punto materiale P su una
circonferenza ruotante, moto già trattato negli esempi 4.1.4 e 4.1.6, determinando la
funzione Hamiltoniana nell’ipotesi che il vincolo sia liscio e che l’unica forza non
vincolare agente su P sia la forza peso diretta nel verso opposto dell’asse z. L’energia
potenziale della forza peso è data da
V (x, y, z) = mgz, ⇒ V̂ (θ) = −mgR cos θ,
186
LEZIONI DI SISTEMI DINAMICI
e quindi, ricordando la (4.41), la funzione Lagrangiana è
�
�
� �2
dϕ
mR2 2
θ̇ +
sin2 θ + mgR cos θ,
L θ, θ̇, t = T − V̂ =
2
dt
�
�
dϕ
dϕ
che può dipendere esplicitamente dal tempo tramite
. Evidentemente se
è codt
dt
stante, il che vuol dire che la circonferenza ruota uniformemente attorno all’asse z,
cioè
dϕ
= ω, ⇔ ϕ (t) = ωt + ϕ0 ,
dt
allora la funzione L non dipende esplicitamente dal tempo t. Sfruttando la (5.84) e la
(4.42) dove sono specificate T2 e T0 , abbiamo
H
=
=
T2 + V − T0
mR2
mR2 2
θ̇ − mgR cos θ −
2
2
�
dϕ
dt
�2
sin2 θ.
� �2
mR2 dϕ
Quindi Veff = V − T0 = −mgR cos θ −
sin2 θ. La variazione nel
2
dt
tempo di H è data
dH
dϕ d2 ϕ
∂L
sin2 θ,
=−
= mR2
dt
∂t
dt dt2
dϕ
d2 ϕ
dH
= 0, se
≡ 0, cioè vincolo è fisso, o se 2 ≡ 0, cioè la rotazione
e quindi
dt
dt
dt
è uniforme. Notiamo che H si conserva anche se il vincolo è mobile, a patto che la
rotazione sia uniforme.
Esempio 5.7.2 E’ dato un punto materiale P vincolato a muoversi su una superficie
di rotazione ottenuta ruotando attorno all’asse z la curva z = f (x). La superficie
è priva di attrito ed il punto è soggetto alla forza peso ed a quella esercitata da una
molla di costante elastica k, ed avente lunghezza a riposo e massa trascurabili, il cui
secondo estremo è fissato in O.
�
�
La forma implicita della superficie è z = f x2 + y 2 . Una descrizione parametrica
può essere data in termini di r = x2 + y 2 , distanza di P dall’asse z, e dell’angolo φ
che la proiezione del vettore (P − O) sul piano (x, y), forma con l’asse x,
x = r cos φ,
y = r sin φ,
z = f (r) ,
φ ∈ (−π, π] , r > 0.
I vettori base del piano tangente sono
ur
= cos φe1 + sin φe2 + f ′ (r) e3 ,
uφ
= −r sin φe1 + r cos φe2 ,
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
187
2
per cui |ur ∧ uφ | = r2 f ′ 2 + 1 �= 0, se r �= 0. L’energia cinetica del punto è
T
=
=
1 + (f ′ (r))2 0
m
ṙ
ṙ φ̇
φ̇
0
r2
2
m
2
1 + (f ′ (r)) ṙ2 + r2 φ̇2 ,
2
mentre l’energia potenziale dovuta al peso è Vpeso (x, y, z) = mgz, e quindi V̂peso =
k 2
x + y 2 + z 2 , ovvero V̂molla =
mgf (r), e quella dovuta alla molla è Vmolla =
2
k 2
2
r + f (r) . La Lagrangiana è
2
k 2
m
2
1 + (f ′ (r)) ṙ2 + r2 φ̇2 − mgf (r) −
r + f 2 (r) .
L=
2
2
La coordinata φ è ciclica. Infatti
d ∂L
∂L
∂L
= 0, ⇒
= Ao = costante.
−
dt ∂ φ̇
∂φ
∂
φ̇
=0
mr 2 φ̇
L’equazione per r è
k
2
(r + f ′ f ′′ ) = 0,
1 + (f ′ (r)) r̈ + f ′ f ′′ ṙ2 − rφ̇2 + gf ′ +
m
che scriveremo così
A2
k
2
1 + (f ′ (r)) r̈ + f ′ f ′′ ṙ2 − 2o 3 + gf ′ +
(r + f ′ f ′′ ) = 0.
m r
m
(5.89)
La (5.89) rientra nella classe di equazioni del secondo ordine analizzate nella sezione
2.6.3. Dobbiamo quindi scrivere la (5.89) nella corrispondente forma conservativa,
individuando l’energia meccanica, ossia la funzione di Hamilton
H=
∂T
∂T
ṙ +
φ̇ − L.
∂ ṙ
∂ φ̇
dH
= 0. Scriveremo quindi
dt
· 2
m
k 2
2 · 2
′
2
H=
1 + (f (r)) r + r φ + mgf (r) +
r + f 2 (r) .
2
2
Infatti, essendo il vincolo liscio e fisso,
(5.90)
Lo studio qualitativo può essere svolto a partire direttamente dalla (5.90). Infatti,
·
Come caso particolare consideriamo
sostituendo φ in termini di Ao e r, otteniamo H.
2
f (r) = cr , e supponiamo k = 0 (assenza della molla), per cui
2
m
A2o
2 2
1 + 4c r ṙ + 2 2 + mgcr2 = E,
H (ṙ, r) =
2
m r
188
LEZIONI DI SISTEMI DINAMICI
dove E è costante e si calcola a partire dalle condizioni iniziali. Avremo quindi
�
�
�
� 2
E
1
A2o
2 2
2
− V̂ef f (r) , con V̂ef f (r) =
mgcr +
. (5.91)
1 + 4c r ṙ =
m
m
2mr2
In particolare, siccome il segno del primo membro della (5.91) è sempre non negativo,
E
gli r “accessibili” sono quelli per cui su cui V̂ef f (r) ≤ .
m
Esempio 5.7.3 Consideriamo un punto materiale P vincolato a muoversi su una superficie di rotazione ottenuta ruotando attorno all’asse z la curva x = h (z), con
h (z) ≥ 0. La superficie è liscia ed il punto è soggetto alla forza peso diretta nel verso
opposto a quello dell’asse z.
Una descrizione parametrica della superficie è
z∈R
x = h (z) cos ϕ,
y = h (z) sin ϕ,
dove ϕ è l’angolo che la proiezione del vettore (P − O) sul piano x, y forma con
l’asse x. La forma implicita della superficie è
f (x, y, z) = x2 + y 2 − h 2 (z) = 0.
I vettori base del piano tangente sono
uz
= h′ (z) cos ϕe1 + h′ (z) sin ϕe2 + e3 ,
uϕ
= −h (z) sin ϕe1 + h (z) cos ϕe2 ,
per cui l’energia cinetica è
T
=
=
��
�
�
� 1 + (h ′ (z))2
m�
ż
0
ż ϕ̇
ϕ̇
0
h2 (z)
2
��
�
�
m
2
1 + (h ′ (z)) ż 2 + h2 (z) ϕ̇2 .
2
L’energia potenziale è Vpeso (x, y, z) = mgz, e quindi V̂peso = mgz, che comporta la
seguente funzione di Lagrange
�
�
m ��
2
L=
1 + (h ′ (z)) ż 2 + h2 (z) ϕ̇ − mgz.
2
Da essa si ricava immediatamente che ϕ è ciclica, cioè
ϕ =
Ao 1
,
m h2 (z)
con Ao = costante.
La funzione di Hamilton è dunque
�
�
m ��
2
1 + (h ′ (z)) ż 2 + h2 (z) ϕ̇2 − mgz,
H=
2
(5.92)
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
189
che, sostituendo ϕ̇ con l’espressione data dalla (5.92), assume questa forma
2
(ż, z) = m 1 + (h ′ (z))2 ż 2 + Ao 1 + mgz.
H
2
2m h2 (z)
L’energia potenziale efficace è dunque
Veff (z) =
A2o 1
+ mgz.
2m h2 (z)
Esempio 5.7.4 Come ultimo esempio consideriamo quello di un punto materiale vincolato a stare sulla cicloide (4.17) e rappresentata nella figura 5.5. In tal caso la
z
x
Figura 5.5: Rappresentazione della curva (4.17), detta cicloide.
particella ha un solo grado di libertà: ψ. Si suppone che il vincolo sia liscio e che
il punto materiale, la cui massa è m, sia soggetto soltanto all’azione della forza peso
diretta nel verso opposto dell’asse z. E’ facile scrivere la funzione Hamiltoniana dal
momento che
T = mR2 ψ̇ 2 (1 + cos ψ) ,
V = mgR(1 − cos ψ),
(5.93)
e quindi
H = mR2 ψ̇ 2 (1 + cos ψ) + mgR(1 − cos ψ).
Se poniamo
q 2 = R(1 − cos ψ),
Derivando (5.94) si ottiene
R2 ψ̇ 2 = 4
(5.94)
q 2 q̇ 2
,
sin2 ψ
(5.95)
e sostituendo nella (5.93)
T = 4m
q 2 q̇ 2
(1 + cos ψ) = 4mRq̇ 2 ,
sin2 ψ
V = mgq 2 ,
(5.96)
da cui si ricava
H = 4mRq̇ 2 + mgq 2 ,
che è la funzione di Hamilton dell’oscillatore armonico, q̇ 2 + ω 2 q 2 , se ω 2 = g/4R2 .
Si deduce quindi che le oscillazioni della particella sotto l’azione della sola forza peso non dipendono dall’energia. La variabile q compie un’oscillazione armonica di
190
LEZIONI DI SISTEMI DINAMICI
periodo T = 4π R
g , indipendente dalle condizioni iniziali ovvero dalla quota massima (purché minore di R) che si raggiunge durante il moto. Durante una oscillazione
completa della variabile q la variabile z = q 2 compie due oscillazioni complete (una
quando q > 0 e una quando
q < 0) e quindi il periodo di oscillazione del punto sulla
cicloide è dato da T /2 = 2π R
g.
5.8 Il teorema di Noether
La conservazione dei momenti coniugati20 pα , α = 1, ...., ν, nel caso delle variabili cicliche e la conservazione della funzione Hamiltoniana, sono legati alle proprietà
di invarianza della funzione di Lagrange. Nel caso di una coordinata ciclica qh , la
∂L
condizione di ciclicità, ∂q
= 0, ci dice che comunque si “trasli” la coordinata qh la
h
funzione Lagrangiana rimane immutata (in questo caso la cosa è “ovvia” visto che la
Lagrangiana non dipende da qh ).
Cerchiamo di chiarire questo punto con qualche esempio. Come primo esempio
consideriamo il moto centrale analizzato nella sezione 3.4. In questo caso la variabile
ϕ è ciclica. Questo semplicemente traduce il fatto che, essendo tutto il sistema simmetrico per rotazioni attorno all’asse perpendicolare al piano del moto. La variabile ϕ
non deve intervenire nella dinamica: solo la sua variazione nel tempo, cioè ϕ̇, ha importanza. Un secondo esempio è quello del punto materiale libero (cioè una particella
a cui non sono applicate forze). In tal caso la Lagrangiana è
L≡T =
1
m(ẋ2 + ẏ 2 + ż 2 ).
2
Qui tutte e tre le coordinate (x, y, z) sono cicliche. E questo è la “conseguenza” della
omogeneità dello spazio: ogni punto dello spazio è indistinguibile dagli altri. In termini matematici apparentemente più raffinati, il problema del moto del punto libero
deve essere invariante per traslazione (o meglio ancora, per l’azione del gruppo delle
traslazioni dello spazio euclideo).
Anche la conservazione dell’energia, seppur meno palesemente, è legata a un’invarianza traslazionale: quella delle traslazioni temporali (cioè della variabile t).
Per generalizzare queste osservazioni occorre formalizzare meglio il concetto di
invarianza. Per evitare complicazioni limitiamoci soltanto a funzioni Lagrangiane
indipendenti dal tempo. La funzione L è quindi una funzione definita su un insieme
S = D × Rl dove D ⊂ Rl è un aperto, ed è il dominio delle coordinate lagrangiane21
=
= (q1 , . . . , ql ), mentre il secondo Rl è il dominio delle velocità lagrangiane q̇
q
(q̇1 , . . . , q̇l ).
Definizione 5.8.1 Uno pseudo-gruppo22 ad un parametro di diffeomorfismi di D è
un’applicazione da Φ : I × D → D, dove I ⊂ R è un intervallo contenente lo zero e
20 Si
veda la formula (5.69).
per semplicità, la notazione introdotta nella sezione 4.1.
22 Il nome “pseudo-gruppo” proviene dal fatto che in genere I = R e quindi la terza proprietà richiesta
è solo “localmente” una proprietà di gruppo. Nel seguito, per non appesantire, elimineremo il prefisso
“pseudo”
21 Utilizziamo,
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
191
D è un aperto di Rl
)
(s, q
(s,(q1 ,...,ql ))
Φ
) , Φ2 (s,
)) ∈ D ⊂ Rl ,
−→ Φ (s,
q ) = (Φ1 (s, q
q ) , ... , Φl (s, q
che gode delle seguenti proprietà:
1. per ogni s ∈ I la mappa Φ(s, ·) : D → D è un diffeomorfismo (ovvero è un’applicazione biunivoca da D in D, differenziabile con inversa differenziabile); per
∈ D la mappa Φ(·, q
) : I → D è differenziabile;
ogni q
per ogni
2. Φ(0, ·) : D → D è la trasformazione identica, cioè Φ(0,
q) = q
∈ D, ;
q
3. per ogni s1 , s2 ∈ I tali che s1 + s2 ∈ I, vale Φ(s1 , Φ(s2 , ·)) = Φ(s2 , Φ(s1 , ·))
= Φ(s1 + s2 , ·).
∈ D,
Nota 5.8.1 Fissato un qualunque punto di D, ovvero una qualunque l-upla q
) : I → D, cioè s → Φ(s, q
). Questa rappreconsideriamo l’applicazione Φ(s, q
∈ D passa una sola curva del
senta una “curva” in D. Evidentemente, per ogni q
). Tuttavia la “rappresentazione” della curva non è univoca a causa della
tipo Φ(s, q
proprietà di traslazione al punto 3.
Esempio 5.8.1 Mostriamo che la traslazione della coordinata lagrangiana q1 , ovvero
l’applicazione Φ : R×Rl −→ Rl , così definita
Φ
(s, (q1 , . . . , ql )) −→ (q1 + s, q2 , . . . , ql )
è un gruppo a un parametro. Le proprietà 1 e 2 sono soddisfatte. Proviamo la proprietà
3. Abbiamo
))
Φ(s1 , Φ(s2 , q
= Φ (s1 , (q1 + s2 , q2 , . . . , ql )) = (q1 + s2 + s1 , q2 , . . . , ql )
= Φ (s1 + s2 , (q1 , q2 , . . . , ql )) ,
e
))
Φ(s2 , Φ(s1 , q
= Φ (s2 , (q1 + s1 , q2 , . . . , ql )) = (q1 + s1 + s2 , q2 , . . . , ql )
= Φ (s1 + s2 , (q1 , q2 , . . . , ql )) ,
e quindi la proprietà 3 è verificata.
) è un gruppo ad un parametro, allora
Nota 5.8.2 E’ facile verificare che se Φ(s, q
) è l’applicazione inversa di Φ(s, q
), ovvero che Φ(−s, Φ(s, q
)) = q
. AppliΦ(−s, q
)) = Φ(s − s, q
) = Φ(0, q
), che,
cando infatti la proprietà 3 abbiamo Φ(−s, Φ(s, q
per la proprietà 2, è proprio l’identità.
192
LEZIONI DI SISTEMI DINAMICI
Definizione 5.8.2 Sia Φ un gruppo a un parametro nel senso della definizione 5.8.1.
Chiameremo rilevamento del gruppo allo spazio S = D × Rl ⊂ R2l il gruppo a un
parametro T Φ : I × S → S, così definito:
�
�
� = T Φ (s, (q1 , . . . , ql , q̇1 , . . . , q̇l ))
�, q̇
T Φ s, q
�
�
l
l
�
�
∂Φ1
∂Φl
�) , . . . , Φl (s, q
�) ,
(5.97)
q̇k , . . . ,
q̇k
= Φ1 (s, q
∂qk
∂qk
k=1
k=1
�), j = 1, ..., l, della l-upla
Notiamo che se leggiamo la generica componente Φj (s, q
�) come la j-esima coordinata di una particella che si “muove” sotto l’azione del
Φ(s, q
�l
∂Φj
gruppo di diffeomorfismi, allora
q̇k , altro non è che la velocità della partik=1 ∂qk
cella lungo la j-esima coordinata. Infatti, tornando alla sezione 4.1.2, se le coordinate
dell’i-esimo punto materiale xi (�
q ) = (xi (�
q ) , yi (�
q ) , zi (�
q )) non dipendono esplicitamente dal tempo, allora considerando, a titolo di esempio, la componente yi del vettore
�l
∂yi
posizione, la velocità del punto materiale rispetto ad y è data da ẏi =
q̇k .
k=1 ∂qk
Quindi, volendo proseguire questa analogia, se le (q1 , . . . , ql ) vengono mappate dal
�
�) (che leggiamo come l-upla delle coordinate) è ovvio che le q̇
gruppo nelle Φ(s, q
�l
∂Φj
dovranno essere mappate nelle “velocità”, ovvero in
q̇k , j = 1, ..., l.
k=1 ∂qk
Proposizione 5.8.1 Il rilevamento di un gruppo a un parametro è esso stesso un gruppo a un parametro che agisce sui vettori di R2l .
Dim.� Per prima
� cosa bisogna mostrare che, fissato un qualunque s ∈ I, l’applicazione
� : S → S, è invertibile, sapendo che Φ (s, q
�, q̇
�) è un gruppo ad un paraT Φ s, q
metro e che quindi soddisfa la proprietà 1 della definizione 5.8.1. Proprio in virtù di
� ∈ D, det JΦ �= 0 dove JΦ è la
tale proprietà, abbiamo che, per ogni s ∈ I e per ogni q
matrice jacobiana
∂Φ
∂Φl
1
···
∂q1
∂q1
.
..
JΦ = ..
. .
∂Φ
∂Φl
1
···
∂ql
∂ql
Se calcoliamo la matrice jacobiana dell’applicazione T Φ abbiamo
�
�
JΦ D
JT Φ =
,
0 JΦ
dove D è la seguente matrice l × l
�
l
∂ 2 Φ1
q̇k
k=1 ∂q1 ∂qk
..
D=
.
�l
∂ 2 Φ1
q̇k
k=1 ∂ql ∂qk
···
�l
···
�l
k=1
k=1
∂ 2 Φl
q̇k
∂q1 ∂qk
..
.
∂ 2 Φl
q̇k
∂ql ∂qk
.
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
193
2
Sfruttando le proprietà delle matrci triangolari a blocchi, det JT Φ = (det JΦ ) �= 0, e
quindi T Φ è invertibile.
, abbiamo
Passiamo adesso alla proprietà 2. Siccome Φ(0,
q) = q
l
)
∂Φ1 (0, q
TΦ
, q̇
) , ... , Φl (0, q
),
0, q
q̇k , ..
−→
(Φ1 (0, q
∂qk
k=1
(q1 , ..., ql )
..,
l
)
∂Φl (0, q
q̇k .
∂qk
k=1
l
)
∂Φj (0, q
) = qj , e quindi
Ora, per ogni j = 1, ..., l , si ha Φj (0, q
q̇k =
k=1
∂qk
l
δjk q̇k = q̇j . Dunque
k=1
TΦ
−→
, q̇
0, q
(q1 , ..., ql , q̇1 , ...., q̇l ) ,
è l’identità.
, q̇
ovvero T Φ 0, q
Mostriamo infine la proprietà 3, provando che T Φ(s1 , T Φ(s2 , ·)) = T Φ(s1 +
s2 , ·). Il passaggio T Φ(s1 , T Φ(s2 , ·)) = T Φ(s2 , T Φ(s1 , ·)) è banale. Dalla (5.97)
l
l
∂Φ
(s
,
q
)
∂Φ
(s
,
q
)
1
2
l
2
= Φ (s2 , q
, q̇
) ,
q̇k , ...,
q̇k
T Φ s2 , q
∂qk
∂qk
k=1
k=1
e quindi
l
l
)
)
∂Φ1 (s2 , q
∂Φl (s2 , q
) ,
q̇k , ...,
q̇k
T Φ s1 , Φ (s2 , q
∂qk
∂qk
k=1
k=1
·
=
q
T Φ s2 ,
q,
)) ,
Φ (s1 , Φ (s2 , q
..,
l
k=1
l
))
∂Φ1 (s1 , Φ (s2 , q
q̇k , ..
∂qk
k=1
))
∂Φl (s1 , Φ (s2 , q
q̇k
∂qk
,
che, sfruttando la proprietà 3 della definizione 5.8.1, diventa
l
l
)
)
∂Φ1 (s1 + s2 , q
∂Φl (s1 + s2 , q
) ,
=
Φ (s1 + s2 , q
q̇k , ...,
q̇k
∂qk
∂qk
k=1
k=1
.
, q̇
= T Φ s1 + s 2 , q
194
LEZIONI DI SISTEMI DINAMICI
Esempio 5.8.2 Riprendendo l’esempio 5.8.1, il rilevamento della “traslazione” è dato
da
TΦ
(s, q1 , . . . , ql ; q̇1 , . . . , q̇l ) −→ (q1 + s, . . . , ql ; q̇1 , . . . , q̇l ).
) = qj , se j = 2, ..., l, e Φ1 (s, q
) = q1 + s, abbiamo
Infatti, dal momento che Φj (s, q
l
l
)
∂Φj (s, q
q̇k =
δjk q̇k = q̇j , j = 2, ..., l ,
∂qk
k=1
k=1
e
l
l
)
∂Φ1 (s, q
∂ (q1 + s)
q̇k =
q̇k = q̇1 .
∂qk
∂qk
k=1
k=1
Definizione 5.8.3 Un gruppo a un parametroΦ si dice
una simmetria per la funzione
, q̇ ∈ S vale
Lagrangiana L se per ogni s ∈ I e per ogni q
= L T Φ s, q
, q̇
, q̇
L q
,
∈ S, abbiamo
, q̇
cioè, per ogni s ∈ I, e q
L(q1 , . . . , ql , q̇1 , . . . , q̇l ) =
) , ...Φl (s, q
) ,
L Φ1 (s, q
..,
l
k=1
∂Φ1
q̇k
∂qk
.
(5.98)
l
∂Φ1
q̇k , ..
∂qk
k=1
(5.99)
Possiamo ora enunciare il teorema di Noether23
Teorema 5.8.1 Sia Φ una simmetria per la funzione Lagrangiana L, allora la funzione
I : S → R definita da
l
∂L dΦk
, q̇ =
I q
,
∂ q̇k ds s=0
(5.100)
k=1
è una costante del moto, ovvero
dI
= 0.
dt
Dim. La dimostrazione si basa sulla possibilità di scambiare le derivate rispetto a s e a
t. Queste sono due variabili indipendenti tra loro (t è il tempo, mentre s è il parametro
di una trasformazione “geometrica” indipendente dal tempo). Quindi, considerando
23 Amalie
(t) = (q1 (t) , ...., ql (t)) ,
q
Emmy Noether (Erlangen, 1882 – Bryn Mawr, Pennsylvania 1935), matematica tedesca.
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
195
q (t)) , avremo
per ogni componente Φj , j = 1, ..., l, della l-upla Φ (s,
l
(t))
d dΦj (s, q
d dΦj
d ∂Φj ·
=
=
q .
dt
ds
ds
dt
ds
∂qk k
(5.101)
k=1
Deriviamo la funzione I rispetto al tempo
l
d
d ∂L dΦk
I(q1 , . . . , ql , q̇1 , . . . , q̇l ) =
,
dt
dt
∂ q̇k ds s=0
(5.102)
k=1
e sviluppiamo la derivata del prodotto dentro la somma
l
l
d ∂L
∂L d dΦk
dΦk
+
dt ∂ q̇k
ds s=0
∂ q̇k dt
ds s=0
k=1
(5.103)
k=1
d ∂L
Nel primo addendo possiamo usare le equazioni di Lagrange per sostituire
dt ∂ q̇k
∂L
con
, e nel secondo addendo possiamo scambiare le derivate rispetto a s e t come
∂qk
nella (5.101),
l
l
∂L dΦk
∂L d dΦk
+
∂qk ds s=0
∂ q̇k ds
dt s=0
k=1
=
k=1
l
l
l
∂L d ∂Φk
∂L dΦk
+
q̇
h
∂qk ds s=0
∂ q̇k ds
∂qh
k=1
k=1
h=1
.
s=0
Quest’ultima è la derivata di L (T Φ(s, (q1 , . . . , ql ; q̇1 , . . . , q̇l ))) rispetto a s ed è quindi nulla per l’invarianza della Lagrangiana sotto l’azione del gruppo a un parametro.
Infatti, sfruttando la (5.99), per ogni s ∈ I,
l
l
d
∂Φ1
∂Φ1
) , ..., Φl (s, q
) ,
0 =
L Φ1 (s, q
q̇k , ...,
q̇k
ds
∂qk
∂qk
k=1
=
l
l
∂L dΦk ∂L d
+
∂qk ds
∂ q̇k ds
k=1
k=1
l
∂Φk
q̇h
∂qh
h=1
k=1
.
E quindi, calcolando la derivata per s = 0, otteniamo la tesi.
5.9 Equilibrio
Nel seguito lavoreremo sotto le seguenti ipotesi:
Hp. 1. Il sistema di N punti materiali è sottoposto a m vincoli olonomi lisci, ed è
≡ 0.
soggetto soltanto a forze conservative ed alle forze vincolari, cioè S
196
LEZIONI DI SISTEMI DINAMICI
Hp. 2. La Lagrangiana non dipende esplicitamente dal tempo. Dalla (4.33), abbiamo
dunque
L =
l
l
1
ahk (q1 , . . . , ql )q̇h q̇k +
bh (q1 , . . . , ql )q̇h +
2
h,k=1
h=1
T1
T2
+T0 (q1 , . . . , ql ) − V (q1 , . . . , ql ) .
(5.104)
Notiamo che tale espressione potrebbe sembrare in contrasto con l’ipotesi 2:
infatti, se nella funzione L compaiono T1 e T0 , allora abbiamo a che fare con
vincoli mobili e quindi con Lagrangiane dipendenti dal tempo. Così non è poiché
esistono casi di vincoli mobili per cui la L non dipende esplicitamente dal tempo.
Questo è il caso dell’esempio 5.7.1 dove, se la circonferenza ruota con velocità
costante ω, abbiamo una Lagrangiana che non dipende esplicitamente dal tempo.
≡
Poiché che la Lagrangiana in (5.104) non dipende esplicitamente dal tempo e S
0, la funzione di Hamilton (5.78) è un integrale primo del moto. Infatti dalla (5.82)
deduciamo
dH
= 0.
(5.105)
dt
La forma di H è data dalla (5.84), cioè
H=
l
1
ahk (q1 , . . . , ql )q̇h q̇k − T0 (q1 , . . . , ql ) + V (q1 , . . . , ql ) = T2 − Veff .
2
h,k=1
(5.106)
Ora, cerchiamo (se esistono) soluzioni costanti delle equazioni di moto (5.36), ovvero
funzioni del tipo
q1 (t) ≡ q1, e , . . . , ql (t) ≡ ql, e ,
per ogni t .
(5.107)
In analogia con la definizione 2.8.1, diamo la seguente:
e = (q1, e , . . . , ql, e ) si dice una configurazione
Definizione 5.9.1 La configurazione q
di equilibrio se una volta posto il sistema in tale configurazione, con (q̇1 , ..., q̇1 ) ≡
e è configurazione
(0, ...., 0), il sistema ivi rimane indefinitamente. In altri termini, q
(t) ≡ q
e , è soluzione delle equazioni di moto (5.36) con le condizioni
di equilibrio se q
e , e q̇
|t=0 = q
=0.
iniziali q
t=0
Proposizione 5.9.1 Se le ipotesi Hp. 1 e Hp. 2 sono sodisfatte, le configurazioni di
equilibrio sono tutte e sole le soluzioni di
∂Veff
∂ (V − T0 )
=
= 0,
∂qk
∂qk
k = 1, . . . , l .
(5.108)
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
197
Dim. Ricordando la forma compatta (4.40) della Lagrangiana, abbiamo
L=
1� T � � �
q),
q̇ Aq̇ + b • q̇ − Veff (�
2
dove né A né �
b dipendono esplicitamente dal tempo. Scriviamo
(5.36)
1 T ∂A ∂ �
b
�
�
�
•
q̇
q̇
q̇
2
∂q1
∂q1
�
dA
d
b
.
.
�+
�+
−
..
..
−
Aq̈
q̇
+
dt
dt
∂�
1 � T ∂A �
b
q̇
q̇
�
• q̇
2
∂ql
∂ql
adesso le equazioni
∂Veff
∂q1
..
.
∂Veff
∂ql
= 0.
In particolare,
e quindi
d�
b
=
dt
�+
Aq̈
db1
dt
..
.
dbl
dt
�l
=
∂b1
q̇k
k=1 ∂qk
�
l
∂�
b
..
=
q̇k ,
.
∂q
k=1 k
�l
∂bl
q̇k
k=1 ∂qk
l
b
dA � � ∂ �
q̇k
q̇ +
dt
∂qk
(5.109)
k=1
1 T ∂A
�
�
q̇
q̇
2
∂q1
..
−
.
1 T ∂A
�
�
q̇
q̇
2
∂ql
∂�
b
�
• q̇
∂q
1
..
−
.
�
∂b
�
• q̇
∂ql
� = 0, il sistema (5.109) si riduce a
Ora, se q̇
∂V
eff
∂q1
..
.
∂V
eff
∂ql
∂V
eff
∂q
1
..
+
.
∂Veff
∂ql
= 0.
= 0.
�e sono quindi tutte e sole le soluzioni di (5.108).
Le configurazioni di equilibrio q
Ricordiamo poi che il potenziale efficace si riduce al potenziale delle forze direttamente applicate nel caso dei vincoli fissi. In questo caso le configurazioni di equilibrio
corrispondono ai punti critici dell’energia potenziale V .
198
LEZIONI DI SISTEMI DINAMICI
5.9.1 Stabilità
� = 0,
In quello che segue continuiamo a considerare le ipotesi Hp. 1 e Hp. 2, cioè S
e Lagrangiane indipendenti dal tempo. Ricordando la sezione 5.4, sappiamo che il
sistema (5.109) può essere scritto nella seguente forma compatta
�
�
� =G
� q
� ,
�, q̇
Aq̈
(5.110)
� si può ricavare dalla (5.109). Ora, la matrice A è non singolare
dove l’espressione di G
(v. teorema 4.1.3), e quindi possiamo ridurre il sistema (5.110), ad un sistema del primo
ordine in forma normale. Infatti introducendo
η1
q̇1
. .
�, ⇔
� = q̇
η
.. = .. ,
ηl
abbiamo
�
q̇
�
η̇
q̇l
�,
= η
(5.111)
� (�
� ).
= A−1 G
q, η
Di conseguenza, ricordando il teorema 2.8.1, abbiamo la seguente
�e = (q1, e , . . . , ql, e )
Definizione 5.9.2 Una configurazione di equilibrio, o punto di equilibrio, q
� e ) = (qe1 , . . . , qel , 0, . . . , 0) è una posizione di equilibrio stabisi dirà stabile se (�
qe , η
le nel senso della definizione 2.8.2, per il sistema di equazioni del primo ordine (5.111).
Un punto di equilibrio non stabile si dirà instabile.
Come nella sezione 2.8.3, vale il
Teorema 5.9.1 (Principio di Dirichlet) Se le ipotesi Hp. 1 e Hp. 2 sono sodisfatte,
�e = (q1, e , . . . , ql, e ) è un minimo isolato dell’energia potenziale efficace Veff =
eq
�e è una configurazione di equilibrio stabile.
−T0 + V , allora q
Dim. La dimostrazione di questo principio è relativamente semplice: si riduce a far
� e di q
�,
vedere che la funzione Hamiltoniana data da (5.106), vista come funzione di η
meno Veff (�
q e ), cioè
�) = H (�
�) − Veff (�
qe ) =
Λ (�
η, q
η, q
1 T
� A�
η
η + Veff (�
q ) − Veff (�
qe ) ,
2
è una funzione di Lyapunov per il sistema (5.111). Si applica dunque il teorema 2.8.1 da
� e ) è punto di equilibrio stabile. Mostriamo dunque che Λ (�
�)
cui discende che (�
qe, η
η, q
è funzione di Lyapunov.
�) lungo le soluzioni sia minore o uguale a
La condizione che la derivata di Λ (�
η, q
zero è conseguenza della conservazione dell’energia (5.105). Resta da far vedere che
la funzione Λ ha un minimo isolato in (qe,1 , . . . , qe,l , 0, . . . , 0). Anche questo segue
facilmente dalla forma della Λ e dall’ipotesi di minimo isolato per Veff . Infatti il primo
addendo nella definizione di Λ è una forma quadratica definita positiva nelle ηk (cioè
nelle q̇k ) e quindi è nullo soltanto se η1 = ..... = ηl = 0, mentre Veff (�
q ) > Veff (�
q e ).
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
199
e ),
) in un intorno della configurazione di equilibrio (
Quindi, se prendiamo (
q, η
qe , η
e ), si ha
ma diversi da (
qe , η
) =
Λ (
η, q
1 T
A
η
η + Veff (
q ) − Veff (
q e ) > 0,
2
La funzione Λ ha un minimo isolato in (q1, e , . . . , ql, e , 0, . . . , 0).
Esempio 5.9.1 Continuando con l’esempio 5.7.1, vogliamo determinare le configurazioni di equilibrio stabile nel caso in cui la circonferenza ruoti uniformemente, cioè
dϕ
= ω = costante. Abbiamo già osservato che, in questo caso, L non dipende
dt
esplicitamente dal tempo. Sono quindi verificate le ipotesi Hp.1 e Hp.2, per cui le
configurazioni di equilibrio sono i massimi e i minimi di
Veff (θ) = V − T0 = −
ω2
g
sin2 θ − cos θ.
2
R
I punti di equilibrio sono dunque le soluzioni di
g
dVeff (θ)
= ω 2 sin θ
− cos θ = 0.
2
dθ
ω R
Si distinguono due casi:
•
g
≥ 1. I punti di equilibrio sono θ = 0, π (o θ = −π). Dall’analisi del segno
ω 2 R′
di Veff
,
si deduce che θ = 0, è un minimo isolato e quindi è punto di equilibrio
stabile. E’ facile poi vedere che θ = π è configurazione di equilibrio instabile.
g
g
′
• 2 < 1. Gli zeri di Veff
.
sono θ = 0, π, ±θ̄, dove θ̄ = arccos
ω R
ω2R
Le configurazioni di equilibrio stabile corrispondono a ±θ̄. Applicando poi la
definizione 5.9.2, si prova che θ = 0, π, sono punti di equilibrio instabile.
5.10 Piccole Oscillazioni
Supponiamo di avere un sistema meccanico con l gradi di libertà, con funzione Lagrangiana della forma24
l
=1
, q̇
).
L q
aij (
q )q̇i q̇j − V ( q
2 i,j=1
e = (q1, e , . . . , ql, e ) sia tale che si abbia
Supponiamo che la configurazione q
∂V
(
q ) = 0,
∂qk e
k = 1, ..., l,
(5.112)
(5.113)
24 Se la Lagrangiana ha la forma L = T + T − V , quello che segue vale sostituendo V
2
0
eff = −T0 + V
al posto dell’energia potenziale V .
200
LEZIONI DI SISTEMI DINAMICI
e che la matrice hessiana
B(
qe ) =
qe )
∂ 2 V (
,
∂qk ∂qh
k, h = 1, ..., l,
(5.114)
sia definita positiva. Le condizioni (5.113) e (5.114), e il criterio di Dirichlet, ci garane è una configurazione di equilibrio stabile, ovvero
tiscono che la configurazione q
e (e della
che il moto resta confinato in un intorno della configurazione di equilibrio q
nulla). In altri termini, durante il moto, le norme �
e �
velocità
lagrangiana
q̇
q
(t) − q
e q̇(t) restano “piccole”. Vediamo dunque come sfruttare questo fatto per sempli-
ficare le equazioni di Lagrange in vicinanza della configurazione di equilibrio stabile.
Dapprima considereremo sistemi con un solo grado di libertà e poi sistemi con l > 1,
gradi di libertà.
5.10.1 Sistemi con un solo grado di libertà
In questo caso L è data da
1
a (q) q̇ 2 − V (q) .
2
La configurazione di equilibrio stabile è q = qe , per cui V ′ (qe ) = 0, e V ′′ (qe ) >
0. Consideriamo quindi (q, q̇) “vicini” al punto di equilibrio (qe , 0), cioè (q, q̇) ∈
Bε (qe , 0), essendo Bε (qe , 0) l’intorno di (qe , 0) di raggio ε, come mostrato in figura
5.6. Si introduce quindi la nuova variabile ξ
L (q, q̇) =
q
= qe + εξ,
q̇
= εξ˙ .
⇔
ξ=
q − qe
,
ε
Evidentemente 0 ≤ |ξ| ≤ 1, mentre ε sarà “piccolo”, cioè ε ≪ 1. Scriveremo
dunque ε = O (q − qe ), mentre ξ = O (1), che significano: ε è dell’ordine di (q − qe ),
e quindi “molto piccolo”, mentre l’ordine di grandezza di ξ è 1.
Adesso sviluppiamo sia V (q) che a (q) in vicinanza di qe ,
V (q)
1
= V (qe ) + V ′ (qe ) (q − qe ) + V ′′ (qe ) (q − qe )2 + ....
2
=0
>0
1
= V (qe ) + V ′′ (qe ) ε2 ξ 2 + o ε2 .
2
1
2
= a (qe ) + a′ (qe ) (q − qe ) + a′′ (qe ) (q − qe ) + ....
2
1
= a (qe ) + a′ (qe ) εξ + a′′ (qe ) ε2 ξ 2 + o ε2 .
2
Sostituiamo tali sviluppi nella Lagrangiana
2 2 2
1 ′′
1
′
2 2
a (qe ) + a (qe ) εξ + a (qe ) ε ξ + o ε
ε ξ˙
L =
2
2
1
+V (qe ) + V ′′ (qe ) ε2 ξ 2 + o ε2 .
2
a (q)
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
201
.
q
ε
qe
q
Figura 5.6: L’intorno Bε (qe , 0).
Se trascuriamo i termini o ε2 , possiamo approssimare la funzione di Lagrange con
Lapp =
1
1
a (qe ) ε2 ξ̇ 2 − V ′′ (qe ) ε2 ξ 2 − V (qe ) ,
2
2
che definiamo Lagrangiana approssimata, o Lagrangiana delle piccole oscillazioni.
Scrivendo, per tale Lagrangiana, l’equazione di moto (5.36) otteniamo
a (qe ) ξ¨ + V ′′ (qe ) ξ = 0, ⇒
ξ̈ = −
V ′′ (qe )
ξ,
a (qe )
che è l’equazione dell’oscillatore armonico mξ¨ − kξ = 0, la cui frequenza è
ω2 =
V ′′ (qe )
.
a (qe )
5.10.2 Sistemi con l gradi di libertà
Si procede come nella sezione precedente introducendo lo sviluppo di Taylor di V in
un intorno del punto del punto di equilibrio limitandoci soltanto al secondo ordine
V (q) ≈ V (
qe ) +
l
∂V (
qe )
1
e )T B (
e ) ,
(
q−q
(qk − qk,e ) +
q ) (
q−q
e
∂qk
2
k=1
l
b (
q )(q −q )(q −q )
=0
k,h=1
kh
e
h
h,e
k
k,e
202
LEZIONI DI SISTEMI DINAMICI
�e , data dalla (5.114). Per quel che
dove B (�
q e ) è la matrice Hessiana calcolata in q
riguarda l’energia cinetica, seguendo lo stesso approccio illustrato nella sezione 5.10.1,
ci limitiamo all’ordine “zero”, cioè
T ≈
l
l
1 �
1 �
d (qk − qk, e ) d (qh − qh, e )
ahk (�
q e ) q̇h q̇k =
ahk (�
qe )
.
2
2
dt
dt
h,k=1
h,k=1
�
��
�
T
q̇ A(
q e )
q̇
Approssimiamo dunque la Lagrangiana (5.112) con la seguente
�
�
�
�, q̇
Lapp q
=
l
1 �
d (qk − qk, e ) d (qh − qh, e )
ahk (�
qe )
2
dt
dt
h,k=1
−
l
1 �
bkh (qh − qh,e ) (qk − qk,e ) .
2
(5.115)
k,h=1
In particolare, introducendo
q1 (t) − q1 e
�e ) �
q−q
..
� = d (�
� (t) = q
� (t) − q
�e =
= q̇ ,
u
, ⇒ u̇
.
dt
ql (t) − ql e
(5.116)
possiamo riscrivere la (5.115) in forma matriciale compatta
�
�
� = 1 u̇
�−1u
� T A (�
� T B (�
� , u̇
�.
q e ) u̇
qe ) u
Lapp u
2
2
(5.117)
Le equazioni di Lagrange (5.36) sono
�+Bu
� = 0,
Aü
(5.118)
dove A e B sono matrici l × l, simmetriche, definite positive, le cui componenti sono
costanti.
Chiameremo Lagrangiana delle piccole oscillazioni o Lagrangiana approssimata la funzione definita in (5.117) (o (5.115)), mentre le equazioni (5.118) sono
usualmente dette equazioni delle piccole oscillazioni.
Soluzione delle equazioni delle piccole oscillazioni
Come già visto nella sezione 2.10, dove abbiamo trattato i sistemi lineari bidimensionali di equazioni differenziali a coefficienti costanti, cerchiamo di semplificare il sistema
(5.118) applicando un “trucco vecchio quanto la matematica”: il cambiamento di varia� (t), che siano una combinazione
bili. Cerchiamo cioè nuove variabili indipendenti w
� (t), ovvero che siano legate alle u
� (t) da una trasformazione
lineare delle variabili u
lineare, ovviamente invertibile, del tipo
� (t) = Vw
� (t) ,
u
⇔
� (t) = V−1 u
� (t) ,
w
(5.119)
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
203
dove V è una matrice l × l, invertibile, le cui componenti, denotate con vij , i, j = 1,
...., l, sono numeri reali. Sostituendo nella (5.118) si ha
� + BV w
� = 0,
AV ẅ
che, moltiplicata a sinistra per VT , diventa
� T �
�
�
� + VT BV w
� = 0.
V AV ẅ
(5.120)
Se adesso riusciamo a selezionare V in modo tale che
VT AV = I,
e
VT BV = M =
(5.121)
µ1
0
0
..
.
0
µ2
0
..
.
0
0
µ3
..
.
···
···
···
0
0
0
..
.
0
0
0
···
µl
,
(5.122)
con µk positivi, cioè µk > 0, ∀ k = 1, ..., l, il sistema (5.120) diventa
� +Mw
� = 0,
ẅ
che, scritto per esteso, assume la forma
ẅ1 + µ1 w1 = 0,
ẅ2 + µ2 w2 = 0,
.
..
ẅl + µl wl = 0.
Abbiamo quindi ottenuto un sistema di l oscillatori armonici disaccoppiati, le cui
soluzioni sono25
√
(5.123)
wk (t) = ak cos ( µk t + φk ) , k = 1, 2, ..., l,
dove ak , e φk ,sono costanti arbitrarie (il cui valore può essere determinato quando sono
note le condizioni condizioni iniziali).
� , che poi, ricordando
Quindi tornando alla (5.119), ovvero alle “vecchie variabili” u
la (5.116), altro non sono che (�
q (t) − �
q e ), abbiamo
qi (t) − qi e
=
l
�
vik wk (t)
k=1
=
l
�
√
vik ak cos ( µk t + φk ) ,
j=1
25 Una
scrittura equivalente della (5.123) è
√
√
wk (t) = ak cos ( µk t) + bk sin ( µk t) ,
con ak , bk , costanti.
i = 1, ..., l,
204
cioè
LEZIONI DI SISTEMI DINAMICI
�√
�
µ1 t + φ1
..
� (t) − q
�e = V
q
.
.
�√
�
al cos µl t + φl
a1 cos
�
Le variabili w(t)
sono detti modi normali, mentre
√
ωk = µk , k = 1, ..., l,
(5.124)
sono dette frequenze26 proprie delle piccole oscillazioni.
Mostriamo adesso che esiste ed è unica la matrice V che, realizzando le (5.121)
�e ), ai modi normali w(t)
�
e (5.122), permette di passare dalle variabili (�
q (t) − q
dati
dalla (5.123). Poniamoci dunque in Rl , dove, seguendo la notazione fin qui utilizzata,
� intendiamo i vettori (cioè le l-uple) colonna
con v
v1
� = ... ,
v
vl
�T =
�T i vettori (l-uple) riga, v
e con v
seguente teorema per le matrici A e B
�
v1
···
vl
�
. Dimostreremo che è vero il
Teorema 5.10.1 (Teorema spettrale) Sia A una matrice simmetrica definita positiva
�1 , . . . ,
e B una matrice simmetrica. Allora esistono l vettori linearmente indipendenti v
�l , e l numeri reali µ1 , . . . , µl (non necessariamente diversi tra loro) tali che
v
µk A�
v k = B�
vk ,
e27
k = 1, . . . , l ,
�h • A�
�T
v
vk = v
v k = δhk ,
h A�
∀ h, k = 1, . . . , l .
(5.125)
(5.126)
Se anche la matrice B è definita positiva, allora i numeri µk sono tutti positivi.
�k sono detti rispettivamente gli autovalori e gli autovettori
I numeri µk e i vettori v
di B relativi ad A. Il teorema è una generalizzazione del teorema spettrale per le
matrici simmetriche (e infatti rientra in questa versione se A = I). Ciò che si perde
rispetto al caso in cui A = I, è il fatto che la base di autovettori non è più, in generale,
�h • v
�k = δhk , bensì la (5.126).
ortonormale. Infatti non vale v
In accordo con il teorema spettrale possiamo facilmente provare che esiste ma
matrice V che realizza le (5.121) e (5.122). Abbiamo infatti
�1 , . . . , v
�l , sono gli autovettori di B relativi ad A, allora, ponendo
Teorema 5.10.2 Se v
�
�
�1 v
�2 · · · v
�l ,
V= v
(5.127)
V realizza le (5.121) e (5.122).
26 In realtà, se volessimo esser precisi, si tratta di pulsazioni e non di frequenze. Le frequenze ν sono date
k
da ωk /2π.
27 Con • si intende l’usuale prodotto scalare, componente per componente, in Rl , cioè
•p
=z
T p
=p
T z
.
z
Al solito δhk denota la δ di Dirac: δhk = 1 se h = k, δhk = 0, altrimenti.
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
205
�k ,
Dim. Le colonne della matrice V sono i vettori colonna (cioè le l-uple colonna) v
k = 1, ..., l. La matrice VT sarà dunque formata dai vettori riga
VT =
�T
v
1
�T
v
2
..
.
�T
v
l
.
Eseguendo il prodotto righe per colonne abbiamo
VT AV =
ed anche
�T
v
v1
1 A�
�T
v
v1
2 A�
..
.
�T
v1
v
l A�
VT BV
�T
v
v2
1 A�
�T
v
v2
2 A�
..
.
�T
v
v2
l A�
=
=
=
···
···
···
�T
v
v1
1 B�
T
�2 B�
v
v1
..
.
�T
v
v1
l B�
�T
v
v2
l B�
�T
µ1 v
v1
l A�
0
µ2
..
.
0
0
�T
v
vl
l A�
�T
v
v2
1 B�
T
�2 B�
v
v2
..
.
�T
µ1 v
v1
1 A�
�T
µ1 v
A�
2 v1
..
.
µ1
0
..
.
�T
v
vl
1 A�
�T
v
vl
2 A�
..
.
=
(5.126)
···
···
···
�T
µ2 v
v2
1 A�
�T
µ2 v
A�
2 v2
..
.
�T
v
vl
1 B�
T
�2 B�
v
vl
..
.
�T
v
vl
l B�
···
···
�T
µ2 v
v2 · · ·
l A�
··· 0
··· 0
.. .
.
· · · µl
1 0
0 1
.. ..
. .
0 0
···
···
0
0
..
.
···
1
,
=
(5.125)
�T
µl v
vl
1 A�
�T
µl v
A�
2 vl
..
.
�T
µl v
vl
l A�
Da notare che, siccome la matrice B è definita positiva (è la matrice hessiana di un
punto di minimo), ogni µk , k = 1, ..., l, è positivo. La matrice V, soddisfacendo sia la
(5.121) che la (5.122), è dunque la matrice che cercavamo.
Il teorema spettrale ci fornisce anche il “metodo pratico” per determinare µk , k = 1,
...., l, e quindi calcolare le frequenze delle piccole oscillazioni tramite la (5.124), ed i
modi normale, ovvero i vettori colonna v k , k = 1, ...., l. Infatti, la (5.125) può esser
così riscritta
�k = 0,
(B − µk A) v
�k �= 0, k = 1, ...., l. Di conseguenza i valori µk si ottengono
dove sappiamo che v
risolvendo l’equazione
det (B − µ A) = 0,
(5.128)
206
LEZIONI DI SISTEMI DINAMICI
anche detta equazione secolare. Una volta determinati i µk (che sappiamo essere tutti
reali), i vettori colonna
vk, 1
vk, 2
�k = . , k = 1, ...., l,
v
..
vk, l
si ottengono risolvendo il sistema lineare
vk, 1
(B−µk A) ... = 0,
vk, l
(5.129)
�k • A�
v k = 1, k = 1, ...., l. Assemblando poi gli l
con la condizione supplementare v
�1 , ..., v
�1 , si forma la matrice V secondo la (5.127). I modi normali w
�
vettori colonna v
si ottengono poi applicando la (5.119).
Dimostrazione del Teorema spettrale
Prima di passare alla dimostrazione vera e propria del teorema spettrale è opportuno
premettere il seguente
Lemma 5.10.1 Se le matrici A e B soddisfano le ipotesi del teorema spettrale, allora
l’equazione in µ (5.128) ha soltanto radici reali. Se poi B è definita positiva allora le
radici di (5.128) sono tutte positive.
Dim. Il teorema fondamentale dell’algebra ci dice che (5.128) ammette l soluzioni.
Vediamo che queste non possono essere complesse. Supponiamo infatti che µ sia una
soluzione complessa, e quindi Im (µ) �= 0, di (5.128). Siccome l’equazione (5.128) è a
� la l-upla complessa, n
� = Re n
� + i Im n
�,
coefficienti reali anche28 µ̄ è soluzione. Sia n
corrispondente a µ, cioè soluzione di
B�
n = µ A�
n.
(5.130)
� =
Siccome A e B sono reali, considerando i complessi coniugati, abbiamo che n
� = µ̄ An.
� Consideriamo adesso
� − i Im n
� , risolve Bn
Re n
� =
� • An
n
=
� + i Im n
� ) • A (Re n
� − i Im n
�) =
(Re n
� ) • A (Re n
� ) + (Im n
� ) • A (Im n
�) +
(Re n
� ) • A (Re n
� ) − (Re n
� ) • A (Im n
� )] .
i [(Im n
� ) • (Re n
� ) = A (Im n
�) •
� ) • A (Re n
� ) = AT (Im n
Siccome A è simmetrica, (Im n
� ), e dunque il termine in parentesi quadra si annulla. Concludiamo pertanto che
(Re n
� = (Re n
� • An
� ) • A (Re n
� ) + (Im n
� ) • A (Im n
� ) > 0.
n
�
��
� �
��
�
>0 perchè A è
definita positiva
28 Con
>0 perchè A è
definita positiva
µ̄ intendiamo il complesso coniugato di µ, cioè µ̄= Re (µ̄) − i Im (µ̄).
(5.131)
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
207
�1,
Osserviamo adesso che se µ1 , µ2 , con µ1 �= µ2 , sono due soluzioni di (5.128) e n
� 2 , sono le due corrispondenti l-uple,
n
� 1,
� 1 = µ1 A n
Bn
abbiamo
B�
n2 = µ2 A�
n2 ,
� 1 • A�
� 2 • A�
n
n2 = n
n1 = 0 .
Infatti, sfruttando la simmetria di A e B,
� 2 • A�
� 2 • B�
� 1 = µ2 A�
�1
n1 = n
n1 = B�
n2 • n
n2 • n
µ1 n
� 2 • A�
= µ2 n
n1 ,
B=BT
A=AT
� 1 • A�
n2 = 0. Ma allora, tornando alla
che ci darebbe l’assurdo µ1 = µ2 , se non fosse n
� relative a µ e µ̄, ovviamente
� e n,
(5.131), abbiamo ottenuto un assurdo: due soluzioni n
� > 0, anziché n
� = 0. Concludiamo quindi che
� • An
� • An
fra loro diversi, danno n
una qualunque soluzione µ di (5.128) non può essere complessa.
Mostriamo infine che, se B è definita positiva e se µ è soluzione di (5.128), abbiamo
� è il vettore colonna (ovviamente non nullo) relativo a µ, cioè
µ > 0. Sia infatti se n
B�
n = µ A�
n. Otteniamo
T
� T��
�� = µ n
�� ,
Bn
An
�n
�� ��
>0
=⇒
µ > 0.
>0
Passiamo adesso alla dimostrazione del teorema spettrale. Si parte dalla (5.128) e si
considera una radice µ, che, in virtù del lemma precedente, sappiamo essere reale. Sia
� �= 0 il corrispondente vettore colonna di Rl soluzione di
quindi v
(5.132)
B�
v = µ A�
v.
�l , vettori linearmente indipendenti che soddi�1 , . . . , v
Vogliamo provare che esistono v
sfano la (5.132) in corrispondenza delle soluzioni µ (tutte reali) della (5.128).
Osserviamo che la matrice A, essendo simmetrica e definita positiva, ammette una
� 1 , ...., a
� l , di A, cioè
base di l autovettori a
A�
ai
=
�j
�i • a
a
=
� i , con ρi ∈ R e ρi > 0, i = 1, ..., l,
ρi a
� j = δij ,
�T
a
i a
∀ i, j = 1, ..., l.
�l ,
� 1 , ...., a
Costruiamo quindi la matrice P le cui colonne sono i vettori a
T
�1
a
T
a
�
�
�2
�1 a
�2 · · · a
� l , PT = . .
P= a
..
�T
a
l
Evidentemente PT P = PPT = I e
PT AP = D, dove D =
ρ1
0
..
.
0
ρ2
..
.
···
···
0
0
..
.
0
0
···
ρl
,
(5.133)
208
LEZIONI DI SISTEMI DINAMICI
dove tutti i ρi sono positivi. Riscrivendo quindi la (5.132) otteniamo
T
T
� = BPP
�, =⇒
µ APP
���� v
����v
I
I
che, ponendo
� = PT BP PT v
�,
µ �PT��AP� PT v
D
PT BP = B1 , e
riscriveremo come
µDV� = B1 V� .
Definiamo adesso
D1/2
�,
V� = PT v
√
ρ1
..
= .
0
···
···
0
.. , D−1/2 =
.
√
ρl
1
√
ρ1
..
.
0
(5.134)
(5.135)
···
···
0
..
.
1
√
ρl
,
ed osserviamo che D1/2 D−1/2 = D−1/2 D1/2 = I, e che D−1/2 DD−1/2 = I. Se
moltiplichiamo dunque a sinistra la (5.135) per D−1/2 ed inseriamo fra B1 e V� la
matrice identità scritta come I = D−1/2 D1/2 , si ottiene
−1/2 1/2 �
µD−1/2 D V� = D−1/2 B1 D
� ��D � V ,
(5.136)
I
che potremo scrivere come µD1/2 V� = B2 D1/2 V� , dove
B2 = D−1/2 B1 D−1/2
=
(5.134)
D−1/2 PT BPD−1/2 .
(5.137)
Quindi, introducendo
� = D1/2 V� ,
W
la (5.136) si riscrive così
⇔
�,
V� = D−1/2 W
� = µW
�.
B2 W
Ora, tenendo presente la definizione (5.137), è facile provare che B2 è simmetrica. Possiamo quindi�invocare il teorema
� spettrale per matrici simmetriche e concludere che esi� 1, . . . , W
� l di autovettori a due a due ortogonali cui corrispondono l
ste una base W
autovalori µk , reali. Scriveremo dunque
�k • W
� h = δkh .
� k = µk W
� k , k = 1, ..., l, con W
B2 W
(5.138)
�
�
� l non sono i vettori {�
� 1, . . . , W
�l } che stiamo cerv1 , . . . , v
Chiaramente i vettori W
�
�
� 1, . . . , W
� l . Infatti,
cando. Facciamo vedere che questi si ottengono a partire da W
ripercorrendo all’indietro i passaggi abbiamo
� k = µk W
� k, ⇒
D−1/2 PT BP D−1/2 W
� k = µk P D1/2 W
�k ,
BP D−1/2 W
� ���
DD−1/2
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
cioè
209
� k = µk PDD−1/2 W
� k = µk PD PT P D−1/2 W
�k .
BPD−1/2 W
����
I
T
da cui, ricordando la (5.133) che scriviamo come PDP = A, si ottiene
�
�
�
�
� k = µk A PD−1/2 W
�k .
B PD−1/2 W
� k , k = 1, . . . , l, che soddisfano la (5.125)
Quindi gli l vettori linearmente indipendenti v
sono dati da
� k , k = 1, 2, ..., l .
�k = PD−1/2 W
v
(5.139)
Rimane da dimostrare la (5.126) e che µk > 0, per ogni k = 1, ..., l, se B è definita
positiva. Per quel che riguarda la (5.126) abbiamo
�h • A�
v
vk
=
(5.139)
� h • APD−1/2 W
�k
PD−1/2 W
�T
�
T
−1/2 �
� h • D−1/2
� h • D−1/2 DD−1/2 W
�k
= W
Wk = W
�
��
�
�P ��AP�D
� �� � D
I
=
(5.138)
δhk .
D−1/2
Infine, per dimostrare che µk > 0, per ogni k = 1, ..., l, quando B è definita positiva, è
sufficiente applicare il lemma 5.10.1.
Esempio 5.10.1 Consideriamo29 un punto materiale di massa m vincolato senza attrito al piano e soggetto all’energia potenziale di tipo elastico della forma
V (x, y) =
�
k� 2
x + y 2 − α̂xy,
2
con k > 0, α̂ > 0, costanti e dove k > α̂. Le posizioni di equilibrio si ottengono
imponendo
kx − α̂y = 0,
∇V (x, y) = 0, ⇒
⇒ Pe ≡ (0, 0) .
ky − α̂x = 0,
Se calcoliamo la matrice hessiana
B (Pe ) =
�
k −α
−α k
�
,
deduciamo che Pe è un punto di equilibrio stabile poiché entrambi gli autovalori di
B (Pe ) sono positivi (se k > α̂). Scrivendo le equazioni di moto otteniamo
ẍ + ωo2 x − αy = 0,
(5.140)
ÿ + ωo2 y − αx = 0,
29 Questo esempio è tratto da L.D. Landau, E. M. Lifsits, Fisica Teorica 1 - Meccanica, Editori Riuniti,
1976.
210
LEZIONI DI SISTEMI DINAMICI
dove ωo2 = k/m, e α = α̂/m. Ovviamente ωo2 > α. Il sistema (5.140) può riscriversi
come la (5.118) se
�
�
�
�
� 2
�
x
1 0
ωo −α
�=
u
, A=
, B=
.
y
0 1
−α ωo2
Le frequenze proprie (5.124) si ottengono essenzialmente risolvendo l’equazione secolare (5.128), cioè
� 2
�
µ1 = ωo2 − α,
ωo − µ
−α
det
= 0, ⇒ µ =
−α
ωo2 − µ
µ2 = ωo2 + α,
�
�
da cui ω1 = ωo2 − α, ω2 = ωo2 + α. Quindi, ricordando la (5.123), i modi normali
sono
�
��
a1 cos
ωo2 − αt + φ1
� =
w
� ,
��
2
a2 cos
ωo + αt + φ2
con ak , φk , k = 1, 2, le solite costanti di integrazione da calcolarsi tramite le condi� k , k = 1, 2, risolviamo la (5.129), cioè
zioni iniziali. Per determinare i vettori v
� 2
��
�
�
��
�
ωo −α
v11
1 0
v11
=
µ
,
1
−α ωo2
0 1
v12
v12
� 2
��
�
�
��
�
ωo −α
v21
1 0
v21
= µ2
,
−α ωo2
0 1
v22
v22
con la condizione supplementare
� �
��
�
�
vk1
1 0
vk1
2
2
•
= vk1
+ vk2
= 1, k = 1, 2,
0 1
vk2
vk2
� �� �
A
ottenendo
1
1
�
�
√
√
1
1 1
2
√
�1 = 12 , v
�2 =
v
.
,
⇒
V
=
1
1 −1
2
√
−√
2
2
Le soluzioni nelle variabili dipendenti originarie x e y sono
�
��
ωo2 − αt + φ1
a1 cos
x (t)
1
1
.
= √1
�
�
�
2
y (t)
1
−1
2
a2 cos
ωo + αt + φ2
E’ interessante trovare l’espressione dei modi normali in funzione delle variabili x e
y. Dalla (5.119) otteniamo
��
�
�
� √ �
�
�
2
1 1
x (t)
x (t)
w1 (t)
−1
,
=
=V
1 −1
y (t)
w2 (t)
y (t)
2
e quindi
w1 (t) =
x (t) + y (t)
√
,
2
w2 (t) =
x (t) − y (t)
√
.
2
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
211
5.10.3 Esempio: la catena di oscillatori
In questa sezione vogliamo studiare i modi normali e le frequenze proprie di oscillazione per un sistema meccanico caratterizzato da una Lagrangiana quadratica (per cui
non ci sarà bisogno di approssimare la Lagrangiana ma solo di riscriverla utilizzando
coordinate lagrangiane centrate nell’equilibrio).
Consideriamo un sistema di N punti materiali {Pi , mi }, i = 1, . . . , N , che si
muovono senza attrito su una retta orizzontale30 e sono collegati l’uno all’altro da molle
le cui masse e lunghezza a riposo sono trascurabili. Questa “catena di oscillatori” è
fissata ai punti fissi A e B, posti a distanza L l’uno dall’altro, come mostrato in figura
5.7. La forza totale Fi agente sull’i-esimo punto materiale è data da31
Fi = −ki (xi − xi−1 ) + ki+1 (xi+1 − xi ) , i = 1, ..., N .
forza su Pi
esercitata da Pi−1
(5.141)
forza su Pi
esercitata da Pi+1
dove:
• kj , j = 1, ..., N + 1, è il coefficiente elastico (o rigidezza) della j-esima molla.
In particolare, la molla che collega il primo punto materiale della catena, cioè P1 ,
al punto A ha rigidezza k1 , mentre quella che la collega l’ultimo punto materiale
PN a B ha rigidezza kN +1 .
• xr , r = 1, ..., N , indica l’ascissa del punto r-esimo punto materiale. Inoltre,
xN +1 = xB = L e x0 = xA sono, rispettivamente, le ascisse dei punti fissi B e
A a cui la catena è collegata (vedi figura 5.7).
Figura 5.7: Catena di N punti materiali mobili P1 , . . . , PN , di ascisse x1 , . . . , xN . La
catena è collegata ai punti fissi A e B, di ascisse xA e xB = L, da molle di rigidezza
k1 e kN +1 , rispettivamente. Inoltre i punti materiali mobili sono collegati fra loro da
molle le cui rigidezze sono k2 , . . . , kN . Tutte le molle hanno lunghezza a riposo e
masse trascurabili.
La Lagrangiana del sistema è data da
N
L=
30 Per
31 P
0
N
1
1
mi ẋ2i −
ki+1 (xi+1 − xi )2 .
2 i=1
2 i=0
cui la forza peso non ha nessuna influenza.
corrisponde al punto fisso A, mentre PN+1 al punto fisso B.
212
LEZIONI DI SISTEMI DINAMICI
Cerchiamo adesso gli eventuali punti di equilibrio. Questi corrispondono alle configurazioni del sistema nelle quali la risultante delle forze agenti su ciascun punto è nulla.
Imponiamo pertanto
F
=
0,
1
−k1 (x1 − x0 ) − k2 (x1 − x2 ) = 0,
..
..
⇒
(5.142)
.
.
F = 0,
−k (x − x
N
N
N
N −1 ) − kN +1 (xN − L) = 0,
che scritto in forma esplicita diventa
−(k1 + k2 )
k2
.
k2
−(k2 + k3 ) .
.
.
.
.
.
.
.
.
.
0
0
. −(kN
�
��
M
x1
−k1 x0
0
.
0
0
.
.
.
. =
.
.
.
.
0
.
xN
−kN +1 L
+ kN +1 )
�
� � �� �
��
�
x
b
Tale sistema ammette una e una sola soluzione poiché la matrice M è invertibile32. La
soluzione, che corrisponde all’unica configurazione di equilibrio cercata, è dunque
xe = M−1 b.
(5.143)
Eseguiamo ora il cambio di coordinate
qi = xi − xei ,
i = 1, ...., N,
(5.144)
dove xei , i = 1, ..., N , è la posizione di equilibrio dell’i-esimo punto materiale (ottenuta
dalla (5.143)). Dalla (5.144) otteniamo ẋi = q̇i , mentre la configurazione di equilibrio
corrisponderà a qi = 0, i = 1, ..., N . L’energia potenziale V nelle nuove variabili
diventa
V̂ (q1 , ..., qN ) =
N
�2
��
�
1�
ki+1 qi+1 + xei+1 − (qi + xei )
2 i=0
N
=
N
�
�2
1�
1�
ki+1 (qi+1 − qi )2 +
ki+1 xei+1 − xei
2 i=0
2 i=0
+
N
�
i=0
�
�
ki+1 (qi+1 − qi ) xei+1 − xei ,
(5.145)
dove abbiamo posto q0 = qN +1 = 0, xe0 = x0 e xeN +1 = L.
32 E’ facile provare che M è invertibile essendo essa una matrice a bande e simmetrica. La dimostrazione
si fa per induzione. Definiamo con MN la matrice N × N . Per N = 1 è banale mostrare l’invertibilità,
perché M1 = (−(k1 + k2 )). Supponiamo ora che MN sia invertibile e dimostriamo che lo è anche MN+1 .
Ricordando che una matrice è invertibile se e solo se ha determinante non nullo, abbiamo
det(MN+1 ) = −(kN + kN+1 ) det(MN ) �= 0,
ed è dunque chiaro che MN+1 è invertibile.
LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI
Se adesso calcoliamo
213
∂ V̂
per ogni i = 1, ..., N , si ottiene
∂qi
�
�
�
�
∂ V̂
= ki (qi − qi−1 ) − ki+1 (qi+1 − qi ) + ki xei − xei−1 − ki+1 xei+1 − xei .
�
��
� �
∂qi
��
�
termini che derivano dal primo
addendo della (5.145)
termini che derivano dal terzo
addendo della (5.145)
�
�
�
�
Tuttavia ki xei − xei−1 − ki+1 xei+1 − xei = 0, poiché xei , i = 1, ..., N , sono
proprio le soluzioni del sistema (5.142). Di conseguenza il terzo addendo della (5.145)
così come il secondo (che è costante) è del tutto ininfluente ai fini delle equazioni di
Lagrange. Possiamo dunque riscrivere la Lagrangiana come
N
L=
N
1�
1�
mi q̇i2 −
ki+1 (qi+1 − qi )2 ,
2 i=1
2 i=0
dove, lo ricordiamo ancora, q0 = qN +1 = 0. Questa Lagrangiana ci dà il seguente
sistema di equazioni di Lagrange33
mi q̈i = −ki−1 (qi − qi−1 ) + ki (qi+1 − qi ),
i = 1, ...., N,
che è appunto un sistema di equazioni lineari del secondo ordine lineari reciprocamente
accoppiate. L’idea è quindi quella di disaccoppiare le equazioni tramite un opportuno
cambio di variabili, giungendo così ad N equazioni del tipo oscillatore armonico.
Se ci limitiamo a considerare il caso in cui tutte le masse siano uguali a m, e tutte
le molle abbiano la stessa costante elastica k, allora la Lagrangiana si semplifica e
(utilizzando la funzione L = L/m invece della Lagrangiana L) otteniamo
L=
N
N
1 � 2 ω2 �
q̇i −
(qi+1 − qi )2 ,
2 i=1
2 i=0
dove, al solito, ω 2 = k/m. Le equazioni di Lagrange prendono la forma
q̈i = −ω 2 (qi−1 − 2qi + qi+1 ) ,
i = 1, ...., N.
Le matrici A e B che intervengono nella scrittura di L nella forma matriciale (5.117)
sono rispettivamente la matrice identità e la matrice
−2 1
0
. . . .
.
.
0
1 −2 1 0 . . .
.
.
0
0
1 −2 1 0 . .
.
.
0
.
.
.
. . . .
.
.
.
.
.
. . . .
.
.
.
2 .
.
B = −ω
.
.
. . . .
.
.
.
.
.
.
.
. . . .
.
.
.
0
.
.
. . 0 1 −2 1
0
0
.
.
. . . 0 1 −2 1
0
.
.
. . . .
0
1 −2
33 Con
le condizioni aggiuntive q0 = qN+1 = 0.
214
LEZIONI DI SISTEMI DINAMICI
Quindi la determinazione dei modi normali e delle loro frequenze è ridotta alla ricerca
degli autovettori e degli autovalori della matrice B.
E’ facile verificare che gli N autovettori sono dati da
srπ
(
v s )r = sin
,
r = 1, . . . , N , s = 1, . . . , N,
(5.146)
N +1
dove (
v s )r è la r-esima componente del s-esimo autovettore. Il corrispondente autovalore è
sπ
.
(5.147)
λs = 2ω 2 1 − cos
N +1
Lasciamo come esercizio la verifica che i vettori (5.146) sono effettivamente gli
autovettori di B con autovalori λs dati dalla (5.147). Suggerimento: usare le formule
di addizione del seno e calcolare
s(r − 1)π
srπ
s(r + 1)π
− sin
+ 2 sin
− sin
.
N +1
N +1
N +1
Nota 5.10.1 Se si scorrono le componenti degli autovettori dalla prima alla N -esima,
si osserva che nel primo autovettore (s = 1) tutte le componenti hanno lo stesso segno,
mentre nel secondo si hanno metà componenti positive e metà negative (se N è pari, se
N = 2M + 1 la componente M -esima è nulla) e in generale il numero di cambiamenti
di segno delle componenti è uguale a s − 1.
Inoltre il primo autovalore è il più piccolo degli autovalori, che sono una successione crescente, λ1 < λ2 < · · · < λN . Questo significa che le frequenze di oscillazione
aumentano all’aumentare di k, ovvero all’aumentare del numero di cambi di segno
delle componenti.34
Per chiarire la dinamica di questo sistema, vediamo il caso semplice di due soli punti.
In questo caso gli autovettori sono semplicemente
1
1
2
1 =
2 =
v
con autovalore ω , e v
con autovalore 3ω 2 .
1
−1
Nel modo normale associato al primo autovettore, le due masse si muovono oscillando nella stessa direzione e con la stessa frequenza ed ampiezza, mantenendo quindi
inalterata la distanza reciproca (uguale alla distanza all’equilibrio). Nel secondo modo
invece le due masse oscillano ancora con la stessa frequenza ed ampiezza, ma in due
direzioni opposte: in questo caso il centro di massa delle molle resta fermo durante
il moto. Il moto generico del sistema è dunque una sovrapposizione (combinazione
lineare) di questi due moti.
34 Si
veda anche la sezione 44 di F. Gantmacher, Lectures in Analytical Mechanics, MIR 1975.
Capitolo 6
Cinematica dei Sistemi Rigidi
6.1 Introduzione
In questo capitolo descriveremo come si muove un corpo rigido nello spazio. Un corpo,
o sistema, rigido è un insieme di punti materiali vincolati a mantenere inalterate le loro
mutue distanze.
Lo scopo del capitolo è duplice: da un lato vogliamo determinare la relazione fondamentale che lega le velocità di punti differenti che “partecipano di uno stesso moto
rigido” (ovvero si muovono mantenendo inalterate le mutue distanze) rispetto a un osservatore fisso; dall’altro vogliamo trovare le relazioni che legano le osservazioni che
due osservatori, in moto tra loro, fanno dei moti di altri “corpi” (punti o corpi rigidi).
Quest’ultimo problema prende il nome di cinematica relativa.
Con l’espressione osservatore ci riferiamo a un sistema cartesiano ortogonale, con
orientamento fissato, cioè nel quale sono determinati: un’origine, un’unità di misura
per le lunghezze, tre assi ortogonali orientati (ovvero tra i quali si sia fissato un ordine,
per esempio gli assi x, y e z disposti come i diti pollice, indice e medio della mano
destra1 , come specificato nella sezione 1.5.1) e un orologio per misurare il tempo.
6.2 Moti rigidi
Sia fissato un osservatore, ovvero un sistema di riferimento (SdR) cartesiano ortogonale levogiro centrato in Ω, i cui assi coordinati sono ξ, η e ζ. Indichiamo con
Σ = (Ω, ξ, η, ζ) tale SdR, oppure con (Ω, e1 , e2 , e3 ), essendo ei , i = 1, 2, 3, i versori
degli assi coordinati, ovvero i versori di una terna ortonormale levogira. L’osservatore Σ viene detto osservatore fisso2 , o sistema di riferimento (SdR) fisso, o terna
fissa. Viene poi dato un sistema rigido, che per brevità chiameremo B, di cui vogliamo
studiare il moto rispetto all’osservatore Σ.
1 Ricordiamo che, in questo caso, il sistema di riferimento viene detto destrorso, o levogiro. Si ricordi
inoltre che un riferimento destrorso e uno non destrorso, cioè sinistrorso, non possono essere sovrapposti
mantenendo l’ordine degli assi.
2 Non indichiamo mai esplicitamente la scelta dell’orologio per un osservatore. In questo paragrafo
la scelta dell’orologio non è molto importante in quanto l’osservatore fisso è il solo che vede i punti in
movimento. Dovremo tornare su questo problema nel caso della cinematica relativa.
216
LEZIONI DI SISTEMI DINAMICI
Per prima cosa eliminiamo dalla nostra analisi il caso “degenere” in cui tutti i punti
del sistema rigido siano allineati (o ci siano solo due punti).
SdR mobile S, solidale
con il corpo rigido
z
ζ
y
O
SdR fisso Σ
Ω
η
x
ξ
Figura 6.1: Sistema di riferimento - SdR - fisso Σ, e SdR solidale S.
Consideriamo quindi un sistema rigido che abbia almeno tre punti non allineati.
Siano essi P1 , P2 , e P3 . Al corpo B è possibile associare una terna ortonormale
levogira S = (O, x, y, z) di versori i, j, k, costruita nel seguente modo: poniamo
O = P1 , i = vers(P2 − P1 ), j = vers(i ∧ (P3 − P1 )) e infine k = i ∧ j. Il sistema
di riferimento S, viene anche detto sistema di riferimento (SdR) solidale, o terna
solidale, o anche osservatore solidale.
Ora, la geometria di B è nota e pertanto conosciamo la posizione di ogni suo punto
rispetto al sistema solidale. Quindi ogni P ∈ B è individuato dalla terna x ∈ R3 , data
da
x
x = y ,
z
i cui elementi rappresentano le coordinate di P rispetto ad S, ovvero le componenti del
vettore (P − O) rispetto a S, x = xi + yj + zk. Con xT si denota, come al solito, la
terna trasposta, cioè
xT = (x, y, z).
Notiamo che una volta determinata la terna solidale, il numero di punti di cui è
composto B non ha più importanza: ogni punto P viene ora individuato dalle sue
coordinate x, rispetto alla terna solidale3 . Quest’ultime inoltre sono costanti nel tempo. Quindi la posizione dei punti di B nello spazio (e non rispetto alla terna solidale) è
determinata dalla posizione della terna solidale stessa. In altre parole: il moto di un sistema rigido nello spazio è equivalente al moto di una terna di riferimento. Infatti,
siccome i punti che partecipano al moto rigido di B hanno coordinate (x, y, z) costanti
3 Questa semplice osservazione ha una conseguenza importante: la cinematica dei sistemi rigidi discreti
e dei sistemi rigidi continui può essere descritta allo stesso modo.
CINEMATICA DEI SISTEMI RIGIDI
217
nel SdR solidale, è sufficiente conoscere la posizione di S rispetto a Σ per localizzare
ogni punto del sistema rigido. Abbiamo quindi ridotto il problema del moto rigido
al moto relativo di due sistemi di riferimento nello spazio euclideo tridimensionale,
ovvero a situare ad ogni istante la terna mobile S rispetto alla terna fissa Σ.
A sua volta questo problema si scompone naturalmente nella localizzazione dell’origine O della terna mobile S rispetto alla terna fissa, e all’orientazione dei versori di
S rispetto ai versori della terna fissa Σ.
6.2.1 Primo caso: Ω ≡ O
Consideriamo dapprima il caso in cui le origini dei due SdR O e Ω rimangono coincidenti. Le coordinate del generico punto P ∈ B, saranno espresse dalla terna x nel
SdR S, e dalla terna ξ ∈ R3 ,
ξ
ξ = η ,
ζ
nel SdR Σ, ovvero
(P − O) −→
ξ = ξe1 + ηe2 + ζe3 ,
x = xi + yj + zk,
rispetto al SdR fisso Σ,
rispetto al SdR solidale S.
ζ
z
y
O =Ω
η
ξ
x
Figura 6.2: Primo caso: Ω ≡ O.
Indichiamo con
ξ = ̥ (x) ,
(6.1)
l’applicazione da R in R che trasforma le coordinate dal sistema S al riferimento
fisso4 Σ. Siccome il corpo è rigido, la distanza fra due punti qualsiasi di B deve essere
3
3
4 Le coordinate dei punti nel sistema S, sono note dal momento che B è dato (cioè si conosce la geometria
del corpo). Non sono invece note le coordinate ξ dei punti rispetto al SdR Σ.
218
LEZIONI DI SISTEMI DINAMICI
la stessa in entrambe i riferimenti, |ξ 1 − ξ 2 | = |x1 − x2 |, cioè
|̥ (x1 ) − ̥ (x2 )| = |x1 − x2 | ,
(6.2)
̥ (0) = 0,
(6.3)
ed inoltre
dal momento che O rimane sempre coincidente con Ω.
Definizione 6.2.1 Un’applicazione da R3 in R3 , che verifica le (6.2) e (6.3), si dice
isometria ortogonale.
Abbiamo quindi questo importante risultato
Teorema 6.2.1 Se ̥ è un isometria ortogonale, allora:
1. ̥ è un applicazione lineare, ovvero possiamo far corrispondere ad ̥ una matrice A, tale che
̥ (x) = Ax.
2. La matrice A è ortogonale (si veda la sezione 1.3), cioè AT = A−1 , e di
conseguenza
det A = ±1.
(6.4)
Dim5 . E’ facile provare che l’isometria ̥ conserva il prodotto scalare. Infatti,
2
2
|̥ (x1 ) − ̥ (x2 )| = |x1 − x2 | ,
implica
2
2
2
2
|̥ (x1 )| + |̥ (x2 )| − 2̥ (x1 ) · ̥ (x2 ) = |x1 | + |x2 | − 2x1 · x2 ,
|x1 |2
|x2 |2
e dunque ̥ (x1 ) · ̥ (x2 ) = x1 · x2 .
La linearità si prova mostrando che ∀ x1 e x2 di R3 , e per ogni coppia di numeri
reali m, n, sia ha
̥ (mx1 + nx2 ) = m̥ (x1 ) + n̥ (x2 ) ,
ovvero che
|̥ (mx1 + nx2 ) − m̥ (x1 ) − n̥ (x2 )| = 0.
La dimostrazione di questo passaggio viene lasciata per esercizio. Quindi se ̥ è lineare
e ̥ (0) = 0, allora
̥ (x) = Ax ,
dove A è un matrice 3 × 3. Notiamo inoltre che la matrice A è sicuramente invertibile.
Infatti, siccome |Ax| = |x|, abbiamo Ax = 0 se e solo se x = 0.
Il punto 2 si ottiene provando che
AT A = I,
(6.5)
5 La dimostrazione del presente teorema è ripresa da Giuseppe Benfatto, Note del Corso di Meccanica
Analitica, Università di Roma “Tor Vergata”, a.a. 2007-08.
CINEMATICA DEI SISTEMI RIGIDI
219
essendo I la matrice identità. Per la dimostrazione6 della (6.5) rimandiamo alla sezione 1.3. Di conseguenza, moltiplicando a destra per A−1 ambo i membri della (6.5),
abbiamo AT = A−1 . Infine, sempre dalla (6.5)
�
�
2
1 = det I = det AT A = �det��AT� det A = (det A) ,
det A
da cui deriva banalmente la (6.4).
La condizione ̥ (x1 ) · ̥ (x2 ) = x1 · x2 , comporta la conservazione degli angoli.
Infatti, se θ1 è l’angolo fra ̥ (x1 ), ̥ (x2 ), e θ2 è l’angolo fra x1 , x2 , abbiamo
̥ (x1 ) · ̥ (x2 ) = |̥ (x1 )| |̥ (x2 )| cos θ1
�
��
�
|x1 ||x2 |
x1 · x2 = |x1 | |x2 | cos θ2
⇒ cos θ1 = cos θ2 ,
da cui θ1 = ± θ2 . E dunque, considerando gli angoli privi di segno, θ1 = θ2 .
Vediamo adesso come determinare la matrice A. Consideriamo le immagini mediante ̥ delle terne rappresentanti i versori i, j e k (ovvero le componenti in Σ dei
versori di S)
1
α1
α2
α3
0
0
̥ 0 = β1 , ̥ 1 = β2 , ̥ 0 = β3 .
0
γ1
γ2
γ3
0
1
� �� �
� �� �
� �� �
i
j
k
Ora, data la linearità di ̥ abbiamo
̥ (xi + yj + zk)
Quindi
6 La
= x̥ (i) + y̥ (j) + z̥ (k)
α1
α2
α3
= x β1 + y β2 + z β3
γ1
γ2
γ3
x
α1 α2 α3
= β1 β2 β3 y .
z
γ1 γ2 γ3
α1
A = β1
γ1
α2
β2
γ2
α3
β3 .
γ3
dimostrazione è immediata se ricordiamo che ̥ (x2 ) · ̥ (x2 ) = x1 · x2 . Abbiamo infatti
Ax1 · Ax2 = AT Ax1 · x2 = x1 · x2 ,
da cui discende (6.5).
(6.6)
220
LEZIONI DI SISTEMI DINAMICI
Ne segue che la relazione fra terne (6.1) si potrà esplicitamente scrivere come
x
ξ
α1 α2 α3
ξ = Ax, ⇔ η = β1 β2 β3 y .
z
γ1 γ2 γ3
ζ
Il cambiamento dal SdR solidale S al SdR fisso Σ, è completamente descritto dalla
matrice A. In generale le componenti di A dipenderanno dal tempo, dal momento
che l’orientazione dei versori i, j e k rispetto a Σ può variare nel tempo. Scriveremo
pertanto A = A (t), intendendo
α1 (t) α2 (t) α3 (t)
A (t) = β1 (t) β2 (t) β3 (t)
(6.7)
γ1 (t) γ2 (t) γ3 (t)
Osserviamo che la condizione (6.5) rappresenta un “vincolo” sulle nove componenti della matrice A (tale concetto verrà approfondito nella sezione 6.2.3). Infatti i
versori devono soddisfare la condizione di ortonormalità, ovvero le equazioni
i · i = 1, j · j = 1, k · k = 1, i · j = 0, j · k = 0, k · i = 0,
(6.8)
che si traduce nelle sei7 condizioni date dalla (6.5), ovvero
Ai · Aj = 0, A j · Ak = 0, Ak · Ai = 0,
Ai · Ai = 1, A j · Aj = 1, Ak · Ak = 1.
(6.9)
Com’è noto, le matrici 3 × 3 che soddisfano la condizione (6.5), ovvero AT = A−1 ,
sono dette ortogonali.
Ora, siccome stiamo studiando moti continui dello spazio, possiamo escludere le
matrici a determinante negativo (che rappresentano un moto rigido più un ribaltamento
speculare: quest’ultimo infatti non è riconducibile con continuità, attraverso moti rigidi, all’identità, che, a sua volta, indica lo “stato di partenza”)8 e limitarci alle matrici a
determinante uguale a uno,
det A = +1.
(6.10)
Vediamo adesso un’importante teorema, usualmente noto come teorema di Eulero.
Teorema 6.2.2 Sia A una matrice ortogonale, A �= I. Allora esiste x ∈ R3 , x �= 0,
definita a meno di una costante moltiplicativa (ovvero esiste una direzione individuata
dal vettore associato alla terna x) per cui
Ax = x.
7 La
(6.11)
(6.5) dà luogo a sei equazioni indipendenti, e non nove, dal momento che AT A è simmetrica.
altre parole, e in modo più formale: prendiamo la posizione a un certo istante come “configurazione
di riferimento”. Possiamo sempre orientare gli assi del sistema fisso in modo che questi coincidano con gli
assi solidali. Avremo quindi A(0) = I. La (6.4) ci dice che, al variare del tempo A(t) può assumere solo i
valori 1 e −1. Ma il determinante è una funzione continua delle componenti della matrice, pensata come un
elemento di R3×3 , quindi non può passare con continuità dal valore iniziale 1 al valore −1.
8 In
CINEMATICA DEI SISTEMI RIGIDI
221
Dim. Innanzitutto osserviamo che A non ammette autovalori nulli9 . Proviamo adesso
che se λ è un autovalore reale di A, ovvero se Az = λz con λ ∈ R, allora |λ| = 1.
Dalla (6.5) infatti
2
T
2
|z|2 = z · z = z·A
A z = A z· Az = λ |z| .
I
Abbiamo quindi dimostrato che tutti gli autovalori reali di A hanno modulo unitario.
Supponiamo adesso che λi , i = 1, 2, 3, siano i tre autovalori di A. La (6.10)
comporta
1 = det A = λ1 λ2 λ3 .
(6.12)
Si hanno quindi due casi:
1. Due autovalori sono complessi, diciamo λ1 e λ2 , mentre λ3 ∈ R e, per quanto
visto, |λ3 | = 1. Siccome gli autovalori sono radici dell’equazione a coefficienti
reali det (A − λI) = 0, λ1 e λ2 sono uno il complesso coniugato dell’altro. Ne
segue λ1 λ2 = |λ1 |2 . Riscrivendo la (6.12) abbiamo |λ1 |2 λ3 = 1, e dunque,
per evitare contraddizioni nei segni, deve essere λ3 = 1. Evidentemente i tre
autovettori non possono essere tutti e tre complessi per il fatto che, come già
detto, le radici di det (A − λI) = 0 sono coppie di numeri complessi coniugati.
2. Tutti e tre gli autovalori sono reali e inoltre |λi | = 1, i = 1, 2, 3. In tal caso
necessariamente almeno uno deve essere uguale a +1.
Dunque, in entrambi i casi esiste un autovalore λ = 1, cui corrisponde (a meno di una
costante moltiplicativa) un autovettore x che soddisfa la (6.11).
In sostanza il teorema di Eulero afferma che esiste una retta r, eventualmente dipendente dal tempo, i cui punti sono invarianti per l’applicazione di A: ovvero un qualunque
vettore (P − O) ∈ r è rappresentato in S ed in Σ dalla medesima terna. Non solo, ma
valgono anche le seguenti proprietà:
(a) Detto Po un qualsiasi punto di r, individuato dalla terna xo in S, il piano π⊥r per
Po ortogonale ad r è descritto nel sistema S dalla equazione (x − xo ) · ν = 0,
essendo ν il versore di r. Consideriamo adesso Ax, e mostriamo che soddisfa
la stessa equazione, cioè (Ax − xo ) · ν = 0. Infatti10
T
0 = A
A(x−xo )·ν = A (x − xo )·
Aν = (Ax − Axo )·ν = (Ax − xo )·ν .
I
ν
Questo vuol dire che, comunque si scelga una generica terna x di S, Ax è giace
sullo stesso piano ortogonale ad r su cui giace x.
9 Se
10 Si
A avesse autovalori nulli la (6.10) sarebbe contraddetta.
ricordi che Axo = xo , come del resto Aν = ν.
222
LEZIONI DI SISTEMI DINAMICI
(b) Consideriamo ancora il generico punto Po della retta r, ed il solito piano π⊥r
passante per Po . Sia q una generica retta giacente su tale piano e passante per Po ,
la cui direzione è individuata, in S, dal versore q. Quindi, nel SdR S, l’equazione
parametrica della retta q è x − xo = µq, essendo µ ∈ R, il parametro. Proviamo
adesso che q è trasformata, nel SdR Σ, in un’altra retta. Infatti
x − xo = µq, ⇒
T
A
A (x − xo ) = µq.
I
Quindi moltiplicando a sinistra per A si ha
A (x − xo ) = µAq, ⇒
Ax − Axo = µAq ,
ξ
ξo
che è l’equazione parametrica, nel SdR Σ, di una retta di direzione Aq.
(c) Mostriamo infine che, data una qualsiasi retta q di π⊥r per Po , l’angolo fra q e
Aq è indipendente dalla retta selezionata. Infatti, consideriamo un’altra retta p,
diversa da q, giacente sempre sul piano π⊥r e passante per Po . Sia β l’angolo
che p forma con la retta q. Ora, siccome l’applicazione A conserva gli angoli,
l’angolo fra Aq e Ap è sempre β. Di conseguenza, riferendoci alla figura 6.3
se θq è l’angolo fra la retta q e la retta Aq, e θp è quello fra p e Ap, abbiamo
θq + β = θp + β, ⇒ θp = θq . Si conclude quindi che, dato un generico x,
l’angolo fra (x − xo ) e A (x − xo ), è indipendente da x.
Quindi, volendo riformulare alla luce delle proprietà (a), (b) e (c) l’enunciato del teorema di Eulero si potrebbe renderlo come: dati due sistemi di riferimento (nello
specifico il SdR S ed il SdR Σ) è sempre possibile sovrapporre il primo al secondo
con un’unica rotazione intorno ad un opportuno asse. Infatti: (i) l’applicazione rappresentata dalla matrice A lascia invariate lunghezze ed angoli; (ii) le terne x (ovvero
le coordinate dei punti) che giacciono su r non vengono mutate dalla rotazione; (iii)
le coordinate dei punti che non stanno sulla retta r sono comunque trasportate in altre
terne che giacciono nel medesimo piano ortogonale ad r; (iv) le rette del piano π⊥r ,
passanti per il punto Po sono “mappate” in altre rette; (v) l’angolo, misurato sul piano
π⊥r , fra x e Ax, è indipendente da x.
L’asse di rotazione si individua determinando l’autovettore di A relativo all’autovalore λ = 1, mentre l’angolo di rotazione si determina calcolando la traccia della
matrice11 A. Infatti, tornando alla notazione del teorema di Eulero, se λ3 = 1, gli altri
due autovalori di A, saranno12 λ1 = eiα , e λ2 = e−iα , con α ∈ R. Abbiamo quindi13
trA =
3
λi = 1 + 2 cos α.
(6.13)
ι=1
11 Riferendoci
alla (6.6), trA = α1 + β2 + γ3 .
che la formula di Eulero per i numeri complessi di modulo unitario afferma che, per ogni
numero reale α, si ha
eiα = cos α + i sin α.
Osserviamo anche che il caso λ2 = λ1 = −1, corrisponde a α = π.
13 Si ricorda che gli autovalori, la traccia ed il determinante della matrice A, risultano indipendenti dalla
base. Se infatti avessimo scelto un diverso SdR fisso Σ′ ed un diverso SdR mobile S ′ , avremmo ottenuto
una matrice A′ diversa da A (ma ad essa collegata tramite una trasformazione di similitudine). Tuttavia gli
autovalori di A′ sono gli stessi di A, ed inoltre det A = det A′ , trA =trA′ .
12 Ricordiamo
CINEMATICA DEI SISTEMI RIGIDI
θp
223
θq
β
β
Piano
θp + β =θp + β,
π ⊥r
⇒
θ p = θq
Figura 6.3: L’angolo fra due rette viene conservato.
Se adesso si sceglie come SdR fisso quello in cui la direzione della retta invariante r
coincide con l’asse ζ, la matrice A è data da
cos θ
A = sin θ
0
− sin θ
cos θ
0
0
0 ,
1
(6.14)
essendo θ, l’angolo di cui la coppia di versori i, j è ruotata rispetto ai versori e1 , e2 .
Calcolando la traccia di A data da (6.14), e confrontando con (6.13), otteniamo
α = θ,
(6.15)
e quindi α va identificato con l’angolo di rotazione. Osserviamo però che per definire
univocamente l’angolo di rotazione θ è necessario definire una convenzione. Noi
adotteremo la seguente: scelto il verso positivo della retta invariante r come quello di
k, se la rotazione avviene in senso antiorario rispetto al verso di k, allora θ è positivo,
altrimenti è negativo.
Va infine osservato che l’uguaglianza (6.15), data l’invarianza della traccia, assume
carattere generale e non si riferisce soltanto al caso in cui la retta r è parallela a k.
Nota 6.2.1 In definitiva il teorema di Eulero dà anche la regola per passare, mediante semplici operazioni, dal SdR Σ al SdR S. Lavorando nel SdR Σ, si individua la
retta r (autodirezione relativa all’autovalore λ = 1) ed un qualsiasi piano π⊥r . Poi,
selezionato un qualsiasi punto P ∈ π⊥r , si ruota P attorno ad r dell’angolo α (che
essenzialmente si trova calcolando trA). In questo movimento P trascina con sé il
sistema rigido e quindi anche gli assi cartesiani. Al termine della rotazione il SdR
ottenuto è proprio S.
224
LEZIONI DI SISTEMI DINAMICI
6.2.2 Secondo caso: Ω �= O
Consideriamo ora il caso particolare in cui14 O, origine del SdR S, e Ω origine del SdR
Σ, non sono coincidenti. Il generico punto P ∈ B, è individuato, rispetto al SdR S
dal vettore (P − O), la cui espressione è data dalla terna x. Lo stesso punto P viene
individuato, rispetto al SdR Σ dal vettore (P − Ω), la cui espressione, sempre relativa
a Σ, è data dalla terna ξ. Consideriamo poi il SdR Σ′ , i cui assi si mantengono sempre
paralleli a quelli di Σ, e la cui origine coincide con O (v. figura 6.4). Denotiamo con
ξ P la terna che rappresenta il vettore (P − O) rispetto al SdR Σ′ . La relazione che
lega ξP e x sarà sempre
x
ξp
α1 α2 α3
ξP = Ax, ⇔ ηp = β1 β2 β3 y ,
z
ζp
γ1 γ2 γ3
dove A è la matrice di rotazione di cui abbiamo parlato nella precedente sezione.
Quindi, la relazione vettoriale
(P − Ω) = (P − O) + (O − Ω) ,
(6.16)
ξ = ξ O + ξP = ξO + Ax,
(6.17)
si traduce nella seguente relazione fra terne
ξO
dove ξ O = ηO , è la terna che rappresenta il vettore (O − Ω) nel SdR Σ. OsζO
serviamo che nella (6.17) ξ O = ξO (t), come A = A (t), nel senso della (6.7), mentre
x non dipende dal tempo (essendo la terna che, nel SdR S solidale col corpo rigido,
rappresenta il vettore (P − O)).
6.2.3 Gradi di libertà di un corpo rigido
Dato un corpo rigido B, col termine gradi di libertà intendiamo il numero di variabili
indipendenti necessarie per determinare univocamente la sua posizione nello spazio (si
tratta quindi del numero di gradi libertà anche secondo la definizione data nella sezione
4.1). Quindi, siccome è nota la struttura geometrica di B, ovvero sono note, rispetto
ad un SdR solidale, tutte le coordinate x dei punti che lo compongono, dalla (6.17) si
deduce che determinare la posizione di un qualsiasi punto di B rispetto ad un SdR fisso
Σ è necessario:
• conoscere la posizione di almeno un punto O solidale con B; ovvero la terna ξO ,
e questi sono tre parametri indipendenti;
• conoscere la rotazione descritta dalla matrice A.
Per quanto riguarda la matrice A, a priori sembrerebbe che fossero necessari 9 parametri per determinarla. Tuttavia, è ben noto che per descrivere una rotazione sono
sufficienti solo tre parametri: l’angolo di rotazione (un parametro); e l’asse di rotazione
(due parametri). Quest’ultimo è determinato infatti dal versore che ne dà la direzione.
Abbiamo infatti il seguente teorema
14 Si
ricorda che O è solidale con il corpo rigido B.
CINEMATICA DEI SISTEMI RIGIDI
225
Σ‘
P
Σ
S
Ο
Ω
Figura 6.4: Secondo caso: Ω �= O. Il SdR Σ′ ha l’origine in O, ma mantiene gli assi
costantemente paralleli a quelli di Σ.
Teorema 6.2.3 La matrice A può essere espressa in termini di soli tre parametri indipendenti.
Dim. Le 9 componenti della matrice di rotazione A si trovano esplicitate nella formula
(6.6). Di esse però non tutte sono indipendenti: ovvero ben 6 possono essere espresse
in termini di soli tre parametri indipendenti. Infatti A deve soddisfare la relazione
(6.5), che quindi rappresenta un vincolo per le 9 componenti. In pratica, la (6.9) è un
insieme di sei vincoli indipendenti (si veda la sezione 4.1 del capitolo 4) che legano fra
loro le componenti αi , βi , γi , i = 1, 2, 3. Tali equazioni consentono di esprimere sei
coefficienti in termini di soli tre parametri indipendenti (che, come visto nella sezione
4.1, sono detti parametri lagrangiani). Per semplicità svolgiamo la dimostrazione nel
caso in cui A sia una matrice 2 × 2, cioè nel caso in cui si abbia a che fare con un corpo
rigido piano che si muove sul piano. In questo semplice caso
α1 α2
A=
,
β1 β2
dove −1 ≤ αi ≤ 1, i = 1, 2, e −1 ≤ βi ≤ 1, i = 1, 2. Ovviamente
(6.18)
det A = α1 β2 − α2 β1 > 0,
mentre la condizione (6.5) si traduce in
α1 β1
α1 α2
α21 + β12
=
α2 β2
β1 β2
α1 α2 + β1 β2
α1 α2 + β1 β2
α22 + β22
=
1
0
0
1
,
226
LEZIONI DI SISTEMI DINAMICI
ovvero nelle seguenti 3 equazioni che i coefficienti α1 , α2 , β1 e β2 devono soddisfare
2
α1 + β12 = 1,
α1 α2 + β1 β2 = 0,
(6.19)
2
α2 + β22 = 1.
Ora, applicando il teorema delle funzioni implicite al sistema (6.19) possiamo stabilire
quando è possibile utilizzare una sola variabile per esplicitare le altre 3 (ovvero quando
le tre equazioni di (6.19) sono indipendenti). Leggendo (6.19) come
F1 (α1 , α2 , β1 , β2 ) = 0,
F2 (α1 , α2 , β1 , β2 ) = 0,
F3 (α1 , α2 , β1 , β2 ) = 0,
se
∂F1
∂α1
∂F2
∂α1
∂F3
∂α1
∂F1
∂β1
∂F2
∂β1
∂F3
∂β1
∂F1
∂α2
∂F2
∂α2
∂F3
∂α2
∂F1
∂β2
∂F2
∂β2
∂F3
∂β2
2α1
α2
=
0
2β1
β2
0
0
α1
2α2
0
β1 ,
2β2
(6.20)
ha rango massimo, cioè 3, allora (almeno localmente) sarà possibile esplicitare tre
variabili in funzione della quarta. Se consideriamo15 α2 �= 0, il determinante delle
prime tre colonne di (6.20) dà
2α1 2β1
0
β2
α1 = 4α2 det A �= 0.
det α2
(6.18)
0
0
2α2
Infatti, possiamo riscrivere (6.19) come
2
β1 = 1 − α21 ,
α2 α2 = β12 β22 ,
22 1
β2 = 1 − α22 ,
⇒
2
β1 = 1 − α21 ,
α2 = 1 − α21 ,
22
β2 = α21 ,
(6.21)
e quindi usare α1 come parametro indipendente ed esprimere gli altri 3 in funzione di
esso. Di fatto, al posto di α1 è molto più pratico usare l’angolo di rotazione θ, θ ∈
[0, 2π), come variabile (o parametro lagrangiano) tramite cui esprimere αi , βi , i = 1,
2. Utilizzando dunque l’angolo θ, otteniamo α1 = cos θ, β1 = sin θ, α2 = − sin θ, e
β2 = cos θ, e quindi
�
�
cos θ − sin θ
A=
.
(6.22)
sin θ
cos θ
Nel caso in cui A sia una matrice 3 × 3, si procede nello stesso modo (adesso i calcoli
sono decisamente più complicati). Si individuano tre parametri indipendenti che, come
15 Il
caso α2 = 0 implica, in virtù del sistema (6.19),
1 0
A=
.
0 1
CINEMATICA DEI SISTEMI RIGIDI
227
visto nel capitolo 4, sono tre parametri lagrangiani e si esprimo tutti i coefficienti αi ,
βi , γi , i = 1, 2, 3, in funzione di essi. Di fatto, cioè, non si adoperano tre dei nove
coefficienti αi , βi , γi , i = 1, 2, 3, in quanto, come nella (6.21), i legami funzionali sono
di tipo quadratico e quindi difficilmente utilizzabili. Si preferisce quindi usare altri tre
parametri, i cosiddetti angoli di Eulero (che saranno illustrati nella sezione 6.4), ed
esprimere tramite essi i coefficienti della matrice A.
In sostanza quanto fino ad ora detto ci porta a concludere che un sistema un sistema
rigido che si muove nello spazio ha 6 gradi di libertà: le tre coordinate dell’origine
O del sistema mobile; ed i tre parametri indipendenti tramite cui si definisce la matrice
A. Infatti, come abbiamo visto, le nove componenti della matrice A sono vincolate a
“muoversi” sulla sottovarietà determinata dalle equazioni (6.5) (o meglio nella componente connessa che soddisfa anche alla disequazione detA > 0). Questo insieme, che
ha la struttura di gruppo rispetto al prodotto tra matrici, si indica con la sigla16 SO(3),
�
�
SO (3) = M ∈ R3×3 | MMT = I, det M = +1 .
In definitiva, l’insieme delle possibili “configurazioni” che un sistema di riferimento
“mobile” può assumere rispetto a un sistema di riferimento “fisso” è parametrizzato
dai punti dell’insieme R3 × SO(3), che risulta essere una varietà differenziabile di
dimensione 6.
Nota 6.2.2 Il prodotto tra matrici non è commutativo. Infatti, date due matrici A e
B, in generale AB �= BA. Questo è vero anche per due matrici generiche di SO(3).
Come si interpreta ciò in termini di moti rigidi?
6.3 Formula fondamentale del moto rigido
La velocità di un corpo rigido varia, in generale, da punto a punto. Per tal motivo
si parla di campo di velocità o atto di moto. L’atto di moto è infatti definito come
un’applicazione che ad ogni punto del corpo associa la sua velocità. Rifacendoci
a quanto detto nell’introduzione, la velocità delle particelle di B è quella misurata
dall’osservatore solidale con il SdR fisso Σ centrato in Ω. Quindi, considerando la
(6.17) e derivandola abbiamo
ξ
ξ
α α2 α3
x
d
d O
d 1
η =
(6.23)
ηO +
β1 β2 β3 y ,
dt
dt
dt
ζ
z
ζO
γ1 γ2 γ3
dove
α
d 1
β1
dt γ
1
α2
β2
γ2
·
·
·
α1 (t) α2 (t) α3 (t)
α3
·
·
·
β3 = β 1 (t) β 2 (t) β 3 (t) ,
·
·
·
γ3
γ 1 (t) γ 2 (t) γ 3 (t)
16 Il numero 3 sta a indicare la dimensione della matrice (e quindi dello spazio su cui agisce come matrice
di trasformazione), O sta per “ortogonale” e significa che le matrici devono soddisfare la (6.5) e infine S sta
per “speciale” indicando che si prendono solo le matrici con determinante positivo.
228
LEZIONI DI SISTEMI DINAMICI
dx
= 0, dal momento che x rappresenta la terna delle coordinate del punto P
e dove
dt
rispetto al SdR solidale S (che quindi non variano nel tempo).
Rimarchiamo ancora che la derivata a primo membro della (6.23) è la velocità del
punto P misurata da Σ, e ugualmente la derivata di (ξO , ηO , ζO )T è la velocità del
punto O rispetto al SdR Σ.
x
y la
Possiamo ora riscrivere la relazione (6.23) inserendo tra dA
e
il
vettore
dt
z
matrice identità scritta nella forma AT A, cosicché abbiamo
�
�
ξ
ξ
x
d
d O
dA T
η =
ηO +
A
A y .
(6.24)
dt
dt
dt
ζ
z
ζO
� �� �
ξP
x
Ricordiamo infatti che ξ P = A y è la terna delle componenti del vettore geomez
trico (P − O) espresse rispetto al SdR Σ (ovvero le differenze tra le coordinate di P
e quelle di O calcolate da Σ). Osserviamo inoltre che se si sceglie un punto diverso
da O come origine del riferimento solidale (mantenendo però gli stessi versori i, j, k)
dA T
la matrice
A che compare nella formula non cambia. Possiamo quindi dire che
dt
la distribuzione di velocità di tutti i punti di un sistema rigido si ottiene dalla formula
dA T
(6.24) quando si conosca la velocità di un punto solidale e la matrice
A .
dt
dA
. Derivando la
Osserviamo infine una caratteristica fondamentale della matrice
dt
relazione (6.5) si ha
� �T
dA T
dA T
dAT
dA
A +A
=
A +A
= 0.
(6.25)
dt
dt
dt
dt
Ricordando che ABT = (BAT )T , possiamo riscrivere la (6.25) come
�T
�
dA T
dA
A =−
A
,
dt
dt
ovvero la matrice
dA T
A è una matrice antisimmetrica. Indichiamola con
dt
0
−ω3 ω2
dA T
ω3
0
−ω1 ,
A =
dt
−ω2 ω1
0
e riscriviamo la (6.24) come
0
ξ˙
ξ˙O
η̇ = η̇O + ω3
−ω2
ζ̇O
ζ̇
−ω3
0
ω1
ξP
ω2
−ω1 ηP .
0
ζP
(6.26)
(6.27)
(6.28)
CINEMATICA DEI SISTEMI RIGIDI
Se adesso estraiamo dalla matrice (6.27) la terna17
ω1
ω = ω2 ,
ω3
229
(6.29)
e ricordiamo la definizione del prodotto vettoriale fra terne (1.15), è immediato verifidA T
care che il risultato del prodotto tra la matrice antisimmetrica
A e la terna ξ p nella
dt
(6.28) è identico al prodotto vettoriale fra le terne ω e ξp , cioè
�
�
dA T
A
ξp = ω ∧ ξp .
(6.30)
dt
Possiamo quindi riscrivere la (6.28) così:
ξ̇ = ξ̇ O + ω ∧ ξ p .
(6.31)
A questo punto però vengono spontanee le seguenti domande18:
i. La terna ω, o meglio le componenti della “colonna” (6.29) rappresentano veramente le componenti di un vettore? In altre parole, esiste un vettore ω, le cui
componenti sono date dalla terna ω? E, nel caso in cui il vettore ω esistesse,
gli elementi della terna (6.29) sono le componenti del vettore ω rispetto a quale
SdR?
ii. Ammesso che esista il vettore ω, questo è intrinseco all’atto di moto oppure
dipende dai SdR Σ, S, e dalle origini Ω, O?
Se ω esiste ed è un vettore che dipende soltanto dal moto del sistema rigido, allora
(6.31) può essere scritta nella notazione “vettoriale” (la cui forma cioè è indipendente
dal SdR19 )
d (O − Ω)
d (P − Ω)
=
+ ω ∧ (P − O),
(6.32)
dt
dt
detta formula fondamentale del moto rigido. Il vettore ω è detto velocità angolare
del corpo rigido, o anche velocità angolare istantanea del corpo rigido.
Teorema 6.3.1 La velocità di un punto P del sistema rigido B rispetto al SdR Σ è
data dalla formula (6.32), dove ω è un vettore (o meglio uno “pseudovettore”), le
cui componenti nel SdR Σ vengono estratte dalla matrice (6.27) secondo la (6.29). Il
vettore ω può dipendere, in generale, dal tempo, ma è univocamente determinato dal
moto del corpo B rispetto a Σ.
17 Sottolineiamo ancora che ω denota semplicemente tre numeri messi in colonna. Questo aspetto delicato
verrà chiarito nel seguito.
18 Si veda anche: Giuseppe Benfatto, Note del Corso di Meccanica Analitica, Università di Roma “Tor
Vergata”, a.a. 2007-08.
19 La (6.32) non è una relazione vettoriale in senso stretto. Essa infatti mantiene la sua forma solo per
cambiamenti di coordinate ortogonali (cioè se solo se si passa da un sistema ortonormale a un altro sempre
ortonormale); questo perché sia la definizione di ω sia quella di prodotto vettoriale fanno intervenire la
struttura metrica dello spazio euclideo, ovvero la definizione di ortogonalità, e l’orientazione, cioè l’ordine in
cui si considerano i versori della terna. Spesso, per essere più corretti, si usa l’espressione “pseudovettoriale”
per riferirsi a relazioni che si conservano solo per trasformazioni ortogonali con determinante positivo.
230
LEZIONI DI SISTEMI DINAMICI
Dim. La dimostrazione di questo teorema fondamentale verrà svolta nei seguenti passi:
1. Dapprima mostriamo che i tre elementi della (6.29) rappresentano le componenti, rispetto al SdR Σ, di un vettore che appunto abbiamo indicato con ω.
Facciamo poi vedere che tale vettore non dipende né da Σ né dal centro Ω.
2. Proviamo poi che ω è indipendente sia dal SdR S che da O.
Passo 1. Ricordiamo che una terna ordinata di R3 rappresenta effettivamente le componenti di un vettore se, nel cambiamento da un SdR ad un altro, soddisfa una ben precisa regola di trasformazione. In sostanza se u e u′ sono due terne che rappresentano
rispettivamente nei SdR Σ e Σ′ lo stesso vettore allora
u′ = Qu,
(6.33)
dove Q è la matrice del cambio di base da Σ a Σ′ . Viceversa se vale la (6.33) allora le
terne u e u′ sono, rispettivamente nel SdR Σ e nel SdR Σ′ , le terne delle componenti
del medesimo vettore20. Quindi per dimostrare che le componenti della (6.29) sono
effettivamente le componenti di un vettore dobbiamo provare che ω soddisfa la condizione di trasformazione (6.33) quando si considera un diverso SdR. In quest’ottica
consideriamo, come in figura 6.5, un altro SdR fisso Σ′ centrato in Ω′ �= Ω. Sia Q la
matrice del cambiamento di riferimento da Σ a Σ′ . Abbiamo
P − Ω′ = (Ω − Ω′ ) + (P − Ω) = (Ω − Ω′ ) + (O − Ω) + (P − O) .
(6.34)
Se denotiamo con ξ ′ la terna delle componenti del vettore (P − Ω′ ) rispetto al SdR
Σ′ , questa può essere espressa in due modi equivalenti
′
Ax ) = ξ Ω′ + QξO + Qξp ,
ξΩ + Q(ξ O + ����
ξp
(6.35)
ξ′=
′
ξΩ + Qξ O + ξ p′ ,
dove ξ p′ è la terna delle componenti del vettore (P − O) rispetto a Σ′ , mentre, lo stesso
vettore (P − O) è rappresentato dalla terna ξp nel SdR Σ. Di conseguenza, le terne ξp′
e ξ p sono collegate dalla relazione
ξ p′ = Qξp .
(6.36)
Osserviamo poi che, se x è la terna delle componenti del vettore (P − O) rispetto
al SdR solidale S, le terne ξ p′ e ξ p sono legate ad x tramite
ξ p′ = Bx,
ξ p = Ax,
(6.37)
dove B è la matrice di rotazione di S rispetto al SdR fisso Σ′ , mentre, come sappiamo,
A è la matrice di rotazione fra S e Σ. Infine, si rimarca che nella (6.35) né Q né ξ Ω′
(terna delle componenti del vettore (Ω − Ω′ ) rispetto al SdR Σ′ ) dipendono dal tempo.
20 In caso contrario, cioè se ω non rappresentasse alcun vettore, ci ritroveremmo con importanti limitazioni
all’uso della (6.31). Per esempio, la somma di ω 1 e ω 2 , ricavate in due riferimenti diversi, non risulterebbe
definita.
CINEMATICA DEI SISTEMI RIGIDI
231
O
P
S
SdR solidale
con il corpo rigido
Σ
SdR fisso
Ω
Σ‘
SdR fisso
Ω’
Figura 6.5: Il primo SdR fisso Σ è centrato in Ω, il secondo SdR fisso Σ′ centrato in
Ω′ �= Ω.
Calcoliamo adesso la velocità di P rispetto a Σ′ derivando la (6.35). Evidentemente
dQ
= 0, e
= 0, in quanto Σ e Σ′ sono fissi. Abbiamo dunque
dt
dt
dξ Ω′
�
�
dξp
dξ
dξ
Q O +Q
= Q O + Q ω ∧ ξp ,
dt
dt
dt
′
�
�
dξ
dξ p′
dB T
dξO
dξ
dξ O
=
+
= Q
+
B
(Bx) = Q O + ω ′ ∧ Qξp ,
Q
dt
� �� �
dt
dt (6.37)
dt
dt
dt
����
ξp′
ξp′
�
��
�
′
ω ′ ∧ξp
dB T
B . Confrontando
dove ω ′ è la “colonna” associata alla matrice antisimmetrica
dt
adesso le due espressioni otteniamo
�
�
Q ω ∧ ξp = ω ′ ∧ Qξp .
Ora se Q ∈SO (3), cioè se Q è una matrice ortogonale con determinante uguale a +1,
232
LEZIONI DI SISTEMI DINAMICI
vale la seguente uguaglianza21
�
�
Q ω ∧ ξ p = Qω ∧ Qξ p ,
da cui deduciamo
(6.38)
ω ′ = Qω,
(6.39)
ovvero che ω ′ e ω trasformano come specificato nella (6.33). Possiamo quindi affermare che ω ′ e ω sono le terne che rappresentano le componenti del vettore ω nei SdR
Σ′ e Σ, , rispettivamente. Di fatto la prova dell’esistenza del vettore ω si basa sulla
(6.38), che però non è vera per tutte le trasformazioni invertibili, ma soltanto per quelle di SO (3). Per tal motivo non possiamo propriamente affermare che le terne ω ′ e ω
rappresentano le componenti di un vettore ω. Per esser più precisi infatti parliamo di
“pseudovettore” ω.
Inoltre, il fatto che ω si trasformi secondo la (6.33) implica che il vettore ω non
dipende dal particolare SdR fisso (purché ortogonale) né dal punto dove lo stesso è
centrato. Infatti considerando un SdR fisso Σ′ , diverso da Σ, abbiamo ottenuto una
terna ω′ che è collegata ad ω dalla (6.39). Ciò vuol dire che le due terne sono le
componenti dello stesso vettore. Quest’ultimo dunque non varia se si passa dal SdR
Σ centrato in Ω, al SdR Σ′ centrato in Ω′ .
Resta da provare che ω non dipende dal SdR S, né dal centro O. Questo verrà fatto
nel passo successivo.
Passo 2. Mostriamo per prima cosa che ω non dipende dal SdR solidale. Faremo tale
dimostrazione provando che ω non dipende dal SdR solidale. Consideriamo infatti un
altro riferimento solidale S ′ , diverso da S, sempre centrato in O. Indichiamo con x e
x′ le terne delle componenti di (P − O) nei SdR S e S ′ . Quindi, ricordando la (6.17),
scriveremo
SdR S,
A (t) x,
ξ (t) = ξ O (t) + ξ p (t) , dove ξ p (t) =
(6.40)
C (t) x′ ,
SdR S ′ ,
dove C è la matrice di rotazione tra il SdR fisso Σ e il SdR solidale S ′ . Derivando
rispetto al tempo la (6.40) abbiamo
dξ p
dξ
dξ
= O +
,
dt
dt
dt
dove
�
�
dA
dA T
x=
A
Ax ,
����
dt
dt
ξp
dξ p
=
�
�
dC
dt
dC T
′
x =
C
Cx′ ,
����
dt
dt
SdR S,
SdR S ′ .
ξp
21 Questo è un punto delicato, infatti la (6.38) vale soltanto per le matrici di SO (3). In generale, se F è un
matrice invertibile, abbiamo
T
Fu ∧ Fw = (det F) F−1 (u ∧ w) .
E’ chiaro che tale formula si riduce alla (6.38) nel caso in cui F ∈ SO (3), dal momento che det F = 1 e
−1 T
F
= F.
CINEMATICA DEI SISTEMI RIGIDI
Dal confronto si ottiene
233
dA T
dC T
A =
C , e quindi rammentando la (6.27),
dt
dt
0
−ω3 ω2
dC T
ω3
0
−ω1 .
C =
dt
−ω2 ω1
0
Si conclude pertanto che il vettore ω non dipende dal SdR solidale dal momento che
due SdR solidali distinti hanno dato origine alla stessa terna ω.
Terminiamo la dimostrazione con la verifica che il vettore ω è indipendente dal
punto solidale O. Lavoriamo direttamente con la formula vettoriale (6.32), considerando un altro punto solidale O′ , diverso da O, e su di esso centriamo un SdR solidale,
come mostrato in figura 6.6.
O
P
O’
Ω
Figura 6.6: Si considerano due SdR solidali. Il primo centrato in O, il secondo centrato
in O′ �= O.
Se indichiamo con ω′ la velocità angolare relativa alla scelta di O′ , vogliamo provare
che ω ′ = ω. A tal fine consideriamo dapprima il centro O scrivendo
d (P − Ω)
d (O − Ω)
=
+ ω ∧ (P − O).
dt
dt
Se invece consideriamo il centro O′ , scriveremo
d (O′ − Ω)
d (P − Ω)
=
+ ω′ ∧ (P − O′ ).
dt
dt
Ora O′ è solidale con il corpo rigido e dunque
d (O′ − Ω)
d (O − Ω)
=
+ ω ∧ (O′ − O),
dt
dt
(6.41)
234
LEZIONI DI SISTEMI DINAMICI
mentre
(P − O) = (O′ − O) + (P − O′ ) .
Quindi
d (O − Ω)
+ ω ∧ (P − O)
dt
=
d (P − Ω)
=
d (O′ − Ω)
dt
+ ω ′ ∧ (P − O′ ) =
dt
Per confronto si ottiene
d (O − Ω)
+ ω ∧ (O′ − O)
dt
+ω ∧ (P − O′ ) ,
d (O − Ω)
+ ω ∧ (O′ − O)
dt
+ω′ ∧ (P − O′ ).
(ω − ω ′ ) ∧ (P − O′ ) = 0,
che, dovendo valere per ogni punto P , implica ω − ω ′ = 0, ovvero il vettore ω non
dipende neanche dal centro O del SdR solidale.
Nota 6.3.1 Osserviamo che la formula (6.50) implica che la distanza fra i punti del
sistema rigido rimane invariata. Infatti, se P1 e P2 sono due punti del sistema rigido
2
d (P1 − P2 )
dt
=
=
=
d
[(P1 − O) − (P2 − O)] =
dt
2 (P1 − P2 ) · [ω ∧ (P1 − O) − ω ∧ (P2 − O)] =
2 (P1 − P2 ) ·
2 (P1 − P2 ) · [ω ∧ (P1 − P2 )] = 0.
Nota 6.3.2 Vale la pena anche illustrare brevemente un approccio, diverso da quello
seguito, che porta ad introdurre il vettore ω. Tale approccio ha il pregio di condurre
direttamente al vettore ω, evitando il passaggio dalle terne, ma, a nostro avviso, ha il
difetto di non mettere subito in evidenza due importanti fatti: il primo è che, in realtà,
ω è uno pseudovettore mentre il secondo è la stretta relazione fra ω e la matrice A.
Vediamo comunque come si procede secondo questa seconda via. Si lavora nel SdR S
e qui si osserva che
i · i = 1,
j · j = 1,
k · k = 1,
i · j = 0,
i · k = 0,
j · k = 0.
(6.42)
(6.43)
Se adesso consideriamo i versori i, j, k, nel SdR Σ, questi variano nel tempo essendo
solidali col corpo in movimento. Derivando rispetto al tempo le relazioni di (6.42)
otteniamo
di
di
· i = 0, =⇒
= ω 1 ∧ i,
(6.44)
dt
dt
dj
dj
· j = 0, =⇒
= ω2 ∧ j,
(6.45)
dt
dt
dk
dk
(6.46)
· k = 0, =⇒
= ω 3 ∧ k,
dt
dt
CINEMATICA DEI SISTEMI RIGIDI
235
dove ωi , i = 1, 2, 3, sono vettori a priori diversi fra loro. Derivando poi la prima
relazione di (6.43) otteniamo
0=
di
dj
·j +i·
dt
dt
= (ω 1 ∧ i) · j+ (ω 2 ∧ j) · i,
(6.44)
(6.45)
ed espressioni analoghe per le altre due relazioni. Scambiando l’ordine del prodotto
scalare e del prodotto vettoriale e raccogliendo abbiamo
0 = (ω 1 − ω 2 ) · (i ∧ j) = (ω 1 − ω2 ) · k, ⇒ ω 1 · k = ω2 · k.
Eseguendo lo stesso procedimento con le espressioni ottenute derivando i · k = 0, e
j · k = 0, abbiamo
ω2 · i = ω3 · i, ω 3 · j = ω 1 · j.
Come si vede, per ognuno dei vettori ω i resta non soggetta a condizioni solo una
componente: ω 1 · i, ω2 · j, ω 3 · k. Ora nulla vieta di giocare sull’arbitrarietà di queste
componenti e sceglierle in modo che
ω1 · i
ω2 · j
ω3 · k
=
=
=
ω2 · i
ω3 · j
ω1 · k
=
=
=
ω3 · i,
ω1 · j,
ω2 · k .
Ma queste relazioni equivalgono a dire che esiste un unico vettore, appunto il vettore
velocità angolare, tale che
ω = ω1 = ω 2 = ω3 .
In particolare, ricordando (6.44), (6.45) e (6.46) otteniamo una relazione che fornisce
ω in funzione delle derivate dei versori del SdR S,
i∧
di
dj
dk
+j∧
+k∧
= 2ω .
dt
dt
dt
A questo punto, ricordando che (P − O) = xi + yj + zk, abbiamo
d (P − O)
di
dj
dk
=x +y
+z
= ω ∧ (xi + yj + zk)
dt
dt
dt
dt
(P −O)
da cui la (6.41) discende facilemente.
La comparsa del vettore (o “pseudovettore”) ω ha un che di artificioso. Tuttavia il
suo significato cinematico può essere reso più chiaro. Per semplificare la trattazione
consideriamo il caso in cui il moto sia una rotazione attorno ad un asse fisso che,
per esempio, coincide con l’asse ζ nel sistema fisso Σ e con l’asse delle z nel sistema
solidale S. In questo moto tutti i punti che giacciono sull’asse delle z sono fermi
mentre gli altri punti descrivono, rispetto al SdR Σ, delle circonferenze che giaccciono
su piani perpendicolari all’asse ζ ed hanno centro su di esso. Si indica θ (t) l’angolo
236
LEZIONI DI SISTEMI DINAMICI
dA(t)
, associate a questo moto rigido
di rotazione22 (con segno). La matrici A(t) e
dt
hanno la forma (si veda anche (6.22))
cos θ (t) − sin θ (t) 0
−θ̇ sin θ (t) −θ̇ cos θ (t) 0
dA(t)
A(t) = sin θ (t) cos θ (t) 0 ,
= θ̇ cos θ (t) −θ̇ sin θ (t) 0 .
dt
0
0
1
0
0
0
(6.47)
È immediato verificare che
0 −θ̇ 0
dA(t)
A(t) = θ̇ 0 0 ,
dt
0 0 0
e pertanto il vettore velocità angolare è rappresentato,nel SdR23 Σ, dalla seguente terna
0
(6.48)
ω = 0 , ⇔ ω = θ̇e3 .
θ̇
Concludiamo che ω ha per direzione l’asse di rotazione, per modulo il valore assoluto
della velocità angolare (rapporto tra angolo percorso e tempo di percorrenza) e per
verso quello di e3 (ovvero ζ crescenti) o −e3 (ζ decrescenti) a seconda che la rotazione
avvenga concordemente o non con l’orientazione degli assi (ovvero portando e1 su e2 ,
o viceversa). La rotazione si dirà uniforme se vengono descritti angoli uguali in tempi
uguali cioè se θ (t) = ωt + θo , con ω costante.
Se la rotazione avviene attorno ad un asse fisso individuato dal versore n, la
generalizzazione della (6.48) è
ω = θ̇n.
(6.49)
Qualche considerazione sulle notazioni. Sovente, e lo faremo anche noi nel seguito,
la formula vettoriale (6.32) viene, per brevità, denotata così
v(P ) = v(O) + ω ∧ (P − O),
(6.50)
˙ Ω) rappresenta la velocità del punto P rispetto all’osservatore
dove: v(P ) = (P −
·
fisso; v(O) = (O − Ω) denota la velocità, sempre rispetto al medesimo osservatore
fisso, del punto O solidale con il corpo rigido B; ω rappresenta il vettore (o meglio
lo “pseudovettore”) velocità angolare.
Riprendendo le frasi iniziali di questo paragrafo, la (6.50) mette bene in luce quanto
affermato: la velocità dei punti che costituiscono un sistema rigido varia da punto a
punto. In particolare, ricordando la definizione di atto di moto come l’applicazione che
ad ogni punto del sistema associa la sua velocità (rispetto ad un determinato SdR fisso),
la (6.50) è proprio l’atto di moto del sistema rigido.
Per concludere, consideriamo la terna delle componenti di ω rispetto al SdR S.
Indichiamo tale terna con ω S , che è così collegata ad ω:
ω =Aω S ,
22 Cioè
ω S = AT ω .
(6.51)
l’angolo di cui la coppia di versori i, j è ruotata rispetto ai versori e1 , e2 .
che in questo caso particolare ω = ωk, ovvero ω è rappresentato dalla stessa terna anche nel
23 Notiamo
SdR S.
⇔
CINEMATICA DEI SISTEMI RIGIDI
237
dA T
A è la matrice antisimmetrica che dà origine alla terna
Ci chiediamo adesso, se
dt
ω, qual’è la matrice antisimmetrica che dà luogo alla terna ω S ? La risposta a tale
domanda sarà utile quando calcoleremo proprio ωS a partire dagli angoli di Eulero
nella sezione 6.4. Premettiamo il seguente:
Lemma 6.3.1 Se S è una matrice antisimmetrica cui corrisponde il vettore24 w, allora
per ogni matrice B ∈ SO (3), al vettore Bw, corrisponde la matrice antisimmetrica
BSBT .
Dim. Si ricorda che, ∀ terna y ∈ R3 , vale la seguente uguaglianza Sy = w ∧ y.
Considerando adesso la matrice antisimmetrica BSBT , avremo
T
BSBT y = B SBT y = B w ∧ BT y = Bw ∧ BB
y = Bw ∧ y.
(6.38)
I
Quindi, ∀ y ∈ R3 , abbiamo dimostrato BSBT y = Bw ∧ y, ovvero che alla matrice antisimmetrica BSBT è associato il vettore (o meglio lo “pseudovettore”) Bw e
viceversa.
dA T
A , e considerando come matrice
dt
T
T
di SO (3) la matrice A , abbiamo che al vettore A ω, ovvero ad ω S , è associato alla
matrice
dA T
dA
dA T T T
T
A
A
A A = AT
.
= AT
A
dt
dt
dt
B
I
BT
Applicando il lemma alla matrice antisimmetrica
S
Il tutto quindi può essere riassunto in questo semplice schema
dA T
A
dt
−→
ω
dA
AT
dt
−→
ωS
dove ω S = AT ω.
(6.52)
Notiamo che tale risultato ribadisce ancora la coerenza intrinseca dalla (6.23).
Infatti esprimiamo tale formula nel SdR S, cioè
dA
AT ξ̇ = AT ξ̇O + AT
x,
dt
ω S ∧x
che appunto fornisce, nel SdR S, le componenti del vettore velocità di P misurata
·
dall’osservatore Σ. Infatti ad AT A associamo proprio la terna ω S che, coerentemente,
è costituita dalle componenti di ω rispetto al SdR S.
24 Inteso
come terna di R3 .
238
LEZIONI DI SISTEMI DINAMICI
Nota 6.3.3 Il teorema di Eulero, come abbiamo sottolineato, afferma che è sempre
possibile sovrapporre il SdR S al SdR Σ (o meglio al SdR Σ′ ) eseguendo un’unica
rotazione intorno ad un’opportuna retta. Ci chiediamo adesso: in che relazione stanno
l’asse di rotazione ed il vettore ω ? Se ω = ω (t) n, con n costante nel tempo allora ω
è parallelo all’asse di rotazione del teorema di Eulero. Infatti, è sufficiente selezionare
il SdR Σ ed il SdR solidale S in modo che i versori degli assi ζ e z coincidano con n,
per ottenere la matrice A nella forma (6.47), da cui ricavre ω = ω (t) e3 , ed e3 = k,
cioè e3 è l’autovettore di A relativo all’autovalore λ = 1 (e quindi è proprio l’asse
di rotazione del teorema di Eulero). Se invece ω non ha direzione costante, allora,
in generale, ω non è parallelo all’asse di rotazione del teorema di Eulero. Questo
discende direttamente dalla (6.52): le terne delle componenti del vettore ω rispetto
al SdR Σ e al SdR S sono diverse. Quindi ω non è, in generale, autovettore relativo
all’autovalore λ = 1 della matrice A.
6.4 Angoli di Eulero
Abbiamo visto che il moto rigido è parametrizzato dai “punti” dello spazio R3 ×SO(3).
I primi tre parametri, in R3 , sono le coordinate dell’origine O del sistema solidale
rispetto al SdR fisso Σ. Gli altri tre parametri dovranno determinare l’orientamento
degli assi di S rispetto agli assi del sistema Σ, o meglio, la posizione dei tre versori di S
rispetto a Σ′ , che è il SdR con origine in O ed assi costantemente paralleli a quelli di Σ
(v. figura 6.4). Il moto di S rispetto a Σ′ è quindi equivalente a quello di un moto rigido
con un punto che resta fisso. Un tale moto prende il nome di precessione. Fissiamo
quindi una posizione mutua di S e Σ′ e supponiamo che, in questa configurazione, gli
assi dei due sistemi non siano sovrapposti e, in particolare, non coincidano i due assi
ζ e z (vedi figura 6.7). Vogliamo far vedere che possiamo riportare il sistema “fisso”
Σ′ a coincidere con quello “mobile” S mediante tre opportune rotazioni: gli angoli di
queste rotazioni forniranno i parametri cercati.
ζ
z
y
θ
η
ψ
ϕ
linea dei nodi
ξ
x
Figura 6.7: Angoli di Eulero.
CINEMATICA DEI SISTEMI RIGIDI
239
Poiché gli assi ζ e z non coincidono, i piani ζ = 0 e z = 0 si intersecano in una
retta detta linea dei nodi. Sia n il versore di questa retta, orientato in modo che la
terna k, n e e3 (cioè i versori dell’asse z, della linea dei nodi, e dell’asse delle ζ) sia
positivamente orientata. Ovviamente la linea dei nodi sta sia sul piano (ξ, η), che sul
piano (x, y) . Pertanto indichiamo con ψ l’angolo che e1 , cioè l’asse ξ, forma con n, e
con φ l’angolo i, cioè l’asse x, forma con la linea dei nodi. Sia poi θ l’angolo formato
fra gli assi z e ζ.
Nota 6.4.1 La dimostrazione della possibilità di rappresentare una generica rotazione
fra due SdR tramite la composizione ordinata di 3 rotazioni elementari è dovuta, ancora una volta, ad Eulero. I tre angoli di cui ruotare sono detti angoli di Eulero. Tuttavia
oltre a dover specificare i valori dei 3 angoli è necessario specificare quali siano gli
assi attorno ai quali devono essere effettuate le rotazioni elementari. La scelta di tali
assi è libera, cosicché esistono diverse possibilità. Nella presente sezione abbiamo
scelto come assi quelli individuati dai versori k, n ed e3 . Essa viene anche detta ZXZ,
dal nome degli assi intorno ai quali, di volta in volta, si effettuano le singole rotazioni.
Infatti, come spiegheremo in dettaglio nel seguito, partendo dal SdR Σ, si ruota dapprima attorno ad e3 (l’asse “ z ” di Σ), poi una volta ottenuto il nuovo SdR si ruota
attorno a quello che sarebbe l’asse x di tale nuovo SdR. Si ottiene così un altro SdR e,
come ultimo passo, si ruota attorno all’asse z di quest’ultimo SdR. Questo è il motivo
per cui tale scelta degli assi di rotazione è convenzionalmente chiamata ZXZ. Le altre
possibili scelte sono XZX, XYX, YXY, YZY, ZYZ, XZY, XYZ, YXZ, YZX, ZYX e ZXY. Le
12 sequenze sono ottenute tramite tutte le disposizioni possibili in cui assi uguali non
sono consecutivi.
Vediamo come determinare AT , così che x = AT ξ, che corrisponde, come detto, a
passare dalla terna Σ′ alla terna S. Tale passaggio si fa mediante l’applicazione di tre
successive rotazioni (cui corrispondono tre distinte matrici di rotazione):
1. Prima rotazione (in senso antiorario, scelto come positivo) di un angolo ψ,
attorno all’asse e3 , in modo che e1 vada a coincidere con n. Si passa quindi
dal SdR (e1 , e2 , e3 ) al SdR (e′1 ≡ n, e′2 , e′3 ≡ e3 ), la cui matrice è data da25
(e1 , e2 , e3 ) −→ (e′1 , e′2 , e′3 )
matrice Aψ ,
(e′1 , e′2 , e′3 ) −→ (e1 , e2 , e3 )
matrice AT
ψ ,
con
cos ψ
Aψ = sin ψ
0
− sin ψ
cos ψ
0
0
0 ,
1
cos ψ
−
sin ψ
AT
=
ψ
0
sin ψ
cos ψ
0
0
0 .
1
2. Seconda rotazione di un angolo θ, detto angolo di nutazione (sempre in verso
antiorario e quindi positivo) attorno all’asse e′1 che coincide con linea dei nodi.
25 Si
ricordi che secondo la nostra convenzione
(terna in Σ) = A (terna in S) .
240
LEZIONI DI SISTEMI DINAMICI
Si passa da (e′1 ≡ n, e′2 , e′3 ) al SdR (e′′1 ≡ e′1 , e′′2 , e′′3 ) ottenendo la seguente
matrice
matrice Aθ ,
(e′1 , e′2 , e′3 ) −→ (e′′1 , e′′2 , e′′3 )
con
�
�
′′
e′′1 , e2 , e′′3 −→ (e′1 , e′2 , e′3 )
1
Aθ = 0
0
0
cos θ
sin θ
0
− sin θ ,
cos θ
matrice AT
θ ,
1
0
=
0
cos
θ
AT
θ
0 − sin θ
0
sin θ .
cos θ
3. La terza rotazione, di un angolo φ, detto angolo di rotazione propria (sempre
in verso positivo antiorario) attorno al versore e′′3 (che rimane quindi invariato).
Si passa da (e′′1 , e′′2 , e′′3 ) al SdR S, ovvero (i, j, k ≡ e′′3 ),
�
�
′′
e′′1 , e2 , e′′3 −→ (i, j, k)
matrice Aφ ,
(i, j, k) −→ (e′′1 , e′′2 , e′′3 )
con
cos φ − sin φ
Aφ = sin φ cos φ
0
0
0
0
1
matrice AT
φ ,
cos φ sin φ
−
sin φ cos φ
AT
=
φ
0
0
0
0 .
1
La matrice AT (che consente di trasformare le terne di Σ′ in terne di S) è dunque
T T
A T = AT
φ Aθ Aψ ,
mentre la matrice che permette di passare dalle terne di S a quelle espresse in Σ′ (cioè
la matrice A) è data da
� �T
�
�
T T T
A = AT
= AT
= Aψ Aθ Aφ ,
φ Aθ Aψ
cioè26
cos φ cos ψ − cos θ sin φ sin ψ
A = cos φ sin ψ + cos θ cos ψ sin φ
sin θ sin φ
− cos ψ sin φ − cos θ cos φ sin ψ
cos θ cos φ cos ψ − sin φ sin ψ
cos φ sin θ
sin θ sin ψ
− cos ψ sin θ .
cos θ
Da essa poi si ricava l’espressione del vettore ω nel SdR solidale S: la terna27 ω S .
Ricordando poi lo schema (6.52), alla terna ωS è associata alla matrice antisimmetrica
26 Tra gli angoli di Eulero e le orientazioni del corpo rigido esiste una corrispondenza solo localmente
biunivoca. Infatti, si osservi che quando l’asse ζ coincide con z (θ = 0 e θ = π) non si può più definire la
linea dei nodi perché il piano solidale x, y e il piano fisso ξ, η sono sovrapposti; in tale caso (che escludiamo
dalle nostre considerazioni) è sufficiente l’unico parametro ψ per descrivere l’orientazione reciproca delle
due terne. Questo “difetto” è inevitabile, qualsiasi sia il sistema di parametri si scelga per determinare la
posizione di S, in quanto l’insieme SO(3), i cui punti sono in corrispondenza 1-1 con le posizioni di S, non
ammette sistemi coordinate globali (come accade ad esempio per la superficie di una sfera).
27 L’espressione di ω in S, cioè la terna ω , risulta particolarmente utile nell’ambito della dinamica dove è
S
vien fatto uso delle componenti del momento angolare rispetto ad una base solidale e dove l’energia cinetica
viene calcolata lavorando nel sistema S.
CINEMATICA DEI SISTEMI RIGIDI
AT
241
dA
. Cominciamo quindi col calcolare
dt
dA
dAθ
dAφ
dAψ
=
A θ A φ + Aψ
A φ + Aψ A θ
.
dt
dt
dt
dt
(6.53)
E’ facile provare, svolgendo esplicitamente i calcoli, che
0 −ψ̇ 0
dAψ
= Aψ Jψ̇ , dove Jψ̇ = ψ̇
0 0 ,
dt
0
0 0
0 0 0
dAθ
= Aθ Jθ̇ , dove Jθ̇ = 0 0 −θ̇ ,
dt
0 θ̇ 0
0 −φ̇ 0
dAφ
= Aφ Jφ̇ , dove Jφ̇ = φ̇ 0 0 .
dt
0 0 0
In particolare, le tre matrici Jψ̇ , Jθ̇ e Jφ̇ sono matrici antisimmetriche cui possiamo
associare, in base alla regola (6.27), le seguenti terne
0
0
θ̇
Jψ̇ → ψ̇ = 0 , Jθ̇ → θ̇ = 0 , Jφ̇ → φ̇ = 0 . (6.54)
ψ̇
0
φ̇
Quindi, sfruttando la notazione appena introdotta e la (6.53), abbiamo
�
�
dA
T
= (Aψ Aθ Aφ ) Aψ Jψ̇ Aθ Aφ + Aψ Aθ Jθ̇ Aφ + Aψ Aθ Aφ Jφ̇
AT
dt
=
T
T
AT
φ Aθ J Aθ Aφ + Aφ Jθ̇ Aφ + Jφ̇ .
� �� � ψ̇
(Aθ Aφ )T
Ora, rammentando il lemma 6.3.1 dimostrato nella precedente sezione, otteniamo le
seguenti associazioni tra matrici antisimmetriche e terne
0
�
�T
T
T
T
T 0
(Aθ Aφ ) Jψ̇ (Aθ Aφ )
−→ (Aθ Aφ ) ψ̇ = AT
,
φ Aθ
ψ̇
θ̇
�
�
T
T
T
−→ AT
AT
0 ,
φ Jθ̇ Aφ
φ θ̇ = Aφ
0
mentre alla matrice Jφ̇ associamo direttamente la terna φ̇ come specificato nella (6.54).
Abbiamo quindi
0
0
θ̇ cos φ + ψ̇ sin θ sin φ
θ̇
T
0 + 0 = ψ̇ cos φ sin θ − θ̇ sin φ .
0 + AT
ω S = AT
φ Aθ
φ
ψ̇
0
φ̇
φ̇ + ψ̇ cos θ
(6.55)
242
LEZIONI DI SISTEMI DINAMICI
Procedendo in modo simile si trovano le componenti di ω nel SdR Σ, ovvero la
terna ω. Infatti
dA T
A
dt
=
(
dAψ
dAθ
dAφ
T T
A θ A φ + Aψ
A φ + Aψ A θ
)AT
φ Aθ Aψ
dt
dt
dt
� �� �
����
� �� �
Aψ J ·
Aθ J ·
ψ
=
θ
Aφ J ·
φ
T T T
T T
Aψ Jψ̇ AT
ψ + Aψ Aθ Jθ̇ Aθ Aψ + Aψ Aθ Aφ Jφ̇ Aφ Aθ Aψ ,
a cui si associa la terna
0
0
θ̇ cos ψ + φ̇ sin θ sin ψ
θ̇
ω = Aψ 0 +Aψ Aθ 0 +Aψ Aθ Aφ 0 = θ̇ sin ψ − φ̇ cos ψ sin θ .
ψ̇
0
φ̇
ψ̇ + φ̇ cos θ
(6.56)
Notiamo che avremmo ottenuto la stessa espressione se avessimo usato la relazione
ω = AωS .
Nota 6.4.2 Riprendendo quanto illustrato nella nota 6.3.3, rimarchiamo ancora come,
nel caso generale, ω non sia parallelo all’asse di rotazione del teorema di Eulero.
Confrontando le terne (6.55) e (6.56) risulta evidente che le componenti del vettore ω
sono diverse nei due SdR. Quindi ω non è, in generale, un autovettore della matrice A
relativo all’autovalore λ = 1. Lo diventa quando ω = ω S , cioè quando, per esempio,
θ ≡ 0, φ ≡ 0 e la rotazione, di un angolo ψ, avviene attorno all’asse e3 , che così
rimane coincidente con l’asse z del SdR S.
6.5 Asse istantaneo di moto, rigate del moto
Vogliamo ora determinare come è fatto il campo di velocità, o meglio l’atto di moto,
determinato dalla formula (6.50). Fissiamo un istante t e indichiamo con v(P ) la
velocità di un punto solidale P a questo istante. Moltiplicando scalarmente la (6.50)
per il vettore ω/ |ω| otteniamo
v(P ) ·
ω
ω
= v(O) ·
,
|ω|
|ω|
(6.57)
che ci dice che la componente della velocità nella direzione di ω è la stessa per tutti i
punti solidali, ovvero per ogni P ∈ B,
�
�
ω
ω
v � = v(P ) ·
.
|ω| |ω|
Quindi, per ogni punto P vale la seguente scomposizione nella direzione parallela ad
ω
ω (individuata dal versore |ω|
) ed in quella ortogonale
v (P ) =
v�
����
uguale ∀ P
+ v (P )⊥ , dove v (P )⊥ = v (P ) − v � ,
(6.58)
CINEMATICA DEI SISTEMI RIGIDI
243
o meglio, ricordando ancora la (6.50),
v (P )⊥ = v (O)⊥ + ω ∧ (P − O) ,
�
��
�
(6.59)
v (Q) = v � , ∀ Q ∈ asse istantaneo del moto.
(6.60)
vettore ⊥ ω
�
�
ω
ω
, componente di v (O)
con v (O)⊥ = v (O) − v (O)� = v (O) − v(O) ·
|ω| |ω|
ortogonale ad ω. Al variare di P solo la componente di v(P ) ortogonale alla direzione
di ω, ovvero il vettore v (P )⊥ , può cambiare. Mostriamo che esiste una intera retta,
detta asse istantaneo del moto, di punti solidali28 Q tali che v (Q)⊥ = 0, e quindi
v(Q) si riduce a
Nota 6.5.1 Si osserva che la definizione di asse istantaneo di moto coincide con la
definizione di asse centrale data nella sezione 1.5.2.
Scrivendo le (6.58) (6.59) per tali punti abbiamo
v (Q) =
=
v � + v (Q)⊥
v�
����
componente � ω
e, imponendo v (Q)⊥ = 0, otteniamo
+ v (O)⊥ + ω ∧ (Q − O) ,
��
�
�
componente ⊥ ω
v (O)⊥ + ω ∧ (Q − O) = 0.
(6.61)
Possiamo riscrivere l’equazione (6.61) considerando la rappresentazione matriciale
della velocità angolare
ξQ
0
−ω3 ω2
v1 (O)⊥
ω3
0
−ω1 ηQ = − v2 (O)⊥ ,
(6.62)
−ω2 ω1
0
ζQ
v3 (O)⊥
v1 (O)⊥
ξQ
dove ηQ sono le componenti del vettore (Q − O) rispetto al SdR Σ e v2 (O)⊥
ζQ
v3 (O)⊥
quelle del vettore v (O)⊥ , nel medesimo SdR. Ora, il sistema (6.62) può essere visto
come un sistema lineare non omogeneo di tre equazioni (6.62) nelle incognite ξQ ,
ηQ , ζQ . La matrice del sistema ha rango 2 (salvo quando ω = 0) e la condizione
ω · v (O)⊥ = 0, garantisce che anche la matrice completa
0
−ω3 ω2 −v1 (O)⊥
ω3
0
−ω1 −v2 (O)⊥
−ω2 ω1
0
−v3 (O)⊥
28 In generale non è detto che i punti Q facciano parte del corpo rigido B. Può accadere che Q ∈
/ B, pur
restando solidali con B.
244
LEZIONI DI SISTEMI DINAMICI
abbia ancora rango 2. Infatti, comunque si selezioni una matrice 3 × 3 che contenga
l’ultima colonna, quando se ne calcola il determinante si ottiene ωi (ω · v (O)⊥ ), i =
1, 2, 3, e quindi si annulla. Ne segue che (6.62) ammette ∞1 soluzioni: ovvero una
retta. In particolare, se consideriamo due soluzioni (Q1 − O) e (Q2 − O), il vettore
(Q1 − Q2 ) giace sulla retta. Ma siccome
v (O)⊥ + ω ∧ (Q1 − O) = 0,
ω ∧ (Q1 − Q2 ) = 0,
=⇒
sottraendo
v (O)⊥ + ω ∧ (Q2 − O) = 0,
otteniamo che l’asse istantaneo di moto è parallelo a ω.
asse istantaneo
del moto
v( P2 )
v( P1 )
v
v
Q
v
v (P1 )
P1
v (P2 )
P2
Figura 6.8: Il punto Q sta sull’asse istantaneo del moto. Per ogni punto P vale la
scomposizione v (P ) = v � + v ⊥ (P ). La componente v � è uguale per tutti i punti ed
è pari alla velocità dei punti giacenti sull’asse istantaneo del moto.
Sull’asse istantaneo di moto la velocità rispetto a Σ assume il minimo modulo
e coincide con v � , ovvero ha la stessa direzione dell’asse istantaneo di moto, come
mostrato in fig. 6.8. Quindi l’asse del moto “scivola” lungo la sua giacitura, o meglio
la velocità dei punti materiali che ivi giacciono è parallela all’asse. Infatti, dalla (6.58)
si ha
� �2
|v (P )|2 = �v � � + |v (P )⊥ |2 ,
� �
poiché v � · v (P )⊥ = 0. Dunque, per ogni P ∈ B, |v (P )| ≥ �v � �, ed il valor
minimo verrà assunto da quei punti P per cui v (P )⊥ = 0, che sono proprio i punti che
giacciono sull’asse istantaneo di moto. Bisogna però ricordare che i vettori ω e v(O)
sono variabili nel tempo, e quindi anche la posizione dell’asse di moto varia nel tempo
CINEMATICA DEI SISTEMI RIGIDI
245
e i punti (solidali) che si trovano sull’asse ad un istante t2 sono diversi da quelli che ci
si trovavano all’istante t1 . Ciò giustifica l’aggettivo “istantaneo”.
Fissato t, la retta che descrive l’asse istantaneo di moto nel SdR Σ, può essere data
in forma parametrica
ξ = ξ (µ, t) ,
η = η (µ, t) ,
(6.63)
ζ = ζ (µ, t) ,
dove µ ∈ R è il parametro che descrive la retta a t fissato, e t è il tempo. Al variare di t
si ottengono, come dicevamo, rette diverse. Se poi consideriamo il sistema (6.63) con
t e µ entrambe variabili in R, si ottiene l’equazione parametrica di una superficie (si
rimanda alla sezione 4.1.3 per le superfici date in forma parametrica). Tale superficie
è una rigata, in quanto costituita da rette, e viene detta rigata fissa. L’equazione della
stessa superficie (6.63) nel SdR solidale S si ottiene riscrivendo l’equazione (6.62) nel
SdR S. Quindi, se
ξQ
ξ Q = ηQ
ζQ
xQ
denota la terna delle componenti di (Q − O) nel SdR Σ, la terna xQ = yQ ,
zQ
delle componenti del medesimo vettore nel SdR solidale S è data da
x Q = AT ξ Q .
Applicando la matrice AT alla (6.62) otteniamo
�
�
0 = AT v (O)⊥ + AT ω ∧ ξ Q
= AT v (O)⊥ + ω s ∧ xQ ,
����
(6.38)
����
AT ω
(6.64)
AT ξ Q
che è appunto l’equazione dell’asse istantaneo di moto nel SdR S. Evidentemente tale
retta varia nel tempo e descrive una superficie che viene detta rigata mobile.
Esempio 6.5.1 Riprendiamo l’esempio 4.1.2 considerando un disco di raggio R che
rotola senza strisicare lungo l’asse ξ, come mostrato in figura 6.9.
La velocità angolare è ω = ωe3 , con ω = ϕ̇. Di conseguenza, siccome il moto
avviene nel piano (ξ, η), v � = 0, e v = v ⊥ . L’asse istantaneo del moto è dunque
la retta dove v ⊥ = 0. Se Q è un generico punto del disco, le componenti del vettore
(Q − Ω) rispetto al SdR Σ sono (Q − Ω) = ξe1 + ηe2 . Ricordando il vincolo di
rotolamento puro (4.14), abbiamo
(O − Ω) = −Rϕe1 + Re2 ,
e pertanto, siccome (Q − O) = (Q − Ω) − (O − Ω), si ha
ξQ
ξ − Rϕ
ηQ = η − R .
ζQ
0
(6.65)
246
LEZIONI DI SISTEMI DINAMICI
η
y
O
ϕ
ϕ
R
ξ
Ω
C
x
Figura 6.9: Disco che rotola di rotolamento puro. (O, x, y) è il SdR solidale S. Le
coordinate nel SdR S, del punto di contatto C sono (−R sin ϕ, −R cos ϕ). Si osservi
che in questo caso l’angolo di rotolamento ϕ è negativo.
Sempre la (6.65) ci consente di determinare le componenti del vettore v ⊥ (O) nel SdR
Σ. Infatti29
d (O − Ω)
= −Rωe1 .
v (O) =
dt
Scrivendo la (6.62) otteniamo
0 =
=
−Rωe1 + ωe3 ∧ [(ξ − Rϕ) e1 + (η − R) e2 ]
(−ωη) e1 + [ω (ξ + Rϕ)] e2 .
L’equazione parametrica, nel SdR Σ, dell’asse istantaneo di moto è dunque
η = 0,
ξ = −Rϕ,
con µ ∈ R .
ζ = µ,
L’asse di moto è pertanto la retta ortogonale al piano ξ, η, che passa per il punto di
contatto. Questo risultato è coerente con la “fisica” del problema, dal momento che
il punto di contatto è quel punto che, istante per istante, ha velocità nulla (e quindi la
minore in modulo). La rigata fissa è quindi il piano ξ, ζ.
29 Si
ricordi che, in questo caso particolare, v (O)⊥ = v (O).
CINEMATICA DEI SISTEMI RIGIDI
247
Se vogliamo determinare l’equazione dell’asse di moto nel SdR S, dobbiamo lavorare con la (6.64). Abbiamo
−Rω
−Rω cos ϕ
cos ϕ sin ϕ 0
AT v (O) = − sin ϕ cos ϕ 0 0 = Rω sin ϕ ,
0
0
0
0
1
mentre
ω S ∧ x = ωk ∧ (xi + yj + zk) = −ωyi + ωxj .
Scrivendo quindi la (6.64) otteniemo la seguente equazione parametrica dell’asse di
moto nel SdR S
x = −R sin ϕ,
y = −R cos ϕ
con µ ∈ R ,
z = µ,
ovvero una retta perpendicolare al piano x,y. Tale ratta tocca la circonferenza esterna
del disco nel punto di coordinate (R sin (−ϕ) , −R cos ϕ), che sono proprio le coordinate, rispetto al SdR S, del punto di contatto (v. figura 6.9). In questo caso le rigata
mobile è il cilindro di raggio R il cui asse è l’asse z.
Di particolare interesse il caso in cui l’invariante v � è nullo (come nel precedente esempio 6.5.1). In questo caso i punti dell’asse di moto sono “istantaneamente fermi”, cioè
hanno velocità nulla. Ne segue che la rigata mobile rotola senza strisciare sulla rigata fissa e possiamo pensare quindi al moto rigido come “generato” dal rotolamento di
queste due superfici, una sull’altra. Questa osservazione è alla base della teoria su cui
si basa la costruzione degli ingranaggi. In questo caso l’asse viene anche detto asse di
istantanea rotazione, in quanto la distribuzione (istantanea) delle velocità è la stessa di
quella che ci sarebbe in un moto di rotazione (in cui l’asse del moto resta fisso).
Nel caso generale, al variare di P , si “sommano” il moto di rotazione dato dalla
v (P )⊥ , con il moto di “traslazione” dato da v � (uguale per tutti i punti di B). Se
ω e v(O), restano costanti allora le velocità hanno sempre questa distribuzione e, in
particolare, l’asse di moto è sempre lo stesso. Il moto che ne risulta è quindi quello in
cui i punti dell’asse si muovono lungo l’asse, mentre gli altri punti li “seguono girando
attorno all’asse”. Questo moto è detto “elicoidale”, ed è il moto che ha un bullone
mentre viene avvitato, o un cavatappi mentre entra nel tappo. Nel caso generale questa
è la forma della distribuzione di velocità ad ogni istante, ma da un istante all’altro la
posizione dell’asse muta. Per questa si parla, per un moto rigido generico, di atto di
moto elicoidale o roto-traslatorio.
6.6 Cinematica relativa: composizione delle velocità
Vogliamo adesso determinare come due SdR Σ e S, in moto tra loro, giudichino la velocità di un punto P in moto rispetto ad entrambi gli osservatori (e quindi non più fermo
rispetto al SdR S). Anche se i termini “fisso” e “mobile” sono arbitrari continueremo
a riferirci a Σ come al SdR fisso e a S come al sistema mobile.
Supporremo inoltre di conoscere le caratteristiche del moto di S rispetto a Σ, ovvero i vettori v(O) e ω (funzioni del tempo) e chiameremo velocità assoluta, v A , e
248
LEZIONI DI SISTEMI DINAMICI
velocità relativa, v R , la velocità del punto P rispetto a Σ e a S. Riferendoci quindi
alla figura 6.4
vA =
d (P − Ω)
,
dt
mentre
vR =
d (P − O)
.
dt
Per ricavare il legame tra v A e v R partiamo dalla formula (6.16) che lega fra loro i
vettori (P − Ω) e (P − O). Passando alle terne, consideriamo la (6.17) che deriviamo
rispetto al tempo. Questa volta però teniamo conto del fatto che anche x, le coordinate
del vettore (P − O) in S, variano nel tempo
� x
�
ξ
ξ
x
d
d O
d
d
η =
A(t) y + A(t) y .
(6.66)
ηO +
dt
dt
dt
dt
ζ
z
z
ζO
Il termine a primo membro nella (6.66) è la terna delle componenti della velocità assoluta del punto P nel sistema Σ. Il terzo addendo a secondo membro rappresenta le componenti, in S, del vettore velocità relativa moltiplicate per la matrice di cambiamento
di riferimento: queste sono quindi le componenti in Σ del vettore v R , cioè
nel SdR S,
ẋ,
vR →
Aẋ,
nel SdR Σ.
I primi due addendi del secondo membro sono gli stessi che comparivano nella formula fondamentale del moto rigido, quindi possiamo riscrivere la (6.66) nella forma
“vettoriale”
v A (P ) = v A (O) + ω ∧ (P − O) + v R (P ) .
(6.67)
La somma v A (O)+ω∧(P −O), rappresenta la velocità che il punto P avrebbe se fosse
solidale, ovvero se fosse fermo (anche solo “istantaneamente”) rispetto all’osservatore
S. Per questa ragione si dà a questo termine il nome di velocità di trascinamento, v T ,
e si riscrive la (6.67) nella forma
v A (P ) = v T (P ) + v R (P ) ,
(6.68)
che si legge dicendo che la velocità assoluta è uguale alla velocità di trascinamento più
la velocità relativa.
Nota 6.6.1 Con il “senno di poi” ci possiamo rendere conto che nella derivazione
della formula (6.67) si utilizza un’ipotesi non esplicitata: ad ogni istante i due sistemi
di riferimento devono essere in grado di confrontare le variazioni rispetto al tempo di
una quantità scalare (le componenti del vettore che si sta derivando) nei due sistemi.
Questo è possibile solo se i due sistemi possono “sincronizzare” in ogni momento e
istantaneamente i loro orologi. Ma ciò è fisicamente impossibile, come messo in luce
da Einstein nel suo lavoro (del 1905) sulla Relatività Ristretta.
Il motivo per cui questa ipotesi è rimasta nascosta per secoli dipende dal fatto che
la massima velocità con cui due osservatori possono scambiarsi delle informazioni è
la velocità della luce, che è molto maggiore di qualsiasi velocità in gioco nei fenomeni
meccanici macroscopici. L’errore che quindi si compie tenendo per buona l’ipotesi
di sincronizzazione istantanea degli orologi non è quindi rilevabile nell’ambito delle
applicazioni meccaniche ordinarie.
CINEMATICA DEI SISTEMI RIGIDI
249
6.7 Formula di Poisson
Notiamo ora che le considerazioni fatte per la velocità valgono per qualsiasi quantità
vettoriale, in quanto il termine di differenza tra v A (P ) e v R (P ) dipende dalla varia�
d�
zione dell’orientazione degli assi S al variare del tempo. Useremo i simboli dt
e
A
�
d�
per
indicare
la
derivata
rispetto
al
tempo
di
una
qualsiasi
quantità
vettoriale
come
dt R
giudicata rispettivamente dagli osservatori Σ e S, e le chiameremo ancora derivata
assoluta e derivata relativa.
Consideriamo un vettore libero U definito nel sistema di riferimento solidale col
corpo rigido B. Nel generico SdR S solidale il vettore U sarà espresso dalla terna us ,
mentre sarà espresso dalla terna uΣ , nel SdR Σ, ovvero
U →
uS ,
uΣ = AuS ,
nel SdR S,
nel SdR Σ.
Quindi rispetto all’osservatore Σ, U varia sia a causa del moto di S, sia a causa della
“variazione propria” di U (ovvero quella “misurata” dall’osservatore solidale S ), che
dunque sarà
�
nel SdR S,
u̇S ,
d U ��
→
dt �R
nel SdR Σ.
u̇Σ |R = Au̇S ,
In accordo con le notazioni introdotte, avremo quindi per un qualsiasi vettore U ,
�
�
d U ��
d U ��
=
+ ω ∧ U,
dt �A
dt �R
(6.69)
che è nota con il nome di formula di Poisson30 .
Nota 6.7.1 Confrontando la (6.69) con la (6.67) ci si potrebbe chiedere perché nella
(6.69) non compare v A (O). Osserviamo che la (6.67) è la derivata assoluta del vettore (P − Ω) che si scompone come nella (6.16). Calcolando la derivata assoluta del
vettore (O − Ω) otteniamo v A (O), mentre per calcolare la derivata assoluta del vettore (P − O) si applica
la (6.69) dove U = (P − O). Si otteniamo così la (6.67) dal
�
d U ��
momento che
è proprio la velocità relativa v R del punto P .
dt �
R
Per dimostrare la (6.69) consideriamo la derivata di uΣ rispetto al SdR Σ, che denoteremo con
d
(AuS ) .
u̇Σ |A =
dt
30 Siméon-Denis Poisson (Pithiviers, 1781 – Parigi, 1840), matematico, fisico, astronomo e statistico
francese.
250
LEZIONI DI SISTEMI DINAMICI
Questa ci darà appunto le componenti della derivata di U rispetto al SdR fisso Σ.
Abbiamo
dA
dA T
u̇Σ |A =
uS + Au̇S =
A
AuS + Au̇S
dt
dt
=
ω ∧ AuS + Au̇S
uΣ
=
u̇Σ |R
(6.70)
ω ∧ uΣ + u̇Σ |R ,
dove ω è la terna delle componenti della velocità angolare nel SdR Σ. Ora, come
ampiamente illustrato nella sezione 6.3, si può far vedere che (6.70) è indipendente
dagli specifici sistemi di riferimento considerati, e quindi concludere che la (6.70) è
proprio l’espressione nel SdR Σ dell’identità vettoriale
(6.69).
In particolare, l’espressione del vettore ddtU A rispetto al SdR S è data da
AT u̇Σ |A
= AT
dA T
A A uS + AT A u̇S
dt
I
I
dA
uS + u̇S
dt
= ω S ∧ uS + u̇S ,
= AT
(6.71)
dove, ricordando la (6.51), ω S è la terna delle componenti della velocità angolare nel
SdR S.
Nota 6.7.2 Mostriamo come ottenere la (6.71) partendo da uS = AT uΣ e derivandola rispetto al tempo. Abbiamo infatti
T
T
dA
dA
T
u̇S =
uΣ + AΣ u̇Σ =
AAT uΣ + AT
Σ u̇Σ ,
dt
dt
dove u̇Σ va ovviamente intesa come u̇Σ |A , essendo la derivata della terna uΣ costituita dalle componenti del vettore U nel SdR Σ. Adesso si sfrutta la (6.5) che, come
sappiamo, derivata rispetto al tempo fornisce
T
dA
dA
T
A+A
= 0,
dt
dt
e quindi
u̇S = −AT
dA T
T
A uΣ + AT
Σ u̇Σ = −ω S ∧ uS + A u̇Σ |A ,
dt
(6.52)
uS
da cui la (6.71) discende banalmente.
Nota 6.7.3 Calcoliamo la derivata rispetto a Σ della velocità angolare. Se ω è la
terna delle componenti della velocità angolare rispetto a Σ, abbiamo ω̇|A = ω̇. Se
CINEMATICA DEI SISTEMI RIGIDI
251
invece consideriamo le componenti rispetto al SdR S, cioè la terna ω S , sfruttando la
(6.51), abbiamo
T
d T
dA
T
ω̇ S |A =
A ω = A
ω + AT ω̇
A
dt
dt
I
T
dA T
dA
T
T
= A
A
ω+ AT ω̇|A = −AT
A
ω + A ω̇|A
dt
dt
(6.25)
(6.52)
ωS
ωS
T
− dA
A
dt
ω S ∧ω S
= AT ω̇|A ,
e quindi ω̇|A = A ω̇ S |A .
6.8 Composizione di moti rigidi
Siano dati adesso tre osservatori Σ, S e S ′ , con S ′ in moto sia rispetto a Σ che a S, e
siano note le caratteristiche del moto di S rispetto a Σ, v(O) e ω, e di S ′ rispetto31 a
S, v R (O′ ) e ω′ . Vogliamo determinare il moto di S ′ rispetto a Σ.
Se P è un punto solidale con S ′ , la velocità di P rispetto a S è
v R (P ) = v R (O′ ) + ω′ ∧ (P − O′ ).
Indichiamo con v A (P ) la velocità di P rispetto all’osservatore Σ. Dalla (6.67)
otteniamo
v A (P ) =
=
v A (O) + ω ∧ (P − O) + v R (P )
v A (O) + ω ∧ (P − O) + v R (O′ ) + ω ′ ∧ (P − O′ ),
che riscriviamo
v A (P ) =
=
v A (O) + ω ∧ (P − O′ + O′ − O) + v R (O′ ) + ω ′ ∧ (P − O′ )
v A (O) + ω ∧ (O − O′ ) + v R (O′ ) +
v A (O′ )
ω ∧ (P − O′ ) + ω ′ ∧ (P − O′ ).
(6.72)
Il trinomio v A (O) + ω ∧ (O − O′ ) + v R (O′ ) rappresenta la velocità del punto O′
rispetto al SdR Σ, che, secondo la nostra convenzione, abbiamo denotato con v A (O′ ),
velocità di O′ (centro del SdR S ′ ) rispetto all’osservatore fisso Σ. Possiamo pertanto
riscrivere la (6.72)
v A (P ) = v A (O′ ) + (ω ′ + ω) ∧ (P − O′ ) ,
31 Con
O ′ si è ovviamente indicato l’origine di S ′ , e si è usata la notazione v R (O ′ ) per evidenziare che
·
questa è la velocità di O ′ valutata dall’osservatore S, cioè v R (O ′ ) = (O − O ′ ).
252
LEZIONI DI SISTEMI DINAMICI
che ci dice che il sistema S ′ compie rispetto a Σ un moto rigido di velocità angolare
(ω ′ + ω). Quindi nella composizione di due moti rigidi, le velocità angolari si
sommano. Lo stesso vale se si compongono tre o più moti rigidi.
Un’applicazione immediata della formula di addizione delle velocità angolari si ha
in un metodo per la determinazione di ω a partire dagli angoli di Eulero (metodo diverso da quello illustrato nella parte conclusiva del paragrafo 6.4). Da come abbiamo
definito gli angoli di Eulero (v. sezione 6.4) risulta chiaro che la generica trasformazione che porta Σ′ a coincidere con S è ottenuta tramite le tre rotazioni consecutive: (i)
rotazione di ψ attorno all’asse e3 (cioè l’asse ζ del SdR Σ′ ); (ii) rotazione di θ attorno
alla linea dei nodi il cui versore è n; (iii) rotazione di φ attorno all’asse z (asse k del
SdR S). Ricordando la forma della velocità angolare in una rotazione, ovvero la (6.49),
e utilizzando l’addizione delle velocità angolari, si ha la semplice espressione
ω = ψ̇ e3 + θ̇ n + φ̇ k .
(6.73)
La (6.73) è però un’espressione “ibrida” perché non ci dà le componenti di ω né nel
sistema Σ, né nel sistema S. La (6.73) ha un altro difetto: mentre n è perpendicolare32
sia a e3 che a k, questi ultimi due versori non sono in genere perpendicolari tra loro,
quindi il modulo di ω non può essere ottenuto da (6.73) semplicemente sommando
i quadrati di ψ̇, θ̇, e φ̇. E’ tuttavia facile ottenere l’espressione di ω in entrambi i
riferimenti Σ e S, osservando che
n = cos ψ e1 + sin ψ e2 ,
n = cos φi − sin φ j,
k
e3
= sin θ (sin ψ e1 − cos ψ e2 ) + cos θ e3 ,
= sin θ (sin φ i + cos φ j) + cos θ k.
Si ottengono così le formule (6.55) e (6.56).
Esempio 6.8.1 La formula della composizione delle velocità angolare è estremamente utile quando si deve calcolare la velocità angolare di moti rigidi tridimensionali.
Riprendendo l’esempio 4.1.3, dimostriamo la formula (4.19) facendo uso del metodo
della composizione della velocità angolare.
Riferendoci alla figura 6.10, denotiamo con Σ : {Ω, x, y, z} il sistema di riferimento fisso. Consideriamo il SdR S : {O, X, Y, Z} solidale con il vettore (Q − O).
Tale SdR ruota attorno all’asse z ≡ Z, e quindi la velocità angolare di S rispetto
a Σ è ω 1 = θ̇ez . Consideriamo poi il SdR solidale con il disco che rotola, cioè
S ′ : {Q, X ′ , Y ′ , Z ′ }. Quest’ultimo ruota attorno all’asse X ≡ X ′ e quindi la sua
velocità angolare rispetto ad S è ω2 = ϕ̇eX ′ . La velocità angolare del SdR solidale
S ′ rispetto al SdR fisso Σ (e dunque la velocità angolare del disco rigido rispetto a Σ)
è quindi
ω = ω 1 +ω 2 = ϕ̇eX ′ + θ̇ez ,
che possiamo esprimere sia nel SdR Σ che nel SdR solidale S ′ o, eventualmente, nel
SdR “semisolidale” S. Se decidiamo di esprimere ω in Σ, allora otteniamo la (4.19)
siccome
eX ′ ≡ eX = cos θex + sin θey .
32 Ricordiamo che la linea dei nodi è l’intersezione dei piani (ξ, η) e (x, y), e quindi è ortogonale sia
all’asse z, che all’asse ζ.
CINEMATICA DEI SISTEMI RIGIDI
253
_
z_ Z
Y
y
O
ϕ
Z’
_
X _ X’
Q
Ω
θ
Y’
x
Figura 6.10: {Ω, x, y, z} è il SdR fisso Σ. Il sistema di riferimento solidale con il disco
che rotola è {Q, X ′ , Y ′ , Z ′ }.
Viceversa se decidiamo di esprimere ω nel SdR solidale S ′ , allora dobbiamo esprimere
ez nel SdR solidale S ′ . Guardando la figura 6.10 è facile rendersi conto che
ez = cos ϕeZ ′ − sin ϕeY ′ ,
per cui
ω = ϕ̇eX ′ − θ̇ sin ϕeY ′ + θ̇ cos ϕeZ ′ .
(6.74)
6.9 Cinematica relativa: l’accelerazione
Vediamo infine come viene giudicata da due osservatori diversi l’accelerazione di un
punto in movimento rispetto a entrambi. Per trovare la relazione che lega le due accelerazioni, basta derivare la formula (6.67) che lega la velocità relativa alla velocità
assoluta tenendo presente che l’accelerazione giudicata da Σ (che chiameremo assoluta) è la derivata in Σ della velocità giudicata da Σ, mentre l’accelerazione giudicata da
S (che chiameremo relativa) è la derivata in S della velocità giudicata da S
Avremo quindi che l’accelerazione del punto P “misurata” dall’osservatore Σ è
d
d
aA (P ) =
v A (P )
[v A (O) + ω ∧ (P − O) + v R (P )] .
=
(6.75)
dt
A (6.67) dt
A
Calcoliamo la derivata a secondo membro
d
d
d
v A (O) + ω ∧ (P − O) + v R (P ) ,
aA (P ) =
dt
dt
dt
A
A
A
254
LEZIONI DI SISTEMI DINAMICI
utilizzando la formula di Poisson (6.69) per il secondo e terzo addendo. Il primo addenso è chiaramente l’accelerazione del punto O giudicata dall’osservatore Σ. Otteniamo
dunque:
d
•
v A (O) = aA (O), accelerazione del punto O rispetto al SdR Σ;
dt
A
d
d
v R (P ) = ω ∧v R (P )+ v R (P ) = ω ∧v R (P )+ aR (P ), dove aR (P )
•
dt
dt
A
R
è l’accelerazione di P valutata dall’osservatore S;
d
d
d
ω ∧ (P − O) =
ω ∧ (P − O) + ω ∧ (P − O) . La derivata di ω,
•
dt
dt A
dt
A
A
d
valutata dall’osservatore Σ, viene denotata con ω̇, cioè ω̇ =
ω . Abbiamo
dt A
quindi
d
d
ω ∧ (P − O)
= ω̇ ∧ (P − O) + ω ∧ (P − O)
dt
dt
A
A
= ω̇ ∧ (P − O) + ω ∧ [ω ∧ (P − O) + v R (P )] .
Possiamo riunire tutti i “pezzi” e otteniamo il legame cercato tra le due accelerazioni
aA (P ) = aR (P )+aA (O)+ ω̇ ∧(P −O)+ω∧(ω ∧ (P − O))+2 ω∧v R (P ). (6.76)
La (6.76) va letta osservando che il secondo, terzo e quarto termine della somma
sono presenti anche quando il punto P è fermo rispetto ad S; per questa ragione la
loro somma prende il nome di accelerazione di trascinamento, aT (P ). Infine il termine
2 ω ∧ v R (P ), indicato generalmente con il simbolo aC (P ), è dovuto alla correzione
necessaria per il diverso modo che hanno i due osservatori di giudicare sia la variazione
della velocità relativa sia la variazione della velocità di trascinamento. Questo termine
prende il nome di accelerazione complementare o accelerazione di Coriolis33 . La
(6.76) si può quindi scrive nella forma compatta
aA = aR + aT + aC .
(6.77)
L’importanza di questa relazione è dovuta al fatto che molto spesso i fenomeni meccanici sono osservati da sistemi di riferimento non inerziali. Esempi noti sono la deviazione dalla verticale nella caduta di un grave34 , la deviazione dalla direzione dei
meridiani dei venti alisei e il moto del pendolo di Foucault.
33 Gaspard-Gustave
de Coriolis (Parigi, 1792 – Parigi, 1843) matematico, fisico e ingegnere francese.
noti che nella direzione della verticale, che è quella del filo a piombo, è compresa oltre alla forza
di gravità, un termine centrifugo dovuto all’accelerazione di trascinamento della terra. Quando un grave
cade, il termine di accelerazione complementare fa deviare la sua traiettoria dalla verticale. Se si guarda
al fenomeno dal punto di vista di un osservatore posto al di fuori della terra, questa deviazione è l’ovvia
conseguenza del fatto che nel tempo impiegato nella caduta, l’osservatore (la terra) ha ruotato spostando il
piede della verticale del punto di partenza verso oriente. L’osservatore solidale con la terra vedrà quindi
deviare il grave verso occidente. Tuttavia questo effetto è molto piccolo, e praticamente inosservabile, nella
caduta di un grave da altezza ordinarie.
34 Si
Capitolo 7
Dinamica dei Sistemi Rigidi
Abbiamo già visto nel capitolo 6 che un sistema di punti (Pk , mk ), è detto rigido se è
tenuto a rispettare (oltre a eventuali altri vincoli) il vincoli di rigidità, cioè
2
|Pi − Pj | = d2ij , ∀ i �= j, con dij costante nel tempo.
(7.1)
Sempre nel capitolo dedicato alla cinematica abbiamo osservato che, se il sistema possiede almeno tre punti non allineati, allora le sue configurazioni sono in corrispondenza
uno a uno con le posizioni che un sistema di riferimento ortonormale (solidale) può
assumere rispetto a un altro sistema di riferimento ortogonale (fisso).
Un’importante conseguenza è che, almeno dal punto di vista cinematico, non ci
sono differenze nella descrizioni del moto di un sistema rigido “discreto”, cioè formato
da un numero finito di punti materiali, e un corpo rigido continuo1 . In quello che
segue tratteremo il problema della dinamica di un sistema rigido discreto. Le equazioni
di moto che ricaveremo saranno però facilmente “adattabili” al caso continuo. Esse
saranno quindi adottate come modello per la dinamica dei corpi rigidi continui.
Il vincolo di rigidità, che, come visto nell’esempio 5.2.1, è liscio, è mantenuto da
opportune forze (o reazioni) vincolari che risultano incognite. In questo capitolo ricaveremo una coppia equazioni vettoriali, dette prima equazione cardinale e seconda
equazione cardinale, che non contengono le forze vincolari interne relative al vincolo
di rigidità. Per la precisione le equazioni cardinali sono valide anche per sistemi non
rigidi. La loro caratteristica è proprio quella che in esse non compaiono le forze interne
al sistema ma soltanto le forze esterne (daremo più avanti la definizione di forze interne
ed esterne).
Vedremo poi che, nel caso di sistemi rigidi, la seconda equazione cardinale acquista
una struttura particolare a causa della particolare forma della velocità dei punti di un
corpo rigido (si veda il paragrafo 6.3 del capitolo 6).
Concludiamo sottolineando una proprietà fondamentale delle equazioni cardinali
che verrà dimostrata in questo capitolo: proveremo che, nel caso di un sistema rigido,
1 Anche se è abbastanza chiaro cosa si debba, intuitivamente, intendere per corpo rigido continuo, è
bene dare una definizione più formale. Diremo che B un corpo continuo se esso occupa una regione C(t),
ed esiste una funzione continua, non negativa ρ(x, y, z, t) di cui C(t) è il supporto al tempo t, ovvero
se ρ(x, y, z, t) > 0 per (x, y, z) ∈ C(t) e nulla altrimenti: la funzione ρ è detta densità di massa, e
rappresenta la massa per unità di volume. Il corpo si dice rigido se esiste un sistema di riferimento in cui la
funzione densità ρ non dipende dal tempo.
256
LEZIONI DI SISTEMI DINAMICI
le due equazioni cardinali formano un sistema di 6 equazioni scalari indipendenti cioè
tante quanti sono i gradi di libertà de sistema (sezione 6.2.3 del capitolo 6). Le due
equazioni cardinali sono quindi sufficienti a determinare la dinamica del corpo rigido
(se, ovviamente, sono note tutte le forze esterne agenti su di esso).
7.1 Il centro di massa
Sia dato in uno spazio affine euclideo A un sistema B di N punti materiali (Pk , mk ),
k = 1, ..., N , (anche non rigido). Si fissa poi un punto O nello spazio A.
Definizione 7.1.1 Si dice centro di massa, o baricentro, del sistema B il punto Po
dato da
N
mk (Pk − O)
k=1
,
(7.2)
(Po − O) =
M
N
dove M =
mk , è la massa totale del sistema.
k=1
Il centro di massa è un’entità puramente concettuale: in generale Po non coincide con
un punto materiale Pk di B. Tuttavia Po , pur non coincidendo in generale con alcun
punto materiale, è una quantità intrinseca di B: dipende cioè soltanto dalla struttura
geometrico-materiale del sistema. Vale infatti la seguente
Proposizione 7.1.1 Il centro di massa Po non dipende dalla scelta del punto O.
Dim. Per dimostrare la proposizione dobbiamo fare vedere in pratica che, scegliendo
un punto O′ �= O, il vettore che si ottiene applicando la definizione (7.2), cioè
(Po′ − O′ ) =
N
k=1
mk (Pk − O′ )
M
,
identifica lo stesso punto Po .
Riferendoci alla figura 7.1, per provare che Po′ ≡ Po , dobbiamo mostrare che
(Po′ − O′ ) + (O′ − O) = (Po − O) .
(7.3)
Partendo dalla (7.2) abbiamo
(Po − O)
=
N
N
1
1
mk (Pk − O) =
mk [(Pk − O′ ) + (O′ − O)]
M
M
k=1
=
1
M
N
k=1
k=1
mk (Pk − O′ ) +
(Po′ −O′ )
= (Po′ − O′ ) + (O′ − O) ,
cioè la (7.3).
N
1
mk (O′ − O)
M
k=1
N
1
′
k=1 mk )(O −O)
M(
DINAMICA SISTEMI RIGIDI
257
B
O
Po
O’
Figura 7.1: Il sistema materiale B, ed il centro di massa Po , che, in questo caso, non
coincide con alcun punto di B.
Una diretta conseguenza di tale proposizione è che, ai fini del calcolo di Po , conviene
porsi nel sistema di riferimento dove i calcoli sono i più semplici possibili. Quindi,
se B è un corpo rigido conviene sempre considerare un sistema di riferimento solidale
con il corpo.
Un’altra proprietà utile ai fini del calcolo è l’additività rispetto alle masse, ovvero
la proprietà distributiva. Supponiamo di dividere B in due parti B1 , B2 disgiunte, cioè
B = B1 ∪ B2 , con B1 ∩ B2 = ∅. Quindi se B1 = {(Pk , mk ) : k = 1, ... N1 }, tale
N 1
che M1 =
mk è la massa parziale di B1 , e B2 = {(Pk , mk ) : k = N1 + 1, ...,
k=1
N
N }, con M2 =
mk , abbiamo, con evidente significato dei simboli
k=N1 +1
(Po − O)
=
=
N
1
mk (Pk − O)
M
k=1
N
1
1
mk (Pk − O) +
M
k=1
N
k=N1 +1
mk (Pk − O)
1
[M1 (Po, B1 − O) + M2 (Po, B2 − O)] .
M
Il centro di massa dell’intero sistema B coincide quindi col centro di massa dei due
punti materiali Po, B1 e Po, B2 , aventi masse M1 e M2 , che, a loro volta, sono i centri
=
258
LEZIONI DI SISTEMI DINAMICI
di massa “parziali” dei sottosistemi B1 e B2 . Evidentemente tale procedura si può generalizzare, supponendo di suddividere B in L sottosistemi Bi , i = 1, ..., L, disgiunti
di masse Mi . Avremo quindi
(Po − O) =
L
1
Mi (Po, Bi − O) .
M i=1
Nota 7.1.1 Se B è un corpo rigido continuo e C(t) è la regione da esso occupata, il
centro di massa di B è così definito
1
1
xPo =
x dm =
x ρ (x) dV ,
M C(t)
M C(t)
dove:
• x è il vettore posizione del generico punto di C(t);
• dm è la misura di massa che viene espressa come ρ dV , con ρ massa per unità
di volume (densità di massa) e dV misura di volume.
La massa totale del corpo è
M=
Introduciamo la seguente
dm =
C(t)
ρ (x) dV.
C(t)
Definizione 7.1.2 Siano v k , k = 1, ..., N , le velocità dei punti materiali di B rispetto
ad un dato SdR S. Si dice velocità del centro di massa rispetto ad S, il vettore
v (Po ) =
N
1
mk v k .
M
(7.4)
k=1
·
Talvolta v (Po ), viene anche denotato con (Po − O). Inoltre il vettore
K = M v (Po ) =
N
mk v k ,
(7.5)
k=1
viene detto quantità di moto, o momento lineare, o anche semplicemente momento,
del sistema di B rispetto al SdR S.
Concludiamo osservando che, nel caso in cui le masse degli N punti materiali del
sistema siano costanti nel tempo, abbiamo
N
N
k=1
k=1
dK
dv k
=
=
mk
mk ak ,
dt
dt
(7.6)
dove ak denota l’accelerazione del k-esimo punto di B rispetto al SdR S. In particolare, se definiamo l’accelerazione del centro di massa rispetto al SdR S, come
··
1 N
a (Po ) = (Po − O) =
mk ak , la (7.6) si può scrive come
k=1
M
dK
= M a (Po ) .
dt
DINAMICA SISTEMI RIGIDI
259
7.2 Il momento angolare
Consideriamo un sistema B di N punti materiali (non necessariamente rigido) ed un
generico punto Q (non necessariamente coincidente con un punto materiale del sistema). Adesso, seguendo la procedura della sezione 1.5.2, consideriamo il sistema di
vettori applicati
S = {(Pk , v k ) ∈ A × V : k = 1, ...., N } ,
dove v k , k = 1, ..., N , è la velocità del punto Pk , si introduce il momento del sistema
rispetto al polo, o centro di riduzione, Q, che, in questo specifico caso viene detto
momento angolare. Abbiamo cioè la seguente
Definizione 7.2.1 Si dice momento angolare, o momento della quantità di moto, del
sistema B rispetto al centro di riduzione Q, il vettore
L (Q) =
N
k=1
(7.7)
mk (Pk − Q) ∧ v k .
Il punto Q viene talvolta anche detto polo.
A differenza del centro di massa, il momento angolare L (Q) dipende dalla struttura geometrico-materiale del sistema B, ma anche dal centro di riduzione. Se infatti
consideriamo D �= Q, abbiamo
L (D) =
N
k=1
mk (Pk − D) ∧ v k ,
che, in generale, è diverso da L (Q). Infatti
L (D)
=
N
k=1
=
N
k=1
mk (Pk − D) ∧ v k =
mk (Pk − Q) ∧ v k +
L(Q)
Quindi, ricordando la (7.5), abbiamo
N
k=1
N
k=1
mk [(Pk − Q) + (Q − D)] ∧ v k
mk (Q − D) ∧ v k .
(Q−D)∧
N
k=1
mk v k
L (D) = L (Q) + (Q − D) ∧ K ,
che altro non è che la (1.20), già incontrata nella sezione 1.5.2. Quindi L (D) = L (Q),
soltanto se (Q − D) e K sono paralleli oppure la velocità del centro di massa è nulla,
sì che K = 0.
7.3 Geometria delle masse
In questa sezione verrà introdotto il momento d’inerzia ed altri concetti ad esso collegati. Verranno poi presentati alcuni esempi riguardanti il calcolo di momenti d’inerzia,
260
LEZIONI DI SISTEMI DINAMICI
la determinazione della terna principale d’inerzia e proprietà della matrice d’inerzia.
L’applicazione di queste grandezze alla dinamica dei sistemi rigidi verrà presentata
nelle sezione 7.6 ed in quelle successive.
7.3.1 Momenti d’inerzia
Sia B un sistema di N punti materiali (Pi , mi ) , i = 1, 2, ..., N .
Definizione 7.3.1 Data una retta r, il cui versore è er , passante per il punto Q, la
grandezza
N
Ir (Q) =
mi [(Pi − Q) ∧ er ]2 ,
i=1
si dice momento d’inerzia del sistema B rispetto ad r.
Riferendosi alla figura 7.2, [(Pi − Q) ∧ er ]2 , rappresenta la distanza al quadrato di Pi
2
dalla retta r passante per Q (il segmento Pi Ri ). Pertanto, la definizione è indipendente dalla scelta del punto Q ∈ r.
E’ facile vedere che Ir (Q) > 0, e Ir (Q) = 0 soltanto nel caso particolare in cui
tutti i punti Pi giacciono sulla retta r.
Nel caso di un sistema continuo che occupa un dominio D, la somma si sostituisce
con l’integrale, ovvero
2
2
Ir (Q) =
[(P − Q) ∧ er ] dm =
[(P − Q) ∧ er ] ρdV,
D
D
dove, come nell’osservazione 7.1.1, dm è la misura di massa che viene espressa come
ρdV , con ρ densità di massa e dV misura di volume.
Definizione 7.3.2 Siano dati due piani π1 e π2 non paralleli, i cui versori normali
sono eπ1 e eπ2 . Sia r la retta tale che r = π1 ∩ π2 , e sia Q un punto di r. Si definisce
il momento d’inerzia di B rispetto ai piani π1 e π2 come
Iπ1 π2 (Q) = −
N
i=1
mi [(Pi − Q) · eπ1 ] [(Pi − Q) · eπ2 ] .
Analogamente alla definizione di Ir (Q), è facile dimostrare che Iπ1 π2 (Q) non dipende dalla scelta del punto Q su r. Infatti, [(Pi − Q) · eπ1 ] (e allo steso modo anche
[(Pi − Q) · eπ2 ]) rappresenta la “quota” (che può essere quindi positiva, negativa o
nulla) del punto Pi rispetto a π1 .
Come nel caso precedente, se il sistema è continuo la somma andrà sostituita con
un integrale (definito sul dominio D occupato da B) che, al solito, farà intervenire
ρdV .
Teorema 7.3.1 (Teorema di Huygens) Sia dato un sistema di punti N materiali B di
cui Po è il centro di massa. Si ha
2
Ir (Q) = IrPo (Po ) + M [(Po − Q) ∧ er ] ,
(7.8)
DINAMICA SISTEMI RIGIDI
[(P − Q ) ∧ er ]
261
= P Q sin θ = P R
Figura 7.2: Retta r e distanza di Pi da r.
e
Iπ1 π2 (Q) = Iπ1,Po π2,Po (Po ) − M [(Po − Q) · eπ1 ] [(Po − Q) · eπ2 ] ,
(7.9)
dove con rPo si intende una retta parallela ad r, passante per Po , e con π1,Po , π2,Po i
due piani, paralleli rispettivamente a π1 e π2 , la cui retta d’intersezione passa per Po .
Dim. Si nota che (7.8) si può anche scrivere come
Ir (Q) = IrPo (Po ) + M d2 ,
essendo d la distanza fra le retta r e la retta rPo , ovvero d = |(Po − Q)) ∧ er | .
262
LEZIONI DI SISTEMI DINAMICI
Ricordando la definizione di centro di massa (7.2), abbiamo
N
Ir (Q) =
2
mi [(Pi − Q) ∧ er ] =
i=1
N
=
2
mi [(Pi − Po ) ∧ er ] +
i=1
IrP (Po )
o
+2
N
i=1
N
i=1
mi [((Pi − Po ) + (Po − Q)) ∧ er ]
N
2
2
mi [(Po − Q)) ∧ er ] +
i=1
d2
M
mi [(Pi − Po ) ∧ er ]
· [(Po − Q)) ∧ er ] .
L’ultimo termine si annulla per definizione di centro di massa,
N
N
mi [(Pi − Po ) ∧ er ] =
mi [(Pi − O) − (Po − O)] ∧ er
i=1
=
i=1
N
i=1
mi (Pi − O) ∧ er −
M(Po −O)∧er
N
mi
i=1
M
(Po − O) ∧ er = 0.
La prima parte del teorema è così dimostrata.
La (7.9) si dimostra con la stessa tecnica, tenendo cioè conto del fatto che
N
i=1
mi (Pi − Po ) = 0.
Abbiamo infatti
Iπ1 π2 (Q) = −
=−
N
i=1
N
i=1
mi [(Pi − Q) · eπ1 ] [(Pi − Q) · eπ2 ]
mi [((Pi − Po ) + (Po − Q)) · eπ1 ] [(Pi − Po ) + (Po − Q)) · eπ2 ]
= Iπ1,Po π2,Po (Po ) − M [(Po − Q) · eπ1 ] [(Po − Q) · eπ2 ] .
Vediamo adesso alcune proprietà dei momenti d’inerzia.
Proposizione 7.3.1 Sia B un sistema materiale di N punti e sia {e1 , e2 , e3 } una
terna cartesiana ortogonale centrata in Q. Se Ii (Q), i = 1, 2, 3, denota il momento
d’inerzia rispetto all’asse ei (passante per Q), allora
I1 (Q) + I2 (Q) + I3 (Q) = 2
N
i=1
2
mi |Pi − Q| .
DINAMICA SISTEMI RIGIDI
263
Dim. Il generico punto Pi è individuato dal vettore (Pi − Q), che nella terna { e1 , e3 , e3 }
è rappresentato da
Pi − Q = xi e1 + yi e2 + zi e3 .
Applicando la definizione 7.3.1, abbiamo
N
i=1
N
N
N
mi yi2 + zi2 +
mi x2i + zi2 +
mi x2i + yi2 = 2
mi x2i + yi2 + zi2 .
I1 (Q)
i=1
i=1
I2 (Q)
I3 (Q)
i=1
N
2
i=1 mi |Pi −Q|
(7.10)
Nota 7.3.1 Osserviamo che, anche considerando un’altra terna { e′1 , e′2 , e′3 }, sempre
centrata in Q ma diversa da { e1 , e2 , e3 } (sì che il vettore (Pi − Q) non è più rappresentato da (xi , yi , zi ) ma, per esempio, da (x′i , yi′ , zi′ )), la relazione (7.10) continuerà a
2
valere. Infatti, il secondo membro della (7.10) sarà sempre dato da N
i=1 mi |Pi − Q| .
Corollario 7.3.1 Se B giace su un piano π, e Q sta nel medesimo piano, allora, data
una generica terna ortonormale con, e3 ortogonale a π, si ha
I3 (Q) = I1 (Q) + I2 (Q)
Dim. Si procede come nel caso precedente, supponendo, senza perdere di generalità,
che zi = 0, per ogni i = 1, 2, ..., N .
Nota 7.3.2 Vogliamo rimarcare una proprietà importante dei momenti d’inerzia: la
proprietà distributiva. Come già visto per il centro di massa, se il sistema B è composto da due sottosistemi B1 e B2 , tali che B1 ∩ B2 = ∅, e B1 ∪ B2 = B, allora,
definendo con IrBi (Q), IπB1i,π2 (Q) , i = 1, 2, i momenti d’inerzia dei sottosistemi Bi ,
abbiamo
Ir (Q) =
Iπ1 ,π2 (Q) =
IrS1 (Q) + IrS2 (Q) ,
(7.11)
IπS11,π2 (Q) + IπS11,π2 (Q) .
(7.12)
Evidentemente la (7.11) e la (7.12) si generalizzano banalmente al caso in cui B sia
composto non solo da 2 ma n > 2 sottosistemi disgiunti e tali che la loro unione dia
B.
7.3.2 Omografia d’inerzia, matrice d’inerzia e terna principale d’inerzia
In questa sezione vogliamo analizzare come varia il momento d’inerzia al variare del
versore er di una retta uscente dal punto Q. Mostreremo che esiste un’applicazione
lineare che consente di calcolare Ir (Q) come forma bilineare.
264
LEZIONI DI SISTEMI DINAMICI
Definizione 7.3.3 Sia dato un sistema di N punti materiali e sia dato un punto Q. Sia
poi V lo spazio vettoriale definito sullo spazio affine. Su V si definisce il seguente
operatore lineare, detto omografia d’inerzia,
σ (Q) : V → V
che opera così,
σ(Q)
v ∈ V −→ σ (Q) v =
N
i=1
mi (Pi − Q) ∧ [v ∧ (Pi − Q)] .
(7.13)
Si osserva che in base alla nota formula del calcolo vettoriale
a ∧ (b ∧ c) = b (a · c) − c (a · b) ,
σ (Q) può anche essere così definito
σ (Q) v =
N
i=1
2
mi |Pi − Q| v − (v · (Pi − Q)) (Pi − Q) .
(7.14)
Proposizione 7.3.2 L’operatore σ (Q) gode delle seguenti proprietà:
2
1. v · σ (Q) v = Iv (Q) | v| , dove Iv (Q) è il momento d’inerzia rispetto alla retta
passante per Q parallela a v.
2. Se u e v sono due vettori non paralleli
u · σ (Q) v = Iπv πu (Q) | v | | u | +
i
mi |Pi − Q|2 u · v,
dove Iπv πu (Q) è il momento d’inerzia rispetto ai due piani πv , e πu , rispettivamente ortogonali a u e v, la cui retta d’intersezione passa per Q.
Dim. La dimostrazione dei punti 1 e 2 si effettua facilmente sfruttando la formula (7.14). Infatti, per quanto riguarda il punto 1, ricordando che v · (Pi − Q) =
|v| |Pi − Q| cos θi , essendo θi l’angolo fra (Pi − Q) e v, si ha
v · σ (Q) v
=
N
i=1
=
2
mi |Pi − Q| | v |
N
i=1
2
1 − cos2 θi
mi [(Pi − Q) ∧ ev ]
Iev (Q)
sin2 θi
2
2
| v| ,
dove ev vettore unitario parallelo a v.
Analogamente, partendo dalla (7.14) e ricordando la definizione 2, il punto 2 è
facilmente dimostrabile.
DINAMICA SISTEMI RIGIDI
265
La conseguenza della proposizione 7.3.2 è la seguente: σ (Q) definisce una forma
bilineare simmetrica definita positiva. La simmetria è banale da dimostrare come il
fatto che v · σ (Q) v > 0, se v �= 0, e che v · σ (Q) v = 0, solo se v = 0 (si esclude
qui il particolarissimo caso in cui i punti di B giacciono sulla retta passante per Q e
parallela al vettore v). Inoltre, il significato della forma è chiaro: se er è il vettore della
retta passante per Q, la quantità er · σ (Q) er è il momento d’inerzia del sistema B
rispetto a tale retta.
Data adesso una terna ortonormale S : {e1 , e3 , e3 }, centrata in Q, possiamo rappresentare σ (Q) tramite la matrice simmetrica IQ
I11
IQ = I12
I13
I12
I33
I23
I13
I23
I33
i cui elementi si determinano così
Ijk = ej · σ (Q) ek ,
j, k = 1, 2, 3.
Evidentemente, gli elementi Iij della matrice, detta matrice d’inerzia, o tensore
d’inerzia, dipendono dalla particolare terna scelta. Pertanto, se il generico vettore
(Pi − Q) si rappresenta nel SdR S come
Pi − Q = xi e1 + yi e2 + zi e3 ,
(7.15)
la matrice IQ assumerà (rispetto ad S) questa forma
� 2
�
�
�
2
m
+
z
m
x
y
−
m
x
z
y
−
i
i
i
i
i
i
i
i
i
i
i
�
�
�
�
�
2
2
.
− �i mi xi yi
im
�i xi + zi
�− i�m2i zi yi2 �
− i mi xi zi
− i mi z i y i
m
+
y
x
i
i
i
i
�
IQ =
i
(7.16)
Gli elementi diagonali Iii sono i momenti di inerzia rispetto agli assi x, y e z rispettivamente, e gli elementi extra-diagonali sono detti momenti deviatori rispetto alle coppie
di piani {x = 0 , y = 0}, {x = 0 , z = 0} e {y = 0 , z = 0}.
Notiamo che se invece di S avessimo considerato un’altra terna ortonormale S ′ :
{e1′ , e3′ , e3′ }, sempre centrata in Q, avremmo ottenuto un’altra matrice I′Q , che rappresenta l’operatore σ (Q) rispetto S ′ . In particolare, le matrici I′Q e IQ sono legate
da
IQ = BI′Q BT ,
(7.17)
dove B è la matrice ortogonale (cioè BT = B−1 ) del cambio di base da S ′ in S, definita
nella sezione 1.3. Infatti, ricordando la (1.10) abbiamo
ei =
3
�
j=1
bij e′j ,
i = 1, 2, 3 ,
266
LEZIONI DI SISTEMI DINAMICI
dove2 bij , è l’elemento i, j della matrice B la cui forma generale è data dalla (1.12).
Otteniamo dunque
�
�
� 3
� 3
�
�
′
′
ei · σ (Q) ej =
bjs es
bik ek · σ (Q)
�
��
�
s=1
k=1
(IQ )ij
=
=
3
3 �
�
bik (e′k · σ (Q) e′s ) bjs
�
��
�
k=1 s=1
(I′Q )ks
3 �
3
�
k=1 s=1
� �
bik I′Q ks bT
sj ,
ovvero la (7.17).
Data la proprietà di simmetria di IQ (che ovviamente discende dalla simmetria di
σ (Q)), è possibile determinare una particolare terna ortonormale, detta terna principale d’inerzia, rispetto alla quale la matrice d’inerzia è diagonale, ovvero
I1 0 0
IQ = 0 I2 0 .
0 0 I3
I versori che costituiscono la terna principale d’inerzia (centrata in Q) sono detti assi
principali d’inerzia, ed i momenti I1 , I2 , I3 , momenti principali d’inerzia.
I vettori unitari ei , i = 1, 2, 3, della terna principale d’inerzia, sono gli autovettori
dell’operatore σ (Q). Infatti, se un generico vettore v è parallelo ad una autovettore di
σ, allora viene “trasportato” da σ (Q) in un altro vettore, σ (Q) v, parallelo a v stesso,
ovvero
σ (Q) v = Ii v,
con l’evidente significato del momento Ii : l’autovalore corrispondente all’autovettore
ei .
La determinazione della terna principale d’inerzia si fa diagonalizzando IQ , ovvero
ricercando gli autovettori di IQ stessa. Tale procedimento può essere talvolta lungo.
Si preferisce allora seguire (quando possibile) alcune “scorciatoie” che permettono di
individuare subito una terna principale d’inerzia a partire dalle proprietà geometricomateriali del sistema di punti materiali B.
Nota 7.3.3 E’ interessante osservare che si può giungere alla matrice (7.16) partendo direttamente dalla definizione (7.13). Selezioniamo infatti un SdR dove il vettore
(Pi − Q) è dato dalla (7.15) e dove dove v = v1 e1 + v2 e2 + v3 e3 . Utilizziamo poi
l’espressione matriciale del prodotto vettoriale vista nella sezione 6.3, cioè
v1
0
zi −yi
0
xi v2 .
v ∧ (Pi − Q) = − (Pi − Q) ∧ v = − −zi
yi −xi
0
v3
2 Dalla
(1.11) si ha bij = ei · e′j , i, j = 1, 2, 3.
DINAMICA SISTEMI RIGIDI
267
Scrivendo quindi esplicitamente la (7.16) si ottiene
N
0
zi
0
zi −yi
�
0
xi −zi
0
mi −zi
σ (Q) v = −
ι=1
yi −xi
0
yi −xi
2
N
−xi zi
yi + zi2 −xi yi
v1
�
mi −xi yi x2i + zi2 −yi zi v2 .
=
ι=1
−xi zi
−yi zi x2i + yi2
v3
��
�
�
v1
−yi
xi v2
0
v3
IQ
Nota 7.3.4 Sia data la terna ortonormale S : { e1 , e3 , e3 }, tale che e3 , per esempio, è
asse principale d’inerzia, allora I13 = I23 = 0. Viceversa, se IQ è la matrice d’inerzia
rispetto a S, ed è tale che I13 = I23 = 0, allora l’asse e3 è asse principale d’inerzia.
La dimostrazione di tali affermazioni è molto semplice. Infatti se e3 è asse principale
d’inerzia, allora IQ e3 = I3 e3 ovvero
0
0
IQ 0 = 0 .
1
I3
I11
Del resto, in generale, IQ = I12
I13
I11
I12
I13
I12
I33
I23
I12
I33
I23
I13
I23 . Avremo quindi
I33
I13
0
I13
I23 0 = I23 ,
1
I33
I33
da cui, per banale confronto, discende I13 = I23
I11 I12
IQ = I12 I33
0
0
= 0. Se invece IQ ha questa forma
0
0 ,
I33
applicando IQ ad ogni vettore del tipo βe3 (parallelo all’asse e3 )
I11 I12 0
0
0
I12 I33 0 0 = 0 = I33 βe3 ,
β
I33 β
0
0 I33
si ottiene un vettore ancora parallelo ad e3 . L’asse e3 è dunque asse principale d’inerzia. Evidentemente, tale ragionamento resta valido anche se, invece dell’asse e3 ,
avessimo scelto l’asse e1 , oppure l’asse e2 .
Definizione 7.3.4 Dato un sistema B di N punti materiali, un piano π si dice piano di
simmetria materiale se per ogni punto materiale Pi , ne esiste un altro, avente la stessa
massa, disposto in posizione simmetrica rispetto a π.
268
LEZIONI DI SISTEMI DINAMICI
Proposizione 7.3.3 Sia B un sistema di punti materiali e sia π un piano di simmetria
materiale. Sia inoltre Q un qualsiasi punto di π. Allora una retta passante per Q e
perpendicolare a π, è asse principale d’inerzia
Dim. Consideriamo una generica terna ortonormale S : {e1 , e3 , e3 }, centrata in Q,
con e3 , perpendicolare al piano che, senza perdere in generalità, sarà dato da z = 0.
Rifacendosi alla nota 7.3.4, per provare che e3 è asse principale d’inerzia, è sufficiente
mostrare che I23 = I13 = 0. Se Pi − Q = xi e1 + yi e2 + zi e3 , possiamo raggruppare
i primi N/2 punti come quelli caratterizzati da zi ≤ 0, e i rimanenti N/2 come i
loro simmetrici (la cui coordinata rispetto ad e3 è −zi ). Quindi, ricordando la (7.16),
abbiamo
N/2
I13 =
�
i=1
N/2
mi xi (zi − zi ) = 0, e I23 =
�
i=1
mi yi (zi − zi ) = 0.
Corollario 7.3.2 Se B è un sistema piano (tutti i punti giacciono su un piano) allora
una retta perpendicolare al piano è asse principale d’inerzia.
Dim. Possiamo considerare, senza perdere di generalità, che zi = 0, ∀ i = 1, 2, ...N
(il sistema giace sul piano z = 0). Procedendo come nella dimostrazione della proposizione 7.3.3, si ottiene I13 = I23 = 0. La retta e3 (retta perpendicolare al piano su cui
giace il sistema) è asse principale d’inerzia.
Proposizione 7.3.4 Sia SPo : {e1 , e3 , e3 } una terna principale d’inerzia centrata in
Po , centro di massa di B. Dato un qualsiasi punto A appartenente ad uno degli assi
di S (ovvero (A − Po ) parallelo a e1 , oppure ad e2 , oppure ad e3 ), allora la terna
{e1 , e3 , e3 } centrata in A, che si denota con SA , è terna principale d’inerzia.
Dim. Incominciamo col considerare un punto A qualsiasi
(A − Po ) = xA e1 + yA e2 + zA e3 .
Il sistema SPo è terna principale d’inerzia, per cui
I1 0 0
IPo = 0 I2 0 .
0 0 I3
Consideriamo adesso la terna SA centrata in A, e applichiamo il teorema di Huygens
� 2
�
2
−M xA zA
+ zA
−M�xA yA �
I1 + M yA
2
−M xA yA
I2 + M x2A + zA
−M�yA zA � (7.18)
IA =
2
−M xA zA
−M yA zA
I3 + M x2A + yA
Quindi, se, per esempio, A giace sull’asse e1 (sì che yA = zA = 0), avremo IA
diagonale, come del resto se A giace sull’asse e2 o sull’asse e3 .
DINAMICA SISTEMI RIGIDI
269
7.3.3 Ellissoide d’inerzia
Sia dato il sistema di punti materiali B. Fissata una generica direzione individuata dal
versore w, | w | = 1, il momento d’inerzia di S rispetto alla retta avente direzione w,
passante per Q, è dato da (proposizione 7.3.2, punto 1)
(7.19)
Iw (Q) = w · σ w.
1
Consideriamo adesso il vettore W parallelo a w, dato da W = �
w. EvidenIw (Q)
1
temente | W | = �
. Dalla (7.19) abbiamo
Iw (Q)
W · σ W = 1.
Fissiamo una generica terna ortonormale SQ : { e1 , e3 , e3 }, centrata in Q. Rispetto a
SQ , il vettore W avrà componenti
(7.20)
W = ξ e1 + η e2 + ζ e3 ,
�
1
ξ 2 + η2 + ζ 2 = �
. Inoltre, sempre rispetto a SQ , l’omografia
Iw (Q)
d’inerzia σ, sarà rappresentata dalla matrice
I11 I12 I13
IQ = I12 I33 I23 .
I13 I23 I33
tali che
Di conseguenza
ξ
I11
1 = W · σ W = η · I12
I13
ζ
ovvero
I12
I33
I23
I13
ξ
I23 η ,
ζ
I33
I11 ξ 2 + I22 η 2 + I3 ζ 2 + 2I12 ξη + 2I13 ξζ + 2I23 ηζ = 1.
(7.21)
L’equazione (7.21) è l’equazione di una superficie (ellissoide), detto ellissoide d’inerzia, centrata in Q. Quindi, data comunque una direzione w, il vettore W =
w
�
, le cui generiche componenti sono specificate dalla (7.20), individua un
Iw (Q)
ben preciso punto geometrico che giace sulla superficie (7.21). E’ ovviamente vero
anche il viceversa. Ad ogni punto A che giace sulla superficie (7.21), e che è individuato da una generica terna (ξ, η, ζ), possiamo associare il vettore W = (A − Q) =
ξ e1 + η e2 + ζ e3 . La norma di tale vettore ha un ben preciso significato fisico
|A − Q| = |W | =
�
1
ξ 2 + η2 + ζ 2 = �
.
Iw (Q)
(7.22)
Ora, i punti che stanno la superficie (7.21), si trovano a varie distanze3 dal centro
Q. In particolare, i due punti che si trovano in corrispondenza dell’asse maggiore
3I
punti si troverebbero tutti alla stessa distanza da Q nel caso in cui l’ellissoide fosse una sfera.
270
LEZIONI DI SISTEMI DINAMICI
sono quelli che si trovano a maggior distanza da Q, ossia quelli per cui |A − Q| =
ξ 2 + η 2 + ζ 2 è la più grande possibile. Allo stesso modo i due punti che stanno
sull’asse minore
sono quelli che si trovano a minor distanza da Q, ossia quelli per cui
|A − Q| = ξ 2 + η 2 + ζ 2 è la più piccola possibile. Detti dunque Amax e Amin i
punti dell’ellissoide che si trovano in corrispondenza dell’asse maggiore e dell’asse
minore, per ogni punto A che giace sull’ellissoide, varrà
|Amin − Q| ≤ |A − Q| ≤ |Amax − Q| .
Ma allora, dalla (7.22), data una generica direzione individuata da w, abbiamo che
ossia
1
≤ |Amax − Q| ,
|Amin − Q| ≤
Iw (Q)
1
|Amax − Q|
≤
Iw (Q) ≤
1
|Amin − Q|
.
Questo vuol dire che il momento d’inerzia di un sistema B rispetto alla retta per Q
avente direzione w, è limitato dall’alto e dal basso. Non solo, ma, fissato Q, al variare
della direzione w, il momento d’inerzia ha un massimo ed un minimo. Il massimo è ottenuto quando la direzione w corrisponde alla direzione dell’asse minore dell’ellissoide
mentre il minimo quando la direzione w è parallela all’asse maggiore dell’ellissoide.
7.3.4 Determinazione della terna principale d’inerzia nel caso di
sistemi piani
Supponiamo che tutti i punti materiali di B giacciano su un piano che, senza perdere
in generalità, può essere il piano z = 0. Fissiamo poi un punto Q (giacente su z = 0)
ed una terna SQ : {e1 , e2 , e3 }, tale che il versore e3 sia perpendicolare al piano z = 0
(e pertanto, corollario 7.3.2, è asse principale d’inerzia). I punti Pi di B avranno
coordinate (Pi − Q) = xi e1 + yi e2 , i = 1, 2, ..., N . Riferendoci sempre a SQ e
limitandoci solo alle due componenti “piane”, la matrice d’inerzia sarà
I11 I12
IQ =
.
I12 I22
′
Il problema che ci poniamo è il seguente: determinare un nuovo sistema SQ
:
′
′
′
con e1 e e2 ruotati di un angolo α rispetto a e1 ed e2 , in modo che SQ
π
π
sia terna principale d’inerzia. Evidentemente, − ≤ α ≤ . Nel seguito presentiamo
2
2 ′
alcuni metodi per individuare l’angolo α, in modo tale che SQ
risulti terna principale
d’inerzia.
{e1′ , e2′ , e3 },
METODO DEL CERCHIO DI MOHR
′
il sistema {X, Y }.
Riferendoci alla figura 7.3, SQ indica il sistema {x, y}, mentre SQ
′
Nel sistema SQ la matrice d’inerzia è data da
JQ =
J11
J12
J12
J22
.
DINAMICA SISTEMI RIGIDI
271
y
Y
X
α
x
Figura 7.3: Sistema (X; Y ) ruotato di α rispetto a (x, y).
Ora, è facile vedere che
�
x
y
�
�
��
�
cos α − sin α
X
=
,
sin α cos α
Y
�
��
�
B
per cui, ricordando la (7.17), la relazione che lega IQ a JQ è la seguente
IQ = B JQ BT
Q ,
⇔
JQ = BT IQ BQ .
(7.23)
Se supponiamo nota IQ , gli elementi della matrice JQ si ottengono dalla seconda della
(7.23), cioè
I22 − I11
I11 + I22
J11 =
−
cos 2α + I12 sin 2α,
2
2
I22 − I11
I11 + I22
+
cos 2α − I12 sin 2α,
J22 =
2
2
J12 = I22 − I11 sin 2α + I12 cos 2α,
2
dove abbiamo sfruttato le formule di duplicazione: sin2 α =
1 + cos 2α
.
2
(7.24)
1 − cos 2α
, cos2 α =
2
272
LEZIONI DI SISTEMI DINAMICI
Se selezioniamo la (7.24)1 e la (7.24)3, abbiamo, nel piano (J11 , J12 ) , una curva
definita tramite il parametro 2α, −π ≤ 2α ≤ π,
I22 − I11
I11 + I22
−
cos 2α + I12 sin α,
J11 =
2
2
J = I22 − I11 sin 2α + I cos α.
12
12
2
Tale curva rappresenta una circonferenza, detta cerchio di Mohr (v. figura 7.4), di
raggio
��
�2
I22 − I11
2 ,
+ I12
R=
2
�
�
I22 + I11
,0 .
ed il cui centro nel piano (J11 , J12 ) ha coordinate
2
J12
R=
I
−I
2
+ (I
)
R
J
J
I
+I
2
,0
J11
Figura 7.4: Cerchio di Mohr.
′
è principale d’inerzia, è quello per cui J12 = 0,
Quindi, l’angolo α per cui SQ
ovvero
I22 − I11
2I12
sin 2α + I12 cos 2α = 0, ⇔ tan 2α = −
.
(7.25)
2
I22 − I11
In corrispondenza di tali angoli4 J11 assume valore massimo
��
�2
I22 − I11
I11 + I22
2 ,
+
+ I12
JM =
2
2
4 Gli
angoli α che soddisfano la (7.25) sono due e sono separati da π/2.
(7.26)
DINAMICA SISTEMI RIGIDI
273
o minimo
Jm
I11 + I22
−
=
2
I22 − I11
2
2
(7.27)
2 .
+ I12
Notiamo che gli autovalori di IQ sono ottenuti dall’equazione
2
= 0,
(I11 − λ) (I22 − λ) − I12
det (IQ − λI) = 0, ⇒
le cui soluzioni sono proprio le (7.26), (7.27).
METODO DEL PRODOTTO VETTORIALE
Se il versore u è parallelo ad un autovettore di σ (Q), allora σ (Q) u è parallelo ad u
stesso, per cui
(7.28)
u ∧ σ (Q) u = 0.
Quindi, fissata una generica terna SQ , rispetto alla quale u ha la seguente espressione
(7.29)
u = cos αe1 + sin αe2 ,
avremo
σ (Q) u
=
I11
I12
I12
I22
cos α
sin α
= (I11 cos α + I12 sin α) e1 + (I12 cos α + I22 sin α) e2 .
Pertanto
u ∧ σ (Q) u =
I22 − I11
sin 2α + I12 cos 2α e3 ,
2
da cui, imponendo la (7.28), si ottiene nuovamente la (7.25).
METODO DELLA DERIVAZIONE
Il metodo consiste nello sfruttare il fatto (messo in luce nella sezione 7.3.3) che, fissato
Q, una direzione u è asse principale d’inerzia se il momento d’inerzia rispetto ad essa
è massimo o minimo, o comunque stazionario. Quindi, se u è una generica direzione
data da (7.29), avremo
Iu (Q) =
=
u · σ (Q) u =
cos α
sin α
I11
·
I12
I12
I22
cos α
sin α
(I22 − I11 )
I11 + I22
−
cos 2α + I12 sin 2α.
2
2
Quindi, Iu (Q) risulta una essere una funzione di α. Ricercando gli angoli α che
dIu (Q)
= 0, da cui si ottiene, ancora
rendono stazionaria tale funzione, imponiamo
dα
una volta, la (7.25).
274
LEZIONI DI SISTEMI DINAMICI
7.3.5 Esempi e complementi
In questa sezione daremo alcuni esempi sul calcolo dei momenti d’inerzia e illustreremo alcune proprietà della matrice d’inerzia dovute alla simmetria della stessa (proprietà
note dal corso di algebra lineare).
Proposizione 7.3.5 Gli autovalori della matrice d’inerzia sono tutti reali.
Dim. La dimostrazione di questa proposizione è un caso particolare della dimostrazione del lemma 5.10.1 al quale rimandiamo.
Mostriamo adesso che gli autovalori sono invarianti, cioè non dipendono dal particolare SdR ortonormale scelto.
Proposizione 7.3.6 Gli autovalori della matrice d’inerzia sono invarianti per cambiamenti di base.
Dim. Sia SQ : { e1 , e3 , e3 }, una base ortonormale centrata in Q. In tale base
′
σ (Q) è rappresentata dalla matrice simmetrica IQ . Se SQ
: { e1′ , e3′ , e3′ }, è un’altra
base ortonormale centrata in Q. La matrice che rappresenta l’operatore σ (Q) rispetto
′
SQ
è I′Q . Sappiamo però che le matrici I′Q e IQ sono legate dalla (7.17), con B matrice
ortogonale.
�
�
E’ facile provare che det I′Q − λI = det (IQ − λI). Infatti
det (IQ − λI)
=
=
�
�
�
� �
�
det BI′Q B−1 − λBIB−1 = det B I′Q − λI B−1
�
�
�
�
det B det I′Q − λI det B−1 = det I′Q − λI .
�
�
Vediamo però anche un’altra dimostrazione. Sviluppando det I′Q − λI = 0, otteniamo il seguente polinomio in λ (detto polinomio caratteristico)
λ3 − I1 λ2 + I2 λ − I3 = 0,
con
I1 = tr IQ ,
� ��
1�
2
(tr IQ ) − tr IQ2 ,
I2 =
2
I3 = det IQ ,
�3
dove tr IQ = i=1 Iii , è la somma degli elementi diagonali. Le tre quantità I1 , I2 e I3
sono detti invarianti della matrice IQ , proprio perché non dipendono dalla particolare
base. Infatti, ricordando che trAB =trBA, si ha
�
�
�
�
� �
tr IQ = tr BI′Q B−1 = tr B−1 BI′Q = tr I′Q ,
� �
�
�
� �
tr IQ2
= tr( BI′Q B−1 BI′Q B−1 ) = tr B−1 BI′Q2 = tr I′Q2 .
� �� � � �� �
IQ
IQ
DINAMICA SISTEMI RIGIDI
275
Quindi, det (IQ − λI) = 0 darà luogo sempre allo stesso polinomio indipendentemente
dalla base su cui è stata rappresentata σ (Q). Di conseguenza gli autovalori dui σ (Q)
non dipendono dalla particolare base.
Come ultima proprietà degli assi principali d’inerzia (che, come sappiamo, rappresentano gli autovettori della matrice d’inerzia) dimostriamo la seguente
Proposizione 7.3.7 Esiste una base ortonormale di R3 formata da autovettori di σ (Q).
Dim. Siano u1 , e u2 due autovettori relativi agli autovalori distinti I1 e I2 , ovvero
σ (Q) ui = Ii ui ,
i = 1, 2.
Siccome σ (Q) è simmetrica avremo u1 · σ (Q) u2 = σ (Q) u1 · u2 , e quindi
0 = u1 · σ (Q) u2 − σ (Q) u1 · u2 = u1 · I2 u2 − I1 u1 · u2 = (I2 − I1 ) u1 · u2 ,
che comporta u1 · u2 = 0, dal momento che I1 �= I2 .
Evidentemente tale procedura non si applica nel caso in cui I1 = I2 , ovvero se
l’autovalore I2 ha molteplicità algebrica doppia. Consideriamo quindi il caso in cui i
tre autovalori di σ (Q) sono i seguenti I1 = I2 �= I3 . Consideriamo gli autovettori
relativi a I3 ed a I2 , ovvero
σ (Q) ui = Ii ui ,
i = 2, 3.
Sia poi v un vettore ortogonale sia a u2 che a u3 . Mostriamo che v è autovettore di
σ (Q). Infatti le componenti di σ (Q) v lungo u2 e u3 sono nulle
u2 · σ (Q) v
=
σ (Q) u2 · v = I2 u2 · v = 0,
u3 · σ (Q) v
=
σ (Q) u3 · v = I3 u3 · v = 0.
Dunque σ (Q) v è parallelo a v, ovvero σ (Q) v = λv. Se adesso supponiamo che v,
u2 e u3 , siano vettori unitari, si deduce che essi costituiscono una base ortonormale.
Calcolando la traccia di σ (Q) su tale base abbiamo trσ (Q) = λ + I2 + I3 . Ma la
traccia è un invariante, per cui abbiamo anche trσ (Q) = I2 + I2 + I3 . Di conseguenza
λ = I2 . Si conclude che, anche nel caso in cui un autovalore abbia molteplicità doppia,
si trovano comunque tre autovettori ortogonali. Non solo, ma si dimostra che un qualsiasi vettore ortogonale a u3 è autovettore relativo all’autovalore doppio I2 . Infatti,
consideriamo un generico vettore w = αv + βu2 , ortogonale a u3 . Abbiamo
σ (Q) w = σ (Q) (αv + βu2 ) = I2 αv + I2 βu2 = I2 w.
In termini di assi principali d’inerzia, questo fatto vuol dire che ogni retta passante per
Q, e che giace sul piano ortogonale a u3 , è asse principale d’inerzia.
Vediamo infine l’ultimo caso: i tre autovalori sono coincidenti I1 = I2 = I3 = I.
Sia u un autovettore, σ (Q) u = Iu, che supporremo unitario. Consideriamo adesso
altri due vettori unitari v e w, tra loro ortogonali e ortogonali rispetto a u. Il sistema
276
LEZIONI DI SISTEMI DINAMICI
u, v e w, costituisce una base ortonormale, su cui possiamo rappresentare σ (Q). In
particolare, siccome
u · σ (Q) v = σ (Q) u · v = Iu · v = 0,
e analogamente u · σ (Q) w = 0, si deduce che σ (Q) v e σ (Q) w giacciono nel
piano π, piano generato da v e w (e che è ortogonale a u). Rappresentando dunque
σ (Q) nella base {u, v, w} otterremo la seguente matrice
σ (Q) v · v σ (Q) v · w σ (Q) v · u
α β 0
IQ = σ (Q) w · v σ (Q) w · w σ (Q) w · u = β δ 0
σ (Q) u · v σ (Q) u · w σ (Q) u · u
0 0 I
�
�
α β
Se adesso consideriamo la matrice simmetrica 2 × 2,
, ovvero la rappresenβ δ
tazione di σ (Q) sul piano π (piano ortogonale a u), si deduce che la stessa ammette
′
una coppia di autovettori ortogonali (entrambi giacenti
� su π),� che denoteremo con v
γ
0
e w′ , rispetto ai quali assume la forma diagonale
. Ma allora, nella base
0 θ
ortonormale {u, v ′ , w′ }, σ (Q) viene rappresentata dalla seguente matrice
γ 0 0
�IQ = 0 θ 0
0 0 I
Calcolando adesso gli invarianti di �IQ , otteniamo il seguente sistema
γ + θ + I = 3I,
γ = I,
⇒
Iγθ = I 3 ,
θ = I.
Abbiamo quindi determinato tre vettori ortogonali, u, v ′ e w ′ , che sono autovettori
di σ (Q). Non solo, ma nella base {u, v ′ , w′ }, la matrice �IQ è multipla della matrice
identità. Quindi ogni matrice d’inerzia sarà un multiplo della matrice identità. Di conseguenza ogni vettore è autovettore di σ (Q), ovvero ogni direzione è asse principale
d’inerzia.
Concludiamo la sezione con alcuni esempi.
Esempio 7.3.1 Determinare il momento d’inerzia di un anello omogeneo di massa
M , raggio R e spessore trascurabile, rispetto ad una retta passante per il centro e
ortogonale al piano dell’anello.
Applicando semplicemente la definizione 7.3.1 si ha I = M R2 .
Esempio 7.3.2 Determinare la matrice d’inerzia di un disco omogeneo di massa M e
raggio R, rispetto ad una terna centrata nel centro del disco, il cui asse z è perpendicolare al piano del disco (v. figura 7.5). L’asse z è asse principale d’inerzia così
DINAMICA SISTEMI RIGIDI
277
z
y
R
Q
x
Figura 7.5: Disco omogeneo di massa M e raggio R.
come lo sono l’asse x e l’asse y (v. proposizione 7.3.3). Per determinare I3 (momento
rispetto a z) si ricorre all’osservazione 7.3.2, immaginando di suddividere il disco in
un’infinità di “anellini” di raggio r, 0 < r < R, e spessore infinitesimo dr. La massa
infinitesima di ciascun “anellino” sarà
dm = κ2πrdr
essendo κ la massa per unità di superficie (densità superficiale di massa) κ =
Avremo5
I3 =
R
0
2
r dm = 2πκ
0
R
r3 dr =
M
.
πR2
M R2
.
2
Inoltre, dal momento che Ix = Iy , per ovvie ragioni di simmetria, sfruttando il corollario 1, avremo
2Ix =
M R2
M R2
, ⇒ Ix = Iy =
.
2
4
5 Osserviamo
D
2
che questa procedura è equivalente a calcolare, in coordinate polari, l’integrale
x + y 2 κ dxdy, dove κ = M/πR2 e
D = (x, y) ∈ R2 : x2 + y 2 < R2 .
278
LEZIONI DI SISTEMI DINAMICI
La matrice d’inerzia sarà dunque
IQ =
M R2
4
0
0
0
MR
4
0
0
2
0
MR
2
2
.
(7.30)
Esempio 7.3.3 Determinare il momento d’inerzia di un segmento di massa M e lunghezza L, rispetto ad una retta ortogonale al segmento stesso passante per il suo
centro.
Anche in questo caso si ricorre alla nota 7.3.2, considerando il segmento come
l’unione di “massettine infinitesime” dm, la cui posizione sulla retta individuata dal
segmento, è identificata con la coordinata x, −L/2 < x < L/2, essendo x = 0
il centro del segmento. Introducendo la massa per unità di lunghezza λ = M/L,
possiamo scrivere
dm = λdx,
e quindi, il momento d’inerzia rispetto ad una qualunque retta passante per il centro
del segmento e ad esso ortogonale sarà
I=
�
L/2
x2 λdx =
−L/2
M L2
.
12
Esempio 7.3.4 Determinare la matrice d’inerzia di una lamina rettangolare omogenea di massa M e lati a e b, rispetto ad una terna {x, y, z}, centrata in Q, come in
figura 7.6. L’asse z è asse principale d’inerzia, mentre gli assi x e y lo sono perché
ortogonali a piani di simmetria materiale (proposizione 7.3.3). Iniziamo col calcolare
il momento d’inerzia rispetto all’asse y, Iy . Seguendo ancora l’osservazione 7.3.2 si
suddivide il rettangolo in un’infinità di sbarrette di lunghezza b e spessore infinitesimo
dy. La massa di ciascuna sbarretta infinitesima sarà
dm = κbdy,
M
, densità superficiale di massa. Il momento d’inerzia infinitesimo del
ab
b2
b3
segmento che si trova a coordinata y, −a/2 < y < a/2, sarà
dm = κ dy =
12
12
M b2 dy
, (v. esempio 7.3.3) per cui, sfruttando l’additività del momento d’inerzia (si
12 a
veda la nota 7.3.2),
�
M b2
M b2 a/2 dy
Iy =
=
.
12 −a/2 a
12
con κ =
DINAMICA SISTEMI RIGIDI
279
z
y
Q
b
a
x
Figura 7.6: Lamina rettangolare omogenea di massa M .
M a2
, per cui, applicando il corollario
Con lo stesso procedimento si prova che Ix =
12
7.3.1, si ha
M a2
0
0
12
2
M
b
.
IQ =
0
0
12
�
M� 2
a + b2
0
0
12
Esempio 7.3.5 Determinare la matrice d’inerzia di una semidisco omogeneo di massa
M e raggio R, rispetto ad una terna {x, y, z}, centrata in Q, come in figura 7.7.
L’asse z è asse principale d’inerzia, così come l’asse x (perchè ortogonale ad un piano
di simmetria materiale. Il terzo asse sarà di conseguenza asse principale d’inerzia.
Per calcolare Iz , si ricorre ancora all’osservazione 7.3.2, notando che il momento
d’inerzia rispetto all’asse z di un disco di massa 2M è il doppia di Iz . Avremo così
2Iz =
2M R2
, ⇒
2
Iz =
M R2
.
2
Allo stesso modo, 2Ix è il momento d’inerzia di un disco di massa 2M rispetto all’asse
x,
2M R2
M R2
2Ix =
, ⇒ Ix =
.
4
4
La matrice IQ è quindi identica alla (7.30).
280
LEZIONI DI SISTEMI DINAMICI
z
y
R
Q
x
Figura 7.7: Semidisco di massa M .
Esempio 7.3.6 Data una lamina piana omogenea, a forma di triangolo isoscele, avente massa M , base a ed altezza h, determinare il momento d’inerzia rispetto ad una retta
ortogonale alla base e passante per il vertice del triangolo (retta r in figura 7.8 (I)).
Si indica con I il momento d’inerzia che vogliamo determinare. La figura 7.8 (II) rappresenta la metà del triangolo isoscele, ovvero un triangolo rettangolo di base a/2 ed
altezza h, la cui massa è M/2, ed è indicato con A. Il momento della lamina A, rispetto
(1)
alla retta (1) (v. ancora figura 7.8 (II)) si indica con IA . Ricordando l’osservazione
7.3.2, avremo
(1)
I = 2IA .
(7.31)
Ora consideriamo il rettangolo (che denotiamo con A ∪ B) di figura 7.8 (II), dato dal
triangolo A, e dal triangolo “virtuale” B. Il momento d’inerzia del rettangolo A ∪ B
(avente massa M e lati h e a/2) rispetto alla retta (1) sarà
(1)
(1)
(1)
IA∪B = IA + IB ,
(7.32)
(1)
dove IB rappresenta il momento d’inerzia del triangolo “virtuale” B rispetto alla
retta (1). Quest’ultimo sarà uguale al momento d’inerzia di A rispetto alla retta (2),
(2)
(1)
(2)
IA , ovvero IB = IA . Quindi tornando alla (7.32) si ha
(1)
(1)
(2)
IA∪B = IA + IA ,
(1)
(7.33)
dove sappiamo quanto vale IA∪B (è sufficiente ricordare l’esempio 7.3.4 ed il teorema
di Huygens)
2
M
1
a/2
(1)
2
2
IA∪B =
M (a/2) + M
(a/2) .
=
(7.34)
12
2
3
DINAMICA SISTEMI RIGIDI
281
r
B
A
(I)
( II )
Figura 7.8: Lamina piana omogenea a forma di triangolo isoscele.
(1)
(2)
Dobbiamo quindi valutare sia IA , che IA . Anche qui si ricorre al teorema di Huygens sfruttando il fatto che, riferendoci al sistema di riferimento {x,
in
y} indicato
a/2 h
. Perfigura 7.8 (II), il centro di massa del triangolo A ha le coordinate
,
3 3
CM
tanto, indicando con IA il momento d’inerzia di A rispetto alla retta passante per il
centro di massa e parallela alla retta (1), abbiamo
(1)
IA
=
IACM
M
+
2
a/2
3
2
.
e
(2)
IA
=
=
2
2
2
a/2
a/2
M a/2
M
M
(1)
2
2
= IA −
+
=
2
3
2
3
2
3
1 4
M
M
(1)
(1)
2
2
(a/2) − +
= IA +
(a/2) .
IA +
2
9 9
6
IACM +
Inserendo queste ultime due formule nella (7.33) si ha
(1)
(1)
IA∪B = 2IA +
M
2
(a/2) .
6
da cui, ricordando anche la (7.34),
(1)
(1)
2IA = IA∪B −
M
M
2
2
(a/2) =
(a/2) .
6
6
282
LEZIONI DI SISTEMI DINAMICI
E infine, dalla (7.31),
M a2
.
24
Ovviamente il procedimento qui illustrato non è l’unico per determinare I, ma ha il
pregio di far spesso ricorso al teorema di Huygens e all’osservazione 7.3.2.
I=
Esempio 7.3.7 Data una lamina omogenea quadrata di massa M e lato a, dimostrare,
facendo uso del metodo del cerchio di Mohr che, dato un qualunque punto A sulle
diagonali del quadrato, una base {e1 , e2 } è principale d’inerzia se {e1 , e2 } sono
paralleli alle diagonali del quadrato.
e
e
α
A
E
Q
E
Figura 7.9: Quadrato omogeneo.
Riferendoci alla figura 7.9, si indica con SQ il sistema {E 1 , E 2 } centrato in Q, mentre
con SA sistema {E 1 , E 2 } centrato in A. SQ è principale d’inerzia e, rispetto ad esso,
la matrice (2 × 2) d’inerzia è
M a2
0
IQ = 12
.
M a2
0
12
In generale il SdR SA non sarà principale d’inerzia. Infatti la matrice d’inerzia è data
da (v. formula (7.18))
M a2
2
+ M yA
−M xA yA
IA = 12
.
M a2
−M xA yA
+ M x2A
12
DINAMICA SISTEMI RIGIDI
283
Dobbiamo adesso individuare l’angolo α di cui ruotare SA al fine di ottenere un nuovo
′
sistema SA
: { e1 , e2 }, che sia principale d’inerzia. Ricordando la (7.18) abbiamo
M
2
x2A − yA
sin 2α − M xA yA cos 2α = 0.
2
Ora se A giace su una diagonale del quadrato vale xA = ±yA , per cui la formula
precedente diventa
2
±M yA
cos 2α = 0,
π
π
π
′
le cui due soluzioni sono: α = , e α = + . Quindi SA
è principale d’inerzia se
4
4
2
{ e1 , e2 } sono paralleli alle diagonali del quadrato.
7.4 Le equazioni cardinali
Iniziamo con delle considerazioni generali sulle equazioni di moto di un sistema di
punti vere per sistemi qualsiasi, anche non rigidi. Sia (Pk , mk ), k = 1, ..., N , un
sistema di N punti materiali. Se adesso per ogni punto scriviamo la seconda legge di
Newton otteniamo N equazioni del tipo
int
mk ak = F ext
k + Fk ,
k = 1, ...., N,
(7.35)
dove abbiamo indicato con ak è l’accelerazione del k-esimo punto, con F int
k e con
F ext
k le forze risultanti di tutte le forze applicate a Pk e distinte a secondo che la loro
reazione (in accordo al principio di azione e reazione) risulti applicata ad un altro punto
del sistema o a un punto esterno al sistema. Nel primo caso parleremo di forze interne,
ext
F int
k , mentre nel secondo caso di forze esterne, F k .
Sommando le N equazioni (7.35) otteniamo
N
mk a k =
k=1
N
F ext
k +
k=1
N
F int
k .
(7.36)
k=1
Ricordando la (7.6), il primo termine della (7.36) è proprio la derivata rispetto a t della
quantità di moto6 K.
N
Osserviamo ora che la somma k=1 F int
k è nulla in virtù del principio di azionereazione; infatti possiamo scrivere
F int
k =
N
F int
j, k ,
(7.37)
j=1
dove F int
j, k è la forza che si esercita sul punto Pk e la cui reazione è applicata al punto
int
Pj . Si ha quindi F int
j, k = −F k, j , e i due termini si cancellano nella somma in (7.36).
N
Quindi, ponendo F ext = k=1 F ext
k , la (7.36) diventa
N
mk ak = F ext ,
(7.38)
k=1
6 Ovviamente
stiamo assumendo che le masse degli N punti materiali rimangano costanti nel tempo.
284
LEZIONI DI SISTEMI DINAMICI
cioè
d2 (Po − O)
dK
=M
= F ext ,
dt
dt2
(7.39)
dove abbiamo sfruttato la (7.6). Il vettore F ext prende il nome di risultante delle forze
esterne.
Possiamo infine “leggere” l’equazione (7.39) come: la variazione della quantità di
moto totale del sistema è uguale alla risultante delle forze esterne applicate al sistema.
Inoltre, in virtù dell’uguaglianza tra K e M a(Po ), abbiamo che: il centro di massa
del sistema si muove come un punto materiale, avente come massa la massa totale del
sistema, sotto l’azione della risultante delle forze esterne. L’equazione (7.39) è detta
prima equazione cardinale.
Rimarchiamo che la (7.39) è stata ottenuta supponendo che le masse mk , k = 1, ...,
N , siano costanti nel tempo e che nel SdR S valga la seconda legge di Newton, ovvero
che S sia un SdR inerziale. Osserviamo poi che, come anticipato nell’introduzione del
capitolo, l’equazione (7.39) è particolarmente adatta a descrivere la dinamica dei sistemi rigidi in quanto in essa non compaiono le forze vincolari interne che mantengono il
vincolo di rigidità.
Riprendiamo ora le equazioni (7.35) e, fissato un centro di riduzione Q, moltiplichiamo ognuna vettorialmente per (Pk − Q) e sommiamo,
N
k=1
mk (Pk − Q) ∧ ak =
N
k=1
(Pk − Q) ∧ F ext
k +
N
(Pk − Q) ∧ F int
k .
(7.40)
k=1
Sempre in virtù del principio di azione-reazione abbiamo che
N
k=1
(Pk − Q) ∧ F int
k = 0.
(7.41)
Ricordando la (7.37) abbiamo
N
k=1
(Pk − Q) ∧ F int
k =
N
k=1
(Pk − Q) ∧
N
F int
j, k ,
j=1
dove F int
j, k è la forza che si esercita sul punto Pk con reazione applicata nel punto Pj .
Riscriviamo la somma come
N
k=1
=
(Pk − Q) ∧
j=1
F int
j, k =
N
N
k=1 j=1
(Pk − Q) ∧ F int
j, k
N
N
[(Pk − Pj ) + (Pj − Q)] ∧ F int
j, k
N
N
(Pk − Pj ) ∧ F int
j, k +
k=1 j=1
=
N
k=1 j=1
N
N
k=1 j=1
(Pj − Q) ∧ F int
j, k .
DINAMICA SISTEMI RIGIDI
285
Pk
Fj,k
Fk,j = - Fj,k
Pj
Q
Figura 7.10: La forza F int
j, k , è la forza interna agente sul punto materiale Pk . La
int
reazione ad F j, k è la forza F int
k, j , che agisce sul punto materiale Pj . Dal principio
int
int
di azione e reazione abbiamo: (i) F int
j, k = −F k, j ; (ii) F j, k è parallela al vettore
Pk − Pj .
Riferendoci ora alla figura 7.10, (Pk − Pj ) ∧ F int
j, k = 0, in quanto l’azione e la reazione hanno la stessa retta di azione, determinata dalla congiungente dei due punti di
applicazione. Quindi
N
N
k=1 j=1
(Pk − Q) ∧ F int
j, k =
N
N
k=1 j=1
(Pj − Q) ∧ F int
j, k = −
N
N
k=1 j=1
(Pj − Q) ∧ F int
k, j .
Le due somme nel primo e l’ultimo termine dell’uguaglianza
sono lastessa somma: si
N
sono soltanto scambiati gli indici di somma. Ne segue che N
k=1
j=1 (Pk − O) ∧
int
F j, k , è uguale al suo opposto e quindi è nullo e questo prova la (7.41).
Definizione 7.4.1 Il vettore7
τ
ext
(Q) =
N
k=1
(Pk − Q) ∧ F ext
k ,
è detto momento risultante delle forze esterne rispetto al punto Q.
7 Rimandiamo
alla sezione 1.5.2 per le proprità del momento.
(7.42)
286
LEZIONI DI SISTEMI DINAMICI
Deriviamo ora rispetto al tempo il momento angolare L (Q) dato dalla (7.7)
N
d
d
mk (Pk − Q) ∧ v k
L (Q) =
dt
dt
k=1
d
=
dt
=
N
k=1
N
d
d
(Pk − O) −
(Q − O) ∧ v k +
mk (Pk − Q) ∧ ak
dt
dt
N
mk
N
(v k − v Q ) ∧ mk v k +
k=1
=
mk [(Pk − O) − (Q − O)] ∧ v k
k=1
= −vQ ∧
k=1
N
k=1
mk v k +
K
(7.5)
N
(Pk − Q) ∧
k=1
mk a k
int
F ext
k +F k
(Pk − Q) ∧ F ext
k +
k=1
N
τ ext (Q)
(7.42)
N
k=1
(Pk − Q) ∧ F int
k ,
=0
(7.41)
da cui abbiamo
d
L (Q) = τ ext (Q) − v Q ∧ K .
dt
(7.43)
La (7.43) è detta seconda equazione cardinale. Il termine v Q ∧ K può essere reso
nullo con una opportuna scelta del centro di riduzione Q. Infatti se il punto Q ha
velocità parallela alla velocità del centro di massa questo termine si annulla (si ricordi
la (7.5)). Le scelte più utilizzate sono Q fisso oppure Q ≡ Po ; con queste scelte
d
abbiamo L (Q) = τ ext (Q), ovvero la variazione del momento della quantità di
dt
moto uguaglia il momento risultante delle forze esterne.
7.5 Le equazioni cardinali sono sufficienti per determinare il moto dei rigidi
Le equazioni cardinali formano un sistema di sei equazioni scalari, valide per qualsiasi
sistema materiale (sia discreto che continuo). In generale esse risultano insufficienti
per determinare il moto del sistema, non solo nel caso in cui i gradi di libertà siano più
di sei, ma anche in casi semplici come quello di due punti isolati tra loro interagenti
con una forza qualsiasi (problema a due corpi): in questo caso il sistema ha 6 gradi di
libertà ma il moto è solo in parte determinato dalle equazioni cardinali (che in questo
caso ci dicono che il centro di massa del sistema si muove di moto rettilineo uniforme
e che si conserva il momento della quantità di moto rispetto al centro di massa); non
possiamo tuttavia ricavare dalle equazioni cardinali la distanza, variabile nel tempo, tra
i due punti in quanto la sua variazione dipende dalla forza di interazione tra i due punti,
che è una forza interna.
DINAMICA SISTEMI RIGIDI
287
Nel caso dei sistemi rigidi liberi le equazioni cardinali sono anche sufficienti per
determinare il moto del sistema. Questo è dovuto al fatto che esse sono equivalenti
all’equazione simbolica della dinamica (5.22), che, evitando la scomposizione (5.20),
si scrive come8
N
k=1
(F k − mk ak ) · δξ k = 0 ,
(7.44)
∀ (δξ 1 , ...., δξN ) ,
dove, riprendendo la notazione del capitolo 6, sezione 6.2, δξk , k = 1, ..., N , è lo
spostamento virtuale del k-esimo punto materiale del sistema rigido compatibile con il
vincolo di rigidità. Supponendo il sistema rigido libero (cioè non soggetto a vincoli se
non a quello di rigidità), possiamo scrivere la (6.17) come
ξ k = ξ Q (q1 , q2 , q3 ) + A (ϕ1 , ϕ2 , ϕ3 ) xk ,
k = 1, ..., N,
dove Q è un punto solidale con il corpo rigido e:
• (q1 , q2 , q3 ) sono i tre gradi di libertà che identificano la posizione del punto Q
(per esempio le tre coordinate cartesiane di Q rispetto al SdR fisso);
• (ϕ1 , ϕ2 , ϕ3 ) sono gli altri tre parametri lagrangiani che individuano la rotazione
(per esempio i tre angoli di Eulero);
• xk , rappresenta il vettore (Pk − Q), vettore posizione del k-esimo punto materiale nel SdR solidale9 .
Nel seguito di questo paragrafo, dopo aver trovato la forma degli spostamenti “virtuali
rigidi”, mostreremo, sfruttando l’arbitrarietà degli spostamenti virtuali, che dalle (7.44)
si ottengono proprio le equazioni cardinali.
Cominciamo col determinare lo spostamento virtuale δξ k . Applicando la (4.26)
abbiamo
δξ k
=
3
∂ξ Q
δqi +
3
∂ξ Q
δqi +
i=1
=
i=1
∂qi
∂qi
3
3
3
∂ξQ
∂A
∂A T
xk δϕi =
δqi +
A A xk δϕi
∂ϕi
∂qi
∂ϕi
i=1
i=1
i=1
I
3
∂A T
A δϕi
∂ϕi
i=1
Axk .
(7.45)
Ricordando adesso la procedura della sezione 6.3, abbiamo
3
∂A
AT δϕi Axk = δω ∧ Axk ,
∂ϕ
i
i=1
8 Si ricorda che nel vettore F
k non devono essere considerate le eventuali reazioni vincolari esterne
dovute a vincoli lisci, né le forze vincolari interne dovute al vincolo di rigidità. Quest’ultimo è infatti un
vincolo liscio, come mostrato nell’esempio 5.2.1.
9 Ovviamente si conoscono i vettori posizione, rispetto al SdR solidale, di tutti i punti che costituiscono il
sistema rigido, dal momento che le struttura geometrico-materiale del corpo è data.
288
LEZIONI DI SISTEMI DINAMICI
3
∂A T
A δϕi , è lo spostamento virtuale associato alla rotazione.
∂ϕi
3 ∂ξ Q
Ponendo10 (Pk − Q) = Axk , e δξ Q =
δqi , la (7.45) diventa
i=1 ∂qi
dove δω =
i=1
δξk = δξ Q + δω ∧ (Pk − Q) ,
che, utilizzando una notazione vettoriale, scriveremo anche come
(7.46)
δ (Pk − O) = δ (Q − O) + δω ∧ (Pk − Q) ,
dove O è il centro del SdR fisso mentre Q è quello del SdR solidale (avevamo già detto
che Q è un punto solidale col corpo rigido).
L’equazione simbolica della dinamica (7.44) diventa quindi
N
(F k − mk ak ) · δξ Q + δω ∧ (Pk − Q) = 0,
k=1
(7.47)
∀ δξ O , δω .
int
Operando la scomposizione F k = F ext
k + F k , e ricordando la formula (1.16), la
(7.47) può essere così riscritta
N
k=1
=
N
k=1
=
(F ext
k
+
F int
k
k=1
N
(F k − mk ak ) · δξQ + δω ∧ (Pk − Q)
− mk ak ) · δξ Q +
int
[δω ∧ (Pk − Q)] · (F ext
k + F k − mk ak )
N
k=1
N
k=1
(F ext
k
− mk ak ) · δξQ +
(Pk − Q) ∧
(F ext
k
N
F int
k
k=1
=0
− mk ak ) · δω +
· δξ Q +
N
k=1
(Pk − Q) ∧
=0
F int
k
· δω .
A questo punto sfruttiamo l’arbitrarietà degli spostamenti virtuali, δξ Q e δω, considerando dapprima δω = 0, e poi δξ Q = 0. Nel primo caso, δω = 0, la (7.44) si riduce
a
N
(F ext
k − mk ak ) · δξ Q = 0,
k=1
10 Volendo
utilizzare la stessa notazione della sezione 6.2, avremmo dovuto indicare Axk con ξp k .
DINAMICA SISTEMI RIGIDI
289
che, dovendo valere per ogni δξQ , equivale alla (7.38), ovvero alla (7.39). Se adesso
consideriamo δξ Q = 0, otteniamo
N
k=1
(Pk − Q) ∧
(F ext
k
− mk ak ) · δω = 0,
che, per l’arbitrarietà di δω, equivale a
N
k=1
(Pk − Q) ∧ (F ext
k − mk ak ) = 0.
(7.48)
Ora, riprendendo la (7.7) e derivandola rispetto al tempo abbiamo
N
d
L (Q) =
dt
mk
k=1
+
N
k=1
N
=
k=1
+
d
[(Pk − O) − (Q − O)] ∧ v k +
dt
mk (Pk − Q) ∧ ak
mk v k ∧ v k − v Q ∧
N
k=1
=0
N
k=1
mk (Pk − Q) ∧ ak ,
mk v k +
K
ovvero
N
k=1
mk (Pk − Q) ∧ ak =
d
L (Q) + v Q ∧ K,
dt
che, sostituita nella (7.48), dà luogo a
N
k=1
cioè alla (7.43).
(Pk − Q) ∧ F ext
k −
τ ext (Q)
d
L (Q) − v Q ∧ K = 0,
dt
7.6 Momento angolare, energia cinetica e seconda equazione cardinale per i sistemi rigidi
Affrontiamo adesso tre argomenti fondamentali di questo capitolo: la scrittura del momento angolare per un corpo rigido (rispetto ad un centro di riduzione solidale col
corpo stesso), la scrittura della seconda equazione cardinale e la scrittura dell’energia
290
LEZIONI DI SISTEMI DINAMICI
cinetica di un corpo rigido (il cosiddetto Teorema di König11 ). Illustreremo poi un
argomento strettamente collegato alla seconda equazione cardinale: il momento delle
reazioni vincolari nel caso di rotazioni uniformi.
7.6.1 Momento angolare per un sistema rigido
Torniamo all’espressione del momento angolare, o momento della quantità di moto,
(7.7). Nel caso di un sistema rigido possiamo sostituire l’espressione di v k con la
formula fondamentale dei moti rigidi (6.32), se il polo Q è un punto solidale con il
sistema rigido. Nel caso in cui il centro di riduzione non sia solidale la formula è
leggermente più complicata e si invita il lettore a ricavarla per esercizio. Otteniamo
così
L(Q)
=
N
k=1
mk (Pk − Q) ∧ [v(Q) + ω ∧ (Pk − Q)]
= M (Po − Q) ∧ v(Q) +
N
k=1
mk (Pk − Q) ∧ [ω ∧ (Pk − Q)] . (7.49)
Anche questa espressione può essere semplificata scegliendo opportunamente il polo
Q. Se Q è fisso sì che v(Q) = 0 (cioè abbiamo un moto rigido con un punto fisso,
detto moto di precessione), oppure se Q ≡ Po , la (7.49) si semplifica in
L(Q) =
N
k=1
mk (Pk − Q) ∧ [ω ∧ (Pk − Q)]
(7.50)
che, lo ricordiamo ancora, è valida soltanto se Q è solidale con il sistema rigido.
Concentrandoci sulla parte di destra della (7.50) e ricordando la definizione 7.3.3,
abbiamo
L(Q) = σ(Q)ω .
(7.51)
Ora, come illustrato nella sezione 7.3.2, l’operatore σ(Q) è rappresentato da una matrice IQ una volta che viene fissato sistema di riferimento12 centrato in Q. Se il SdR
in cui si calcolano le componenti della matrice IQ ha gli assi fissi mentre il corpo si
muove, allora gli elementi della matrice (7.16) dipendono dal tempo. E’ quindi evidente che conviene selezionare un SdR cartesiano ortogonale i cui assi siano solidali col
corpo rigido, ovvero un sistema di riferimento solidale S centrato in Q. Non solo, ma
tra tutti i sistemi di riferimento solidali conviene scegliere quelli in cui IQ è diagonale,
ovvero SdR che sono terne principali d’inerzia.
La selezione di un riferimento solidale (possibilmente una terna principale d’inerzia) porta, come detto, alla ovvia conseguenza che gli elementi della matrice IQ sono
costanti, ma porta anche ad un’altra conseguenza: il vettore L(Q) viene ad essere
espresso in S, SdR solidale (v. figura 7.11). Bisogna quindi di aver cura di esprimere
anche ω in S, e soprattutto, bisogna porre particolare attenzione quando si calcola la
derivata rispetto al tempo di L(Q), come vedremo nella prossima sezione.
11 Johann
Samuel König (Büdingen, 1712 – Zuilenstein, 1757), matematico tedesco.
comunque che i sistemi di riferimento devono essere ortonormali.
12 Ricordiamoci
DINAMICA SISTEMI RIGIDI
291
7.6.2 Seconda equazione cardinale per i sistemi rigidi
La grande differenza fra la dinamica del punto e la dinamica dei sistemi rigidi risiede
nella seconda equazione cardinale, che è deputata a descrivere la parte rotatoria del
moto. Riferendoci alla figura 7.11, consideriamo un SdR cartesiano ortogonale fisso Σ
ed uno, denotato da S, solidale col corpo rigido. Supponiamo inoltre che il centro di
riduzione Q sia fisso o coincidente con centro di massa del corpo, sì che L (Q) assume
la forma (7.51).
Q
Sistema di Riferimento fisso
Sistema di Riferimento S
solidale con il corpo rigido
Σ
Figura 7.11: Sistema di riferimento fisso Σ e SdR S solidale con il corpo rigido.
Vogliamo calcolare la variazione rispetto al tempo (la derivata temporale) di L (Q)
rispetto all’osservatore Σ. Per mantenere la notazione più chiara possibile indicheremo,
ma soltanto in questa e nelle prossime sezioni, con:
• ISQ , la matrice d’inerzia rispetto al SdR solidale S. Come già detto, le componenti
di ISQ , sono constanti.
• IΣ
Q , la matrice d’inerzia rispetto al SdR fisso Σ, o meglio, la matrice d’inerzia rispetto ad un SdR i cui assi sono paralleli a quelli di Σ ed è centrato in Q. Ovviamente le le componenti di IΣ
Q , non sono constanti nel tempo. Infatti, ricordando
la (7.17), abbiamo
S T
IΣ
(7.52)
Q = AIQ A ,
dove A = A (t), è la matrice di rotazione (6.7), introdotta nella sezione 6.2.
Riprendendo la notazione della sezione 6.3, se ω è il vettore velocità angolare, denotiamo con ω Σ la terna delle componenti ω rispetto al SdR fisso Σ e con ω S la terna
292
LEZIONI DI SISTEMI DINAMICI
delle componenti ω rispetto al SdR solidale S. Quindi
ω −→
ωΣ ,
ωS ,
terna delle componenti rispetto a Σ,
terna delle componenti rispetto a S.
In particolare, ricordando la (6.52), ωΣ = Aωs .
L’espressione di L (Q) nel SdR fisso Σ oppure nel SdR solidale S è dunque(7.51)
Σ
IQ ωΣ ,
L (Q) = σ(Q)ω −→
(7.51)
ISQ ωS ,
nel SdR Σ,
nel SdR S.
Sfruttando la (7.52), è facile ricavare la relazione che lega le due espressioni
S
T
ω = AISQ ωs .
IΣ
Q ω Σ = AIQ A
� �� �
(7.53)
ωs
Per calcolare la variazione nel tempo di L (Q) rispetto all’osservatore Σ, deriviamo
rispetto al tempo IΣ
Q ω Σ . Tenendo presenti la (7.53) e la (6.26), otteniamo
d �Σ �
I ωΣ
=
dt Q
=
=
d � S T �
AIQ A ωΣ
dt
dω Σ
dAT
dA S T
IQ A ω Σ + AISQ
ωΣ + AISQ AT
dt
dt
dt
T
dωΣ
dA T S T
S T dA
A
ωΣ + AISQ AT
A
I
A
ω
+
AI
A
A
Σ
Q
Q � �� �
��
�
�
dt
dt
dt
I
=
�
dA T
A
dt
I
��
�
�
dAT
dω Σ
AISQ AT ω Σ + AISQ AT A
ωΣ + AISQ AT
.
dt
dt
� �� �
�
Ora, rammentando la formula (6.30), cioè
d �Σ �
I ωΣ
=
dt Q
=
ωΣ ∧
T
− dA
dt A
dA T
A v = ω ∧ v, abbiamo
dt
�
� dω
�
Σ
AISQ AT ωΣ − AISQ AT ω Σ ∧ ω Σ + AISQ AT
dt
�
��
�
� �� �
� �� �
�
=0
IΣ
Q
Σ
ω Σ ∧ IΣ
Q ω Σ + IQ
IΣ
Q
dωΣ
.
dt
Notiamo che la stessa equazione si ottiene facendo uso della formula di Poisson
S
(6.69). Infatti, sfruttando la seconda uguaglianza della (7.53), cioè IΣ
Q ω Σ = AIQ ω S ,
DINAMICA SISTEMI RIGIDI
293
otteniamo
�
d � Σ ���
I ωΣ �
dt Q
A
=
� dA
dωS
dω S
dA T S
d � S
AIQ ωS =
ISQ ωS + AISQ
=
A
A�IQ ω S + AISQ
��
�
dt
dt
dt
dt
dt
I
=
ωΣ ∧
AISQ ω S
� �� �
+
dω S
AISQ
��dt�
Σ
d(I ω Σ )
Q
�
IΣ
Q ωΣ
dt
= ωΣ ∧
IΣ
QωΣ
R
�
� ��
d IΣ
Q ωΣ �
+
�
�
dt
R
Osserviamo che talvolta conviene esprimere la derivata rispetto al tempo di13 L (Q)
nel SdR solidale S. In accordo con la (6.52) e la (6.71), abbiamo
�
� � dA �
�Σ �
dω S
S
T d
T d
T
A
I ωΣ
AIQ ω S = AT
A�ISQ
ISQ ω S + �A��
= A
dt Q
dt
dt
dt
� �� �
I
ωS ∧
dω S
.
= ω S ∧ ISQ ω S + ISQ
dt
Quindi, prescindendo dal SdR, la seconda equazione cardinale per un corpo rigido,
nell’ipotesi che il polo Q sia fisso o coincidente col centro di massa14 , si scrive come
ω ∧ σ(Q)ω + σ(Q)ω̇ = τ ext (Q) ,
(7.54)
intendendo che le quantità vettoriali ω, τ ext (Q) e l’omografia d’inerzia σ(Q) che
ivi compaiono possono essere espresse sia nel SdR fisso Σ, sia nel SdR solidale S.
La scelta di quale SdR utilizzare dipende essenzialmente dalla convenienza nel fare i
calcoli.
Alcune osservazioni sono doverose:
1. Notiamo per prima cosa che ω̇ = 0, rotazione uniforme, non comporta necessariamente τ ext (Q) = 0. Infatti, se ω̇ = 0, avremo che τ ext (Q) = 0 soltanto
se ω è parallelo ad un asse principale d’inerzia, cioè se σ(Q)ω è parallelo ad
ω (ovvero ω è un autovettore di σ(Q).
2. La (7.54) assume una forma particolarmente semplice nel caso di moti piani. Se
infatti e3 è il versore ortogonale al piano dove si svolge il moto, abbiamo
ω Σ = ω S = ϕ̇e3 ,
e
I11
I12
IQ =
0
I12
I22
0
0
0
I33
⇒
IQ ω = I33 ϕ̇e3 ,
13 Attenzione a non fare confusione: la derivata rispetto al tempo di L (Q) viene calcolata dall’osservatore
Σ. Tale derivata però, che è un vettore, può essere espressa sia nel SdR fisso Σ, ma anche nel SdR solidale
S.
14 In ogni caso Q deve essere solidale con il corpo rigido.
294
LEZIONI DI SISTEMI DINAMICI
per cui ω ∧ IQ ω = ϕ̇e3 ∧ I33 ϕ̇e3 = 0, e la (7.54) si riduce a
I33 ϕ̈ = τ ext (Q) · e3 .
(7.55)
La configurazione del sistema è determinata completamente dall’angolo ϕ, ed il
suo stato cinematico da ϕ e ϕ̇. Inoltre, se la componente τ ext (Q) · e3 del momento è funzione anch’essa solo di ϕ (oppure di ϕ e ϕ̇ nel caso sia presente una
qualche forma di attrito o resistenza al moto), ne segue che la (7.55) determina
completamente il moto rotatorio del sistema. Da un punto di vista “matematico”
l’equazione (7.55) è del tutto analoga all’equazione di moto di un punto materiale, dove ora il ruolo della forza è tenuto dal momento delle forze esterne e il
ruolo della massa dal momento di inerzia. Possiamo quindi identificare il momento di inerzia di un corpo, relativo ad un dato asse, come la sua tendenza a
permanere in uno stato di moto di rotazione uniforme attorno a quell’asse, così
come la massa inerziale di un punto materiale misura la tendenza a permanere
nel suo stato di moto rettilineo uniforme: far variare la velocità di rotazione sarà
tanto più difficile quanto maggiore è il momento d’inerzia.
Esempio 7.6.1 Una lamina rettangolare è vincolata a ruotare uniformemente attorno
alla propria diagonale maggiore, come mostrato nella figura 7.12. Si vuole determinare il momento τ ext che i cuscinetti che sostengono l’asse di rotazione esercitano
sull’asse stesso.
SdR
fisso Σ
y
x
cuscinetti
che
sostengono
l’asse di
rotazione
α
cuscinetti
che
sostengono
l’asse di
rotazione
Q
asse di rotazione
Figura 7.12: Lamina rettangolare in rotazione uniforme attorno alla diagonale
principale. Si denota con α è l’angolo fra la diagonale della lamina e l’asse x.
DINAMICA SISTEMI RIGIDI
295
Applichiamo la (7.54), scrivendola nel SdR solidale. Il vettore ω, nel SdR fisso è
dato dalla terna
ω
ωΣ = 0 ,
(7.56)
0
mentre nel SdR solidale è ωS = AT ωΣ , dove, al solito, A è la matrice di rotazione.
Evidentemente, la terna delle componenti della velocità angolare nel SdR solidale è
ω cos α
ω S = −ω sin α ,
(7.57)
0
dal momento che la velocità angolare giace sempre nel piano (x, y) del SdR solidale. Tuttavia, mostriamo come si giunge ad ω S passando tramite l’usuale relazione
ω S = AT ω Σ , con ωΣ data dalla (7.56). Per passare dal SdR fisso a quello solidale, dobbiamo prima ruotare attorno all’asse (diagonale maggiore della lamina) di un
angolo φ = ωt, la cui matrice è
1
0
0
0 cos φ sin φ ,
AT
φ =
0 − sin φ cos φ
e poi ruotare attorno all’asse ortogonale al piano della lamina passante per Q, di un
angolo α, la cui matrice è
cos α sin α 0
− sin α cos α 0 .
AT
α =
0
0
1
Quindi
AT
=
=
Si ottiene così
ωS
=
=
1
0
cos α sin α 0
T
0
cos
φ
AT
A
=
−
sin
α
cos
α
0
α φ
0 − sin φ
0
0
1
cos α cos φ sin α sin α sin φ
− sin α cos α cos φ cos α sin φ .
0
− sin φ
cos φ
cos α
AT ω Σ = − sin α
0
ω cos α
−ω sin α ,
0
0
sin φ
cos φ
ω
1
0
0
sin α 0
cos α 0 0 cos φ sin φ 0
0
0 − sin φ cos φ
0
1
cioè la (7.57). Osserviamo adesso che il SdR solidale è una terna principale d’inerzia
per cui
I1 0 0
ISQ = 0 I2 0 ,
0 0 I3
296
LEZIONI DI SISTEMI DINAMICI
e quindi
I1
ISQ ω S = 0
0
0
I2
0
0
ω cos α
ωI1 cos α
0 −ω sin α = −ωI2 sin α ,
0
I3
0
da cui ricaviamo l’espressione del momento applicato dai cuscinetti all’asse nel SdR
solidale
ω cos α
ωI1 cos α
τ ext = ωS ∧ ISQ ω S = −ω sin α ∧ −ωI2 sin α
0
0
0
sin 2α
(I1 − I2 ) 0 .
= ω2
(7.58)
2
1
Si deduce che τ ext = 0, se I1 = I2 , cioè la lamina è un quadrato, oppure se sin 2α =
π
0, ⇒ α = 0, ± , ovvero se l’asse di rotazione coincide con l’asse x o con l’asse y (che
2
sono principali d’inerzia). Osserviamo che l’espressione (7.58) fornisce le componenti
di τ ext nel SdR solidale (nello specifico τ ext è ortogonale al piano della lamina).
L’espressione di τ ext nel SdR fisso è data da
0
sin
2α
(I1 − I2 ) − sin φ ,
Aτ ext = Aφ Aα τ ext = ω 2
(7.59)
2
cos φ
dove φ varia nel tempo.
E’ interessante notare che si giunge esattamente allo stesso risultato se fin da principio si lavora nel SdR fisso. In quest’ottica dobbiamo esprimere la matrice d’inerzia
nel SdR fisso, cioè
=
S T
S T T
IΣ
Q = AIQ A = Aφ Aα IQ Aα Aφ
sin 2α
cos φ (I1 − I�2 )
I1 cos2 α + I2 sin2 α
2
�
sin 2α cos φ (I1 − I2 ) cos2 φ I2 cos2 α + I1 sin2 α + I3 sin2 φ
2
�
�
sin 2α
sin φ (I1 − I2 )
cos φ sin φ I2 cos2 α + I1 sin2 α − I3
2
sin 2α
�
�2 sin2φ (I1 − I2 )2
.
cos φ �sin φ I2 cos α + I1 sin
� α − I32
2
2
2
sin φ I2 cos α + I1 sin α + I3 cos φ
Ora, ricordando che φ = ωt, la precedente espressione di IΣ
Q mette in luce un fatto
importante (già sottolineato alla fine della sezione 7.6.1): in generale gli elementi
della matrice d’inerzia espressa nel SdR fisso dipendono dal tempo. Tornando alla
seconda cardinale,
�
�
ω I1 cos2 α + I2 sin2 α
ω
Σ
IΣ
0 = ω (I1 − I2 ) sin22α cos φ ,
Q ω Σ = IQ
0
ω (I1 − I2 ) sin22α sin φ
DINAMICA SISTEMI RIGIDI
per cui le componenti di τ ext
ω
0 ∧ IΣ
Q
0
297
nel SdR fisso sono
ω
0
sin
2α
0 = ω2
(I1 − I2 ) − sin φ ,
2
0
cos φ
che coincide con (7.59). Per concludere osserviamo che τ ext è il momento imposto all’asse di rotazione dai cuscinetti i quali subiscono, per il principio di azione e reazione,
una sollecitazione uguale ed opposta. Infatti, ponendoci nel SdR solidale scriveremo
�
�
d
2 sin 2α
ω
(I1 − I2 ) = 2
Fcuscinetti ,
2
2
dove d/2 è la semidiagonale e Fcuscinetti è la forza applicata dai cuscinetti all’asse.
La forza che i cuscinetti subiscono è dunque
Fcuscinetti = ω 2
sin 2α
(I1 − I2 ) .
2d
7.6.3 Reazioni vincolari applicate all’asse di rotazione
Alla luce dell’esempio 7.6.1, vogliamo sottolineare ancora il ruolo delle reazioni vincolari nel caso di rotazioni. Supponiamo che il sistema rigido sia vincolato a muoversi
di moto rotatorio attorno ad un asse fisso, che, senza perdere in generalità, assumeremo
coincidere con l’asse e3 . Nello specifico vogliamo:
1. determinare le condizioni che devono valere affinché i vincoli che impongono la
rotazione attorno ad un asse si possano dire lisci;
2. determinare le reazioni vincolari, o meglio il momento delle reazioni, nel caso
di rotazioni uniformi.
Per prima cosa vediamo cosa si deve intendere per vincolo di rotazione liscio. Applicando la definizione 5.2.1, i vincoli che impongono al corpo di ruotare attorno all’asse
e3 sono lisci se le reazioni vincolari Rext
k soddisfano la condizione
�
Rext
(7.60)
k · δ (Pk − O) = 0 ,
k
per ogni sistema di spostamenti virtuali δ (Pk − O) compatibile con i vincoli. La maniera più naturale per vincolare un rigido a ruotare attorno ad un asse fisso è quello
di collocare una o più cerniere in altrettanti punti della retta il cui versore è e3 , come
mostrato nella figura 7.13
Poiché l’asse di rotazione è fisso, supponiamo che il centro di riduzione Q ed O
coincidano e che Q giaccia sull’asse di rotazione (quindi Q ≡ O, ancorché solidale col
sistema rigido, è fisso). La (7.46) comporta
δ (Pk − O) = δϕe3 ∧ (Pk − Q) ,
dove, come detto, e3 è il versore dell’asse di rotazione. Usando l’arbitrarietà di δϕ
nella (7.60) abbiamo
�
��
�
(7.61)
Rext
(Pk − Q) ∧ Rext
· e3 = 0 .
k
k · [e3 ∧ (Pk − Q)] =
k
(1.16)
k
298
LEZIONI DI SISTEMI DINAMICI
e3
Figura 7.13: Corpo rigido in rotazione attorno ad un asse fisso.
Diremo quindi che il corpo rigido ruota senza attrito attorno all’asse, ovvero che il
vincolo di rotazione attorno all’asse è liscio, se le forze di reazione dovute al vincolo
di rotazione hanno momento con componente nulla lungo l’asse di rotazione15. Si
osservi tuttavia che la (7.61) non comporta assolutamente che le reazioni vincolari
16
Rext
k siano nulle .
Nota 7.6.1 Se consideriamo un moto piano e supponiamo che il vincolo di rotazione
sia liscio, nel termine di destra della (7.55), cioè in τ ext (Q) · e3 , le reazioni vincolari
non compaiono. In altri termini, τ ext (Q) · e3 è dovuto alle sole forze esterne direttamente applicate. Se poi τ ext (Q) · e3 = 0, cioè se il momento risultante delle forze
esterne applicate è nullo, la rotazione risulterà uniforme, cioè ϕ̇ = costante.
15 Allo stesso modo si dimostra che se si impone al sistema il vincolo di mantenere un punto fisso Q durante
il moto, la condizione di vincolo liscio equivale a dire che il momento delle reazioni vincolari rispetto ad Q
deve essere nullo.
16 Ricordiamo, a titolo di esempio, che nel caso di un punto materiale vincolato su una superficie, il vincolo
(la superficie) si dice liscio non se la reazione vincolare è nulla, ma se questa è ortogonale al vincolo.
DINAMICA SISTEMI RIGIDI
299
Concentriamoci adesso sul secondo punto, supponendo che la rotazione sia uniforme,
cioè
ω = ϕ̇e3 , con ϕ̇ = costante,
e che non vi siano forze esterne direttamente applicate al corpo. La (7.54) diventa
ω ∧ IQ ω = τ ext (Q) ,
dove τ ext (Q) è il momento delle sole reazioni vincolari. Mostriamo innanzitutto che
il vincolo è liscio. Infatti
τ ext (Q) · e3 = (ϕ̇e3 ∧ IQ ϕ̇e3 ) · e3 = ϕ̇2 (e3 ∧ e3 ) · IQ e3 .
� �� �
(1.16)
=0
Calcoliamo adesso τ ext (Q). Consideriamo un SdR solidale S in cui l’asse z coincida
con l’asse e3 . Lavorando in S, avremo
0
ω = 0 ,
ϕ̇
e
I11
IQ ω = I12
I13
I12
I22
I23
I13
0
I13
I23 0 = ϕ̇ I23 ,
ϕ̇
I33
I33
siccome, in generale, S non sarà una terna principale d’inerzia. Otteniamo così
−I23
(7.62)
τ ext (Q) = ω ∧ IQ ω = ϕ̇2 I13
0
Quindi, se l’asse di rotazione non è principale di inerzia, il termine ω ∧ IQ ω non si
annulla. Le forze vincolari devono fornire un momento per garantire il moto di rotazione attorno all’asse stesso. Si può calcolare il modulo del momento che le reazioni
devono fornire (e quindi “quantificare” la sollecitazione che questa rotazione impone
ai vincoli)
�
� ext
�
�τ (Q)� = ϕ̇2 I 2 + I 2 �= 0 .
(7.63)
13
23
Si osservi che il momento τ ext (Q), che è costante nel sistema di riferimento solidale
S, ruota nel sistema di riferimento fisso, ovvero quello in cui si trovano i dispositivi
che realizzano fisicamente i vincoli (cuscinetti, bronzine, etc.). Quindi la presenza di un
momento deviatore non nullo tende a “destabilizzare” il moto di rotazione, cercando di
far “deviare” l’asse di rotazione dalla sua direzione “scardinando” (alla lunga) i vincoli.
Non solo, ma il modulo del momento dipende dal quadrato della velocità angolare. Ciò
significa che nei sistemi rigidi che ruotano ad altissime velocità, come per esempio le
turbine, è di cruciale importanza posizionare l’asse di rotazione in corrispondenza di
un asse principale d’inerzia.
300
LEZIONI DI SISTEMI DINAMICI
Nota 7.6.2 Nonostante l’apparenza “esoterica”, questo fenomeno dovrebbe essere abbastanza noto a chiunque guidi un’automobile: sono le vibrazioni che si avvertono
sullo sterzo quando si guida un’auto che abbia subito una (lieve) deformazione di una
delle ruote a seguito, per esempio, di un urto con un marciapiede o una buca. Il “rimedio” è la cosiddetta “equilibratura” della ruota: si aggiunge un peso in un punto
opportuno sulla parte esterna del cerchio della ruota. L’effetto è di far tornare l’asse
di rotazione della ruota un asse principale di inerzia, togliendo quindi le sollecitazioni
sul semiasse a cui è attaccata la ruota.
Esempio 7.6.2 Prendendo spunto dalla nota precedente, calcoliamo il momento imposto dalle forze vincolari all’asse di rotazione di un disco che sta uniformemente
ruotando attorno alla retta z, come mostrato in figura 7.14.
X
y=Y
Z
α
asse di
rotazione
z
x
Figura 7.14: Disco in rotazione uniforme alla retta z, che forma un angolo α con l’asse
del disco Z. Si individuano due SdR solidali: S ′ : {X, Y, Z}, che è una terna principale
d’inerzia e S : {x, y, z}, che è non una terna principale d’inerzia, il cui asse y coincide
con Y . Il SdR S è ottenuto da S ′ ruotando quest’ultimo di un angolo α attorno all’asse
Y.
Nel SdR solidale S ′ : {X, Y, Z}, la cui origine è nel punto Q, centro del disco, la
matrice d’inerzia ha la forma (7.30), cioè
1
2
M
R
0
I′Q =
4
0
0
1
0
0
0 .
2
DINAMICA SISTEMI RIGIDI
301
Il SdR solidale S : {x, y, z} si ottiene ruotando S ′ attorno all’asse Y di un angolo α
(come evidenziato dalla figura 7.14). La matrice di rotazione da S ′ ad S è data da
cos α 0 − sin α
.
1
0
B= 0
sin α 0 cos α
L’espressione della matrice d’inerzia nel SdR S si ottiene sfruttando la (7.17), cioè
− cos α sin α
cos2 α + 2 sin2 α 0
2
M
R
.
0
1
0
IQ = BI′Q BT =
4
2
2
− cos α sin α
0 2 cos α + sin α
Nel SdR S la velocità angolare è ω S = ϕ̇e3 , per cui
− cos α sin α
M R2
,
0
IQ ωS = ϕ̇
4
2 cos2 α + sin2 α
ed il momento applicato dalle forze vincolari all’asse di rotazione è
0
2
MR
sin 2α .
τ ext (Q) = ω S ∧ IQ ω S = −ϕ̇2
8
0
π
Notiamo che il momento si annulla se α = 0, ± , ovvero il disco ruota attorno all’asse
2
Z, oppure attorno all’asse X, che sono assi principali d’inerzia.
7.6.4 L’energia cinetica
Il tensore d’inerzia ci fornisce anche una forma compatta per esprimere l’energia cinetica in di un sistema rigido. Selezioniamo un punto Q solidale con il corpo rigido, e
sfruttiamo la formula fondamentale dei moti rigidi (6.32)
N
N
k=1
k=1
1�
1�
2
T =
mk v 2k =
mk [v(Q) + ω ∧ (Pk − Q)] .
2
2
(7.64)
Sviluppando il quadrato otteniamo
�
�
N
N
�
1
1�
2
2
T = M v (Q) + v(Q) · ω ∧
mk (Pk − Q) +
mk [ω ∧ (Pk − Q)] .
2
2
k=1
k=1
(7.65)
dove M la massa totale del corpo. Anche in questo caso il doppio prodotto può essere
reso nullo con una opportuna scelta del punto Q. Infatti:
• se Q è fisso sia il primo che il secondo termine nella somma in (7.65) sono nulli
e abbiamo
N
1�
T =
mk [ω ∧ (Pk − Q)]2 ;
2
k=1
302
LEZIONI DI SISTEMI DINAMICI
• oppure se Q ≡ Po , cioè Q coincide con il centro di massa, la somma tra parentesi
nel secondo addendo si annulla e si può scrivere
N
1
1�
2
T = M v 2 (P0 ) +
mk [ω ∧ (Pk − P0 )] .
2
2
(7.66)
k=1
La formula (7.66) è nota come Teorema di König, e dice che l’energia di un corpo
rigido è data dalla somma dell’energia che avrebbe un punto materiale di massa uguale
alla massa del corpo, indicata con TP0 , e l’energia cinetica che il corpo ha rispetto a
un sistema di riferimento che trasla con velocità uguale a quella del centro di massa17 ,
che indicheremo con TR .
Procedendo nel calcolo in modo analogo a quanto fatto nel calcolo di L(Q), applichiamo la proposizione 7.3.2
TR =
1
ω · σ(P0 )ω .
2
(7.67)
In particolare, una volta selezionato un SdR cartesiano ortogonale centrato nel centro
di massa, avremo
1
TR = ω · IPo ω,
(7.68)
2
essendo IPo l’espressione dell’operatore σ(P0 ) rispetto al SdR selezionato. Anche in
tal caso converrà in generale selezionare un SdR solidale che sia principale d’inerzia in
modo che sia IPo diagonale. Evidentemente dovremo aver cura di esprimere anche ω
nel medesimo SdR.
Riepilogando
T =
1
1
2
2 M v (P0 ) + 2 ω · σ(P0 )ω ,
1 ω · σ(Q)ω ,
2
se Q coincide con Po ,
(7.69)
se Q è fisso.
Esempio 7.6.3 Consideriamo un sistema rigido come in figura 7.15. Il corpo può
ruotare attorno alla retta verticale (con cui l’asta forma un angolo α) e su se stesso.
Si seleziona un SdR solidale centro in O, in cui l’asse x coincide con l’asta, l’asse z
giace sul piano formato dalla retta verticale e dall’asse x, e l’asse y è ortogonale a
tale piano. Tale SdR è una terna principale d’inerzia.
Indichiamo con θ l’angolo di rotazione attorno alla retta verticale e con φ quello
attorno all’asse x. Quindi, l’espressione di ω nel SdR solidale è
φ̇ − θ̇ cos α
,
0
ω=
θ̇ sin α
17 Questo teorema è spesso enunciato dicendo che l’energia cinetica di un sistema rigido è uguale alla
somma dell’energia cinetica del centro di massa e dell’energia cinetica relativa al centro di massa. E’ bene
notare che il senso dei termini usati è quello specificato sopra nel testo: presi “alla lettera” energia cinetica
del centro di massa e energia cinetica relativa al centro di massa non hanno significato.
DINAMICA SISTEMI RIGIDI
303
z
y
O
α
x
Figura 7.15: Il sistema rigido è composto da un disco di massa M e raggio R, e un’asta,
di massa m e lunghezza d, saldata ortogonalmente al disco nel suo centro. L’asta è
incernierata nel punto O della retta verticale e mantiene un angolo α con la retta stessa.
dove θ̇ è la velocità di rotazione attorno alla retta verticale mentre φ̇ è la velocità di
rotazione del corpo su se stesso. Applicando il teorema 7.3.1 e l’osservazione 7.3.2, la
matrice d’inerzia è data da
IO
=
=
Iasta
+ Idisco
O
O
0
0
0
2
2
0 md + m d
0
12
4
2
2
md
d
0
0
+m
12
4
M R2
0
0
2
2
MR
+
0
+ M d2
0
4
M R2
+ M d2
0
0
4
che, per brevità di notazione, indicheremo come
I1 0 0
IO = 0 I2 0 .
0 0 I2
,
304
LEZIONI DI SISTEMI DINAMICI
Applicando la (7.69)2, abbiamo
φ̇ − θ̇ cos α
φ̇ − θ̇ cos α
I1 0 0
1
· 0 I2 0
0
0
T =
2
0 0 I2
θ̇ sin α
θ̇ sin α
� �
�
�2
1
I1 φ̇ − θ̇ cos α + I2 θ̇2 sin2 α .
=
2
Esempio 7.6.4 Consideriamo il sistema rigido dell’esempio 7.6.1. Le componenti del
vettore ω nel SdR solidale di figura 7.12, sono
ω cos α
ω = −ω sin α ,
0
per cui, applicando sempre la formula (7.69)2
ω cos α
I1 0
1
−ω sin α · 0 I2
T =
2
0
0 0
=
�
ω2 �
I1 cos2 α + I2 sin2 α .
2
0
ω cos α
0 −ω sin α
0
I3
Esempio 7.6.5 Calcoliamo l’energia cinetica del disco dell’esempio 4.1.3, applicando
la (7.69)1, dove Po è il centro Q della figura 4.3. Ricordando la (4.18),
M 2 2
1
M v 2 (Q) =
R θ̇ .
2
2
Per quel che riguarda l’energia cinetica dovuta alla rotazione, riferendoci alla figura
6.10, selezioniamo il SdR solidale S ′ . Come mostrato nell’esempio 6.8.1, la velocità
angolare del disco è data da ω = ϕ̇eX ′ + θ̇ez , che, come già detto, esprimeremo nel
SdR S ′ . Quindi ricordando la (6.74) abbiamo
ϕ̇
ω = −θ̇ sin ϕ ,
θ̇ cos ϕ
dove, lo ricordiamo, θ e l’angolo di rotolamento ϕ sono legati dalla (4.20). Si applica
adesso la (7.68), con IQ data da
M R2
0
0
2
M R2
IQ =
.
0
0
4
M R2
0
0
4
ottenendo così
1
M R2 2 M R2 2
ω· IQ ω =
ϕ̇ +
θ̇ .
2
4
8
DINAMICA SISTEMI RIGIDI
305
La (7.69)1 diventa quindi
M R2
M R2 2
5
ϕ̇ =
T = M R2 θ̇2 +
8
4
4
(4.20)
�
5 R2
+ 2
2
r
�
θ̇2 .
Esempio 7.6.6 Il sistema di figura 7.16 è costituito da un asta AB, di lunghezza l e
massa m, i cui estremi sono vincolati a scorrere su una circonferenza di raggio l/2
e massa m. La circonferenza può ruotare attorno all’asse x. I gradi di libertà del
sistema rigido sono due: l’angolo ϕ di rotazione della circonferenza e l’angolo θ di
rotazione dell’asta. Rispetto al SdR {O, x, y, z} solidale con il disco (ma non con
ez
O
A
B
ey
ex
θ
ϕ
x
Figura 7.16: Asta vincolata ad una circonferenza ruotante.
l’asta), abbiamo
ω = ϕ̇ex + θ̇ez .
In tale SdR dobbiamo esprimere la matrice d’inerzia, che sarà
+ Iasta
.
IO = Ianello
O
O
Come già osservato, il SdR {O, x, y, z} non è solidale con l’asta. Consideriamo quindi
un SdR S, sempre centrato in O, solidale con l’asta, in cui l’asse X coincide con l’asta
AB, l’asse Y giace sul piano dell’anello ed è ortogonale ad X, e Z ≡ z. In tale SdR
abbiamo
0 0 0
2
ml
0 1 0 .
Iasta
O, S =
12
0 0 1
306
LEZIONI DI SISTEMI DINAMICI
Per passare ad Iasta
O , bisogna applicare la formula (7.17), dove B è la matrice di
rotazione di un angolo θ attorno all’asse z, cioè
cos θ
sin θ 0
0 0 0
cos θ − sin θ 0
2
ml
sin θ cos θ 0 0 1 0 − sin θ cos θ 0
Iasta
=
O
12
0
0
1
0 0 1
0
0
1
− cos θ sin θ 0
sin2 θ
ml2
=
− cos θ sin θ
cos2 θ
0 .
12
0
0
1
Come più volte osservato, gli elementi della matrice d’inerzia in un SdR non solidale
dipendono, in generale, dal tempo (si ricordi infatti che θ = θ (t) ). Dunque, la matrice
d’inerzia della circonferenza e dell’asta è
1 0 0
sin2 θ
− cos θ sin θ 0
2
ml
ml2
− cos θ sin θ
0 1 0 +
IO =
cos2 θ
0
8
12
0 0 2
0
0
1
3
+ sin2 θ − cos θ sin θ 0
2
ml2
.
3
=
2
+
cos
−
cos
θ
sin
θ
θ
0
12
2
0
0
4
Applicando quindi la (7.69)2 otteniamo
3
+ sin2 θ − cos θ sin θ
ϕ̇
2
ml
3
0 ·
− cos θ sin θ
+ cos2 θ
24
2
θ̇
0
0
�
��
�
ml2
3
4θ̇2 + ϕ̇2 sin2 θ +
.
24
2
2
T
=
=
ϕ̇
0
0
θ̇
4
0
7.7 Le precessioni per inerzia
Un caso importante di moto rigido è quello che va sotto il nome di precessione per inerzia. Ad esso si riducono diversi moti, apparentemente diversi. Il primo caso è quello
di un corpo che si muove mantenendo un punto fisso O ed è soggetto a vincoli lisci e a
forze esterne che hanno momento risultate τ ext (O) nullo rispetto al punto O. In questo caso si vede immediatamente che la seconda equazione cardinale è sufficiente per
determinare il moto (essa è infatti equivalente all’equazione simbolica della dinamica),
mentre la prima equazione cardinale serve solo per determinare la risultante delle forze
vincolari.
Il secondo caso è il moto di un corpo rigido “libero” (cioè non soggetto a vincoli
oltre a quelli di rigidità) e a cui non siano applicate forze esterne. In questo caso il
centro di massa si muove di moto rettilineo uniforme, e il moto “essenziale” è quello
del corpo rispetto al riferimento inerziale con origine nel centro di massa.
DINAMICA SISTEMI RIGIDI
307
Infine a questo tipo di moto si può ridurre il moto di un corpo rigido quando sia
soggetto solo alla forza di gravità (e quando si possa assumere che questa sia uniforme,
ovvero uguale a −mk g). Infatti in questo caso la prima equazione cardinale determina
il moto del centro di massa, mentre il moto del corpo relativo al sistema di riferimento
che trasla con la velocità del centro di massa è determinato dalla seconda equazione
cardinale, dove ora le forze esterne hanno momento nullo rispetto al centro di massa.
E’ interessante notare che ora, al contrario del caso precedente, questo il riferimento
non è più inerziale.
7.7.1 Le equazioni di Eulero
Le equazioni fondamentali per la descrizione delle precessioni per inerzia sono le
Equazioni di Eulero. In realtà non si tratta di nuove equazioni; le equazioni di Eulero sono le equazioni scalari ottenute dalla seconda equazione cardinale, scritta nella
forma (7.54), scomposta nel sistema di riferimento principale di inerzia (quindi un sistema solidale) centrato nel polo della precessione (il punto fisso). Se O è il punto
fisso, la matrice d’inerzia ha la forma
I1 0 0
IO = 0 I2 0 ,
0 0 I3
le equazioni di Eulero per precessioni qualsiasi, non solo per quelle per inerzia, hanno
la forma
I1 ω̇1
I2 ω̇2
I3 ω̇3
= (I2 − I3 )ω2 ω3 + τ1ext ,
= (I3 − I1 )ω3 ω1 + τ2ext ,
= (I1 − I2 )ω1 ω2 +
τ3ext
(7.70)
,
dove abbiamo indicato con ωi le componenti di ω in questo sistema di riferimento. Le
componenti τiext del momento delle forze estere τ ext (O), rispetto ai tre assi solidali
del riferimento principale, dipendono in genere dall’orientazione del corpo rispetto al
sistema di riferimento che giudica il moto, e quindi sono funzioni degli angoli di Eulero. Quindi nel caso generale le (7.70) formano un sistema di equazioni differenziali del
secondo ordine negli angolo di Eulero (per “esplicitare” questo sistema si dovrebbero
sostituire le componenti di ω tramite gli angoli di Eulero e le loro derivate).
Nel caso di una precessione per inerzia, tuttavia, abbiamo τiext = 0, i = 1, 2,
3, e le equazioni di Eulero diventano un sistema di equazioni del primo ordine per le
componenti di ω. E’ bene notare subito che la risoluzione di queste equazioni non
fornisce direttamente il moto del sistema ma l’evoluzione del vettore velocità angolare
nel sistema di riferimento solidale; ovvero come si muove il vettore ω nel sistema di
riferimento di cui stavamo cercando il moto!
In effetti la soluzione delle equazioni di Eulero è solo un passo intermedio nella
determinazione del moto. Una volta determinato ω dobbiamo ricostruire la matrice A
di passaggio tra il sistema di riferimento fisso e quello mobile di cui ω, come espresso
dalla formula (6.27) della sezione 6.3, è “la derivata”, cioè
0
−ω3 ω2
dA T
ω3
0
−ω1 .
A =
dt
−ω2 ω1
0
308
LEZIONI DI SISTEMI DINAMICI
7.7.2 Risoluzione dell’equazione di Eulero nel caso di precessioni
per inerzia
Le equazioni di Eulero per le precessioni per inerzia sono risolubili “per quadrature”,
cioè se ne può trovare la soluzione con un numero finito di integrazioni (e inversioni
di funzioni) come avveniva per l’equazione scalare ẍ = f (x), analizzata nella sezione
2.6 capitolo 2. Questo è dovuto all’esistenza di due integrali primi, che permettono di
ridurre il sistema a una sola equazione scalare del primo ordine. Riscriviamo il sistema
(7.70) ponendo τ ext (O) = 0,
I1 ω̇1
=
I2 ω̇2
=
I3 ω̇3
=
(I2 − I3 )ω2 ω3 ,
(I3 − I2 )ω3 ω1 ,
(7.71)
(I1 − I2 )ω1 ω2 .
Il primo integrale è la conservazione dell’energia: poiché non ci sono forze che compiono lavoro, l’energia si riduce alla sola energia cinetica
T =
1
I1 ω12 + I2 ω22 + I3 ω32 .
2
(7.72)
La costanza di T si può ricavare direttamente delle (7.71) moltiplicando la prime per
·
·
·
ω 1 , la seconda per ω 2 e la terza per ω3 e sommando membro a membro: il risultato è
la derivata di T eguagliata a zero.
L’altro integrale è la conservazione del momento della quantità di moto che segue
dalla seconda equazione cardinale, dal momento che τ ext (O) = 0. In particolare resta
costante il modulo quadro del momento
L2 = I12 ω12 + I22 ω22 + I32 ω32 .
(7.73)
Si noti che questi due integrali si riducono, essenzialmente, alla stessa equazione nel
caso in cui i tre momenti di inerzia siano uguali: in questo caso ogni asse è principale di
inerzia e il moto è una rotazione uniforme attorno all’asse individuato dalla condizione
iniziale per ω.
I due integrali primi ci dicono che ad ogni istante il vettore ω si trova sulla curva
determinata dall’intersezione dei due ellissoidi determinati da (7.72) e (7.73): questa
curva prende il nome di poloide (v. figura 7.17).
Dividendo la (7.72) per 2T
I1 2
I2 2
I3 2
ω +
ω +
ω =1
2T 1 2T 2 2T 3
(7.74)
I12 2 I22 2 I32 2
ω +
ω +
ω = 1,
L2 1 L2 2 L2 3
(7.75)
e la (7.73) per L2
e sottraendo membro a membro, otteniamo
L2
L2
L2
2
2
I1 I1 −
ω1 + I2 I2 −
ω2 + I3 I3 −
ω32 = 0 .
2T
2T
2T
(7.76)
DINAMICA SISTEMI RIGIDI
309
La (7.76) è l’equazione di un cono (detto cono di Poinsot18 ) passante passante per O
(v. figura 7.18), che è la superficie spazzata dall’asse di moto al variare del tempo,
ovvero la rigata mobile di questo particolare moto rigido19.
Figura 7.17: Integrali primi del moto per inerzia. Poloide.
Casi degeneri: rotazioni
Vediamo prima cosa succede in alcuni casi particolari. Supponiamo di aver scelto gli
L2
= I1 , il cono rappresentato dalla (7.76)
assi in modo che sia I1 < I2 < I3 . Se 2T
degenera nella retta ω2 = ω3 = 0 (il coefficiente di ω1 è nullo e gli altri due sono
negativi) che è l’asse maggiore dell’ellissoide 2T = I1 ω12 + I2 ω22 + I3 ω32 . Questo
implica che la velocità angolare ω ha sempre la direzione dell’asse ω1 . Per valori di
L2
2T leggermente maggiori di I1 , la poloide è una piccola curva chiusa attorno all’asse
maggiore: ne segue che le rotazioni attorno all’asse maggiore sono stabili.
L2
Analogamente se 2T
= I3 , ω ha sempre la direzione dell’asse ω3 (l’asse minore
dell’ellissoide). Il moto risultante è una rotazione del sistema attorno a questo asse.
L2
Anche in questo caso le poloidi corrispondenti a valori leggermente inferiori di 2T
,
sono curve chiuse attorno all’asse minore, e la rotazione è ancora stabile.
18 Louis
Poinsot (Clermont, 1777 – Parigi, 1859) è stato un matematico e fisico francese noto per i suoi
contributi alla meccanica dei sistemi rigidi.
19 Ovviamente (7.76) è l’equazione di un cono se e solo se min{I , I , I } < L2 < max{I , I , I }.
1 2 3
1 2 3
2T
Questa condizione è garantita (con i segni non stretti nei casi degeneri) dall’esistenza stessa del moto, ovvero
2
L
soddisfi le due diseguaglianze.
la condizione iniziale per ω fa sì che 2T
310
LEZIONI DI SISTEMI DINAMICI
Figura 7.18: Integrali primi: l’ellissoide scuro (si vede solo una calotta) è la superficie dell’energia cinetica: l’ellissoide chiaro è la superficie del modulo quadro del
momento; la superficie aperta è il cono di Poinsot solidale.
Nel caso in cui si abbia
L2
2T
= I2 , il cono degenere nella coppia di piani20
L2
L2
ω12 + I2 I2 −
ω32 = 0 .
I1 I1 −
2T
2T
Ovviamente vi è anche la soluzione ω1 = ω3 = 0, e ω2 �= 0, che corrisponde alla
condizione iniziale ω diretto lungo l’asse intermedio: moto di rotazione attorno all’asse
intermedio. Questa volta però il moto di rotazione è instabile.
Il giroscopio
Un altro caso in cui è facile determinare il moto per inerzia è quello che corrisponde ad
un corpo a struttura giroscopica, ovvero quando due dei momenti di inerzia risultano
uguali (ma non tutti e tre). Volendo caratterizzare un corpo a struttura giroscopica in
termini di ellissoide d’inerzia, abbiamo che questo è un ellissoide di rotazione. L’asse
di simmetria dell’ellissoide è detto asse giroscopico, e su di esso giace il centro di
massa.
In questo caso i due ellissoidi (7.74) e (7.75) sono “rotondi” (cioè a sezione circolare). Le poloidi sono quindi delle circonferenze e il cono di Poinsot è un cono circolare
retto.
20 Si
noti che i due coefficienti hanno segni opposti.
DINAMICA SISTEMI RIGIDI
311
Senza perdere in generalità, possiamo supporre I1 = I2 = I, mentre l’asse z ha
momento d’inerzia I3 . Le equazioni di Eulero si riducono a
I ω̇1
I ω̇2
I3 ω̇3
= (I − I3 )ω2 ω3 ,
= (I3 − I)ω3 ω1 ,
= 0.
Abbiamo quindi immediatamente ω3 (t) = ω3 0 = costante, e
ω̈1 = −Ω2 ω1 ,
ω̇1 = Ωω2 ,
⇒
ω̇2 = −Ωω1 ,
ω̈2 = −Ω2 ω2 ,
(7.77)
dove
I − I3
ω3 0 .
(7.78)
I
Le (7.77) sono immediatamente risolubili: sono le equazioni del moto armonico e ci
dicono che ω ruota con velocità di modulo costante attorno all’asse z. In particolare,
se supponiamo che all’istante iniziale ω1 |t=0 = A, e ω2 |t=0 = 0, la soluzione è
ω1 (t) = A cos (Ωt) ,
ω2 (t) = A sin (Ωt) ,
ω3 (t) = ω3 0 .
Ω=
Le componenti del momento angolare (ovviamente nel SdR solidale) sono
A cos (Ωt)
I 0 0
AI cos (Ωt)
L (O) = IO ω = 0 I 0 A sin (Ωt) = AI sin (Ωt) .
ω3 0
0 0 I3
I3 ω3 0
Quindi, rispetto al SdR solidale, le prime due componenti di L (O), cioè L1 e L2 variano nel tempo, mentre la terza componente L3 = I3 ω3 0 , rimane costante. Ma allora,
se osservato dal SdR solidale il vettore L (O) ruota attorno all’asse z, con velocità angolare Ω. Tale moto viene appunto detto precessione. Quindi, se ξ è l’angolo fra l’asse
z e il vettore L (O), esso rimane invariato e, siccome L3 = |L (O)| cos ξ, si ha
cos ξ =
I3 ω3 0
.
|L (O)|
Ora poniamoci nel SdR fisso {X, Y, Z} in cui l’asse Z coincide con il vettore L (O),
che, ovviamente, è costante. Da questa prospettiva è l’asse z del SdR solidale che
forma un angolo (costante) ξ con l’asse Z. In tal caso è l’asse z che precede attorno
all’asse Z (come mostrato dalla figura 7.19) con velocità angolare Ω, data da (7.78),
detta anche velocità di precessione. In particolare, Ω può anche essere espresso in
funzione dell’angolo ξ, infatti
Ω=
I − I3
I − I3 |L (O)|
ω3 0 =
cos ξ .
I
I
I3
312
LEZIONI DI SISTEMI DINAMICI
z
L(O)
Z
ξ
Y
O
Ωt
X
Figura 7.19: SdR fisso {X, Y, Z}, in cui l’asse Z è allineato con L (O). L’asse z del
SdR solidale precede attorno a L (O), ovvero attorno all’asse Z.
Caso generico
L2
è diversa
Torniamo al caso generico in cui sia I1 < I2 < I3 , e la costante del moto
2T
dai momenti di inerzia. Possiamo utilizzare le due relazioni (7.72) e (7.73) per scrivere
un’equazione che coinvolge solo una delle ωi , per esempio la seconda componente ω2 .
Infatti si ha
ω12 = a21 (ν12 − ω22 ) ,
ω32 = a23 (ν32 − ω22 ) ,
(7.79)
con
a21 =
e
I2 I1 − I2
I2 I3 − I2
, a23 =
,
I1 I3 − I1
I3 I1 − I3
L2
L2
−
I
1
2T
2T
2
2T
2T
ν12 =
, ν3 =
.
I2
I3 − I2
I2
I1 − I2
I3 −
Sostituendo nella seconda equazione di Eulero il prodotto ω1 ω3 tramite la (7.79), otteniamo un’equazione a variabili separabili per la sola ω2 (l’equazione sarà affetta da
una doppia determinazione di segno a causa delle radici quadrate; questo è inevitabile poiché corrisponde al fatto che ad ogni valore di ω2 corrispondono due punti sulla
poloide).
DINAMICA SISTEMI RIGIDI
313
7.7.3 Il moto à la Poinsot
Accanto alla descrizione analitica del moto fornita dalle equazioni di Eulero, i due
integrali primi T e L (O) ci permettono di dare una elegante descrizione geometrica
del moto di precessione per inerzia, anche detto moto à la Poinsot. Denotiamo con
E = costante, l’energia cinetica del corpo e consideriamo l’ellissoide dato da
φ (ω) = ω · IO ω − 2E = 0.
(7.80)
Nel SdR solidale {ex , ey , ez } l’espressione di φ (ω) è particolarmente semplice se
supponiamo che questo sia una terna principale d’inerzia,
φ (ω1 , ω2 , ω3 ) = I1 ω12 + I2 ω22 + I3 ω32 − 2E = 0 .
(7.81)
Fissato adesso un qualsiasi ω che soddisfa la (7.81), calcoliamo il gradiente della
superficie φ = 0, in corrispondenza di tale ω
∇φ = 2 [I1 ω1 ex + I2 ω2 ey + I3 ω3 ez ] = 2IO ω .
Si osserva facilmente che ∇φ è parallelo al momento angolare L (O)
L (O) = IO ω = I1 ω1 ex + I2 ω2 ey + I3 ω3 ez .
Adesso consideriamo il piano Π ortogonale a ∇φ, passante per ω. Esso sarà ovviamente tangente all’ellissoide nel punto ω. Abbiamo quindi provato che, fissato comunque
ω che soddisfa la (7.81), il piano tangente all’ellissoide in ω è ortogonale ad L (O).
O
d
ω
L (O)
Figura 7.20: Moto à la Poinsot.
Adesso facciamo gli stessi ragionamenti nel SdR fisso. Ovviamente l’equazione
dell’ellissoide (7.80) avrà una forma molto più complicata e varierà nel tempo dal
momento che, in generale, i coefficienti di IO dipendono dal tempo. Tuttavia L(O)
è costante e allora anche la giacitura del piano Π è costante (essendo perpendicolare
ad un vettore costante). Calcoliamo ora la distanza d di questo piano dal punto fisso O.
Riferendoci alla figura 7.20 abbiamo
d = ω · n,
314
dove n =
IO ω,
LEZIONI DI SISTEMI DINAMICI
L (O)
∇φ
=
, è la normale al piano n. Ricordando adesso che L (O) =
|∇φ|
|L (O)|
d=ω·
ω · IO ω
2E
L (O)
=
=
.
|L (O)|
|L (O)|
|L (O)|
(7.82)
La (7.82) ci dice dunque che la distanza d del piano Π dall’origine è costante nel
tempo. Quindi il piano tangente all’ellissoide nel punto di intersezione con ω, che è
l’asse istantaneo di moto, è un piano fisso (rispetto all’osservatore fisso). A sua volta
il punto solidale che istantaneamente si trova a essere il punto di tangenza, ha velocità
nulla in quanto è un punto dell’asse istantaneo di moto. Ne segue che l’ellissoide
rotola senza strisciare sul piano. La curva descritta dal punto sul piano Π dal punto
di tangenza prende il nome di erpoloide. Essa è l’intersezione del piano con la rigata
fissa del moto.
7.8 Lagrangiana del corpo rigido
Le equazioni di Lagrange sono utilizzabili per qualunque sistema meccanico, quali
che siano i vincoli, purché olonomi. In particolare, abbiamo visto che il vincolo di
rigidità è un vincolo liscio (esempio 5.2.1) per cui le forze vincolari che lo mantengono
non compaiono nelle equazioni di Lagrange. In questa sezione illustreremo come si
scrivono la funzione di Lagrange e le equazioni di Lagrange per un corpo rigido che:
• sia soggetto alla forza peso;
• sia soggetto a K forze F r , r = 1, ..., K, applicate nei punti Pr , r = 1, ..., K,
del corpo;
Come nel paragrafo 7.5 si denotano con qi , le coordinate, rispetto al SdR fisso, del
centro del SdR solidale, e con ϕj , gli angoli che descrivono la rotazione. Ovviamente
se il corpo è libero i = 1, 2, 3 e j = 1, 2, 3, ed il numero di gradi di libertà è 6, mentre
se il corpo è soggetto a vincoli allora il numero di gradi di libertà sarà imax + jmax ,
dove 0 ≤ imax ≤ 3, e 0 ≤ jmax ≤ 3.
Per quanto riguarda la forza peso, questo è un sistema di vettori applicati negli N
punti Pi del corpo, cioè
S = {(Pi , −mi gez ) , i = 1, ...., N } ,
dove −gez è l’accelerazione di gravità. Come visto nella
sezione 1.5.4 il sistema S, è
equivalente alla forza peso risultante −M gez = − i mi gez , applicata in un punto
qualunque della retta passante per il centro di massa Po e parallela a g. Possiamo quindi
supporre che la forza peso risultante sia applicata in Po , sì che l’energia potenziale ad
essa associata è Vpeso = M gzPo , dove zPo è la quota del centro di massa. Esprimendo
quest’ultima in termini dei parametri lagrangiani qi e ϕj , cioè zPo = zPo (qi , ϕj ),
poniamo, come nella sezione 5.3, Vpeso (qi , ϕj ) = M g
zPo (qi , ϕj ), e la funzione di
Lagrange è
L = T − Vpeso = T − M g
zPo ,
DINAMICA SISTEMI RIGIDI
315
con T energia cinetica del corpo data dalla (7.69). Quindi il sistema di equazioni di
Lagrange (5.33) diventa
�
�
d ∂L
∂L
−
= Ξi , i ≤ imax ,
dt ∂ q̇i
∂qi
�
�
∂L
d
∂L
−
= Ξj , j ≤ jmax ,
dt ∂ ϕ̇j
∂ϕj
dove Ξi e Ξj sono le forze generalizzate che, ricordando la (5.32), sono date da
Ξi =
K
�
r=1
Fr ·
∂xr
,
∂qi
e
Ξj =
K
�
h=1
Fr ·
∂xr
,
∂ϕj
dove, per brevità, xr = (Pr − O) denota il vettore posizione del punto Pr , dove è
applicata la forza F r . Se poi le forze applicate nei K punti del corpo sono conservative (per esempio sono forze generate da molle) allora sono derivabili da un’energia
potenziale V (x1 , ..., xK ), per cui
Ξi = −
∂ V�
,
∂qi
Ξj = −
∂ V�
,
∂ϕj
con V� (qi , ϕj ) = V (x1 (qi , ϕj ) , ..., xK (qi , ϕj )). La funzione di Lagrange diventa
L = T − V�peso − V� .
Esempio 7.8.1 In figura 7.21 è data un’asta AB, di lunghezza l e massa m, vincolata
senza attrito nell’estremo A. L’estremo B è soggetto all’azione di una molla di lunghezza a riposo e massa trascurabili fissata nel punto C ≡ (0, 0, l). Il peso è� come in
�
figura. Prendiamo come parametri lagrangiani gli angoli ϕ ∈ [0, 2π) e θ ∈ − π2 , π2 ,
mostrati in figura. Consideriamo poi il SdR fisso S : {A, x, y, z} e quello solidale
S ′ : {A, X, Y, Z}. La velocità angolare nel SdR S è
ω
=
ϕ̇ez + θ̇eY = ϕ̇ez + θ̇ (− sin ϕex + cos ϕ ey )
=
−θ̇ sin ϕex + θ̇ cos ϕey + ϕ̇ez ,
mentre nel SdR S ′ diventa
ω
= ϕ̇ez + θ̇eY = ϕ̇ (sin θeX + cos θeZ ) + θ̇eY
= ϕ̇ sin θeX + θ̇eY + ϕ̇ cos θeZ .
Poniamoci nel SdR solidale S ′ per calcolare l’energia cinetica. Applichiamo il teorema
′
7.3.1 per determinare ISA ,
′
ISA
0
0
=
0
0
� �2
ml2
l
+m
12
2
0
0
0
ml2
=
0
� �2
3
0
ml2
l
+m
12
2
0
0 0
1 0 .
0 1
316
LEZIONI DI SISTEMI DINAMICI
z
C
X
peso
B
Z
Y
A
θ
ϕ
x
y
Figura 7.21: Asta vincolata nell’estremo A con l’estremo B soggetto alla forza di una
molla.
Sfruttando poi la (7.69)
ϕ̇ sin θ
ml
·
θ̇
6
ϕ̇ cos θ
�
ml2 � 2
θ̇ + ϕ̇2 cos2 θ
6
2
T
=
=
0 0
0 1
0 0
ϕ̇ sin θ
0
0
θ̇
1
ϕ̇ cos θ
.
Notiamo che se θ = 0, corrispondente all’asta orizzontale, l’energia cinetica è massima (a parità di ϕ̇ e θ̇) mentre è minima quando l’asta è verticale,cioè θ = ±π/2.
Nel punto B è applicata una forza elastica, che possiamo derivare dall’energia
k
2
potenziale V = (B − C) ,
2
�
k�
2
2
(l cos θ) + (l − l sin θ) = kl2 (1 − sin θ) .
V� =
2
L’energia potenziale della forza peso è V̂ = mg 2l sin θ, e dunque la Lagrangiana è
L=
�
ml2 � 2
l
θ̇ + ϕ̇2 cos2 θ − kl2 (1 − sin θ) − mg sin θ.
6
2
La variabile ϕ è ciclica e ciò consente di determinare l’energia potenziale efficace (si
suggerisce di farlo come esercizio).
DINAMICA SISTEMI RIGIDI
317
Esempio 7.8.2 Riprendiamo l’esempio 4.1.2 e: (i) calcoliamo la funzione di Lagrange; (ii) mostriamo che il vincolo di rotolamento puro è liscio. Cominciamo proprio da
questo punto, considerando l’angolo di rotolamento ϕ come parametro lagrangiano.
Se C è il punto che, istante per istante, è a contatto con la guida rettilinea (v. figura
4.2), e F rot è la forza che impone il vincolo, dobbiamo calcolare
F rot ·
∂ (C − Ω)
,
∂ϕ
dove (C − Ω) deve essere espresso nel SdR fisso {Ω, x, y, z}.
Selezioniamo un generico punto P del disco e prendiamo il centro del disco O
come punto solidale. Volendo esprimere il vettore (P − Ω) nel SdR fisso scriveremo
(P − Ω) = (O − Ω) + (P − O) ,
� �� �
� �� �
−Rϕex +Rey
AX
dove A è la matrice di rotazione
cos ϕ − sin ϕ 0
A = sin ϕ cos ϕ 0 ,
0
0
1
e X è la terna delle coordinate, rispetto al SdR solidale, del punto P . Dunque
∂ (P − Ω)
∂A
= −Rex +
X.
∂ϕ
∂ϕ
(7.83)
Adesso consideriamo come punto P quello che, ad un determinato istante, coincide
con C, cioè con il punto di contatto fra la guida ed il disco. Siccome nel SdR fisso il
punto di contatto è individuato dal vettore −Rey , la terna X è data da
0
X = AT −R .
0
Se quindi consideriamo il punto di contatto, la (7.83) diventa
0
∂ (C − Ω)
∂A T
−R .
= −Rex +
A
∂ϕ
∂ϕ
0
Siccome
∂A T
A
∂ϕ
=
=
cos ϕ
− sin ϕ − cos ϕ 0
cos ϕ − sin ϕ 0 − sin ϕ
0
0
0
0
0 −1 0
1 0 0 ,
0 0 0
sin ϕ 0
cos ϕ 0
0
1
318
LEZIONI DI SISTEMI DINAMICI
abbiamo
0
0
−1 0
0 0 −R = 0 .
0
0
0 0
−R
0
∂ (C − Ω)
0 + 1
=
∂ϕ
0
0
Di conseguenza, qualunque sia la forza F rot , F rot ·
∂ (C − Ω)
= 0: il vincolo di
∂ϕ
rotolamento è liscio.
Per quel che riguarda l’energia cinetica, sfruttando la (7.69)1, otteniamo
�
�2
mR2 2
3
m d (O − Ω)
ϕ̇ = mR2 ϕ̇2 ,
+
T =
2
dt
4
4
da cui L =
3
mR2 ϕ̇2 .
4
7.9 Il giroscopio pesante
Un altro caso interessante di moto rigido, che può essere risolto analiticamente, è quello
della “trottola”, ovvero di un corpo a struttura giroscopica21 soggetto alla sola forza
peso e vincolato senza attrito a precedere attorno a un punto dell’asse giroscopico,
come mostrato in figura 7.22. Ovviamente assumeremo che il punto in cui il corpo è
vincolato sia diverso dal centro di massa (altrimenti il moto sarebbe una precessione
per inerzia).
ζ
θ
z
x
η
φ
ψ
ξ
y
linea dei nodi
Figura 7.22: Giroscopio pesante
In questo caso l’integrazione delle equazioni di moto è fatta a partire dalle equazioni
di Lagrange, utilizzando come parametri lagrangiani gli angoli di Eulero.
21 La
caratteristica di un corpo rigido a struttura giroscopica è stata descritta all’inizio del paragrafo 7.7.2.
DINAMICA SISTEMI RIGIDI
319
Scegliamo il SdR solidale, S : {i, j, k}, con origine O nel polo della precessione
(il punto fisso) con l’asse delle z coincidente con l’asse giroscopico. Ogni coppia di
assi x e y (ortogonali) sul piano z = 0 definisce un sistema principale di inerzia per la
simmetria di rotazione dell’ellissoide rispetto all’asse giroscopico.
Prendiamo poi un riferimento fisso, Σ : {e1 , e2 , e3 }, con asse delle ζ coincidente
con la direzione della verticale (ascendente): i parametri lagrangiani sono gli angoli di
Eulero definiti da questi due riferimenti. I due SdR sono rappresentati nella figura 7.22.
L’energia potenziale della forza peso è dato da
V� (θ, ψ, ϕ) = M gl cos θ
dove M è la massa totale del corpo rigido e l la distanza tra P0 e il polo O.
Per determinare l’energia cinetica esprimiamo la velocità angolare ω in funzione
degli angoli di Eulero
ω = θ̇ n + ψ̇ e3 − ϕ̇ k .
Per determinare ω · σ(O)ω, osserviamo che il calcolo può essere eseguito nel riferimento che ha come assi l’asse giroscopico, la linea dei nodi e l’asse perpendicolare a
questi due: questo è una terna principale d’inerzia ad ogni istante (anche se mobile sia
rispetto a S che a Σ) per la simmetria dell’ellissoide, e la matrice d’inerzia è del tipo
A 0 0
IO = 0 A 0 ,
0 0 C
con A > 0 e C > 0. Indichiamo con t il terzo versore di questo sistema. Basta quindi
esprimere ω nelle componenti lungo k, n e t. Siccome e3 è ortogonale alla linea dei
nodi otteniamo
ω = θ̇ n + (ψ̇ cos θ − ϕ̇)k + ψ̇ sin θ t ,
da cui
2T = C(ψ̇ cos θ − ϕ̇)2 + A(θ̇2 + ψ̇ 2 sin2 θ) .
Le due variabili ψ e ϕ sono cicliche, come dovevamo aspettarci visto che il sistema
è invariante per rotazioni attorno al suo asse giroscopico (variazioni di ϕ) e rotazioni
del sistema fisso attorno alla verticale (variazioni di ψ). Ne segue che le quantità
pϕ =
e
∂L
= −C(ψ̇ cos θ − ϕ̇) = Cw3 = −Aa ,
∂ ϕ̇
(7.84)
∂L
(7.85)
= C(ψ̇ cos θ − ϕ̇) cos θ + A ψ̇ sin2 θ = Ab ,
∂ ψ̇
sono costanti del moto. I loro valori sono stati indicati con −A a e A b. Si noti che
il primo integrale (7.84) dice che la componente della velocità angolare lungo l’asse
giroscopico è costante.
Avendo supposto che il corpo sia vincolato senza attrito, abbiamo anche la conservazione dell’energia
pψ =
E=
1
1
C(ψ̇ cos θ − ϕ̇)2 + A(θ̇2 + ψ̇ 2 sin2 θ) + M gl cos θ .
��
� 2
2�
p2
ϕ
C
(7.86)
320
LEZIONI DI SISTEMI DINAMICI
Possiamo ora utilizzare (7.84) per esprimere ϕ̇ in funzione di ψ̇ e θ
C ϕ̇ = −Aa + C ψ̇ cos θ ,
(7.87)
che sostituita nella (7.85) dà
b − a cos θ
.
sin2 θ
Sostituendo infine (7.88) nella (7.87) si ottiene
ϕ̇ =
ψ̇ =
(7.88)
b − a cos θ
A
a + cos θ
.
C
sin2 θ
(7.89)
Le due relazioni (7.88) e (7.89) ci forniscono l’espressione delle derivate dei due
angoli di Eulero in funzione dell’angolo θ. Quindi una volta ricavato θ in funzione del
tempo, possiamo integrarle e ottenere ψ e ϕ in funzione del tempo.
Possiamo ricavare un’equazione per la sola θ partendo dalla conservazione dell’energia che riscriveremo in forma ridotta, sfruttando la conservazione di pϕ . Infatti,
partendo dalla (7.86) e considerando
E′ = E −
1
1 p2ϕ
= A(θ̇2 + ψ̇ 2 sin2 θ) + M gl cos θ ,
2C
2
(7.90)
abbiamo che E ′ è ancora un integrale primo del moto. Sostituendo le (7.88) e (7.89)
nella (7.90) abbiamo l’equazione cercata
sin2 θ θ̇2 = sin2 θ (α − β cos θ) − (b − a cos θ)2 ,
(7.91)
dove
2M gl
2E ′
, β=
.
A
A
L’equazione (7.91) può essere scritta in termini della variabile u(t) = cos θ(t)
α=
u̇2 = (1 − u2 )(α − β u) − (b − a u)2 = f (u) ,
(7.92)
che può essere risolta per separazioni di variabili esprimendo il tempo t in funzione
della soluzione u
u(t)
du
t − t0 = ±
.
(7.93)
2
(1 − u )(α − β u) − (b − a u)2
u(t0 )
L’integrale in (7.93) è un integrale ellittico, quindi non esprimibile, con un numero
finito di operazioni, in termini di “funzioni elementari”. Inoltre la “soluzione” di (7.93)
non consente di chiarire la fisica del problema più di quanto non si possa fare con
l’analisi qualitativa della soluzione basata direttamente sull’equazione (7.92).
Dalla (7.92) abbiamo che il moto è possibile solo per quei valori di u per cui f (u) >
0. Inoltre, essendo u = cos θ, solo i valori di u compresi nell’intervallo [−1, 1] hanno
significato fisico.
Notiamo che f (u) è un polinomio di terzo grado con coefficiente del termine di
ordine massimo positivo. Inoltre abbiamo f (±1) ≤ 0, e il segno di uguaglianza vale
solo nei casi a = b e a = −b che corrispondono a dati iniziali con l’asse giroscopico
DINAMICA SISTEMI RIGIDI
321
asse giroscopico
θ2
asse giroscopico
θ2
arccos (a/b)
θ1
θ1
Figura 7.23:
a
b
�∈ [u1 , u2 ] , e
a
b
∈ [u1 , u2 ].
verticale. Nel caso generico abbiamo che, denotando con u3 il massimo delle soluzioni
di f (u) = 0, u3 è sicuramente maggiore di 1 e tale che f (u)(u − u3 ) > 0 per u in un
intorno di u3 e per tutti gli u > u3 .
Poiché i coefficienti della funzione f (u) sono determinati dalle condizioni iniziali,
essi saranno tali che f (u) è positiva (o meglio non negativa) in un sottoinsieme (eventualmente ridotto a un punto) contenuto in [−1, 1]. Quindi nella situazione generica
avremo f (u) > 0 per u ∈ (u1 , u2 ) ⊂ (−1, 1), dove u1 e u2 sono le altre due radici del
polinomio. Ne segue che il moto dell’asse, per quanto riguarda il suo angolo di nutazione θ, è un moto periodico compreso tra i due valori θ2 = arccos u2 e θ1 = arccos u1
(si noti che θ2 < θ1 dal momento che la funzione coseno decrescente in (0, π)).
L’angolo di precessione ψ è determinato dall’equazione (7.88). Ciò implica che
ψ sarà, o non sarà, una funzione monotona del tempo, a seconda che il valore ab non
appartenga, oppure appartenga, all’intervallo delle radici, si vedano le figure 7.23.
Un caso limite interessante è quello in cui u2 = ab , schematicamente rappresentato in figura 7.24. Tale caso corrisponde all’asse giroscopico “lasciato con velocità
nulla” (ovviamente il giroscopio è inizialmente in rotazione attorno al proprio asse
giroscopico). Questo caso può essere trattato in modo sufficientemente esauriente nell’approssimazione di “rotazione veloce” del giroscopio, ovvero nel caso, detto trottola
veloce, in cui il numero adimensionale
p2ϕ
2C >> 1 ,
2M gl
(7.94)
ovvero quando l’energia cinetica di rotazione attorno all’asse giroscopico è molto
maggiore della massima variazione possibile dell’energia potenziale.
Gli effetti dovuti al momento generato dalla forza peso sono ora solo delle piccole
perturbazioni del moto della trottola attorno al suo asse giroscopico. Possiamo quindi
valutare l’estensione della nutazione e la velocità media della precessione dell’asse
giroscopico, e le loro frequenze.
322
LEZIONI DI SISTEMI DINAMICI
asse giroscopico
θ2
θ1
Figura 7.24: Caso:
a
b
= u2
L’angolo iniziale θ0 corrisponde alla circonferenza superiore nella figura 7.24, ovvero u0 = u2 . Quindi l’estensione della nutazione dipenderà dalla posizione della
seconda radice di f (u) = 0. Poiché abbiamo assunto anche ψ̇ = 0, le costanti a e b
sono legate (vedi la formula (7.88)), da
b = au0 .
Inoltre f (u0 ) = 0, quindi avremo anche
α = βu0 ,
che significa semplicemente che il valore dell’energia ridotta E ′ è dato da M gl cos θ0 ,
ovvero l’energia potenziale iniziale. Usando queste relazioni possiamo riscrivere la
funzione f (u) fattorizzando la radice u0
f (u) = (u0 − u) β(1 − u2 ) − a2 (u0 − u) .
(7.95)
La seconda radice u1 è quindi data dalla radice minore di 1 del polinomio di secondo
grado tra parentesi quadre, che riscriveremo nella forma
x2 + px − q = 0,
con x = u0 − u, e
p=
a2
− 2 cos θ0 ,
β
q = sin2 θ0 .
Il termine 2 cos θ0 in p può essere trascurato, poiché il rapporto
p2ϕ
C C
a
=
,
β
A 2M gl
2
a2
β
è dato da
DINAMICA SISTEMI RIGIDI
323
che, nell’ipotesi di “trottola veloce”, è molto più grande di 2 a meno che il giroscopio
non sia di forma molto allungata lungo l’asse giroscopico (un sorta di trottola a forma
di cilindretto). Allo stesso modo p2 sarà molto più grande di 4q quindi la radice che ci
interessa è data, approssimativamente, da
u0 − u1 =
β sin2 θ0
A 2M gl
=
sin2 θ0 .
a2
C Cw32
(7.96)
La (7.96) ci dice che l’ampiezza della nutazione (ovvero di quanto “scende” l’asse
giroscopico) decresce in modo inversamente al quadrato della velocità di rotazione
attorno all’asse.
Possiamo anche determinare in modo approssimato la frequenza di nutazione.
In-
fatti, poiché l’ampiezza della nutazione è piccola, possiamo sostituire il termine 1 − u2
nella (7.95) con il suo valore iniziale sin2 θ0 , ottenendo l’equazione differenziale in
termini del rapporto x = u0 /u
ẋ2 = x(β sin2 θ0 − a2 x) ,
che è l’integrale primo di una equazione di moto armonico e ha soluzione x = x21 (1 −
p
cos at). Ne segue che la frequenza di nutazione è data da a = Aϕ , ovvero aumenta con
l’aumentare della velocità di rotazione attorno all’asse giroscopico.
Infine, sostituendo questa soluzione nell’equazione per ψ, (7.88) otteniamo ψ̇ =
β
2a (1 − cos at), che ci dice che velocità di precessione non è uniforme e non cambia segno (lo sapevamo!). La quantità importante in questo caso è la velocità media
β
della precessione sul suo periodo, che è data da ψ̇ = 2a
= Mgl
pϕ , che ci dice che la
precessione è tanto più lenta quanto la trottola è veloce.
Nota 7.9.1 Il moto della trottola è un ottimo esempio per capire i cosiddetti effetti
giroscopici: la tenacia dell’asse e la tendenza al parallelismo. Il primo effetto consiste nel fatto che spostare l’asse giroscopico dalla sua direzione è tanto più “difficile”
(ovvero richiede tanto maggiore momento della forza) quanto più la rotazione attorno
all’asse è veloce. Il secondo effetto consiste nell’osservazione di un spostamento dell’asse non nella direzione della forza applicata, ma in quella del suo momento, ovvero
in direzione perpendicolare alla forza applicata (questo comportamento paradossale
è solo “macroscopicamente vero” nel senso che il moto iniziale dell’asse è nella della
direzione della forza ma è piccolo e viene “immediatamente” mascherato dal moto di
precessione, che avviene nella direzione del momento).
324
LEZIONI DI SISTEMI DINAMICI
Capitolo 8
Principi variazionali
Il est démontré, disait-il, que le choses ne peuvent être autrement: car
tout étant fait pour une fin, tout est nécessairement pour la meilleure fin.
Candide, Voltaire
I principi variazionali della meccanica hanno origine da un “principio”, piuttosto
oscuro e impregnato di misticismo, enunciato nel 1744 da Pierre Louis Moreau de
Maupertuis1 con il nome di principe de la moindre quantité d’action2. Esso sosteneva
che il moto avviene in modo da rendere minima l’azione che la Natura deve compiere
in esso: “Lorsqu’il arrive quelque changement dans la Nature, la quantité d’action
nécessaire pour ce changement est la plus petite qu’il soit possible3 . ”
Questo modo “finalistico” di interpretare le leggi della fisica ha però un antecedente
nel principio di Fermat4 per la propagazione della luce a cui Maupertuis fa esplicito
riferimento.
Fermat cerca “. . . l’explication des réfractions dans cet unique principe que la Nature agit toujours par les voies les plus courtes5 . . . ”: enuncia un principio secondo cui
la luce segue il percorso lungo il quale in cammino ottico è il più breve, ovvero quello
in cui la luce impiega il minor tempo possibile per andare dalla sorgente all’osservatore. Grazie a questo riesce a ricavare la legge della rifrazione di Snell6 della costanza
del rapporto tra i seni dell’angolo di incidenza e quello di rifrazione (si veda la figura
8.1).
Questo tipo di principi, detti variazionali, ha però trovato sempre dei feroci oppositori. Il principio di Fermat fu subito osteggiato dai seguaci di Cartesio, con argomenti
abbastanza convincenti: se si sceglie il principio di Fermat come legge fondamentale
per la propagazione della luce ci si trova a dover ammettere che il raggio di luce che va
1 Maupertuis
(Saint-Malo, 1698 – Basilea, 1759) è stato un matematico, fisico, filosofo, naturalista e
astronomo francese.
2 Principio della minima quantità d’azione
3 Quando in Natura avviene un qualche cambiamento, la quantità di azione necessaria a tale cambiamento
è la più piccola possibile.
4 Pierre de Fermat (Beaumont-de-Lomagne, 1601 – Castres, 1665) fu tra i principali matematici della
prima metà del XVII secolo e dette importanti contributi allo sviluppo della matematica moderna.
5 La spiegazione delle rifrazioni in quell’unico principio per cui la Natura agisce sempre per le vie più
brevi.
6 Willebrord Snell van Royen (Leida,1580 – Leida, 1626), matematico, astronomo e fisico olandese.
326
LEZIONI DI SISTEMI DINAMICI
da A a B, quando giunge alla superficie di separazione dei due mezzi deve, per andare
proprio in B e non in un altro qualsiasi punto equidistante dal punto O di incidenza,
ricordarsi di essere partito da A per andare in B, contrariamente al principio di “localizzazione” che vuole che solo ciò che accade al momento del passaggio da un mezzo
all’altro deve influenzare la variazione di direzione del moto.
In effetti il principio di Fermat si può poi ricavare attraverso il principio di Huygens
della teoria ondulatoria, principio questo in accordo con la “localizzazione”.
A
i
n1sin i = n 2sin r
mezzo 1
O
mezzo 2
r
B
Figura 8.1: La legge si Snell o della rifrazione. n1 è l’indice di rifrazione del mezzo 1,
n2 è l’indice di rifrazione del mezzo 2.
8.1 La brachistocrona
Esiste un classico problema della meccanica che si presenta direttamente in forma
variazionale: la ricerca della brachistocrona, ovvero della curva di “minimo tempo”.
Il problema è quello di trovare la curva che unisce due punti A e B su cui un punto
materiale, liberamente cadendo, ovvero muovendosi senza attrito e sotto l’influenza
del suo solo peso, passi dal punto A al punto B nel minor tempo possibile. Si assume
che il punto parta da A con velocità nulla e quindi B si trovi a una quota inferiore a
quella di A.
Il problema aveva già attratto l’attenzione di Galileo, che aveva proposto come
soluzione un arco di circonferenza al posto del segmento di retta che unisce A con B.
Malgrado questa non sia la soluzione corretta, essa mette in evidenza una caratteristica
della possibile soluzione: avere una prima parte molto ripida in modo che il punto
acquisti al più presto un’elevata velocità; poi potrà percorrere anche un cammino “più
lungo” purché lo faccia con maggiore velocità.
Il problema tornò all’attenzione dei matematici e fisici della fine del XVII secolo
con la sfida a trovarne la soluzione lanciata da Johann Bernoulli7 nel 1696.
7 Johann Bernoulli (Basilea 1667 – Basilea 1748) matematico svizzero, è stato uno dei più importanti
scienziati della famiglia Bernoulli. Johann è fratello minore di Jacob.
PRINCIPI VARIAZIONALI
327
La soluzione di Johann venne pubblicata, assieme a quella del fratello Jacob ed a
una nota di Leibniz nel maggio del 1697. Una soluzione anonima apparve nel gennaio
1697 in Inghilterra (opera di Newton).
La soluzione originale di Johann Bernoulli è interessante perché stabilisce una profonda analogia tra il problema della brachistocrona e il problema ottico della rifrazione: il modo di procedere è lo stesso che si utilizza per dare conto dei miraggi e altri
fenomeni ottici dovuti alla progressiva variazione di densità dell’atmosfera.
A
x
C
ds
dz
H
dx
D
B
z
Figura 8.2: La cicloide.
In analogia col principio di Fermat, pensiamo alla curva come al percorso di un
raggio luminoso che parte da A. Fissiamo un punto C sulla curva. L’angolo di deviazione della curva (ovvero della sua tangente) dalla verticale sarà l’angolo di rifrazione
alla quota del punto C. Il suo seno è dato da
dx
ds
dove ds è la lunghezza della curva tra C e il punto “vicino” D e dx la sua proiezione
orizzontale. In accordo con la legge di Snell quindi
dx
v
= ,
ds
a
(8.1)
dove v è la velocità del raggio e a la costante di proporzionalità (ricordiamo che
nella legge di Snell, come vista da Fermat, la velocità è inversamente proporzionale
all’indice di rifrazione8).
8 Una delle alternative poste dall’“eterna” dualità tra struttura corpuscolare e ondulatoria della luce era
che la velocità della luce fosse maggiore nei mezzi più densi (Cartesio e Newton, corpuscolaristi) oppure in
quelli più rarefatti (Fermat, in accordo con l’“intuizione” e soprattutto Huygens per la teoria ondulatoria).
Fu proprio la misurazione sperimentale della velocità della luce in laboratorio, effettuata solo alla metà del
XIX secolo, a far trionfare, provvisoriamente, la teoria ondulatoria nella fisica pre-quantistica. Al tempo di
cui stiamo parlando, Newton era ancora vivo, quindi l’assunzione di Bernuolli, della proporzionalità inversa
tra velocità e indice di rifrazione non era una cosa ovvia. Tant’è che nella già citata memoria, Maupertuis
introduceva l’azione, ovvero una nuova quantità, in modo che la minimizzazione di questa quantità, al posto
del tempo di percorrenza, permettesse di ricavare la legge della rifrazione da un principio di minimo à la
Fermat anche nell’ipotesi newtoniana che la luce fosse più veloce nei mezzi densi.
328
LEZIONI DI SISTEMI DINAMICI
Ma ds2 = dx2 + dz 2 quindi possiamo riscrivere la (8.1) come
√
dz
a2 − v 2
=
.
dx
v
(8.2)
Fino a questo punto la “meccanica” non è ancora intervenuta.
√ Essa interviene nell’esprimere la velocità in funzione della caduta del grave: v = 2g z. Inserendo questa
velocità nella (8.2), otteniamo l’equazione differenziale cercata
√
dz
b−z
= √
,
(8.3)
dx
z
2
con b = a2g , che Bernoulli dimostra essere l’equazione soddisfatta dalla cicloide,
rappresentata in figura 8.2.
8.1.1 La trattazione moderna
La soluzione di Johann Bernoulli però non si presta a una generalizzazione a problemi
variazionali più generali.
Il metodo che ora seguiamo per dedurre le equazioni differenziali da problemi variazionali è dovuto a Lagrange (e ad Eulero) e permette di trovare le equazioni per tutta
una vasta classe di problemi.
Riscriviamo il problema della brachistocrona introducendo il funzionale “tempo”
in dipendenza della curva scelta. Consideriamo un sistema di coordinate cartesiane in
cui l’asse z è la verticale discendente uscente da A (coincidente con l’origine degli
assi) e l’asse delle x è l’asse orizzontale. In tale piano le coordinate dei punti A e B,
sono rispettivamente (0, 0) e (L, H) (ovviamente escludiamo il caso in cui B non stia
sulla verticale condotta da A, ma in questo caso la soluzione è banale!). Assumiamo
inoltre che:
• la curva soluzione del problema giaccia nel piano (z, x);
• la curva sia esprimibile come il grafico di una funzione z = z(x). In particolare
z (0) = 0 e z (L) = H.
Queste assunzioni, benché ragionevoli, non sono essenziali. Potremmo infatti pensare
a una curva espressa parametricamente come x = x(τ ) e z = z(τ ), o addirittura
rinunciare all’ipotesi, ovvia, che la curva sia piana e aggiungere anche y = y(τ ),
ed ottenere dalla soluzione stessa del problema che in effetti le assunzioni sono, a
posteriori, soddisfatte.
Il vettore posizione del punto materiale, espresso in funzione del tempo, è dato da
x (t) = x (t) ex + z (x (t)) ez ,
per cui la velocità del punto materiale è ẋ (t) = ẋ (t) [ex + z ′ ez ], dove z ′ = dz/dx.
Assumendo che ẋ (t) > 0, e denotando con v il modulo di ẋ, abbiamo
2
v = ẋ (t) 1 + (z ′ ) .
(8.4)
PRINCIPI VARIAZIONALI
329
Il tempo T che il punto impiega per andare da A a B è ovviamente dato da
T
dt .
T =
(8.5)
0
·
Ora, se x (t) > 0, possiamo esprimere t in funzione dell’ascissa x, cioè t = t (x). In
particolare, t (0) = 0, mentre t (L) = T . Effettuando quindi tale cambio di variabile
nell’integrale (8.5) si ottiene
L
L
1
T =
dx,
t′ (x) dx =
0
0 ẋ
dove, evidentemente, dobbiamo aver cura di esprimere ẋ in termini di x. A tale scopo,
ricordando la (8.4) e la conservazione dell’energia9
m 2
v − mgz = 0, ⇒ v = 2 g z ,
2
abbiamo
v
=
ẋ
1 + (z ′ )2 , =⇒
√
2gz
2 g z (x)
.
ẋ (x) =
2
′
1 + (z (x))
Quindi il tempo impiegato dal punto materiale per andare da A a B sotto l’azione della
sola forza peso è dato da
L (z ′ )2 + 1
√
T [z] =
dx ,
(8.6)
2gz
0
dove abbiamo messo in evidenza la dipendenza dell’integrale dalla scelta della curva.
Il problema della brachistocrona si può ora enunciare facendo riferimento alla (8.6):
Tra tutte le funzioni z(x) tali che z(0) = 0 (partenza da A) e z(L) = H (arrivo in B),
determinare quella che rende minimo il valore di T [z] in (8.6)
8.2 L’equazione di Eulero-Lagrange
Generalizziamo ora il problema della brachistocrona a una funzione integranda f “qualsiasi”:
Problema: Data una funzione f : R3 → R determinare una funzione y : [a, b] → R
tale che:
1. y(a) = ya e y(b) = yb ;
2. il valore dell’integrale
I [y] =
b
f (y ′ (x) , y (x) , x) dx ,
a
sia minimo.
9 Si
ricordi che il punto materiale parte da fermo e che l’energia potenziale iniziale è nulla.
(8.7)
330
LEZIONI DI SISTEMI DINAMICI
Con y ′ si intende ancora la derivata della funzione y rispetto alla variabile x. Le ipotesi
di regolarità da assumere sulla funzione f e sulla y saranno determinate dal calcolo che
faremo, per ora le lasciamo nel vago!
La struttura del problema è: fissato un certo insieme di funzioni (le y(x) che soddisfano alle condizioni agli estremi y(a) = ya e y(b) = yb ) e, data una “funzione” a
valori in R su questo insieme, determinarne il minimo.
Anziché usare il termine “funzione” per I[y] si usa il termine funzionale, per
sottolineare il fatto che I è “funzione di una funzione”.
Il problema sopra enunciato è quindi simile al problema di determinare i minimi di
una funzione in più variabili. Inoltre, anche se ancora non ben specificato, l’insieme
dove cercare la soluzione ha una naturale struttura affine: ogni y(x) può essere ottenuta
da una funzione y(x) di questo insieme più una funzione h(x) (con la stessa regolarità)
che soddisfa alla condizioni omogenee al bordo h(a) = h(b) = 0. Inoltre, l’insieme
delle funzioni h è uno spazio vettoriale. Quindi ci sono molti degli ingredienti che nel
calcolo differenziale permettono di “risolvere” il problema della ricerca dei minimi.
La difficoltà è che l’insieme, qualsiasi sia la richiesta di regolarità che si fa sulle y,
è “molto grande” (ha dimensione infinita!). Quindi diventa assai difficile definire, per
esempio, la derivata di I[y] come limite del rapporto incrementale (I[y+h]−I[y])/�h�
(dobbiamo decidere come definire �h�). In verità questo programma può essere portato
a termine, ma con grande dispiegamento di mezzi matematici!
C’è però un modo per dare una condizione necessaria per il minimo, simile a
quella dell’annullarsi della derivata. Supponiamo che il nostro problema di minimo
(assoluto) abbia una o più soluzioni e che y ∗ (x) sia una di queste soluzioni. Fissiamo
ora una qualsiasi della funzioni h(x) nulle agli estremi e consideriamo solo le funzioni
del tipo y ∗ (x)+εh(x) con ε ∈ R. Possiamo quindi pensare all’applicazione che manda
ε nel valore di I[y ∗ + εh] come ad una funzione reale di una sola variabile reale ε.
Ora, se y ∗ (x) rende minimo il valore di I[y], ovvero se I[y ∗ ] ≤ I[y] per ogni y, allora
la funzione ε → I[y ∗ + εh], avrà un minimo per ε = 0 (un po’ più complesso il caso
di “minimi locali” cioè quando I[y ∗ ] ≤ I[y] è verificata solo per funzioni y “vicine”
a y ∗ (x), perché non abbiamo definito cosa intendiamo per funzioni vicine; comunque
si ha che qualsiasi sia questa definizione, y ∗ + εh sarà “vicina” a y ∗ (x) purché ε sia
sufficientemente piccolo).
Ne risulta che condizione necessaria affinché y ∗ (x) sia un minimo per il funzionale
I[y] è che sia nulla la derivata rispetto a ε della funzione I[y ∗ +εh], calcolata per ε = 0,
e questo per ogni funzione h nulla agli estremi10 .
d
I[y ∗ + εh]|ε=0 è detta variazione prima del funzionale
dε
I[y] in y = y ∗ , e si indica con δI[y ∗ ], per cui la condizione necessaria affinché y ∗ (x)
sia un minimo per il funzionale I[y] si esprime dicendo che in y ∗ si annulla la variazione prima di I[y]. La funzione minimizzante y ∗ (x) va quindi cercata tra le soluzioni
dell’equazione variazionale δI[y] = 0, ovvero
Nota 8.2.1 La derivata
δI = δ
b
f (y ′ (x), y(x), x) dx = 0.
a
10 Si confronti questa condizione con la condizione di annullamento di tutte le derivate direzionali in un
punto di minimo di una funzione da Rn in R
PRINCIPI VARIAZIONALI
331
La funzione arbitraria (purché nulla agli estremi) h è detta variazione della y, ed è
spesso indicata con δy.
Vogliamo adesso calcolare esplicitamente la variazione prima
d
dε
a
b
f ((y ) (x) + εh (x), y (x) + εh(x), x) dx
∗ ′
′
∗
.
ε=0
Derivando sotto il segno di integrale, e calcolando il risultato per ε = 0, otteniamo
b
∂f
∂f
∗ ′
∗
′
∗ ′
∗
((y ) (x), y (x), x) h (x) +
0=
((y ) (x), y (x), x) h(x) dx ,
∂y ′
∂y
a
∂f
∂f
dove ∂y
′ e ∂y denotano rispettivamente la derivata rispetto al primo e al secondo
argomento della funzione f . Infine integriamo per parti il primo temine
b
d
∂f
∂f
∗ ′
∗
∗ ′
∗
((y
−
((y
)
(x),
y
(x),
x)
+
)
(x),
y
(x),
x)
h(x) dx
0 =
dx ∂y ′
∂y
a
x=b
∂f
∗ ′
∗
((y
)
(x),
y
(x),
x)
h(x)
,
+
∂y ′
x=a
e, tenendo conto che h(a) = h(b) = 0, si ha
b
∂f
d
∂f
∗ ′
∗
∗ ′
∗
((y ) (x), y (x), x) h(x) dx .
−
((y ) (x), y (x), x) +
0=
dx ∂y ′
∂y
a
(8.8)
La (8.8) deve valere per ogni funzione h(x), quindi deve annullarsi il temine tra
parentesi nell’integrale, ovvero la funzione y ∗ deve soddisfare l’equazione differenziale
d
∂f
∂f
= 0,
(8.9)
−
dx ∂y ′
∂y
che è nota come equazione di Eulero-Lagrange.
Nota 8.2.2 La (8.9) segue da (8.8) supponendo che
d
∂f
∂f
∗ ′
∗
((y ∗ )′ (x), y ∗ (x), x)
φ(x) = −
((y
)
(x),
y
(x),
x)
+
dx ∂y ′
∂y
sia una funzione continua. Se infatti esistesse un qualche xo ∈ (a, b), per cui φ(xo ) �=
0 (per esempio φ(xo ) > 0), allora per la continuità avremo che φ(x) > 0 in un
intervallo (x1 , x2 ) ⊂ (a, b), che contiene al suo interno xo . A questo punto, se si
sceglie la funzione h (x) in modo che: sia continua, valga 0 in [a, x1 ] ∪ [x2 , b], e sia
b
positiva per x ∈ (x1 , x2 ). Ne segue che a φ(x) h(x) dx > 0 contro l’ipotesi che sia
nullo per ogni h.
E’ chiaro a questo punto quali siano le ipotesi di regolarità: (nel seguito dicendo “derivabile” si sottintende “con derivate continue”) dobbiamo avere f derivabile due volte
sia a rispetto y ′ che a y e una volta rispetto a x, inoltre le soluzione della (8.9) devono
332
LEZIONI DI SISTEMI DINAMICI
essere funzioni di classe C 2 , il che obbliga anche le variazioni h ad avere la stessa
regolarità.
Si confronti la (8.9) con le equazioni di Lagrange per il moto di un sistema meccanico.
Nota 8.2.3 Utilizzando la “notazione del δ” introdotta nell’osservazione 8.2.1, la procedura pratica per calcolare δI, ovvero la variazione del funzionale, consiste nel
calcolo della differenza
δI = I [y + δy] − I [y] ,
dove I [y + δy] viene approssimato sviluppando in serie di Taylor l’integrando. Quindi, in pratica,
δI
=
b
a
f (y ′ (x) + δy ′ (x) , y(x) + δy (x) , x) dx −
b
f (y ′ (x), y(x), x) dx
a
b
∂f
∂f
δy dx −
f (y ′ (x), y(x), x) + ′ δy ′ +
f (y ′ (x), y(x), x) dx
∂y
∂y
a
a
b
∂f ′ ∂f
δy
dx,
δy
+
=
∂y ′
∂y
a
=
b
dδy
. Se poi la funzione δy (x) è tale che δy (a) = δy (b) = 0, integrando
dove δy ′ =
dx
per parti otteniamo
δI =
b
a
d
∂f
−
∂y
dx
∂f
∂y ′
δy (x) dx.
Esempio 8.2.1 Come esempio di calcolo delle variazioni, consideriamo il problema di
minimizzare il consumo di un’automobile che deve compiere un percorso di lunghezza
L > 0 in un tempo fissato T > 0. Consideriamo quindi la distanza s(t) coperta al
tempo t, per cui si dovrà avere (se il viaggio inizia a t = 0)
s(0) = 0.
(8.10)
s(T ) = L.
Supponiamo, in prima approssimazione, che il consumo sia proporzionale al lavoro
fatto dal motore per opporsi alla forza di attrito viscoso dell’aria. Essendo tale forza
proporzionale alla velocità ṡ (si veda l’esempio 2.5.1 del capitolo 2) e diretta nella
direzione opposta al moto, ne risulta che il lavoro effettuato dal motore è dato da
0
L
αṡ ds =
T
αṡ2 (t) dt,
0
dove α > 0 è un opportuno fattore di proporzionalità. Più in generale, potremo supporre che α dipenda da s (ad esempio, poiché l’efficienza del motore diminuisce nei
tratti in salita, si avrà che α(s) è a sua volta proporzionale alla pendenza della strada, ovvero alla derivata della quota raggiunta alla distanza s). Il funzionale consumo
PRINCIPI VARIAZIONALI
333
dell’automobile sarà pertanto11
C[s] =
T
α(s(t))ṡ2 (t) dt,
0
dove la funzione incognita s : [0, T ] → R, è soggetta alle condizioni (8.10). Si tratta
quindi di un funzionale del tipo (8.7) con
f (ṡ, s, t) = α(s)ṡ2 .
Condizione necessaria affinché s(t) sia un minimo del funzionale C[s] è che s(t)
soddisfi l’equazione di Eulero-Lagrange (8.9), che in questo caso è
2α(s)s̈ + α′ (s)ṡ2 = 0,
(8.11)
dove, ovviamente, α′ (s) indica la derivata di α (s) rispetto a s.
Supponiamo ora per semplicità che la strada abbia una pendenza proporzionale a
sq (corrispondente a una quota proporzionale a s(q+1) ) per una certa potenza q ∈ R.
L’efficenza del motore, α(s), è dunque proporzionale a sq e l’equazione (8.11) diventa
2sq s̈ + qs(q−1) ṡ2 = 0
(8.12)
(indipendentemente dalla costante di proporzionalità tra α e sq ). Per risolvere questa
equazione differenziale consideriamo come funzione incognita la derivata di s rispetto
al tempo e dunque poniamo
ṡ = u(s).
Poiché s̈ = u′ (s)ṡ = u′ (s)u (al solito, l’apice indica la derivazione rispetto a s e il
punto la derivazione rispetto a t), la (8.12) diventa
2sq u(s)u′ (s) + qs(q−1) u2 (s) = 0.
Osserviamo che possiamo supporre u(s) �= 0, in quanto u(s) = 0 corrisponde alla
soluzione in cui l’auto è ferma, e le condizioni (8.10) non possono essere soddisfatte.
Dividendo per u(s) si ottiene quindi
2sq u′ (s)s̈ + qs(q−1) u(s) = 0,
(8.13)
che è un’equazione a variabili separabili la cui soluzione generale è
u(s) = cs−q/2 ,
(8.14)
dove c è una costante arbitraria. Ricordando che u(s) = ṡ, la (8.14) è un’equazione
differenziale per s(t), che può essere facilmente risolta a sua volta per separazione
di variabili. In questo modo si ottiene la seguente soluzione generale dell’equazione
(8.12):
s(t) = (c1 t + c0 )2/(q+2) ,
(8.15)
11 Il lavoro fatto contro la forza peso sarà semplicemente dato dalla differenza fra la quota finale e quella
iniziale ed è quindi una costante ininfluente.
334
LEZIONI DI SISTEMI DINAMICI
dove c0 e c1 sono costanti arbitrarie. Imponendo infine le condizioni (8.10) si ottiene
s(t) = L
� t �2/(q+2)
T
.
(8.16)
Il caso q = 0 corrisponde a una strada con pendenza costante (compreso naturalmente il caso della strada pianeggiante). In questo caso la (8.16) ci dice che, indipendentemente dal valore della pendenza, per minimizzare il consumo si dovrà viaggiare
a velocità costante ṡ = L/T .
Se, invece, q > 0, dalla (8.16) si vede che l’automobile dovrà progressivamente
rallentare mano a mano che la pendenza aumenta.
Esempio 8.2.2 Si considerino due punti A ≡ (a, ya ), B ≡ (b, yb ) sul piano. Tra tutte
le curve del tipo y (x) che connettono A con B, cioè tali che ya = y (a), yb = y (b),
si vuole determinare quella di lunghezza minima. Il funzionale che, data la funzione
y (x), esprime la lunghezza della curva è
I [y] =
�
a
b
�
2
1 + (y ′ (x)) dx .
L’equazione di Eulero-Lagrange è
�
′ 2
d ∂ 1 + (y )
y ′ y ′′
�
= 0,
=
0,
⇒
dx
∂y ′
2
1 + (y ′ (x))
che, escludendo y ′ = 0, ha come soluzione y ′′ = 0. La curva di minima lunghezza è
dunque la retta
yb − ya
(x − a) .
y (x) = ya +
b−a
8.2.1 Un integrale primo e ritorno alla brachistocrona
Possiamo ora ricavare l’equazione differenziale per la brachistocrona direttamente dall’equazione di Eulero-Lagrange e dalla forma della funzione integranda
�
2
(z ′ ) + 1
′
.
(8.17)
f (z , z, x) = √
2gz
Si ottiene
�
�
′ )2 + 1
(z
(z ′ )2 + 1
d ∂
∂
√
−
= 0.
√
dx ∂z ′
∂x
2gz
2gz
(8.18)
Così facendo però si giunge ad un’equazione differenziale del secondo ordine per
z(x), mentre l’equazione (8.3) è un’equazione del primo ordine con una costante “b”
da determinare in funzione delle condizioni iniziali e finali. Questo ci dice che, se
abbiamo operato correttamente e le (8.18) e (8.3) sono “equivalenti”, la (8.3) deve
essere un integrale primo dell’equazione di Eulero-Lagrange della brachistocrona, cioè
PRINCIPI VARIAZIONALI
335
della (8.18). Vediamo che è effettivamente così poiché la funzione integranda (8.17)
non dipende esplicitamente da x. Considerando un contesto generale, assumiamo che
la funzione che definisce il funzionale, cioè la f che compare nella (8.7), non dipenda
esplicitamente da x, ovvero
∂f
= 0.
∂x
Definiamo la funzione12
u = y′
∂f
−f,
∂y ′
(8.19)
e calcoliamone la derivata rispetto a x. Poiché ∂f
∂x = 0 si ottiene
du
∂f
d
∂f
∂f
∂f ′
= y ′′ ′ + y ′
y .
− ′ y ′′ −
dx
∂y
dx ∂y ′
∂y
∂y
Chiaramente il primo e il terzo termine si cancellano tra loro. Ciò che resta è l’equazione di Eulero-Lagrange, moltiplicata per y ′ , e quindi è nullo anch’esso. Abbiamo
quindi il seguente
Teorema 8.2.1 Se la funzione integranda in (8.7) non dipende esplicitamente dalla x,
la quantità
∂f
y′ ′ − f
∂y
è un integrale primo dell’equazione di Eulero-Lagrange.
Torniamo ora alla brachistocrona, e scriviamo l’equazione differenziale corrispondente
′
all’integrale
√ primo (8.19) con f = f (z , z) data dalla (8.17). Abbiamo (tralasciando il
fattore 2g che non ha effetto sulla ricerca del minimo)
1 + (z ′ )2
z′
z′
√
,
−
C= √
z 1 + (z ′ )2
z
dove C è una costante, da cui si ottiene
√
C 1 + (z ′ )2 z = −1 ,
e quindi, ponendo
√
1
b=− ,
C
z′ =
√
b−z
√
,
z
(8.20)
(8.21)
che è di nuovo la (8.3). Si noti che per passare da (8.20) a (8.21) si deve estrarre una
radice quadrata di (z ′ )2 e quindi abbiamo una ambiguità di segno. Ovviamente questa
ambiguità non c’è all’inizio della curva: il punto, per mettersi in moto, deve scendere
e quindi z ′ > 0 con la nostra scelta degli assi. Vedremo nella nota 8.2.4, e la cosa
12 Si confronti la (8.19) con la funzione di Hamilton (3.29), scritta nel caso di un solo parametro
lagrangiano q.
336
LEZIONI DI SISTEMI DINAMICI
è abbastanza sorprendente, che se il rapporto L/H è sufficientemente grande (quindi
il punto B è distante da A ma “non troppo sotto” A) la soluzione passerà per punti
del piano verticale più bassi di B, ovvero il punto dovrà scendere sotto il suo punto di
arrivo, e poi risalire, per arrivare nel minor tempo possibile.
Per trovare la soluzione della (8.20) introduciamo un parametro ϕ e poniamo x =
x(ϕ) e z = z(ϕ). Possiamo quindi riscrivere la (8.20) nella forma
(x′ )2 + (z ′ )2 = c
(x′ )2
,
z
(8.22)
1
dove c = 2 e l’apice indica adesso la derivata rispetto al parametro ϕ.
C
Si può verificare, a questo punto, che le funzioni
x (ϕ) =
c
(ϕ − sin ϕ) ,
2
z (ϕ) =
c
(1 − cos ϕ) ,
2
(8.23)
sono soluzioni di (8.22). Inoltre, le (8.23) soddisfano x(0) = y(0) = 0, quindi il valore
ϕ = 0 del parametro corrisponde al punto di partenza A. Tuttavia, per affermare che
(8.23) sono le soluzioni del problema dobbiamo mostrare che esiste un unico valore
della costante c ed un unico valore ϕB ∈ (0, 2π) tale che
c
x(ϕB ) = L ,
2
c
z(ϕB ) = H .
2
(8.24)
H
e, teniamo presenti le (8.23), possiamo riscriver la (8.24) in
Ora, se poniamo h =
L
questo modo
c
H
z(ϕB ) =
L , ⇒ z(ϕB ) = h x(ϕB ).
(8.25)
2
L
c2 x(ϕB )
h
Quindi, se introduciamo
a(ϕ) = (1 − cos ϕ),
e
b (ϕ) = (ϕ − sin ϕ),
la (8.25) ammetterà soluzione se l’equazione
(8.26)
a(ϕ) = h b(ϕ),
ha soluzione. Il valore di c sarà poi determinato da c =
2L
x(ϕB ) .
Lemma 8.2.1 Per ogni L > 0 e H > 0, ovvero per ogni h > 0, l’equazione (8.26)
ammette almeno una soluzione.
Dim. Si osserva che b(0) = 0, b(ϕ) > 0 in (0, 2π], mentre a(2π) = a (0) = 0, e
a (ϕ) > 0, per ϕ ∈ (0, 2π). Per provare che (8.26) ha almeno una soluzione bisogna
far vedere che, qualunque sia h, esiste un εh tale che b(ϕ) < a(ϕ) per ϕ ∈ (0, εh ). Ciò
segue facilmente dal confronto degli sviluppi di Taylor in ϕ = 0 delle funzioni a(ϕ)
e b(ϕ). Infatti a è infinitesima del secondo ordine, mentre b è infinitesima del terzo
ordine, qualunque sia h.
PRINCIPI VARIAZIONALI
337
Lemma 8.2.2 L’equazione (8.26) ammette una sola soluzione in (0, 2π).
Dim. Poniamo
r(ϕ) =
1 1 − cos ϕ
a(ϕ)
=
.
hb(ϕ)
h ϕ − sin ϕ
In ogni soluzione ϕ̃ di (8.26) si ha r(ϕ̃) = 1. Per dimostrare l’unicità basta far vedere
che r(ϕ) è una funzione strettamente decrescente in (0, 2π), dal momento che r(ϕ) >
0, per ϕ ∈ (0, 2π), r (2π) = 0, e limϕ→0+ r (ϕ) = +∞. Se calcoliamo la derivata si
ha
1 ϕ sin ϕ − 2 (1 − cos ϕ)
r′ (ϕ) =
.
(8.27)
h
(ϕ − sin ϕ)2
In (π, 2π) si ha r′ (ϕ) < 0 in quanto somma di due funzioni negative. Inoltre r′ (ϕ) < 0
“vicino” a ϕ = 0. Infatti
1 4
1
ϕ + 180
ϕ6 + O ϕ8
1 − 12
′
r (ϕ) =
,
1 6
8
h
36 ϕ + O (ϕ )
per cui limϕ→0+ r′ (ϕ) = −∞. Inoltre il numeratore di r′ ,
n(ϕ) = ϕ sin ϕ − 2 (1 − cos ϕ),
è una funzione decrescente e sempre negativa nell’intervallo (0, π), come mostrato
dalla figura 8.3. Quindi il rapporto r(ϕ) è strettamente decrescente.
0.0
0.2
0.4
0
0.6
0.8
1.0
1.2
1.4
1.6
1.8
2.0
2.2
2.4
2.6
2.8
3.0
ϕ
-1
-2
-3
-4
n(ϕ)
Figura 8.3: Grafico della funzione n(ϕ) = ϕ sin ϕ − 2 (1 − cos ϕ), per ϕ ∈ [0, π].
Ne risulta il seguente
338
LEZIONI DI SISTEMI DINAMICI
Teorema 8.2.2 Comunque dati due punti A e B, con B posto a quota inferiore ad
A, esiste unica una curva congiungente A con B sulla quale un punto, liberamente
cadendo sotto l’azione della forza peso, passa da A a B nel minor tempo possibile.
Questa curva è l’unico ramo di cicloide (8.23) sul piano verticale contenente A e B
con un vertice in A e passante per B.
Nota 8.2.4 Se L > π2 H, ovvero se la distanza tra le verticali passanti per A e B
è “abbastanza grande” rispetto alla caduta H, il valore di ϕ supera π. Ma in π la
funzione z(ϕ) assume il suo massimo: questo significa che la brachistocrona discende
al di sotto del livello del punto di arrivo.
Ci resta solo da “giustificare” il nome di cicloide dato alla curva (8.23). Riferendoci
alla figura 4.2 dell’esempio 4.1.2, col nome di cicloide si indica una famiglia di curve,
ognuna delle quali è descritta “cinematicamente” come la traiettoria sul piano di un
punto S solidale con un cerchio che rotola senza strisciare su una guida rettilinea.
Dovrebbe essere abbastanza evidente da questa descrizione che si hanno due parametri positivi per descrivere la curva. Il primo è il raggio R della circonferenza, il
secondo il rapporto r tra la distanza del generico punto dal centro della circonferenza e il raggio della stessa. Il primo è sostanzialmente un fattore di scala, a parità del
secondo parametro le curve si ottengono l’una dall’altra per omotetia. Nel caso della
brachistocrona si ha r = 1, ovvero il punto si trova sulla circonferenza (come mostrato
in figura 4.2), mentre il valore 2c in (8.23) è il raggio R della circonferenza. Per r = 1
la cicloide ha un punto singolare (cuspide) di arresto del moto nella direzione parallela
alla giuda e di inversione del moto nella direzione ortogonale. Nella rappresentazione
(8.23) questo punto corrisponde a ϕ = 0 e ϕ = 2 π (la curva è ovviamente periodica e,
in questa rappresentazione, il periodo è proprio 2 π), ovvero al punto A di partenza del
grave.
E’ opportuno notare che la rappresentazione (8.23) non coincide con quella data
dalle (4.15) e (4.16). La differenza risiede nel fatto che le (4.15) e (4.16) sono state
ottenute considerando ϕ > 0 per rotazioni antiorarie, mentre nelle (8.23) ϕ > 0 in
caso di rotazioni orarie, come mostrato nella figura 8.4.
A
z’
x
P
x’ = xo
φ=π
x’
xo
P
z’ = zo
B
zo
z
Figura 8.4: La generazione della cicloide
PRINCIPI VARIAZIONALI
339
La cicloide, oltre a una notevole quantità di proprietà geometriche13, gode di un
altra interessante proprietà meccanica: è l’unica curva per cui cui le oscillazioni di un
punto materiale che si muove su di essa, senza attrito e sotto l’azione della gravità, sono
isocrone, ovvero il periodo delle oscillazioni è lo stesso per ogni valore (ammissibile)
dell’energia14. A tal riguardo si rimanda all’esempio 5.7.4.
8.3 Funzionali dipendenti da l funzioni
Supponiamo che sia data f : R2l+1 → R. Vogliamo determinare l funzioni
yi (x) : [a, b] → R,
i = 1, ...., l,
tali da rendere stazionario il funzionale
b
f (y1′ (x), ...yl′ (x), y1 (x), ..., yl (x), x)dx,
I[y1 , , yl ] =
(8.28)
a
(x) = (y1 (x) , . . . , yl (x)) e y
′ (x) = (y1′ (x) , . . . , yl′ (x)),
che, denotando con y
scriveremo nella seguente forma compatta
b
(x), x)dx.
I[
y] =
f (
y ′ (x) , y
a
Il problema che stiamo analizzando è più generale di quello trattato nella precedente
sezione 8.2, dove il funzionale dipendeva da una sola funzione e dalla sua derivata:
adesso il funzionale I dipende da l funzioni e dalle loro derivate.
(x), ovvero il
Definiamo adesso l’insieme dove ricercare le l-uple di funzioni y
dominio del funzionale I. Sia
(x) : [a, b] → R : yk (x) ∈ C 2 ([a, b]) ∀ k = 1, 2, ..., l .
V= y
Se indichiamo con
(b) = (y1b , ..., ylb )
(a) = (y1a , ..., yla ) e y
y
(8.29)
(x) ∈ V : y
(a) = y
a , y
(b) = y
b } .
D={y
(8.30)
le l-uple costituite dai valori assunti dalle funzioni yk (x), k = 1, ..., l, agli estremi a e
b, il dominio del funzionale I è l’insieme
Consideriamo adesso l’insieme
(x) ∈ V : g
(a) = g
(b) = 0} .
V0 = { g
E’ facile mostrare che V e V0 hanno struttura di spazio vettoriale (in particolare V0 è
sottospazio di V ) mentre D, anche se è un sottoinsieme di V, non è spazio vettoriale
13 Si
consiglia di consultare la pagina dedicata alle curve su:
www-groups.dcs.st-and.ac.uk/~history/
14 Ovviamente si assume che la cicloide giaccia su un piano verticale e che i suoi vertici siano alla stessa
quota.
340
LEZIONI DI SISTEMI DINAMICI
(la somma di due elementi di D non dà un elemento di D). Si osservà però che D è uno
spazio affine il cui spazio vettoriale è V0 (si veda la definizione 1.4.1). In particolare, su
V, e quindi anche su V0 , è possibile definire un prodotto scalare � , � : V →R, ponendo
, z
=
f
b
l
fk (x) zk (x) dx,
a k=1
e z
∈V.
se f
(8.31)
Seguendo la notazione dell’osservazione 8.2.1, indichiamo con δ
y (x) ∈ V0 ,
δ
y (x) = (δy1 (x) , . . . , δyl (x)) ,
una l-upla di funzioni tramite la quale calcolare la variazione del funzionale, cioè
δ [I]. Tuttavia prima di calcolare esplicitamente la variazione del funzionale (8.28),
dimostriamo il seguente lemma che generalizza l’osservazione 8.2.2.
(x) = (F1 (x) , ...., Fl (x)) ∈ V. Se F
, z
= 0, ∀ z
∈ V0 ,
Lemma 8.3.1 Sia F
≡ 0.
allora F
Dim. Applicando la definizione (8.31) si ha
b
l
a k=1
Fk (x) zk (x) dx = 0, ∀ (z1 (x) , ...., zl (x)) ∈ V0 .
(8.32)
Siccome zk (x), k = 1, ..., l, sono fra loro indipendenti, possiamo scegliere
= (0, ..., 0, b (x) , 0, 0, .., 0, )
z
i−esimo
posto
cioè zk (x) = z (x) δki , k = 1, ..., l. Con tale scelta la (8.32) si riduce a
b
Fi (x) z (x) dx = 0,
a
dove, lo ricordiamo, z (x) è una funzione arbitraria. Quindi, ricordando la nota 8.2.2,
si ha Fi (x) ≡ 0. Ma, data l’arbitrarietà con cui è stato scelto l’indice i, abbiamo
≡ 0.
Fi (x) ≡ 0 per ogni i = 1, 2, ..., l, e quindi F
Fissiamo adesso δ
y ∈ V0 e calcoliamo la corrispondente variazione del funzionale.
Otteniamo
b
(x) + δy (x) , x)dx,
δI[
y] =
f (
y ′ (x) + δy ′ (x) , y
(8.33)
a
Dato che le variazioni δyk (x), k = 1, ..., l, sono fra loro indipendenti, è legittimo
considerare questa l-upla:
δ
y (x) = (δy1 (x) , . . . , δyl (x)) = (εh1 (x) , ...., εhl (x)) ,
PRINCIPI VARIAZIONALI
341
dove tutte le funzioni hk (x), k = 1, ..., l, ancorché arbitrarie, sono fissate. In corrispondenza di tale δ
y otteniamo la seguente funzione della variabile reale ε,
F (ε) =
b
a
f (y1′ + εh′1 , ...yl′ + +εh′k , y1 + εh1 , ..., yl + εhl , x)dx.
Se il funzionale è stazionario allora
che hk (a) = hk (b) = 0, si ha
0 =
ovvero
d
dove con
dx
dF (ε)
= 0, e dunque, tenendo conto del fatto
dε ε=0
l
∂f ′
d
′
′
−
(y , .., yk , ..yl , y1 , .., yk , .., yl , x)
dx ∂yk′ 1
a k=1
∂f ′
′
′
+
(y , .., yk , ..yl , y1 , .., yk , .., yl , x) hk (x)dx,
∂yk 1
b
d
dx
∂f
∂
y′
∂f
, δ
y
−
∂
y
= 0,
(8.34)
∂f
∂f
, intendiamo la l-upla
−
′
∂
y
∂
y
d
∂f
∂f
∂f
∂f
d
−
.
−
,
....,
dx ∂y1′
∂y1
dx ∂yl′
∂yl
Ora la (8.34) vale per qualunque l-upla δ
y (x) ∈ V0 . Possiamo applicare il lemma
8.3.1 e concludere
∂f
d
∂f
−
= 0, ∀ k = 1, 2, ..., l.
(8.35)
′
dx ∂yk
∂yk
Il sistema di l equazioni (8.35) è dunque la generalizzazione dell’equazione di EuleroLagrange al caso di funzionali dipendenti da l funzioni e dalle loro derivate prime. Con ∗ (x) rende stazionario il funzionale (8.28) allora è soluzione
cludiamo dunque: se y
del sistema (8.35).
8.3.1 Massimizzazione vincolata
Supponiamo adesso che si richieda di determinare i punti di estremo del funzionale
(8.28) assumendo che le funzioni yi (x), i = 1, ..., l, soddisfino la relazione
Φ (y1 (x) , ..., yl (x) , x) = 0, ∀ x ∈ [a, b],
(8.36)
che, scritta in forma compatta, diventa Φ (
y (x) , x) = 0. Di conseguenza il dominio
del funzionale I diventa
={y
(x) ∈ D : Φ (y1 (x) , ..., yl (x)) = 0, ∀ x ∈ [a, b]} .
D
dove D è definito dalla (8.30).
342
LEZIONI DI SISTEMI DINAMICI
Nota 8.3.1 Osserviamo che devono essere soddisfatte le seguenti condizioni di compatibilità
Φ (y1a , ..., yla , a) = Φ (y1b , ..., ylb , b) = 0.
Φ(
y(a),a)
Φ(
y(b),b)
Il vincolo (8.36) potrebbe essere utilizzato per esprimere una delle funzioni yi (x) in
termini delle rimanenti (l − 1). Tuttavia, siccome questa procedura può essere estremamente complicata, si preferisce percorrere una via alternativa e, per certi versi, più
semplice.
Definiamo innanzitutto qual è l’insieme dove cercare le l-uple δ
y (x). Fissata una
o (x) ∈ D, una generica l-upla y
(x) ∈ D può scriversi come
l-upla y
(x) = y
o (x) + δ
y
y (x) ,
a patto che:
1. δ
y (a) = δ
y (b) = 0.
y (x)) = 0.
2. Φ (
y (x)) = 0, ovvero Φ (
y o (x) + δ
Le l-uple δ
y ammissibili sono dunque quegli elementi di V0 per cui
y (x)) = 0,
Φ (
y o (x) + δ
e ∀ x ∈ [a, b] .
o (x) ∈ D,
∀ y
(8.37)
La condizione (8.37) è tuttavia “scomoda” dal punto di vista pratico. Una condizione
equivalente si ottiene considerandone lo sviluppo di Taylor15
0 = Φ (
y o (x) + δ
y (x)) = Φ (
y o (x)) +
=0
l
∂Φ
2
δyk + O ||δ
y || .
∂yk
k=1
Quindi, trascurando i termini del secondo ordine (che però sono influenti ai fini del
calcolo delle variazioni), la (8.37) è equivalente a
• δ
Λ
y = Λ1 (x) δy1 (x) + .. + Λl (x) δy2 (x) = 0, ∀ x ∈ [a, b] ,
dove16
(x) = (Λ1 (x) , ...., Λl (x)) =
Λ
(8.38)
∂Φ
∂Φ
,
, ....,
∂y1 y(x)
∂yl y (x)
e dove • denota, come al solito, il prodotto scalare in Rl . Quindi, l’insieme delle
l-uple δ
y (x) di funzioni con cui calcolare la variazione del funzionale (8.28) non è più
V0 ma
0 = δ
• δ
V
y (x) ∈ V0 : Λ
y (x) = 0, ∀ x ∈ [a, b] .
Quest’ultimo è un sottoinsieme di V0 e questo fa sì che anche il lemma 8.3.1 debba
essere modificato. Infatti le l funzioni δyk (x), k = 1, ..., l, non sono più fra loro
indipendenti (come lo erano nel caso del lemma 8.3.1) ma vincolate dalla (8.38).Vale
dunque il seguente
15 Ovviamente
16 Si
si assumeche Φ sia sufficientemente regolare.
assume che Λ
(x) �= 0, ∀ x ∈ [a, b].
PRINCIPI VARIAZIONALI
343
(x) ∈ V.
Se
Lemma 8.3.2 Sia F
con λ (x) ∈ R.
, δ
F
y
0 , allora F
= λ (x) Λ,
= 0, ∀ δ
y ∈V
Dim. Osserviamo innanzi tutto che la condizione (8.38) implica
b
a
• δ
Λ
y (x) dx = 0, ⇐⇒
, δ
Λ
y = 0,
(8.39)
0 e Λ
sono ortogonali, nel senso del prodotto scalare � , � definito dalla
cioè δ
y ∈V
(8.31) . Non solo, ma la (8.38) implica anche
, δ
0 = γ (x) Λ
y =
b
l
(8.40)
γ (x) Λk (x) δyk (x) dx,
a k=1
per ogni funzione γ (x) sufficientemente
regolare.
, δ
Scriviamo adesso la condizione F
y = 0, tenendo conto della (8.40) dove
γ (x) è una generica funzione non identicamente nulla, ovvero
0 =
=
b
l
Fk (x) δyk (x) dx
a k=1
b
l
Fk (x) δyk (x) dx +
a k=1
=
b
l
b
l
γ (x) Λk (x) δyk (x) dx
a k=1
=0
[Fk (x) + γ (x) Λk (x)] δyk (x) dx.
(8.41)
a k=1
Come già osservato, la (8.38) implica che (l − 1) componenti di δ
y sono indipendenti
mentre una può esser espressa in termini delle altre17 . Quindi, senza perdere di generalità, possiamo supporre che le funzioni δy2 (x), ..., δyl (x), siano indipendenti e,
tornando alla (8.41), scrivere
0
=
b
[F1 (x) + γ (x) Λ1 (x)] δy1 (x) dx
a
+
b
l
[Fk (x) + γ (x) Λk (x)] δyk (x) dx .
(8.42)
a k=2
17 Infatti,
se per esempio Λ1 �= 0, la (8.38) dà luogo a
δy1 = −
l
1
Λi δyi .
Λ1 i=2
Quindi le funzioni δy2 (x), ..., δyl (x), sono indipendenti mentre la prima, δy1 (x), viene espressa in
termini delle altre.
344
LEZIONI DI SISTEMI DINAMICI
A questo punto si sceglie la funzione γ (x) in modo da far annullare il primo integrale
F1 (x)
). La (8.42) si riduce quindi a
(se, per esempio, Λ1 �= 0 si pone γ (x) = −
Λ1 (x)
b
l
[Fk (x) + γ (x) Λk (x)] δyk (x) dx = 0,
a k=2
dove adesso le funzioni δyk (x), k = 2, ..., l, sono tutte indipendenti. Possiamo quindi
applicare il lemma
8.3.1
e concludere che Fk (x) + γ (x) Λk (x) ≡ 0, k = 2, ..., l. In
, δ
0 , abbiamo provato che
definitiva, se F
y = 0, per qualunque funzione δ
y ∈V
= λ (x) Λ,
dove λ (x) = −γ (x) per un’opportuna funzione γ (x).
F
Nota 8.3.2 Il lemma appena dimostrato può essere letto anche in chiave geometrica:
= λ (x) Λ
è una condizione di parallelismo fra F
e Λ.
la condizione F
Passiamo adesso a calcolare esplicitamente la variazione (8.33) per una generica δ
y∈
0 . Abbiamo
V
b
l
∂f
∂f
d
−
δyk dx,
δI[
y] =
dx ∂yk′
∂yk
a
k=1
che, ponendo
(x) =
F
d
dx
∂f
∂y1′
∂f
d
−
, ....,
∂y1
dx
∂f
∂yl′
∂f
−
∂yl
,
(x) , δ
riscriveremo anche come δI[
y] = F
y . Ora se il funzionale è stazionario in
avremo che δI[
0 e quindi
∗ (x) ∈ D,
corrispondenza di y
y ∗ ] = 0, per ogni δy (x) ∈ V
= λΛ,
=⇒
F
d
dx
∂f
∂yk′
−
∂f
∂Φ
= λ (x)
, ∀ k = 1, ..., l.
∂yk
∂yk
(8.43)
Osserviamo infine che il sistema di equazioni (8.43) può anche riscriversi come
∂F
∂F
d
−
= 0, ∀ k = 1, ..., l,
dx ∂yk′
∂yk
dove
F(y1′ , ...yl′ , y1 , ..., yl , x) = f (y1′ , ...yl′ , y1 , ..., yl , x) + λ (x) Φ (y1 , ..., yl , x) .
Abbiamo quindi un sistema di l equazioni differenziali nelle l funzioni incognite y1 (x),
..., yl (x), con le condizioni agli estremi date dalla (8.29), cioè yk (a) = ya, k e yk (b) =
yb, k , k = 1, ..., l. Per quanto riguarda la funzione λ (x), questa sarà determinata
imponendo il vincolo (8.36).
PRINCIPI VARIAZIONALI
345
Esempio 8.3.1 Come esempio di massimizzazione/minimizzazione vincolata consideriamo il problema della ricerca della curva di minima lunghezza che connette due punti
A e B su una sfera di raggio R. Sia
x (τ ) = x (τ ) ex + y (τ ) ey + z (τ ) ez , τ ∈ [0, 1] ,
la parametrizzazione della generica curva che collega A e B (curva tratteggiata in
figura 8.5).
B
A
Figura 8.5: Cammino più breve stra i punti A e B con il vincolo di rimanere sulla
superficie della sfera.
Il funzionale che ne esprime la lunghezza è
� 1�
I [x] =
x′ 2 + y ′ 2 + z ′ 2 dτ ,
0
mentre il vincolo cui le funzioni x (τ ), y (τ ) e z (τ ) sono sottoposte è
x2 (τ ) + y 2 (τ ) + z 2 (τ ) − R2 = 0, ⇒
�x (τ )� = R ∀ τ ∈ [0, 1] .
Scrivendo le (8.43) otteniamo
d
x′
�
= 2λ (τ ) x,
dτ x′ 2 + y ′ 2 + z ′ 2
d
y′
�
= 2λ (τ ) y,
dτ x′ 2 + y ′ 2 + z ′ 2
d
z′
�
= 2λ (τ ) z,
dτ x′ 2 + y ′ 2 + z ′ 2
(8.44)
ovvero, se indichiamo con
1
x′ (τ )
t (τ ) = �
,
(x′ ex + y′ey + z ′ ez ) =
�x′ (τ )�
x′ 2 + y ′ 2 + z ′ 2
(8.45)
346
LEZIONI DI SISTEMI DINAMICI
il versore tangente alla curva, il sistema (8.44) può riscriversi nella seguente forma
compatta
dt
= 2λ x .
dτ
Se moltiplichiamo vettorialmente per x (τ ) tale equazione si ottiene
x∧
dt
= 2λ x ∧ x = 0,
dτ
e quindi
dt
d
dx
(x (τ ) ∧ t (τ )) = x ∧
∧t =
+
x′ 2 + y ′ 2 + z ′ 2 t ∧ t = 0,
dt
dτ
dτ
(8.45)
=0
ovvero
x (τ ) ∧ t (τ ) = c ,
(8.46)
dove c è un vettore costante. La (8.46) implica che, per ogni τ , x (τ ) e x′ (τ ) giacciono
su un piano passante per l’origine, il cui versore normale è parallelo a c. Ma allora
anche i punti A e B posti agli estremi della curva x (τ ) giacciono su tale piano, che
è appunto un piano equatoriale e la cui intersezione con la sfera è la circonferenza
di raggio massimo, ovvero di raggio R. Quindi la curva che connette A e B avente
minima lunghezza è l’arco di cerchio massimo che contiene A e B (curva continua in
figura 8.5).
8.4 Il principio di Hamilton
Sia dato un
sistema meccanico con funzione lagrangiana L(q1 , . . . , ql , q̇1 , . . . , q̇l , t) =
t , dove, come nella sezione 4.1, abbiamo posto q
, q̇,
(t) = (q1 (t) , . . . , ql (t)) .
L q
Ipotizziamo inoltre che il moto sia governato dal sistema (5.36), ovvero che il sistema
sia soggetto a vincoli lisci e che le uniche forze attive siano conservative.
Definizione 8.4.1 Siano dati due tempi t1 e t2 , con t1 < t2 , e due configurazioni di
coordinate lagrangiane
a = (q1a , . . . , qla ) e q
b = (q1b , . . . , qlb ).
q
(8.47)
Diremo classe dei moti variati sincroni l’insieme Q costituito dalle l-uple di fun (t) = (q1 (t), . . . , ql (t)) tali che: (1) qk (t) : [t1 , t2 ] → R, e qk (t) ∈
zioni q
(t1 ) = q
a , q
(t2 ) = q
b .
C 2 ([t1 , t2 ]) ∀ k = 1, ..., l; (2) q
(t) soluzioni delle
Definizione 8.4.2 Diremo moti naturali per il sistema le funzioni q
equazioni di Lagrange18 (5.36).
18 Ovvero distinguiamo tra un “moto” compatibile con la struttura cinematica del sistema meccanico, ivi
(t), e un moto che sia compatibile con la
compresi i vincoli imposti, che è dato da una qualsiasi funzione q
dinamica risultante dalle forze applicate.
PRINCIPI VARIAZIONALI
347
Definizione 8.4.3 Si dice azione hamiltoniana il funzionale A : Q −→ R, che opera
così
t2
]=
(t) ,
A[ q
L q
q̇ (t) , t dt.
(8.48)
t1
Vale il seguente teorema, anche noto come Principio di Hamilton,
∗ (t) rende stazio∗ (t) ∈ Q è moto naturale del sistema allora q
Teorema 8.4.1 Se q
19
],
nario il funzionale (8.48), ovvero la variazione del funzionale (8.48), cioè δA [ q
∗ .
è nulla in corrispondenza di q
∗ (t) ∈ Q rende stazionaria l’azione (8.48), cioè
anche il viceversa: se q
Vale
∗
∗
= 0, allora q
(t) è moto naturale secondo la definizione 8.4.2.
δA q
Dim. La dimostrazione del teorema è una ripetizione del calcolo che abbiamo effettuato nella sezione 8.3 per ricavare il sistema (8.35) (equazioni di Eulero-Lagrange)
nel caso in cui il funzionale dipenda da l funzioni e dalle loro derivate prime. Infatti,
utilizzando la notazione dell’osservazione 8.2.3, abbiamo
δA =
t2
t1
l
∂L
d ∂L
−
δqk dt,
dt ∂ q̇k
∂qk
k=1
dove δ
q (t) = (δq1 (t), . . . , δql (t)) ∈ Q0 , con
δ
q (x) : [t1 , t2 ] → R : δqk (x) ∈ C 2 ([t1 , t2 ]) ∀ k = 1, ..., l e
Q0 =
q (t2 ) = 0} .
δ
q (t1 ) = δ
∗ (t) è moto naturale, cioè se le q1∗ (t), ..., ql∗ (t) , soddisfano
E’ quindi evidente che se q
d ∂L
∂L
−
= 0, k = 1, ..., l,
dt ∂ q̇k
∂qk
∗
= 0. Viceversa, se l’azione è stazionaria in corrispondenza di q
∗ (t),
allora δA q
∗ = 0, allora
cioè δA q
t2
t1
l
d ∂L
∂L
d ∂L
∂L
, δ
q = 0,
−
δqk dt = 0, ⇔
−
dt ∂ q̇k
∂qk
dt ∂ q̇
∂
q
k=1
per ogni l-upla δ
q (t) ∈ Q0 . Ora le funzioni δqk (t), k = 1, ..., l, sono indipendenti
e quindi, applicando il lemma 8.3.1, concludiamo che le funzioni q1∗ (t), ..., ql∗ (t),
∗ (t), risolvono le equazioni di Lagrange (5.36). Dunque, in virtù
costituenti la l-upla q
∗ (t) è moto naturale.
della definizione 8.4.2, q
19 Questo enunciato è una forma più generale del classico enunciato Il moto naturale di un sistema meccanico rende minima l’azione stazionaria nella classe dei moti che rispettano le condizioni iniziali e finali;
così enunciato il principio è molto più “significativo” in quanto fa appello alla proprietà di minimo, come nel
principio di Fermat. Questo però non è generalmente vero, l’azione è minima solo se le condizioni iniziale
e finale sono “sufficientemente vicine”. Nella enunciazione del teorema (8.4.1) si ottiene l’equivalenza tra il
principio e le equazioni di Lagrange. Il principio è così matematicamente corretto, ma meno significativo!
348
LEZIONI DI SISTEMI DINAMICI
Esempio 8.4.1 Consideriamo l’oscillatore armonico la cui Lagrangiana è
3
L=
m 2
q̇i − ω 2 qi2 ,
2 i=1
e, sull’intervallo [0, T ], consideriamo il seguente moto naturale
q2∗ (t) = q3∗ (t) = 0.
q1∗ (t) = a sin ωt,
Mostriamo che tale moto naturale rende minima l’azione se T è sufficientemente piccolo. Calcoliamo esplicitamente
∗
∗
+ δ
,
δA = A q
q −A q
e mostriamo che δA > 0, per ogni δ
q ∈ Q0 . Abbiamo
2
3
d ∗
2
2
∗
(q + δqi ) − ω (qi + δqi ) dt
=
dt i
0 i=1
2
3
dqi∗
m T
2 ∗2
dt
−
− ω qi
2 0 i=1
dt
δA
=
m
2
m
2
T
3
T
0
+m
i=1
T
3
m
2 i=1
− ω 2 q1∗ δq1 ]dt
q̇ ∗ δ q̇1
1
[
0
=
δ q̇i2 − ω 2 δqi2 dt
si integra per parti
con δq1 (0)=δq2 (T )=0
T
δ q̇i2
0
−ω
2
δqi2
dt − m
ovvero
3
δA =
Si sfrutta adesso δqi (t) =
cui
δqi (t) ≤
i
·
20 δq
L2 (0,T )
=
t
0
m
2 i=1
0
T
0
T
q̈1∗ + ω 2 q1∗ dt ,
=0
δ q̇i2 − ω 2 δqi2 dt .
δ q̇i dτ , e la stima
20
t
0
√
δ q̇i dτ ≤ t �δ q̇i �L2 (0,T ) , per
√
2
t �δ q̇i �L2 (0,T ) , ⇒ δqi2 (t) ≤ t �δ q̇i �L2 (0,T ) .
T
0
·
δqi (t)
2
dt .
(8.49)
PRINCIPI VARIAZIONALI
349
Tornando a δA, otteniamo
3
3 T
m T 2
2
2
δA =
δqi dt
δ q̇i dt − ω
2 i=1 0
i=1 0
≥
(8.49)
T
3
3
m
2
2
�δ q̇i �L2 (0,T ) − ω 2
�δ q̇i �L2 (0,T )
t dt
2 i=1
i=1
0
T2
2
=
3
ω2T 2
m
2
,
�δ q̇i �L2 (0,T ) 1 −
2 i=1
2
ω2T 2
> 0, si ha δA > 0.
per cui, se T è sufficientemente piccolo sì che 1 −
2
8.4.1 Sistemi vincolati ed equazioni di Lagrange di prima specie
Riprendiamo quanto visto nell’osservazione 4.1.3 della sezione 4.1 supponendo che il
sistema meccanico, con l gradi di libertà sia soggetto ad un ulteriore vincolo olonomo e
liscio del tipo (4.11), che per brevità indicheremo con Φ (
q ) = 0. Evidentemente si può
sfruttare l’equazione vincolare e ridurre così i gradi di libertà passando da l ad (l − 1).
Tuttavia si può anche procedere come nella sezione 8.3.1, considerando il funzionale
(8.48) con in più il vincolo Φ (
q ) = 0. Quindi, ricordando la (8.43) e supponendo
che tutti gli altri vincoli siano lisci e che le uniche forze attive siano conservative, le
equazioni di Eulero-Lagrange per il sistema diventano
d ∂L
∂L
∂Φ
−
=λ
, k = 1, ..., l,
(8.50)
dt ∂ q̇k
∂qk
∂qk
che coincidono proprio con le equazioni di Lagrange di prima specie (5.56) nel caso in
cui le forze non vincolari siano conservative. Come già specificato nella sezione 5.3.2,
∂Φ
il termine λ
, k = 1, ..., l, si interpreta come la componente Lagrangiana della forza
∂qk
dovuta all’ulteriore vincolo (4.11).
Esempio 8.4.2 Riprendiamo l’esempio 4.1.2, solo che adesso consideriamo il disco
che rotola senza strisciare lungo un piano inclinato come mostrato nella figura 8.6.
Il sistema ha due gradi di libertà: l’ascissa s del centro e l’angolo di rotolamento
ϕ. La relazione tra s e ϕ è data dalla (4.14), ovvero da
Φ (s, ϕ) = Rϕ + s = 0.
(8.51)
Adesso però, anziché sfruttare la (8.51) per esprimere ϕ in funzione di s, o viceversa,
manteniamo i due gradi di libertà ϕ ed s e consideriamo il vincolo (8.51). La funzione
di Lagrange del sistema è la differenza fra l’energia cinetica del disco rigido
M 2 1 M R2
T =
ṡ +
ϕ̇2 ,
2
2
2
350
LEZIONI DI SISTEMI DINAMICI
y
x
s
α
Figura 8.6: L’inclinazione del piano rispetto all’orizzontale è α. Il disco è omogeneo
ed M è la sua massa. Il raggio del disco è R. Il peso è diretto nel verso opposto
dell’asse y.
e l’energia potenziale dovuta alla forza peso, V = −M gs sin α, cioè
�
�
M
R2 2
L=
ṡ2 +
ϕ̇ + M gs sin α .
2
2
Il sistema (8.50), (8.51) diventa
�
�
d ∂L
∂L
∂Φ
−
=λ
,
dt
∂
ṡ
∂s
∂s
�
�
d ∂L
∂L
∂Φ
−
=λ
,
dt
∂
ϕ̇
∂ϕ
∂ϕ
Φ (s, ϕ) = 0 ,
da cui otteniamo
λ
s̈ − g sin α =
,
M
R
λ
⇒
ϕ̈ =
,
2
M
s = −Rϕ ,
2
s̈ = g sin α,
3
2
g sin α, ,
ϕ̈ = −
3R
λ = − M g sin α .
3
PRINCIPI VARIAZIONALI
351
8.5 Il principio di Jacobi
8.5.1 Coordinate cicliche nell’ambito del principio di Hamilton
Ricordiamo che se una delle coordinate lagrangiane, diciamo qk , non compare esplicitamente nella funzione di Lagrange L (ma la q̇k ovviamente compare nella L) la
coordinata si dice ciclica (si veda la definizione definizione 3.3.1). Come conseguenza delle equazioni di Lagrange (si ricordi la proposizione 3.3.2) si ha che il momento
∂L
coniugato pk =
è costante.
∂ q̇k
Abbiamo già visto nella sezioni 3.3.1 e 5.6 l’importanza delle coordinate cicliche
nel processo di soluzione delle equazioni di moto, in quanto esse permettono di ridurre
la “dimensione” del problema, ovvero il numero di equazioni che restano da risolvere. Si ricordi, per esempio, come nella sezione 3.4 è stata sfruttata la ciclicità della
variabile angolare nel problema di Keplero al fine di ridursi a risolvere un problema
unidimensionale per la distanza dal centro della forza.
In particolare, nelle sezioni 3.3.1 e 5.6 abbiamo introdotto la funzione di Routh,
come quella funzione da utilizzare “al posto” della funzione di Lagrange quando si
vogliono sfruttare le semplificazioni indotte dalle variabili cicliche. In questa sezione
vogliamo mostrare come la funzione di Routh emerga naturalmente nell’ambito del
principio variazionale di Hamilton.
Supponiamo di avere un sistema caratterizzato da l variabili lagrangiane e assumiamo, per semplicità, che una sola variabile, la ql , sia ciclica21 . Abbiamo quindi
∂L
= pl , con pl = costante,
∂ q̇l
(8.52)
da cui, invocando la proposizione 5.6.1, possiamo ricavare q̇l in funzione della costante
pl e delle altre variabili. Pertanto, utilizzando la notazione della sezione 5.6, scriveremo
q˙l =
q̇ l (q1 , ..., ql−1 , q̇1 , ..., q̇l−1 , pl , t) .
(8.53)
Dobbiamo poi tener conto del fatto che la relazione (8.53) rende la ql funzione delle
altre variabili: una volta assegnate le (q1 , ..., ql−1 ), la ql si ottiene integrando la (8.53)
rispetto al tempo. In altri termini, le funzioni q1 (t), ..., ql (t), sono vincolate. Il vincolo che le lega però non è del tipo analizzato nella sezione 8.3.1 (per intendersi un
vincolo del tipo (8.36)) ma è un vincolo che coinvolge un integrale. La teoria sviluppata nella sezione 8.3.1 non è quindi applicabile al presente caso. Si procede pertanto
seguendo una strada diversa da quella illustrata nel paragrafo 8.3.1. L’idea è quella di
utilizzare l’equazione (8.53) per eliminare fin dall’inizio la dipendenza dalla variabile
q̇l nell’integrale (8.48).
Nota 8.5.1 Si osservi che, comunque si varino le funzioni q1 (t), ..., ql−1 (t), se la q̇l è
definita dalla (8.53), la relazione (8.52) viene automaticamente soddisfatta: cioè, per
ogni t, vale
21 Il
∂L
(q1 , .., ql−1 , q̇1 , .., q̇l−1 ,
q̇ l (q1 , .., ql−1 , q̇1 , .., q̇l−1 , pl , t), t) = pl ,
∂ q̇l
caso di m < l variabili cicliche è stato analizzato nella sezione 5.6.
352
LEZIONI DI SISTEMI DINAMICI
dove pl assume il valore costante scelto. In altri termini, le l funzioni q1 (t), ..., ql (t),
con ql (t) ottenuta integrando rispetto al tempo (8.53), giacciono sulla “ipersuperficie”
definita dalla (8.52).
Partendo dalla (8.48), si sostituisce nell’integrando la funzione �
q̇ l al posto di q̇l , ottenendo così un nuovo funzionale che dipende soltanto dalle funzioni q1 (t), ..., ql−1 (t),
e dalle loro derivate. In altri termini, rifacendosi sempre alla notazione della sezione
5.6, introduciamo il funzionale
� t2
� 1 , ..., ql−1 , q̇1 , ..., q̇l−1 , t) dt
A� [q1 , ..., ql−1 ] =
(8.54)
L(q
t1
=
�
t2
t1
�
�
L q1 , ..., ql−1 , q̇1 , ..., q̇l−1 , �
q̇ l (q1 , ..., ql−1 , q̇1 , ..., q̇l−1 , pl , t) , t dt.
Osserviamo che il funzionale definito dalla (8.54) è diverso da quello di partenza, cioè
da quello definito dalla (8.48). Quest’ultimo infatti dipende da22 (q1 , ..., ql−1 ), e da
(q̇1 , ..., q̇l ) mentre A� dipende da (q1 , ..., ql−1 ), e da (q̇1 , ..., q̇l−1 ).
La differenza fra A ed A� è ancora più profonda: mentre A soddisfa il principio di
Hamilton, A� non lo soddisfa. Vale infatti il seguente
Teorema 8.5.1 Siano dati t1 e t2 , con t1 < t2 , e le configurazioni
(q1 (t1 ) , ..., ql−1 (t1 )) = (q1a , ..., ql−1 a ) ,
(8.55)
(q1 (t2 ) , ..., ql−1 (t2 )) = (q1b , ..., ql−1 b ) ,
e sia (q1 (t1 ) , ..., ql−1 (t1 )) il moto naturale del sistema che soddisfa le condizioni
� cioè δ A,
� calcolata in corrispondenza di tale
(8.55). La variazione del funzionale A,
moto non è nulla in generale, ma vale
�
�
� t2 �
l−1
q̇ l
∂�
q̇ l
d ∂�
�
δqi dt,
δA =
(8.56)
−
pl
∂qi
dt ∂ q·
t1
i=1
i
dove pl è la costante data dalla (8.52) e la funzione �
q̇ l è data dalla (8.53).
Tale teorema ricalca lo stesso risultato illustrato nella sezione 3.3.1: la funzione di
� 1 , ..., ql−1 , q̇1 , ..., q̇l−1 , t) non soddisfa le equazioni di Lagrange. Il teoLagrange L(q
� pur dipendendo da l − 1 funzioni
rema 8.5.1 afferma un fatto analogo: il funzionale A,
anziché da l come l’originaria azione A, non soddisfa il teorema 8.4.1.
Dim. del teorema 8.5.1. Consideriamo una (l − 1)-upla di funzioni
(δq1 (t) , ...., δql−1 (t)) ,
tali che δqi (t1 ) = δqi (t2 ) = 0, per ogni i = 1, ..., l − 1. Calcoliamo esplicitamente
la variazione di A� facendo uso della procedura illustrata nella nota 8.2.3, nell’ipotesi
22 Si
ricordi che la qn è ciclica e quindi non compare nella funzione di Lagrange L.
PRINCIPI VARIAZIONALI
353
che q1 (t), ...., ql−1 (t), soddisfino le equazioni di Lagrange (5.36). Otteniamo
δ A =
t2
t1
−
1 + δq1 ) , ..., (ql−1 + δql−1 ) , (q̇1 + δ q̇1 ) , ..., (q̇l−1 + δ q̇l−1 ) , t) dt
L((q
t2
t1
1 , ..., ql−1 , q̇1 , ..., q̇l−1 , t) dt,
L(q
dove L deve essere espressa in termini di L come mostrato esplicitamente nella (8.54).
Abbiamo dunque
t2
l−1
∂L
∂L
δqi +
δ q̇i
δA =
∂qi
∂ q̇i
t1
i=1
n−1
∂L
+
∂q
l
i=1
pl
∂
q̇ l
∂
q̇ l
δqi +
δ q̇i
∂qi
∂ q̇i
dt ,
d
(δqi ). Integrando per parti e sfruttando la condizione
dt
δqi (t1 ) = δqi (t2 ) = 0, i = 1, ..., l − 1, ed il fatto che (q1 (t1 ) , ..., ql−1 (t1 )) sono il
moto naturale, cioè soddisfano le equazioni di Lagrange (5.36), otteniamo
dove, lo ricordiamo, δ q̇i =
δ A =
∂L
d ∂L
−
δqi dt
∂qi
dt ∂ q̇i
i=1
l−1
t2
+
t1
t2
pl
t1
l−1
i=1
=0
q̇ l
∂
q̇ l
d ∂
δqi dt,
−
∂qi
dt ∂ q·
i
ovvero la (8.56).
Il principio di Hamilton 8.4.1 non è quindi soddisfatto a meno di non modificare
l’azione Hamiltoniana considerando
t2
1 , ..., ql−1 , q̇1 , ..., q̇l−1 , t)
AR [q1 , ..., ql−1 ] =
L(q
t1
ovvero
·
− pl q l (q1 , ..., ql−1 , q̇1 , ..., q̇l−1 , pl , t) dt,
AR [q1 , ..., ql−1 ] =
t2
t1
R(q1 , ..., ql−1 , q̇1 , ..., q̇l−1 , t)dt,
(8.57)
(8.58)
essendo R la funzione di Routh definita dalla (5.72). Possiamo enunciare il principio
variazionale di Hamilton come segue
354
LEZIONI DI SISTEMI DINAMICI
Proposizione 8.5.1 Se la variabile ql è ciclica, allora la δAR = 0 se e sole se q1 (t),
..., ql−1 (t), sono moto naturale cioè risolvono le (5.75), ovvero
d ∂R
∂R
−
= 0, i = 1, ...., l − 1 .
dt ∂ q̇i
∂qi
Dim. Calcolando la variazione di AR si ottiene
δAR =
l−1
t2
t1
k=1
d
dt
∂R
∂ q̇k
∂R
−
δqk dt.
∂qk
Quindi se δAR = 0, allora siccome le funzioni δqk , k = 1, ..., l − 1, sono indipendenti
possiamo applicare il lemma 8.3.1 e così ottenere il sistema (5.75). Viceversa se q1 (t),
..., ql−1 (t), soddisfano le (5.75) allora δAR = 0.
∂L
= costante,
∂ q̇l
la minimizzazione del funzionale A si riduce alla minimizzazione del funzionale (8.58).
La soluzione di tale problema variazionale permette di determinare l’evoluzione temporale delle prime l − 1 variabili indipendentemente dalla l-esima. Quest’ultima potrà essere ricavata a posteriori dalla (8.53), il cui secondo membro è diventato una
funzione nota del tempo e della costante pl .
Abbiamo quindi provato che, se vogliamo tener conto del vincolo pl =
8.5.2 Il tempo come variabile
Consideriamo ora per semplicità il caso di una Lagrangiana L che non dipende esplicitamente dal tempo.
Invece di studiare il problema del moto negli usuali termini in cui le coordinate
lagrangiane qk sono funzioni del tempo e il tempo è la variabile indipendente, introduciamo un cambiamento di variabili, sotto forma parametrizzazione delle qk e del tempo
stesso tramite una nuova variabile indipendente23 τ . Avremo quindi24
t
=
t̃(τ ), ⇔ τ = τ (t) , cioè t̃(τ ) è invertibile,
q̃k (τ )
=
qk ( t̃(τ )), ⇔ qk (t) = q̃k (τ (t)),
q̃k′ (τ )
=
dqk ( t̃(τ ))
= q̇k ( t̃(τ )) t̃′ (τ ) , ⇒ q̇k (t (τ )) =
dτ
(8.59)
(8.60)
q̃k′ (τ )
,
t̃′ (τ )
(8.61)
dove l’apice ′ indica la derivata rispetto a τ .
Con questo cambiamento di variabili l’azione Hamiltoniana (8.48) diventa
τ2
L (q̃1 (τ ), ..., q̃l (τ ), q̃1′ (τ ), ..., q̃l′ (τ )) t̃′ (τ ) dτ,
(8.62)
A=
τ1
23 Per esempio si può pensare a τ come al parametro d’arco s lungo la traiettoria. Ovviamente possiamo
ragionare in questo modo anche se la Lagrangiana dipende esplicitamente dal tempo.
24 Assumendo t̃(τ ) invertibile t̃′ (τ ) ha segno definito. Noi considereremo sempre t̃′ (τ ) > 0.
PRINCIPI VARIAZIONALI
355
dove t̃′ (τ ) dτ sostituisce dt e dove
� 1 (τ ), ..., q̃l (τ ), q̃ ′ 1 (τ ), ..., q̃ ′ l (τ ))
L(q̃
= L(q1 (t̃(τ )), ..., ql (t̃(τ )), q̇1 (t̃(τ )), ..., q̇l (t̃(τ )))
�
�
q̃ ′ (τ )
q̃ ′ (τ )
, ..., ′l
.
= L q̃1 (τ ), ..., q̃l (τ ), 1′
(8.61)
t̃ (τ )
t̃ (τ )
(8.63)
Possiamo calcolare la variazione prima di questo funzionale, facendo variare oltre
alle q̃k anche la funzione t̃ con le condizioni δ q̃k = 0 e δ t̃ = 0 per25 τ = τ1 e τ = τ2 .
Se ora scriviamo le equazioni di Eulero-Lagrange per l’annullarsi della variazione di
(8.62) abbiamo un sistema di l + 1 equazioni. Le prime l sono equivalenti alle ordinarie
equazioni di Lagrange (a parte il fattore moltiplicativo t̃′ ). La (l + 1)-esima equazione
è invece
�
�
′
∂
L̃
t̃
d
= 0,
(8.64)
dτ
∂ t̃′
dal momento che t̃(τ ) è ciclica, cioè non compare esplicitamente nella L̃. Quindi, se
poniamo
�
�
∂ L̃ t̃′
pt =
, =⇒ pt = costante.
(8.65)
(8.64)
∂ t̃′
Calcoliamo adesso esplicitamente pt , detto anche momento coniugato a t̃,
pt
=
=
=
�
�
∂
L̃
+ L̃
t̃′
∂ t̃′
��
�
�
� �
q̃ ′
q̃ ′
q̃ ′
q̃ ′
∂
+ L q̃1 , ..., q̃l , 1′ , ..., ′l
t̃′ ′ L q̃1 , ..., q̃l , 1′ , ..., ′l
∂ t̃
t̃
t̃
t̃
t̃
�
�
l
q̃ ′
q̃ ′
1 � ∂L ′
q̃i + L q̃1 , ..., q̃l , 1′ , ..., ′l .
(8.66)
− ′
t̃ i=1 ∂ q̇i
t̃
t̃
�
��
�
1 ,...,q̃l ,q̃′ 1 ,...,q̃′ l )
L(q̃
Se introduciamo la funzione Hamiltoniana26
25 Si
� 1 (τ ), ..., q̃l (τ ), q̃1′ (τ ), ..., q̃n′ (τ ))
H(q̃
�
�
�
�
�
�
�
�
= H(q1 t̃(τ ) , . . . , ql t̃(τ ) , q̇1 t̃(τ ) , . . . , q̇l t̃(τ ) ),
assume t̃ (τ1 ) = t1 e t̃ (τ2 ) = t2 .
che la (8.67) può anche essere derivata se, in accordo con la (5.78), definiamo
26 Osserviamo
e poi sfruttiamo la (8.61) e la (8.63).
=
H
l
∂L
q̃ ′ − L,
′ i
∂q
i
i=1
(8.67)
356
LEZIONI DI SISTEMI DINAMICI
per cui, dalla definizione (5.78),
H
=
=
abbiamo
l
∂L
q̇i t̃(τ ) − L(q1 t̃(τ ) , . . . , ql t̃(τ ) , q̇1 t̃(τ ) , . . . , q̇l t̃(τ ) )
∂ q̇i
i=1
l
1 ∂L ′
q̃1′
q̃l′
q̃ − L q̃1 , ..., q̃l , ′ , ..., ′ ,
t̃′ i=1 ∂ q̇i i
t̃
t̃
(8.68)
1 (τ ), ..., q̃l (τ ), q̃ ′ (τ ), ..., q̃ ′ (τ )) = −pt = costante.
H(q̃
1
n
(8.69)
In particolare, tornando alla variabili originarie, cioè considerando t come variabile
indipendente e ricordando le (8.60), (8.61), abbiamo
pt = L(q1 , . . . , ql , q̇1 , . . . , q̇l ) −
ovvero
l
∂L
q̇i ,
∂
q̇i
i=1
H(q1 , . . . , ql , q̇1 , . . . , q̇l ) = −pt = costante .
(8.70)
(8.71)
Abbiamo quindi ottenuto, ma con un formalismo completamente diverso, lo stesso
risultato dimostrato nella sezione 5.7: se la funzione Lagrangiana non dipende esplicitamente dal tempo, se le uniche forze attive sono conservative e se i vincoli sono lisci
allora vale la (5.81).
La (8.71) ci dà anche un’informazione in più: si può guardare all’Hamiltoniana
(cambiata di segno) come alla variabile coniugata della variabile “tempo” t. La (8.65)
ricalca infatti la definizione 9.0.1 del capitolo 9 se consideriamo t̃′ al posto di q̇k e L̃ t̃′
al posto di L.
8.5.3 Formulazione del principio di Jacobi
La condizione (8.71) rappresenta un vincolo per le qi (t), q̇i (t), i = 1, ..., l. Tale vincolo tuttavia è diverso da quello analizzato nel paragrafo 8.5.1 dal momento che la (8.71),
coinvolgendo tutte le qi e tutte le q̇i , non consente, in generale, di esprimere una variabile lagrangiana in funzione delle rimanenti (l − 1). Se quindi vogliamo tener conto di
tale vincolo sorge il problema di come incorporarlo nel principio di Hamilton. In pratica, come mostrato nella sezione 8.5.1, dobbiamo modificare l’azione Hamiltoniana.
In definitiva, tener conto del vincolo (8.71) significa individuare, come già accennato
nella nota 3.3.1, una particolare funzione di Routh.
La strada da seguire è stata essenzialmente tracciata nella sezioni 8.5.1 e 8.5.2: introduciamo una nuova variabile indipendente τ e consideriamo il tempo come variabile
dipendente. Osservando poi che la funzione riportata nella parentesi quadra di (8.62),
ovvero L t̃′ , non dipende esplicitamente dalla variabile t̃ ma solo dalla sua derivata t̃′ ,
si può attuare la strategia di riduzione delle variabili del paragrafo 8.5.1, tornando così
a “sole” l variabili q̃1 (τ1 ), ..., q̃l (τ1 ), non più vincolate.
Seguendo i passaggi illustrati nel caso generale, dobbiamo considerare solo l variabili q̃1 (τ ), ...., q̃l (τ ), e sfruttare la (8.65), ovvero la (8.66), per ricavare
′
t̃′ = t̃′ (q̃1 (τ ), ..., q̃l (τ ), q̃1 (τ ), ..., q̃l′ (τ )) ,
q(τ )
q ′ (τ )
(8.72)
PRINCIPI VARIAZIONALI
357
e da essa t in funzione di τ , cioè t̃ (τ ). In tal modo, come osservato nella nota 8.5.1, il
vincolo (8.69) sarà automaticamente soddisfatto.
detto classe dei moti variati asincroni isoenergeDefiniamo adesso l’insieme Q,
è formato da tutte le
tici, che costituisce il dominio della nuova azione. l’insieme Q
(τ ), tali che:
l-uple di funzioni q
(1) . q̃i (τ ) ∈ C 2 ([τ1 , τ2 ]), i = 1, ..., l.
(τ1 ) = q
a , e q
(τ2 ) = q
b , con q
a , q
b definite dalla (8.47).
(2) . q
e Q (quest’ultimo
Nota 8.5.2 E’ importante sottolineare la differenza fra gli insiemi Q
non compare il tempo e quindi
introdotto con la definizione 8.4.1). Nelle l-uple di Q
è l’insieme di tutte le curve di Rl che connettono q
a e q
b , non sottoposte ad alcun
Q
(τ ) ∈ Q, si determinano, per mezzo della (8.66),
vincolo. Infattidata una qualunque
q
(τ ) , q
′ (τ ) e, successivamente t in funzione di τ , sì che il vincolo
la funzione t̃′ q
(8.69) risulta automaticamente soddisfatto.
a e
La classe Q è invece l’insieme di tutti i moti che partono al tempo t1 da q
b . Gli elementi di Q sono dunque le l-uple q
(t) che rappreterminano al tempo t2 in q
sentano i possibili moti (quindi elementi “fisici”) non soggetti ad alcun vincolo. Gli
sono invece enti geometrici che non danno informazioni sullo sviluppo
elementi di Q
temporale del moto, ovvero sulla legge oraria con cui la traiettoria è percorsa.
t
(q˜1 (τ), ˜
q2 (τ), ˜t(τ))
q2 a
(q1 (τ), q˜2 (τ))
˜
˜
q2 b
˜
q2
q1b
q1a
q1
(q1 (τ), q2 (τ), ˜t(τ))
(q˜1 (τ), q˜2 (τ))
Figura 8.7: Le due curve continue corrispondono a due generiche traiettorie (q̃1 (τ1 ),
q̃2 (τ1 ). I relativi moti (q̃1 (τ1 ), q̃2 (τ1 ), t̃ (τ )) sono rappresentati dalle curve tratteggiate.
In particolare, una volta fissate le traiettorie, la legge oraria con cui si esprime il tempo
t in funzione di τ , viene determinata dalla (8.65), ovvero dalla (8.66).
Nella figura 8.7 sono riportate sul piano (q1 , q2 ) due possibili traiettorie (q̃1 (τ1 ),
q̃2 (τ1 )), cui corrispondono, nello spazio (q1 , q2 , t), i relativi moti (q̃1 (τ1 ), q̃2 (τ1 ), t̃ (τ ))
(curve tratteggiate). Quest’ultimi danno informazioni sulla traiettoria e anche sulla
legge oraria con cui la stessa è percorsa. Si nota che gli istanti di partenza e di arrivo non sono gli stessi per entrambe i moti. Infatti, una volta selezionati: punto di
358
LEZIONI DI SISTEMI DINAMICI
partenza, punto di arrivo, e la particolare traiettoria (q̃1 (τ1 ), q̃2 (τ1 )) che li connette,
il corrispondente moto (q̃1 (τ1 ), q̃2 (τ1 ), t̃ (τ )) si determina calcolando la legge oraria
t̃(τ ). Questo si fa tramite la (8.66) che permette di determinare t̃′ (τ ) e poi, integrando la (8.72), di esprimere t come funzione di τ . Il moto così determinato è tale da
soddisfare automaticamente il vincolo (8.69).
Seguendo le (8.57) e (8.58), la nuova Lagrangiana, o, se vogliamo, la funzione di
Routh, è data da
l
∂L ′
LR = L̃t̃′ − pt t̃′ =
q̃ ,
(8.66)
∂
q̇i i
i=1
−→ R, ed opera così
e pertanto la nuova azione è così definita: AR : Q
τ2
τ 2
l
∂L ′
q (τ )] =
q̃ dτ ,
LR dτ =
AR [
∂ q̇i i
τ1
τ1
i=1
che, ricordando la (8.61), si può anche scrivere come
AR =
τ2
τ1
l
∂L ′
q̇i t̃ dτ .
∂
q̇i
i=1
Se adesso ipotizziamo che l’energia cinetica del sistema sia27 T = T2 , sfruttando la
(5.83) abbiamo
n
∂L
q̇i = 2T,
∂
q̇i
i=1
e l’azione diventa quindi
AR =
τ2
2T t̃′ dτ .
(8.73)
τ1
In questa forma però compare ancora t̃′ data dalla (8.72) che è stata determinata sfruttando la conservazione del momento pt .
Ora supponiamo che in Rl sia dato un sistema di coordinate curvilinee (q1 , ..., ql )
la cui corrispondente matrice metrica (si veda la sezione 1.4) è la matrice28 A dell’e questa
(τ ) ∈ Q,
nergia cinetica definita nella sezione 4.1.2. Se fissiamo una generica q
definisce una curva, o meglio una traiettoria, γ : [τ1 , τ2 ] −→ Rl ,
γ
τ −→ x (τ ) =
l
xi (q̃1 (τ ), ..., q̃l (τ )) ei .
(8.74)
i=1
Il vettore tangente, x′ (τ ), può essere espresso utilizzando la base locale {ui } legata
alle coordinate curvilinee
l
′
x′ (τ ) =
q̃i (τ )ui .
i=1
27 Si
28 Si
ricordi la (4.33).
ricordi che la matrice A, di componenti aij , è una matrice simmetrica definita positiva.
PRINCIPI VARIAZIONALI
359
Di conseguenza
�x′ (τ )�
2
l
�
=
′
′
aij (�
q (τ )) q̃i (τ ) q̃j (τ )
i,j=1
=
(8.61)
�
l
�
i,j=1
aij (�
q (τ )) q̇i (τ ) q̇j (τ ) t̃′ 2 ,
��
�
2T
(4.38)
per cui la lunghezza della curva γ è
�
ds =
γ
�
τ2
′
�x (τ )� dτ =
τ1
�
τ2
√
2T t̃′ dτ ,
τ1
dove con ds si denota la lunghezza dell’elemento d’arco, cioè
√
ds = �x′ (τ )� dτ = 2T t̃′ dτ.
(8.75)
Possiamo allora riscrivere il funzionale (8.73) da minimizzare come29
AR
=
�
τ2
2T t̃′ dτ =
τ1
=
�
γ
√
√
2T�
� ��
2(E−V )
�
τ2
τ1
√ √
2T � 2T��t̃′ dτ�
ds
� �
ds =
2(E − V ) ds .
γ
dove γ è la traiettoria data da (8.74). Nell’ultimo integrale è “scomparso” definitivamente il tempo, quindi la soluzione delle equazioni che si ottengono annullandone la
variazione prima conterrà solo delle informazioni geometriche: saranno le equazioni
della traiettoria del punto rappresentativo nello spazio delle configurazioni. Una volta
determinata la traiettoria del moto, la legge oraria potrà essere ricavata dalla (8.75),
cioè
�x′ (τ )�
�x′ (τ )�
t̃′ = √
= �
,
(8.76)
2T
2 (E − V )
poiché a questo punto il secondo membro della (8.76) sarà una funzione nota del
parametro τ e la funzione t̃ (τ ), appunto la legge oraria, potrà essere ricavata per
integrazione rispetto a τ .
Abbiamo quindi determinato un principio variazionale la cui soluzione determina completamente la traiettoria del moto nello spazio delle configurazioni. Questo
principio prende il nome di Principio di Jacobi30 ed è la riscrittura “formalmente corretta” di un più antico principio variazionale, noto anche come Principio di Minima
29 Si
ricordi che T + V = E, con E = costante.
Gustav Jacob Jacobi (Potsdam, 1804 – Berlino, 1851) è stato un matematico tedesco.
30 Carl
360
LEZIONI DI SISTEMI DINAMICI
Azione,
il moto annullasse la variazione dell’integrale di azione31
t2 nche prevedevache
t2
i=1 pi q̇i ) dt = t1 2T dt, nella classe dei moti variati isoenergetici.
t1 (
Si può dare anche un’altra formulazione dell’azione se consideriamo come matrice
metrica
G = 2T A = 2 (E − V ) A,
(8.77)
dove A è definita dalla (4.38). In questo caso
l
′
ds = �x (τ )� dτ = 2 (E − V )
aij (
q (τ )) q̇i (τ ) q̇j (τ ) t̃′ dτ,
i,j=1
e quindi
AR =
ds,
γ
rappresenta proprio la lunghezza della traiettoria γ. La matrice metrica (8.77) viene
detta metrica di Jacobi. Possiamo quindi riformulare come segue il principio variazionale: il moto di un sistema meccanico soggetto a forze conservative e vincoli lisci
avviene, nello spazio delle configurazioni munito della metrica di Jacobi, lungo le
geodetiche (linee di più breve cammino).
E’ interessante analizzare il caso in cui un singolo punto materiale si muova per
inerzia (ovvero senza forze direttamente applicate, e quindi V ≡ 0) su una superficie
liscia (come descritto nella sezione 4.1.3). In questo 2T = 2E, e quindi ds definito
dall’energia cinetica coincide√proprio con la lunghezza dell’elemento di arco superficie
(moltiplicato per la massa e 2E, che sono fattori costanti).
Ne segue l’importante risultato: il moto per inerzia di un punto materiale su una
superficie avviene lungo le linee (geodetiche).
31 Il principio di minima azione, nella forma presente, è dovuto a Lagrange, ma è in genere noto sotto il
nome di Principio di Maupertuis che lo anticipò nella sua memoria del 1744. L’“errore” messo in evidenza
da Jacobi consiste nel fatto che non è corretto assumere il tempo come variabile indipendente. Questa
“sottigliezza” era però chiara a Lagrange
Capitolo 9
Il Sistema Canonico
Abbiamo osservato nel paragrafo 5.4 che la risolubilità delle equazioni di Lagrange
è legata alla possibilità di mettere il sistema delle equazioni in forma normale, cioè
di “risolverle” (algebricamente) rispetto alle variabili di ordine massimo, le q̈k . Poi
si trasforma il sistema originario di l equazioni differenziali del secondo ordine in un
sistema di 2l equazioni del primo ordine, definendo delle nuove variabili ηk = q̇k .
Esiste un’altra riduzione al primo ordine che porta a un sistema noto come sistema canonico o sistema di Hamilton. Il punto di partenza è sempre lo stesso: la
non-singolarità della matrice delle derivate seconde rispetto alle q̇k . Ricordando la
definizione della matrice A tramite (4.34) ed il teorema 4.1.3, abbiamo det A �=0. Ora,
partendo dalle (5.34) e (4.33), cioè
L=
otteniamo
l
l
1
1
q , t) − V (
q , t) ,
aij (
q , t) q̇i q̇j +
bi (
q , t) q̇i + c (
2 i,j=1
2
i=1
det
∂2L
∂ q̇i ∂ q̇j
= det A �= 0 .
(9.1)
Estendiamo adesso la definizione 3.3.2 al caso generale di l variabili lagrangiane.
Definizione 9.0.1 Si dicono momenti coniugati delle variabili qk le funzioni
pk =
∂L
(q1 , . . . , ql , q̇1 , . . . , q̇l , t) ,
∂ q̇k
k = 1, ..., l .
(9.2)
Le pk sono l funzioni delle variabili (q1 , . . . , ql , q̇1 , . . . , q̇l ) ed eventualmente del tempo
se la Lagrangiana ne dipende esplicitamente. Infatti, esplicitando la (9.2) abbiamo
pk =
l
akj (
q , t) q̇j + bk (
q , t) ,
k = 1, ..., l,
j=1
ovvero, con ovvio significato di simboli
+
= A (
p
q , t) q̇
b (
q , t) ,
362
LEZIONI DI SISTEMI DINAMICI
La condizione (9.1) ci dice che, per ogni fissato (q1 , . . . , ql ), la mappa tra le coordinate
(q̇1 , . . . , q̇l ) e le (p1 , ..., pl ) definite da 9.2 è invertibile, cioè
= A−1 p
−
b ,
q̇
(9.3)
in funzione delle p
e delle q
(e ovviamente del tempo
che ci consente di esprimere le q̇
t se, al solito, la Lagrangiana ne presenta una esplicita diependenza). Possiamo quindi
definire un “nuovo sistema di coordinate” per lo stato cinematico del sistema (e non
solo per le configuarazioni) usando al posto delle (q1 , . . . , ql , q̇1 , . . . , q̇l ) le variabili
(q1 , . . . , ql , p1 , . . . , pl ).
Per determinare a quali equazioni debbano soddisfare le nuove variabili, quando
le originarie soddisfano alle equazioni di Lagrange, richiamiamo la definizione della
funzione di Hamilton 5.78, che scriviamo ora nella forma
H(q1 , ..., ql , p1 , ..., pl , t) =
l
i=1
pi q̇i − L ,
(9.4)
dove le q̇i nella sommatoria e nella Lagrangiana L sono ora pensate come funzioni
delle variabili1 (q1 , . . . , ql , p1 , . . . , pl ).
Quindi, pensando la H come funzione delle qi e delle pi , calcoliamo la derivata di
H rispetto alla qi
∂H
∂qi
=
=
∂
∂qi
l
l
k=1
pk
k=1
pk q̇k − L
∂ q̇k
−
∂qi
l
∂L ∂ q̇h
∂L
−
∂qi
∂ q̇h ∂qi
h=1
ph
∂L
d
dt
∂ q̇i
pi
=
−
dpi
.
dt
E’ doveroso rimarcare che nel calcolo di ∂H
∂qi abbiamo sfruttato le equazioni di Lagrange nella forma (5.36). Ciò significa che stiamo implicitamento assumendo che il
sistema sia soggetto soltanto a vincoli olonomi e lisci e che le forze attive siano tutte
conservative.
1 Le
q̇i , i = 1, ..., l, sono espresse tramite la (9.3).
IL SISTEMA CANONICO
363
Calcoliamo adesso da derivata di H rispetto alla variabile pi
� l
�
�
∂H
∂
=
pk q̇k − L
∂pi
∂pi
k=1
= q̇i +
l
�
l
pk
k=1
Otteniamo quindi
ph
dqi
.
dt
=
∂H
q̇ =
i
∂pi
assieme con la relazione
∂ q̇k � ∂L ∂ q̇h
−
∂pi
∂ q̇h ∂pi
h=1 ����
, i = 1, ..., l
∂H
ṗi = −
∂qi
(9.5)
l
∂H
∂H
∂H
dH � ∂H
=
=
.
ṗk +
q̇k +
dt
∂pk
∂qk
∂t
∂t
k=1 ����
����
q̇k
−ṗk
La funzione H è dunque una costante del moto se la Lagrangiana, e la Hamiltoniana di
conseguenza, non dipendono esplicitamente dal tempo.
Il dominio delle variabili (q1 , ..., ql , p1 , ..., pl ) è detto spazio delle fasi , mentre il
sistema di equazioni differenziali (9.5) è detto sistema canonico.
9.1 Il Teorema di Liouville
La struttura del sistema di Hamilton, oltre alla sua “gradevolezza estetica” dovuta alla
simmetria assunta dal sistema rispetto alla “coppia di variabili” p e q, è ricca di conseguenze, che richiedono però, per essere messe in evidenza, una trattazione molto
tecnica che supera gli scopi di questo corso. Una conseguenza è però semplice da ottenere come corollario di un teorema generale sui sistemi di equazioni differenziali, che
ci limitiamo a enunciare senza dimostrazione.
Sia dato un sistema di equazioni differenziali in Rn
ẋ1 = F1 (x1 , ...., xn ) ,
ẋ2 = F2 (x1 , ...., xn ) ,
(9.6)
ẋ = F (x) , ⇔
..
.
ẋn = Fn (x1 , ...., xn ) .
Sia Ω0 ⊂ Rn , aperto. Indichiamo con Φt (ξ) l’applicazione
ξ
Φt (ξ)
−→
x = Φt (ξ) ,
364
LEZIONI DI SISTEMI DINAMICI
che opera così: ad ogni ξ ∈ Ω0 , associa x = Φt (ξ), soluzione del problem di Cauchy
ẋ = F (x) ,
x (0) = ξ .
In particolare, Φ0 (ξ) = ξ, mentre, se indichiamo con Ωt l’immagine al tempo t
dell’aperto Ω0 , abbiamo Ωt = Φt (Ωo ) (si veda la figura 9.1).
Φt ( ξ)
x(ξ,t)
Ωt
ξ
Ω0
Figura 9.1: Rappresentazione schematica dell’applicazione Φt (ξ).
Se F (x) è tale che possiamo applicare le ipotesi del teorema 2.3.1, allora l’applicazione Φt è definita (almeno in un intervallo di tempo finito) ed invertibile (ad ogni dato
iniziale ξ corrisponde uno ed un solo x). Inoltre, si può provare (ma non lo faremo) che
Φt è continua (cioè Φt porta punti “vicini” in “punti vicini”), sì che Ωt è un dominio
aperto se lo è Ω0 . Vale poi questo importante:
Teorema 9.1.1 Le seguenti affermazioni sono equivalenti:
1. divF (x) =
�n
i=1
∂Fi
= 0, cioè il campo vettoriale F ha divergenza nulla;
∂xi
2. l’applicazione ξ → Φt (x) preserva il volume per ogni t, ovvero il volume dell’insieme Ωt è uguale al volume di Ω0 , per ogni dominio Ω0 ⊂ Rn e per ogni
tempo t.
IL SISTEMA CANONICO
365
Dim. Per semplicità proviamo il teorema in R2 . Indichiamo con |Ω0 | la misura, cioè
la superficie, del dominio Ω0 , e con |Ωt | la misura di Ωt . Abbiamo
�
�
|Ω0 | = dξ1 dξ2 ,
|Ωt | = dx1 dx2 .
Ω0
Ωt
�
d
dx1 dx2 . Ovviamente tale
dt Ωt
calcolo non è assolutamente agevole dal momento che il dominio di integrazione varia
nel tempo. Tuttavia, ricordando l’applicazione Φt fra Ω0 e Ωt , possiamo effettuare il
cambio di variabile
x1 = x1 (ξ1 , ξ2 , t) ,
Calcoliamo la derivata rispetto al tempo di |Ωt |, cioè
e scrivere
x2 = x2 (ξ1 , ξ2 , t) ,
|Ωt | =
�
det J dξ1 dξ2 ,
Ω0
dove J è la matrice jacobiana
∂x1
∂ξ2
∂x1 ∂x2
∂x1 ∂x2
−
.
, ⇒ det J =
∂ξ1 ∂ξ2
∂ξ2 ∂ξ1
∂x2
∂ξ2
∂x
1
∂ξ1
J =
∂x
2
∂ξ1
(9.7)
Tornando adesso alla derivata rispetto al tempo di |Ωt |, possiamo scrivere
d |Ωt |
=
dt
�
d
(det J) dξ1 dξ2 ,
dt
(9.8)
Ω0
e quindi dobbiamo calcolare la derivata temporale del det J. Questo la facciamo
sfruttando la formula esplicita (9.7)
�
�
�
�
d
d ∂x1 ∂x2
d ∂x1 ∂x2
(det J) =
−
dt
dt ∂ξ1 ∂ξ2
dt ∂ξ2 ∂ξ1
�
�
�
�
∂x1 d ∂x2
∂x1 d ∂x2
−
.
(9.9)
+
∂ξ1 dt ∂ξ2
∂ξ2 dt ∂ξ1
�
�
d ∂xi
Considerando le derivate
, i = 1, 2, k = 1, 2, abbiamo
dt ∂ξk
�
�
∂Fi (x1 (ξ1 , ξ2 , t) , x2 (ξ1 , ξ2 , t))
d ∂xi
∂ ẋi
=
=
dt ∂ξk
∂ξk (9.6)
∂ξk
=
∂Fi ∂x1
∂Fi ∂x2
+
.
∂x1 ∂ξk
∂x2 ∂ξk
366
LEZIONI DI SISTEMI DINAMICI
Sostituendo nella (9.9) otteniamo
∂F1
d
∂F2
(det J) =
(det J) +
(det J) = (det J) divF .
dt
∂x1
∂x2
d |Ωt |
= 0: il volume viene preservato. Viceversa
dt
d |Ωt |
se, per ogni dominio e per ogni tempo,
= 0, cioè se il volume rimane costante,
dt
allora nella (9.8) deve annularsi l’integrando e di conseguenza divF = 0.
Quindi, se divF = 0, abbiamo
E’ immediato verificare che il secondo membro del sistema di Hamilton ha divergenza
nulla, quindi
Teorema 9.1.2 (Teorema di Liouville) Il moto preserva il volume nello spazio delle
fasi.
Questo teorema ha una straordinaria importanza in molti campi, in special modo nella
meccanica statistica. Esso ha però anche una consequenza immediata sulla struttura
delle posizioni di equilibrio di un sistema meccanico conservativo.
Corollario 9.1.1 Un sistema meccanico conservativo non ammette posizioni di equilibrio asintoticamente stabili.
Dim. Se (q e , pe ) = (q1e , ..., qle , pe1 , ..., pel ) fosse un punto di equilibrio asintoticamente stabile, dopo un tempo finito T tutti i punti contenuti in una “sfera” di centro
(q e , pe ) e raggio R qualsiasi, si troverebbero all’interno di una sfera di raggio R/2,
contraddicendo la conservazione del volume.
9.2 Le parentesi di Poisson
Sia f (q, p) una funzione definita sulla spazio delle fasi, e sia H(q, p) la funzione di
Hamilton (che per semplicità assumiamo indipendente dal tempo).
Possiamo calcolare la derivata della funzione f lungo le soluzioni del sistema
hamiltoniano (9.5). Abbiamo
l
l
l
l
k=1
k=1
k=1
k=1
∂f
∂f
∂f ∂H ∂f ∂H
df
q̇k +
ṗk =
−
.
=
dt
∂qk
∂pk
∂qk ∂pk
∂pk ∂qk
Questa ultima formula suggerisce di introdurre per ogni coppia di funzioni definite
sullo spazio delle fasi un prodotto tramite
{f, g} =
l
l
∂f ∂g
∂f ∂g
−
.
∂qk ∂pk
∂pk ∂qk
k=1
k=1
(9.10)
IL SISTEMA CANONICO
367
Il “prodotto” così definito {f, g} prende il nome di parentesi di Poisson tra le funzioni
f e g.
La derivata totale di una funzione f lungo le soluzioni del sistema con Halmiltoniana H può essere espressa come
df
= {f, H} .
dt
Quindi possiamo affermare che
df
= 0, se
Corollario 9.2.1 Una funzione f (q, p) è un integrale primo del moto, cioè
dt
e solo se la sua parentesi di Poisson con la funzione Hamiltoniana è nulla.
E’ immediato verificare alcune proprietà delle parentesi di Poisson:
• antisimmetria: {f, g} = −{g, f }
• linearietà: {αf1 + βf2 , g} = α{f1 , g} + β{f2 , g} per ogni tripla di funzioni
f1 , f2 e g e ogni coppia di numeri reali α e β. Analoga formula vale per le
combinazioni lineari fatte sul secondo elemento della parentesi.
Un po’ meno ovvia ma sempre di verifica elementare (grazie al teorema di Schwarz) è
la cosidetta identità di Jacobi
{f, {g, h}} + {g, {h, f }} + {h, {f, g}} = 0 .
(9.11)
Nota 9.2.1 Le stesse tre proprietà algebriche elencate per la parentesi di Poisson sono
soddisfatte dal prodotto vettoriale di vettori di R3 introdotto nella sezione 1.5.1. In
particolare, l’identità di Jacobi (1.17) segue dalla bilinerità e dal fatto che i∧(j ∧k) =
0.
Possiamo poi utilizzare le Parentesi di Poisson per riscrivere il sistema canonico (9.5)
nella forma
q̇i = {qi , H},
i = 1, ..., l .
(9.12)
ṗi = {pi , H},
Dal corollario 9.2.1 e dalle proprietà della parentesi di Poisson seguono alcune
semplici conseguenze:
• ogni combinazione lineare di integrali primi è ancora un integrale primo;
• la parentesi di Poisson di due integrali primi è ancora un integrale primo (basta
applicare l’identità di Jacobi).
Quest’ultima proprietà potrebbe sembrare una strada per “generare” nuovi integrali
primi: in realtà i nuovi integrali primi che si ottengono in questo modo sono quasi
sempre integrali che “dipendono funzionalmente” dagli integrali già noti.
L’antisimmetria permette di ottenere immediatamente una versione parziale in ambito hamiltoniano del Teorema di Noether. Infatti possiamo usare una qualsiasi funzione f per scrivere un “sistema di equazioni di Hamilton” di cui f sia la Hamiltoniana.
368
LEZIONI DI SISTEMI DINAMICI
Lungo le soluzioni di questo sistema la derivata totale di una funzione g sarà data da
{g, f }. Ma se f è un integrale primo del sistema di Hamiltoniana H sia ha {f, H} =
−{H, f } = 0. Quindi la funzione di Hamilton H risulta costante lungo le traiettorie
del flusso generato dal sistema di Hamiltoniana f , che quindi è un gruppo (locale) di
simmetrie della Hamiltoniana H.
9.3 Derivazione variazionale delle equazioni di Hamilton
Come le equazioni di Lagrange, anche le equazioni di Hamilton possono essere derivate
da un principio variazionale che non differisce di molto da quello che ci ha condotto
alle equazioni di lagrange.
Infatti il punto di partenza resta l’integrale di azione, ovvero l’integrale della Lagrangiana tra due tempi fissati. In questo caso però la Lagrangiana sarà espressa tramite
la funzione di Hamilton e le variabili (q, p), e l’azione prenderà la forma
t2
l
pk q̇k − H(q, p) dt .
(9.13)
t1
k=1
Si noti che ora la funzione integranda contiene le derivate prime delle q ma non le
derivate delle p. Di conseguenza non si chiederà alle variazioni di soddifare delle
condizione agli estremi per le p ma solo per le q. Quindi il principio variazionale richiederà l’annullarsi della variazione dell’azione espressa dalla (9.13) con le condizioni
q(t1 ) = q 1 e q(t2 ) = q 2 , cioè
t2
l
pk q̇k − H(q, p) dt
0 = δ
t1
=
t2
t1
k=1
l
k=1
∂H
∂H
pk δ q̇k + δpk q̇k −
δqk −
δpk
∂qk
∂pk
dt
Ora “scarichiamo” le derivate nei termini δ q̇k integrando per parti e, utilizzando il fatto
che la variazione della q è nulla agli estremi, otteniamo
t2
t1
l
∂H
∂H
−p˙k δqk + δpk q̇k −
δqk −
δpk dt ,
∂qk
∂pk
(9.14)
k=1
da cui, per l’arbitrarietà delle δqk e δpk , seguono le equazioni di Hamilton (9.5).
manuali
Biomedica
Branchi R., Le impronte nel paziente totalmente edentulo
Branchi R., Riabilitazione protesica del paziente oncologico testa-collo
Martinelli E., Rieducazione del piede. Problematiche biomeccaniche e posturali statiche
e dinamiche
Martinelli E., Sviluppo del dolore rachideo
in gravidanza. Mutamenti della biomeccanica rachidea, problematiche posturali,
prevenzione e attività fisica adattata pre e
post parto
Martinelli E., Rieducazione posturale. Fondamenti per la progettazione della postura
Martinelli E., Prevenzione del mal di schiena
di origine meccanica con attività motoria
e comportamentale. Approfondimenti di
patomeccanica e biomeccanica rachidea
Rossetti R., Manuale di batteriologia clinica.
Dalla teoria alla pratica in laboratorio
Rucci L., Testo Atlante di embriologia clinica
della Laringe. La chirurgia conservativa
compartimentale della regione glottica
Rucci L., Clinical Embryology of Human Larynx for Conservative Compartmental
Surgery. A Text and Atlas
Magliulo A., Elementi di economia del turismo
Visentini L., Bertoldi, M., Conoscere le organizzazioni. Una guida alle prospettive
analitiche e alle pratiche gestionali
Scienze Tecnologiche
Borri C., Pastò S., Lezioni di ingegneria del
vento
Borri C., Betti M., Marino E., Lectures on Solid
Mechanics
Cidronali A., Paolo Colantonio P. e Lucci L.,
Antenne Integrate Attive: Quaderni del
Dottorato di Ricerca in Ingegneria dell’Informazione dell’Università di Firenze
Gulli R., Struttura e costruzione / Structure
and Construction
Policicchio F., Lineamenti di infrastrutture
ferroviarie
Umanistica
Bertini F., Risorse, conflitti, continenti e nazioni. Dalla rivoluzione industriale alle
guerre irachene, dal Risorgimento alla
conferma della Costituzione repubblicana
Bombardieri L., Graziadio G., Jasink A.M.,
Preistoria e Protostoria egea e cipriota
Bombi A.S., Pinto G., Cannoni E., Pictorial
Assessment of Interpersonal Relationships
(PAIR). An analytic system for understanScienze
ding children’s drawings
Bart J.C.J., Polymer Additive Analytics. InduBaldini S., Marini D., Vorrei. Corso di lingua
strial Practice and Case Studies
italiana di livello elementare 1. Libro di teCaramelli D., Antropologia molecolare. Masto e libro degli esercizi
nuale di base
Lo Nostro P., Peruzzi N., Spontaneamente. Borello E., Mannori S., Teoria e tecnica delle
comunicazioni di massa
Esercizi Risolti di Chimica Fisica
Ricci R., Lezioni di Sistemi Dinamici, a cura di Brandi L., Salvadori B., Dal suono alla parola.
Percezione e produzione del linguaggio tra
Lorenzo Barletti, Angiolo Farina, Lorenzo
neurolinguistica e psicolinguistica
Fusi, Federico Talamucci
Scialpi A., Mengoni A. (a cura di), La PCR e le Coniglione F., Lenoci M., Mari G., Polizzi G.
(a cura di), Manuale di base di Storia della
sue varianti. Quaderno di laboratorio
filosofia
Simonetta M.A., Short history of Biology from
Marcialis
N., Introduzione alla lingua
the Origins to the 20th Century
paleoslava
Spinicci R., Elementi di chimica (nuova
Michelazzo F., Nuovi itinerari alla scoperta
edizione)
del greco antico. Le strutture fondamentali della lingua greca: fonetica, morfologia,
Scienze Sociali
sintassi, semantica, pragmatica
Ciampi F., Fondamenti di economia e gestione
Peruzzi A., Il significato inesistente. Lezioni
delle imprese
sulla semantica
Giovannini P. (a cura di), Teorie sociologiche
Peruzzi A., Modelli della spiegazione
alla prova
scientifica
Maggino F., L’analisi dei dati nell’indagine statistica. Volume 1. La realizzazione dell’indagi- Sandrini M.G., Filosofia dei metodi induttivi e
logica della ricerca
ne e l’analisi preliminare dei dati
Maggino F., L’analisi dei dati nell’indagine Trisciuzzi L., Zappaterra T., Bichi L., Tenersi
per mano. Disabilità e formazione del sé
statistica. Volume 2. L’esplorazione dei
nell’autobiografia
dati e la validazione dei risultati
Quest’opera si basa sugli Appunti per il corso di sistemi dinamici
scritti dal professor Riccardo Ricci nel 2005 e successivamente
rielaborati fino all’anno della sua scomparsa, avvenuta nel 2013.
Partendo dall’ultima versione, i curatori hanno intrapreso un’opera
di rivisitazione e ampliamento che ha portato al presente manuale. Il
testo si rivolge agli studenti triennali dei corsi di Matematica, Fisica
e Ingegneria e intende presentare gli argomenti fondamentali della
meccanica Lagrangiana, della dinamica dei corpi rigidi e dei principi
variazionali, con qualche cenno alla meccanica Hamiltoniana.
Luigi Barletti è professore associato di Fisica Matematica presso l’Università di
Firenze, dove svolge attività di ricerca nell’ambito delle teorie cinetiche classiche e
quantistiche con applicazioni ai dispositivi ottici ed elettronici.
Angiolo Farina è ricercatore in Fisica Matematica presso l’Università di
Firenze. Ha al suo attivo numerose pubblicazioni nei settori dei problemi a
frontiera libera e della fluidodinamica.
Lorenzo Fusi è ricercatore di Fisica Matematica presso l’Università di
Firenze, dove svolge attività di ricerca nell’ambito fluidodinamica nonNewtoniana.
Federico Talamucci è ricercatore presso l’Università di Firenze. Dal 2000
svolge attività didattica per lezioni ed esercitazioni dei corsi di Meccanica
nella Scuola di Scienze Matematiche, Fisiche e Naturali.