Lezioni di Sistemi Dinamici

This work is based on the “Notes for the course of dynamic systems” written by Professor Riccardo Ricci in 2005 and subsequently reworked until the year of his death, which occurred in 2013. Starting from the latest version, the scholars have undertaken a review and expansion that led to this manual. The text is aimed at bachelor students of the courses in Mathematics, Physics and Engineering. Moreover, it presents the fundamental topics of Lagrangian mechanics and the dynamics of rigid bodies and variational principles, with a hint at Hamiltonian mechanics.

r icc a r d o r i cci LEZIONI DI SISTEMI DINAMICI a cura di l uigi b a r Le t t i a ngioL o f a r in a l oren z o f u s i f ederic o t a L am u c c i FIRENZE UNIVERSITY PRESS manuali scienze –8– Riccardo Ricci Lezioni di Sistemi Dinamici a cura di Luigi Barletti Angiolo Farina Lorenzo Fusi Federico Talamucci Firenze University Press 2016 Lezioni di Sistemi Dinamici / Riccardo Ricci ; a cura di Luigi Barletti, Angiolo Farina, Lorenzo Fusi, Federico Talamucci. – Firenze : Firenze University Press, 2016. (Manuali . Scienze ; 8) http://digital.casalini.it/9788864534015 ISBN 978-88-6453-400-8 (print) ISBN 978-88-6453-401-5 (online) Immagine di copertina: La figura di copertina, gentilmente concessa dalla famiglia Ricci, rappresenta due trottole in movimento sopra gli appunti del professor Ricci. Il moto delle trottole ha un’elegante descrizione matematica che viene trattata nel capitolo 7 di questo libro. Certificazione scientifica delle Opere Tutti i volumi pubblicati sono soggetti ad un processo di referaggio esterno di cui sono responsabili il Consiglio editoriale della FUP e i Consigli scientifici delle singole collane. Le opere pubblicate nel catalogo della FUP sono valutate e approvate dal Consiglio editoriale della casa editrice. Per una descrizione più analitica del processo di referaggio si rimanda ai documenti ufficiali pubblicati sul catalogo on-line della casa editrice (www.fupress.com). Consiglio editoriale Firenze University Press G. Nigro (Coordinatore), M.T. Bartoli, M. Boddi, R. Casalbuoni, C. Ciappei, R. Del Punta, A. Dolfi, V. Fargion, S. Ferrone, M. Garzaniti, P. Guarnieri, A. Mariani, M. Marini, A. Novelli, M.C. Torricelli, M. Verga, A. Zorzi. © 2016 Firenze University Press Università degli Studi di Firenze Firenze University Press via Cittadella, 7, 50144 Firenze, Italy www.fupress.com Printed in Italy RICCARDO RICCI (1953-2013) è stato professore ordinario di Fisica Matematica nell'Università di Firenze. La sua attività di ricerca si è svolta prevalentemente nell'ambito dei problemi a frontiera libera e delle equazioni alle derivate parziali. È stato titolare per numerosi anni della cattedra di Meccanica Razionale e di Sistemi Dinamici. Per tutta la sua carriera accademica si è dedicato attivamente alla divulgazione e alla didattica della matematica, anche attraverso dispense e conferenze, sempre molto apprezzate dagli studenti. Indice Introduzione 1 2 1 Spazio affine e vettori applicati 1.1 Spazi vettoriali su R . . . . . . . . . . . . . . . . . . . 1.2 Spazi vettoriali euclidei . . . . . . . . . . . . . . . . . 1.3 Trasformazioni di basi ortonormali . . . . . . . . . . . 1.4 Spazio affine e coordinate curvilinee . . . . . . . . . . 1.5 Prodotto vettoriale e sistemi di vettori applicati . . . . 1.5.1 Il prodotto vettoriale . . . . . . . . . . . . . . 1.5.2 Vettori applicati e momento rispetto ad un polo 1.5.3 Sistemi equivalenti di vettori applicati . . . . . 1.5.4 Sistemi di vettori paralleli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Equazioni differenziali 2.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Considerazioni generali . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Il problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Equazioni autonome . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Equazioni reversibili . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Equazioni integrabili . . . . . . . . . . . . . . . . . . . . . . 2.4 Equazioni del primo ordine in forma normale . . . . . . . . . . . . . 2.5 Equazioni del secondo ordine in forma normale del tipo q̈ = f (q̇) . . 2.6 Equazioni del secondo ordine del tipo q̈ = f (q): caso conservativo . . 2.6.1 Analisi qualitativa nel caso conservativo . . . . . . . . . . . . 2.6.2 Periodo delle oscillazioni in vicinanza di punti di equilibrio stabile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6.3 Generalizzazione del caso conservativo . . . . . . . . . . . . 2.7 Il piano delle fasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8 Punti di equilibrio, stabilità . . . . . . . . . . . . . . . . . . . . . . . 2.8.1 Il criterio di Lyapunov . . . . . . . . . . . . . . . . . . . . . 2.8.2 Asintotica stabilità . . . . . . . . . . . . . . . . . . . . . . . 2.8.3 Punti di equilibrio per sistemi conservativi: il criterio di Dirichlet 2.9 I potenziali isocroni . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.10 Sistemi lineari bidimensionali . . . . . . . . . . . . . . . . . . . . . 2.11 Moto armonico smorzato . . . . . . . . . . . . . . . . . . . . . . . . 2.12 Moto armonico smorzato con forzante esterna . . . . . . . . . . . . . v 3 3 7 14 16 21 21 24 27 29 31 31 32 34 35 36 37 37 39 41 43 54 55 56 58 59 60 62 63 67 78 80 2 VIII LEZIONI DI SISTEMI DINAMICI capitolo 2.13 6Sistemi degli Appunti. lineari n−dimensionali Nello specifico è. stata . . . aggiunta . . . . . tutta . . .la. sezione . . . . dedicata . . . . alla 83 Geometria delle masse (argomento che veniva trattato in dettaglio nelle esercitazioni 3 Equazioni Lagrange 87 del corso). Neldicapitolo dedicato ai Principi Variazionali è stata aggiunta la sezione Cinematica delIlpunto . . .di. minima . . . . azione . . . . è. stato . . . riscritto. . . . . . .Il .capitolo . . . 987è 8.3 3.1 mentre il paragrafo principio 3.2 essenzialmente Forze conservative . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 rimasto invariato. 3.2.1desiderano Campi scalari e gradiente . . .Annick . . . . Magnier . . . . .per . . aver . . .messo . . . a dis92 I curatori ringraziare la Prof.ssa Campi e campi . . . . . . . . . .senza . . . il. quale 94 posizione3.2.2 il materiale delvettoriali Prof. Ricci e pergardiente il costante. incoraggiamento 3.2.3si sarebbe Forza posizionale e forza . . di . .quest’opera. . . . . . . . Un . . parti97 difficilmente potuti giungere al conservativa completamento 3.3 ringraziamento Equazioni di Lagrange un punto Anichini, materiale Direttore . . . . . del . . .Dipartimento . . . . . 102 colare va al Prof.perGiuseppe di 3.3.1 Conservazione dell’energia, di ed Routh103 Matematica ed Informatica “U. Dini”, che ha variabili accolto ilcicliche progettoe funzione con favore al Prof. 3.4 IlGentili moto centrale . . . . suggerimenti. . . . . . . . . Si. .desidera . . . . .infine . . . ringraziare . . . . . . Il. Dott. 108 Graziano per i numerosi 3.4.1 Direttore L’equazione per r . della . . . Florence . . . . . University . . . . . . .Press, . . . per . . il. .prezioso . 112 Fulvio Guatelli, editoriale 3.4.2la fase Il problema aiuto durante editoriale.di Keplero . . . . . . . . . . . . . . . . . . . . . 113 3.4.3 L’orbita del problema di Keplero . . . . . . . . . . . . . . . . 118 3.4.4 La terza legge . . . . . . . . . . . . . . . . . . . . . . . . . . 121 4 Sistemi vincolati e coordinate lagrangiane 123 4.1 Sistemi olonomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 4.1.1 Spostamenti virtuali in funzione delle coordinate lagrangiane . 133 4.1.2 Velocità ed energia cinetica . . . . . . . . . . . . . . . . . . 141 4.1.3 Punto vincolato sulla superficie . . . . . . . . . . . . . . . . 145 5 Le equazioni di moto per sistemi vincolati 5.1 Dinamica di un punto vincolato sulla superficie. . . . . . . . . . . . . 5.2 L’equazione simbolica della dinamica . . . . . . . . . . . . . . . . . 5.3 Le equazioni di Lagrange . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Equazioni di Lagrange e statica del punto materiale sulla superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.2 Equazioni di Lagrange di prima specie . . . . . . . . . . . . . 5.4 Risolubilità delle equazioni di Lagrange . . . . . . . . . . . . . . . . 5.5 Invarianza delle equazioni di Lagrange . . . . . . . . . . . . . . . . . 5.6 Coordinate cicliche . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.7 La funzione Hamiltoniana e la conservazione dell’energia . . . . . . . 5.8 Il teorema di Noether . . . . . . . . . . . . . . . . . . . . . . . . . . 5.9 Equilibrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.9.1 Stabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.10 Piccole Oscillazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.10.1 Sistemi con un solo grado di libertà . . . . . . . . . . . . . . 5.10.2 Sistemi con l gradi di libertà . . . . . . . . . . . . . . . . . . 5.10.3 Esempio: la catena di oscillatori . . . . . . . . . . . . . . . . 6 Cinematica dei Sistemi Rigidi 6.1 Introduzione . . . . . . . . . . . . . . . . 6.2 Moti rigidi . . . . . . . . . . . . . . . . . 6.2.1 Primo caso: Ω ≡ O . . . . . . . . 6.2.2 Secondo caso: Ω �= O . . . . . . 6.2.3 Gradi di libertà di un corpo rigido 6.3 Formula fondamentale del moto rigido . . vi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 152 155 160 162 172 174 175 178 182 190 195 198 199 200 201 211 215 . 215 . 215 . 217 . 224 . 224 . 227 SOMMARIO 6.4 6.5 6.6 6.7 6.8 6.9 7 8 IX Angoli di Eulero . . . . . . . . . . . . . . . . . Asse istantaneo di moto, rigate del moto . . . . . Cinematica relativa: composizione delle velocità Formula di Poisson . . . . . . . . . . . . . . . . Composizione di moti rigidi . . . . . . . . . . . Cinematica relativa: l’accelerazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238 . 242 . 247 . 249 . 251 . 253 Dinamica Sistemi Rigidi 7.1 Il centro di massa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Il momento angolare . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3 Geometria delle masse . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.1 Momenti d’inerzia . . . . . . . . . . . . . . . . . . . . . . . 7.3.2 Omografia d’inerzia, matrice d’inerzia e terna principale d’inerzia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.3 Ellissoide d’inerzia . . . . . . . . . . . . . . . . . . . . . . . 7.3.4 Determinazione della terna principale d’inerzia nel caso di sistemi piani . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3.5 Esempi e complementi . . . . . . . . . . . . . . . . . . . . . 7.4 Le equazioni cardinali . . . . . . . . . . . . . . . . . . . . . . . . . . 7.5 Le equazioni cardinali sono sufficienti per determinare il moto dei rigidi 7.6 Momento angolare, energia cinetica e seconda equazione cardinale per i sistemi rigidi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6.1 Momento angolare per un sistema rigido . . . . . . . . . . . . 7.6.2 Seconda equazione cardinale per i sistemi rigidi . . . . . . . . 7.6.3 Reazioni vincolari applicate all’asse di rotazione . . . . . . . 7.6.4 L’energia cinetica . . . . . . . . . . . . . . . . . . . . . . . . 7.7 Le precessioni per inerzia . . . . . . . . . . . . . . . . . . . . . . . . 7.7.1 Le equazioni di Eulero . . . . . . . . . . . . . . . . . . . . . 7.7.2 Risoluzione dell’equazione di Eulero nel caso di precessioni per inerzia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.7.3 Il moto à la Poinsot . . . . . . . . . . . . . . . . . . . . . . . 7.8 Lagrangiana del corpo rigido . . . . . . . . . . . . . . . . . . . . . . 7.9 Il giroscopio pesante . . . . . . . . . . . . . . . . . . . . . . . . . . Principi variazionali 8.1 La brachistocrona . . . . . . . . . . . . . . . . . . . . . . . . . . 8.1.1 La trattazione moderna . . . . . . . . . . . . . . . . . . . 8.2 L’equazione di Eulero-Lagrange . . . . . . . . . . . . . . . . . . 8.2.1 Un integrale primo e ritorno alla brachistocrona . . . . . . 8.3 Funzionali dipendenti da l funzioni . . . . . . . . . . . . . . . . . 8.3.1 Massimizzazione vincolata . . . . . . . . . . . . . . . . . 8.4 Il principio di Hamilton . . . . . . . . . . . . . . . . . . . . . . . 8.4.1 Sistemi vincolati ed equazioni di Lagrange di prima specie 8.5 Il principio di Jacobi . . . . . . . . . . . . . . . . . . . . . . . . 8.5.1 Coordinate cicliche nell’ambito del principio di Hamilton 8.5.2 Il tempo come variabile . . . . . . . . . . . . . . . . . . 8.5.3 Formulazione del principio di Jacobi . . . . . . . . . . . . vii . . . . . . . . . . . . 255 256 259 259 260 263 269 270 274 283 286 289 290 291 297 301 306 307 308 313 314 318 325 . 326 . 328 . 329 . 334 . 339 . 341 . 346 . 349 . 351 . 351 . 354 . 356 2 X LEZIONI DI SISTEMI DINAMICI 9 Il Sistema capitolo 6 degliCanonico Appunti. Nello specifico è stata aggiunta tutta la sezione dedicata 361 alla Geometria 9.1 Il delle Teorema masse di Liouville (argomento. .che . .veniva . . . .trattato . . . .in. dettaglio . . . . . nelle . . . esercitazioni . . . . 363 del 9.2 corso). LeNel parentesi capitolo di Poisson dedicato .ai. Principi . . . . . Variazionali . . . . . . .è .stata . . .aggiunta . . . . .la. sezione . 366 8.3 9.3 mentre Derivazione il paragrafo variazionale Il principiodelle di minima equazioni azione di Hamilton è stato riscritto. . . . . .Il .capitolo . . . 368 9è rimasto essenzialmente invariato. I curatori desiderano ringraziare la Prof.ssa Annick Magnier per aver messo a disposizione il materiale del Prof. Ricci e per il costante incoraggiamento senza il quale difficilmente si sarebbe potuti giungere al completamento di quest’opera. Un particolare ringraziamento va al Prof. Giuseppe Anichini, Direttore del Dipartimento di Matematica ed Informatica “U. Dini”, che ha accolto il progetto con favore ed al Prof. Graziano Gentili per i numerosi suggerimenti. Si desidera infine ringraziare Il Dott. Fulvio Guatelli, Direttore editoriale della Florence University Press, per il prezioso aiuto durante la fase editoriale. viii Prefazione Non c’è miglior modo di onorare la memoria di un Collega prematuramente scomparso che quello di dare continuità al suo impegno didattico pubblicando i testi delle sue lezioni. E bene ha fatto la moglie di Riccardo, Annick, ad affidare il compito di curarne la pubblicazione ad alcuni dei più giovani componenti del gruppo dei cultori delle materie che nel tempo di maggior fulgore si chiamavano fisico-matematiche. Ed è stato per noi – che di quel gruppo abbiamo fatto parte per tanti anni- un onore quello di ricevere la richiesta di scrivere poche righe di presentazione di questo volume. Un volume che rispecchia pienamente le capacità didattiche di Riccardo, caratterizzate da una intuizione sicura, chiarezza di vedute e grande comunicativa. Il testo tiene fede alle sue convinzioni in ordine alla formazione degli studenti di matematica. Pur essendo un testo destinato agli studenti della laurea triennale e che quindi non riveste le caratteristiche di un trattato specialistico di livello avanzato, la sua impostazione denota una padronanza degli argomenti di meccanica e degli strumenti - di tipo geometrico ed analitico - che hanno contraddistinto anche tutta la produzione scientifica di Riccardo, i suoi articoli di ricerca e, in generale, il suo modo di intendere la matematica applicata. Infatti gli argomenti di meccanica costituiscono per gli studenti di matematica (ma non solo per essi) la prima occasione di confrontarsi con il “modello matematico”: un insieme di oggetti matematici, di leggi e di relazioni che entro certi limiti è in grado di fornire, proprio attraverso le proprietà matematiche, informazioni sul comportamento di oggetti che matematici non sono. Per la meccanica si tratterà di corpi, che di volta in volta saranno descritti e identificati mentalmente con punti, con sistemi indeformabili di punti, con sistemi continui e così via; ma per altri tipi di modelli si tratterà di cellule, di popolazioni, di prodotti finanziari ecc. Costruire – e poi studiare - un modello matematico non è cosa agevole; è necessaria una profonda conoscenza degli oggetti che si vogliono modellizzare ed anche la sensibilità di capire quali sono (tutte e sole) le grandezze e i parametri che, in un determinato contesto, devono essere introdotti nel modello per ottenere una adeguata descrizione del fenomeno che si intende studiare. In altre parole, come diceva Einstein “a model should be as simple as possible . . . . but not simpler!” E’ come dire che la grande sfida di fronte alla costruzione di un modello matematico per un problema complesso è la ricerca di un compromesso ottimale che colga le componenti principali e sacrifichi quelle meno significative. Ciò richiede la capacità di costruire una visione prospettica del fenomeno, cosa che Riccardo possedeva al massimo grado. Un altro pregio di questo libro è quello di rendere chiari anche argomenti di per sé molto complessi, talvolta anche ricorrendo ad esempi di esperienza quotidiana; d’altra parte rientrava nello stile di Riccardo la ricerca di continui agganci con applicazioni anche semplici, con i casi-limite più illuminanti, con le considerazioni su possibili analogie tra situazioni apparentemente diverse. Però sarebbe molto riduttivo confinare queste considerazioni ad aspetti puramente tecnici e non menzionare il fatto che Riccardo era una persona dai molteplici interessi e di una cultura vastissima. E soprattutto piace ricordare il suo spirito arguto e pungente, che rendeva la sua compagnia estremamente piacevole. iii 2 XII LEZIONI DI SISTEMI DINAMICI capitolo Abbiamo 6 degli trascorso Appunti. tanti Nello annispecifico nello stesso è stata luogo aggiunta di lavoro, tuttasiamo la sezione stati insieme dedicata a tanalla Geometria ti congressi,delle abbiamo massecondiviso (argomento l’emozione che veniva intellettuale trattato indella dettaglio ricerca nelle e, esercitazioni nei momenti del di svago, corso).le Nel escursioni capitolonella dedicato letteratura ai Principi e nella Variazionali musica di cui è stata era aggiunta appassionatissimo. la sezione 8.3 La perdita mentre di il una paragrafo persona Il principio così lasciadiunminima segno indelebile. azione è stato Siamo riscritto. riconoscenti Il capitolo ai cura9è rimasto tori di questa essenzialmente opera, che,invariato. a noi che l’abbiamo conosciuto così bene, riporta alla mente perfino I curatori la suadesiderano voce. E’ bello ringraziare che attraverso la Prof.ssa questo Annick libroMagnier molti giovani per aver possano messoancora a disposizione fruire dellail eredità materiale intellettuale del Prof. di Ricci unaemente per il tanto costante brillante. incoraggiamento senza il quale difficilmente si sarebbe potuti giungere al completamento di quest’opera. Un particolare ringraziamento Antonio Fasano va al Prof. Giuseppe Anichini, Direttore del Dipartimento di Matematica ed Informatica “U. Dini”, che ha accolto il progetto con favore ed al Prof. Mario Primicerio Graziano Gentili per i numerosi suggerimenti. Si desidera infine ringraziare Il Dott. Fulvio Guatelli, Direttore editoriale della Florence University Press, per il prezioso aiuto durante la fase editoriale. iv Introduzione Quest’opera si basa sugli Appunti per il Corso di Sistemi Dinamici, scritti dal Prof. Riccardo Ricci. Nonostante la prima versione degli Appunti risalga al 2005, questi vennero da lui continuamente aggiornati ed ampliati sino 2012. L’anno successivo, purtroppo, il Prof. Ricci venne a mancare. Gli Appunti erano, e lo sono tuttoggi, il testo di riferimento per gli studenti del corso annuale di Sistemi Dinamici, secondo anno Laurea Triennale in Matematica, dell’Università degli Studi di Firenze. Gli Appunti riflettono non solo i contenuti del corso di Sistemi Dinamici che il Prof. Ricci ha tenuto sin dal 1999, ma anche il modo con cui egli affrontava la disciplina. Il Prof. Ricci, pur partendo dai contenuti della classica Meccanica Razionale, sviluppava un corso che metteva in particolare evidenza gli aspetti analitici, algebrici e geometrici. In tal modo gli studenti venivamo continuamente chiamati ad applicare (spesso anche in modo critico) i metodi matematici che gli stessi avevano acquisito nei corsi di Analisi, Geometria e Algebra. E tale caratteristica è, in sostanza, il motivo per cui gli Appunti siano sempre stati molto apprezzati dagli studenti. Alla scomparsa del Prof. Ricci, avvenuta il 19 agosto 2013, è spontaneamente nata l’idea di pubblicare gli Appunti (disponibili sino al 2016 come semplici dispense del corso di Sistemi Dinamici), aggiungendovi quel materiale che veniva generalmente presentato agli studenti durante le esercitazioni. Il progetto è stato subito accolto dalla vedova del Prof. Ricci, La Prof.ssa Annick Magnier, che ha messo a disposizione tutto il materiale del Prof. Ricci ai curatori di quest’opera, i quali hanno provveduto a riorganizzarlo ed ampliarlo. L’idea era quella di giungere ad un testo che fosse un manuale per il corso di Sistemi Dinamici basato sugli Appunti e che, soprattutto, seguisse lo “spirito” con cui il Prof. Ricci aveva scritto i suoi Appunti. Partendo quindi dall’ultima versione degli Appunti, quella datata 10 aprile 2012, è stata intrapresa un’opera di rivisitazione ed ampliamento del testo originario che ha portato al presente manuale. In particolare, rispetto all’originale versione degli Appunti, è stato aggiunto il capitolo 1 dove vengono richiamati alcuni concetti di algebra lineare e geometria frequentemente utilizzati e viene introdotta la teoria dei momenti (parte che veniva usualmente illustrata nell’ambito delle esercitazioni). Il materiale del capitolo 2, pur essendo stato riorganizzato, è rimasto essenzialmente invariato. Sono stati aggiunti gli esempi e le sezioni 2.6.3 e 2.10. Nel capitolo 3 è stato aggiunto il paragrafo Forze conservative e la sezione 3.3.1 dedicata alle variabili cicliche ed alla funzione di Routh. I capitoli 4 e 5 sono stati ampliati introducendo tutta la parte dedicata al punto materiale vincolato su una superficie e la sezione 5.6. Per quanto riguarda il capitolo 6, i primi quattro paragrafi sono stati riscritti, seguendo però la stessa impostazione degli Appunti. Il capitolo 7 è quello che è stato più modificato rispetto al 2 LEZIONI DI SISTEMI DINAMICI capitolo 6 degli Appunti. Nello specifico è stata aggiunta tutta la sezione dedicata alla Geometria delle masse (argomento che veniva trattato in dettaglio nelle esercitazioni del corso). Nel capitolo dedicato ai Principi Variazionali è stata aggiunta la sezione 8.3 mentre il paragrafo Il principio di minima azione è stato riscritto. Il capitolo 9 è rimasto essenzialmente invariato. I curatori desiderano ringraziare la Prof.ssa Annick Magnier per aver messo a disposizione il materiale del Prof. Ricci e per il costante incoraggiamento senza il quale difficilmente si sarebbe potuti giungere al completamento di quest’opera. Un particolare ringraziamento va al Prof. Giuseppe Anichini, Direttore del Dipartimento di Matematica ed Informatica “U. Dini”, che ha accolto il progetto con favore ed al Prof. Graziano Gentili per i numerosi suggerimenti. Si desidera infine ringraziare Il Dott. Fulvio Guatelli, Direttore editoriale della Florence University Press, per il prezioso aiuto durante la fase editoriale. Capitolo 1 Introduzione allo spazio affine, alle coordinate curvilinee ed ai sistemi di vettori applicati In questo capitolo daremo dei brevi richiami di algebra lineare per passare alla definizione di spazio affine, o meglio di spazio affine euclideo. Si postula infatti che lo spazio che percepiamo, dove appunto si trovano i corpi oggetto della meccanica, sia uno spazio affine tridimensionale. 1.1 Spazi vettoriali su R Sia V un insieme i cui elementi saranno chiamati vettori, o vettori liberi, dotato di due operazioni: • la somma, denotata con +, che associa a due vettori u, v ∈ V , un terzo vettore u+v ∈V; • il prodotto di un vettore per uno scalare (un numero reale), che associa al vettore v ∈ V e allo scalare λ ∈ R un altro vettore denotato λv. V si dice uno spazio vettoriale reale o spazio vettoriale sui reali, se le suddette operazioni verificano le seguenti proprietà: • u + v = v + u, ∀ u, v ∈ V. • (u + v) + w = u + (v + w), ∀ u, v, w ∈ V. • In V esiste un vettore, denotato con 0, detto vettore nullo, tale che v + 0 = v, ∀ v ∈ V. • Dato un qualsiasi vettore v ∈ V , esiste un unico vettore, denotato con −v, e detto opposto di v, tale che v + (−v) = 0. • ∀ v ∈ V , si ha 1v = v, e α (βv) = (αβ) v, ∀ α, β ∈ R. 4 LEZIONI DI SISTEMI DINAMICI • ∀ u, v ∈ V , e ∀ α, β ∈ R, valgono le seguenti eguaglianze (α + β) v = αv + βv, e α(u + v) = αu + αv. Uno spazio vettoriale reale di fondamentale importanza è Rn , cioè l’insieme delle nuple in colonna di numeri reali, dette anche vettori colonna,     x1         x2     n R = x =  .  , tali che xi ∈ R, i = 1, 2, .., n ,    ..        xn dotato dell’operazione di somma e prodotto per scalari così definite        y1 x1 + y1 x1 x1  x2  x2   y2   x2 + y2         x+y =  . + .  =   , λx = λ  .. ..  .  ..   ..    . xn yn xn + yn xn       =   λx1 λx2 .. . λxn    .  Il vettore nullo 0 è la colonna costituita da tutti zero. Talvolta con Rn si intende l’insieme delle n-uple in riga di numeri reali (x1 , x2 , · · · , xn ), dette vettori riga, dove la somma ed il prodotto per gli scalari sono definite componente per componente. Quando sarà importante distinguere i due modi di scrittura, specificheremo fra vettore colonna di Rn , o vettore riga di Rn . Diamo adesso la definizione di sottospazio vettoriale. Un sottoinsieme W ⊂ V spazio vettoriale reale, si dice un sottospazio di V se: • 0 ∈ W. • ∀ u, w ∈ W , allora u + w ∈ W. • Se u ∈ W , allora λu ∈ W , ∀ λ ∈ R. Vediamo adesso la definizione di combinazione lineare. Dati m vettori v 1 , ..., v m di uno spazio vettoriale V e m scalari α1 , ..., αm , si dice combinazione lineare degli m vettori con gli m scalari, il vettore w = α1 v 1 + .... + αm v m . I numeri reali α1 , ..., αm si dicono coefficienti della combinazione lineare. Diremo che gli m vettori v 1 , ..., v m di V sono linearmente indipendenti se la combinazione lineare α1 v 1 + .... + αm v m , dà il vettore nullo soltanto quando tutti i coefficienti della combinazione sono nulli. Se invece accade che la combinazione lineare α1 v 1 + .... + αm v m si annulla anche se non tutti i coefficienti sono nulli allora gli m vettori v 1 , ..., v m si dicono linearmente dipendenti. Si dice che gli n vettori v 1 , ..., v n di V generano lo spazio vettoriale V se ∀ u ∈ V esistono n scalari β1 , ..., βn per cui u = β1 v 1 + .... + βn v n , cioè ogni vettore di V si può esprimere come combinazione lineare di v 1 , ..., v n . I vettori v 1 , ..., v n vengono detti generatori di V . Lo spazio V viene poi detto finitamente generato se ammette un insieme finito di generatori. E’ evidente che se SPAZIO AFFINE E VETTORI APPLICATI 5 {v 1 , ..., v n } sono un insieme di generatori, aggiungendo a tale insieme altri vettori otteniamo sempre un insieme di generatori: infatti non è detto che i generatori siano tra loro linearmente indipendenti. Un esempio di spazio finemente generato è Rn , in cui un insieme di generatori è        1 0 0         0   1   0        (1.1) e1 =  .  , e2 =  .  , ... , en =  .  .    ..   ..   ..       0 0 1 Se {v 1 , ..., v n } sono un insieme di generatori di V e sono linearmente indipendenti allora si dice base di V . Una proprietà fondamentale è data dal seguente Teorema 1.1.1 I vettori {v 1 , ..., v n } sono una base di V se e solo se ogni vettore di V si può esprimere in modo univoco come combinazione lineare di v 1 , ..., v n . Dim. Se l’insieme {v 1 , ..., v n } costituisce una base allora, dalla definizione di base sappiamo che, ∀ u ∈ V , possiamo scrivere u = β1 v 1 + .... + βn v n . Vediamo che tale rappresentazione è unica. Infatti, se non lo fosse avremo anche u = α1 v 1 + .... + αn v n , con, in generale, αi �= βi , per qualche i. Ma allora avremo anche (β1 − α1 ) v 1 + .... + (βn − αn ) v n = 0, che comporta, data la lineare indipendenza dei vettori v 1 , ..., v n , βi = αi , ∀ i = 1, 2, ..., n, che quindi contraddice l’ipotesi αi �= βi , per qualche i. Supponiamo adesso che dato un qualunque vettore u ∈ V , questo si possa scrivere in modo unico come combinazione lineare di v 1 , ..., v n . Dalla definizione di generatori deduciamo che {v 1 , ..., v n } costituisce un insieme di generatori di V . Per mostrare che {v 1 , ..., v n } è un base bisogna provare che v 1 , ..., v n sono linearmente indipendenti, ovvero che α1 v 1 + .... + αn v n = 0 =⇒ α1 = α2 = · · · = αn = 0. Ora, siccome 0 = 0v 1 + .... + 0v n , dall’unicità della rappresentazione ricaviamo immediatamente α1 = α2 = · · · = αn = 0. Una base rappresenta l’insieme minimo per generare V . Infatti, tornando all’insieme finito di generatori di V , è facile rendersi conto che in tale insieme possono stare anche vettori che non sono necessari in quanto combinazione lineari di altri vettori di V . Il seguente teorema (la cui dimostrazione viene omessa) ci garantisce che, se V è finemente generato, ovvero è generato da un numero finito di generatori, allora da essi si riesce ad escludere i vettori “superflui” fino a giungere ad una base. 6 LEZIONI DI SISTEMI DINAMICI Teorema 1.1.2 Dato V spazio vettoriale reale finemente generato, allora V ammette almeno una base. E’ quindi evidente che ogni insieme di generatori contiene almeno una base. Ora, uno spazio vettoriale ammette infinite basi, tuttavia ogni base è caratterizzata dallo stesso numero di vettori. Infatti, supponendo che V sia finemente generato, è possibile dimostrare il seguente risultato Teorema 1.1.3 Ogni base di V possiede lo stesso numero di vettori. Dim. La dimostrazione non è difficile ma abbastanza lunga. La riassumeremo quindi nei suoi punti essenziali. Si comincia col far vedere che se A= {v 1 , ..., v m } è un insieme di vettori linearmente indipendenti e U= {u1 , ..., up } un insieme di generatori1 di V , allora p ≥ m. Tale dimostrazione si fa per assurdo supponendo p < m. Se così fosse allora si identifica un sottoinsieme Ap ⊂A, costituito da p vettori Ap = {v 1 , ..., v p }, e si esprimono in funzione dei vettori di U. Se si introduce quindi la matrice A, n×n, dei coefficienti delle combinazioni lineari, risulta chiaro, sfruttando il teorema di Rouché-Capelli, che det A �= 0, e quindi A è invertibile. Allora possiamo esprimere i vettori di U come combinazione lineare dei vettori di Ap , dove A−1 sarà la matrice dei coefficienti delle combinazioni lineari. Ora, per ipotesi, i vettori di U generano tutto V , e quindi anche v p+1 potrà essere espresso come combinazione lineare di u1 , ..., up , i quali, a loro volta, sono combinazioni lineari v 1 , ..., v p . Quindi v p+1 è combinazione lineare di v 1 , ..., v p , il che è assurdo dato che i vettori di A sono per ipotesi linearmente indipendenti. Di conseguenza deve essere p ≥ m. Adesso supponiamo di avere due basi B1 e B2 , di V , tali che B1 ha m vettori mentre B2 ne ha p, e che m > p, per esempio (il caso m < p è del tutto analogo). Allora, leggiamo B1 come l’insieme di vettori linearmente indipendenti e B2 come l’insieme di generatori. Da quanto visto prima deve essere p ≥ m, e quindi assumere m > p porta ad un assurdo. Si conclude quindi che B1 e B2 hanno necessariamente lo stesso numero di vettori. Diamo quindi la definizione di dimensione di uno spazio V finemente generato: la dimensione di V è il numero di vettori di una qualunque base di V (tale numero è sempre lo stesso). Se la dimensione di V è n, scriveremo brevemente dim V = n. L’insieme (1.1) è una base di Rn , ed è usualmente detta base canonica. Vediamo adesso il concetto di componenti, o coordinate, di un vettore. Sia V uno spazio vettoriale di dimensione n. Sia {v 1 , ..., v n }, una base di V . Dato un qualunque vettore u ∈ V , potremo scrivere u = u1 v 1 + .... + un v n , dove i coefficienti della combinazione lineare sono univocamente determinati. Tali coefficienti sono detti componenti, o coordinate, di u rispetto alla base {v 1 , ..., v n }. 1 Ricordiamo che stiamo lavorando su spazi finemente generati. SPAZIO AFFINE E VETTORI APPLICATI 7 Le componenti di u vengono quindi espresse tramite la n-upla   u1  u2    u →  . , .  .  un scrivendo anche u = u1 v 1 + u2 v 2 + ... + un v n . (1.2) Quindi, una volta specificata la base di V , ad ogni vettore u possiamo associare una ed una sola2 n-upla: risulta quindi definita una corrispondenza biunivoca fra lo spazio V e lo spazio Rn . In tal senso, nel seguito di quest’opera, intenderemo, salvo che non diversamente specificato, con la stessa lettera in grassetto u sia il vettore dello spazio vettoriale V sia la n-upla di Rn che lo rappresenta (rispetto ad un data base). Ovviamente le componenti di un vettore dipendono dalla base scelta, cambiando base allo stesso vettore u viene associato un diverso vettore colonna. In altri termini, il vettore u prescinde dalla base mentre la n-upla dipende dalla base scelta. In effetti, la scrittura (1.2), specificando esplicitamente sia le componenti che la base, mette ben in luce questo stretto legame fra la n-upla di Rn e la base prescelta. Le considerazioni appena illustrate mostrano che vale il seguente Teorema 1.1.4 Tutti gli spazi vettoriali ad n dimensioni (n fissato) su R, sono isomorfi fra loro e quindi sono isomorfi ad Rn . In altri termini, il teorema precedente afferma che se V e U sono due spazi vettoriali su R, aventi la stessa dimensione n, si può stabilire una corrispondenza biunivoca fra i vettori di V e quelli di U , cioè v ←→ u, se v ∈ V e u ∈ U . Inoltre, se v, v ′ , sono vettori V e u, u′ , è la corrispondente coppia di vettori di U , cioè v ←→ u, e v ′ ←→ u′ , allora v + v ′ ←→ u + u′ , e αv ←→ αu, per ogni α ∈ R. Si può quindi affermare che, astrattamente, U e V sono lo stesso spazio. 1.2 Spazi vettoriali euclidei Allo scopo di definire le nozioni di lunghezza di un vettore e di angolo tra vettori si introduce una nuova operazione tra vettori: il prodotto scalare. Se V è uno spazio vettoriale reale di dimensione finita, definiamo prodotto scalare in V la seguente operazione · : V × V −→ R 2 Infatti se al vettore u si potesse associare due n-uple, cioè α1 v 1 + .... + αn v n , u= β1 v 1 + .... + βn v n , facendo la differenza otterremmo (α1 − β1 ) v1 + .... + (αn − βn ) v n = 0, che può essere soddisfatta soltanto se (αi − βi ) = 0, ∀ i = 1, ..., n, dal momento che gli n vettori v i sono linearmente indipendenti. 8 LEZIONI DI SISTEMI DINAMICI che gode delle seguenti proprietà: 1. u · v = v · u, ∀ u, v ∈ V. 2. v · v > 0, se v �= 0, ed è zero solo nel caso in cui v = 0. 3. · è lineare sia nel primo che nel secondo argomento, ovvero (α1 v 1 + α2 v 2 ) · u = v · (α1 u1 + α2 u2 ) = α1 v 1 · u + α2 v 2 · u, α1 v · u1 + α2 v · u2 . Lo spazio vettoriale V dotato del prodotto scalare viene detto spazio vettoriale euclideo, che usualmente si denota (V, ·). Talvolta, sfruttando la linearità sul primo e secondo argomento e la simmetria, si dice anche che il prodotto scalare è una forma bilineare (proprietà 3) simmetrica (proprietà 1), definita positiva (proprietà 2). Nel caso in cui V = Rn , l’applicazione · : Rn × Rn −→ R, così definita     y1 x1  y2   x2      (1.3) x =  .  , y =  .  , x · y = x1 y1 + x2 y2 + ... + xn yn ,  ..   ..  xn yn soddisfa le proprietà del prodotto scalare. Dunque (Rn , ·) è uno spazio vettoriale euclideo. Osserviamo inoltre che se leggiamo l’n-upla x come una matrice n× 1, e denotiamo con y T = (y1 , y2 , ... , yn ), ovvero l’n-upla riga che corrisponde ad una matrice 1 × n, il prodotto scalare può anche essere visto come prodotto righe per colonne fra matrici x · y = y T x = xT y . Dato (V, ·) spazio vettoriale euclideo, l’applicazione � � : V −→ R, che opera così: √ �v�= v·v, viene detta modulo, o norma, o lunghezza, del vettore v. Talvolta la norma del vettore v potrà anche essere denotata con |v| anziché con �v�. In Rn , la norma (o modulo o lunghezza), associata al prodotto scalare standard dato dalla (1.3), di una n-upla x è � � x � = x21 + x22 + ... + x2n . Dalla proprietà del prodotto scalare si deducono facilmente le seguenti proprietà: • � v � > 0, se v �= 0, ed è zero solo nel caso in cui v = 0. • ∀ λ ∈ R, �λv� = |λ| �v�. Due importanti risultati sono riassunti nel seguente SPAZIO AFFINE E VETTORI APPLICATI 9 Teorema 1.2.1 Se (V, ·) è uno spazio vettoriale euclideo (reale), allora ∀ u, v ∈ V , si ha: 1. |u · v| ≤ �u� �v�, disuguaglianza di Cauchy-Schwarz. 2. �u + v� ≤ �u� + �v�, disuguaglianza triangolare o di Minkowski. Dim. Dimostriamo prima la disuguaglianza di Cauchy-Schwarz. E’ chiaro che la disuguaglianza è verificata se almeno uno dei due vettori è nullo. Supponiamo quindi che siano entrambi non nulli. Consideriamo w = αu + βv, con α, β ∈ R, w · w = (αu + βv) · (αu + βv) = α2 �u�2 + β 2 �v�2 + 2αβu · v ≥ 0. 2 Prendendo adesso α = �v� e β = −u · v, si ottiene 4 2 2 2 2 2 2 �v� �u� + (u · v) �v� − 2 �v� (u · v) = �v� 2 2 �v� �u� − (u · v) 2 ≥ 0. Siccome v �= 0, possiamo dividere per �v�2 , ed ottenere così la disuguaglianza �v�2 �u�2 ≥ (u · v)2 , =⇒ |u · v| ≤ �u� �v� . Per quanto riguarda la disuguaglianza triangolare, sfruttando la disuguaglianza di Cauchy-Schwarz abbiamo 2 �u + v� 2 2 = (u + v) · (u + v) = �u� + �v� + 2u · v ≤ �u� + �v� + 2 �u� �v� = (�u� + �v�) . 2 2 2 2 2 2 Notiamo che se u · v = 0, allora abbiamo �u + v� = �u� + �v� , che altro non è che il teorema di Pitagora. A partire dalla disuguaglianza di Cauchy-Schwarz possiamo definire l’angolo compreso fra due vettori . Infatti, se u �= 0 e v �= 0, abbiamo −1 ≤ u·v ≤ 1. �u� �v� Per cui, possiamo definire l’angolo θ ∈ [0, π] fra i vettori u e v come quell’angolo il cui coseno è dato da u·v cos θ = . (1.4) �u� �v� Dalla (1.4) scaturisce questa importante relazione fra norme dei vettori u e v, prodotto scalare e angolo compreso u · v = �u� �v� cos θ. Da cui segue la definizioni di ortogonalità fra vettori: diremo che u e v sono ortogonali, e scriveremo u ⊥ v, se u · v = 0, ⇔ l′ angolo θ fra u e v è retto. 10 LEZIONI DI SISTEMI DINAMICI Diamo adesso la definizione di base ortonormale. Se (V, ·) è uno spazio vettoriale di dimensione n, una base {e1 , ..., en } si dice ortonormale, o base canonica, se �ei � = 1, ∀ i = 1, 2, ... , n e ovvero3 ei · ej = δij = � ei · ej = 0, ∀ i �= j , 1 se i = j , 0 se i �= j . (1.5) I vettori delle basi ortonormali si denotano in genere con la lettera e, e vengono usualmente detti versori. Notiamo che la base (1.1) di Rn è ortonormale se il prodotto scalare è dato dalla (1.3). Dato (V, ·) spazio vettoriale euclideo, si può provare che esiste un metodo che permette di determinare sempre una base ortonormale. Ciò prova, in generale, l’esistenza di una base ortonormale. Tale metodo viene detto procedimento di ortonormalizzazione di Gram–Schmidt. Se si scrive l’espressione del prodotto scalare utilizzando le componenti dei vettori rispetto ad una base ortonormale su uno spazio vettoriale Euclideo di dimensione n, si ottiene la stessa espressione del prodotto scalare standard su Rn , cioè quello definito dalla (1.3). In altri termini abbiamo questo Teorema 1.2.2 Se (V, ·) è uno spazio vettoriale euclideo, e {e1 , ..., en } è una base ortonormale, allora dati comunque due vettori u e w   u1  u2    u = u1 e1 + ... + un en , ⇒ a u si associa l’n − upla u =  .  ,  ..  un   w1  w2    w = w1 e1 + ... + wn en , ⇒ a w si ssocia l’n − upla w =  .  ,  ..  wn si ha u·w = u ·w � �� = uT w = w T u . (1.6) p. scalare in Rn def inito dalla (1.3) Dim. La dimostrazione è facilissima. Infatti, ricordando la (1.5),  �  n � n n n � � � � u i ei ·  wj ej  = ui (ei · ej )wj u·w = � �� i=1 j=1 i=1 j=1 δij = n � ui wi . i=1 3 La δij è detta δ di Kronecker. Leopold Kronecker (1823 – 1891) è stato un matematico tedesco. SPAZIO AFFINE E VETTORI APPLICATI 11 Vale anche il viceversa. Se ∀ u, w ∈ V vale la (1.6) allora la base {e1 , ..., en } è ortonormale. La dimostrazione è lasciata per esercizio. Due conseguenze di questo risultato sono le seguenti: • le componenti di un qualunque vettore v rispetto ad una base ortonormale B = {e1 , ..., en } hanno questa forma particolare v = (v · e1 ) e1 + (v · e2 ) e2 + ... + (v · en ) en . In altri termini, se v = v1 e1 + v2 e2 + ... + vn en , allora     v1 v · e1  v2   v · e2      ≡  ..   . ..  .  Se B è   . ortonormale vn v · en (1.7) Infatti, se moltiplichiamo scalarmente v per e1 , poi per e2 , e così via otteniamo v · e1 = (v1 e1 + v2 e2 + ... + vn en ) · e1 = v1 , v · e2 = (v1 e1 + v2 e2 + ... + vn en ) · e2 = v2 , v · en .. . = (v1 e1 + v2 e2 + ... + vn en ) · en = vn . (1.5) (1.5) (1.5) Gli scalari (v · ei ), i = 1, 2, ... , n, vengono detti proiezioni ortogonali di v sui vettori della base. • Alla base ortonormale {e1 , ..., en } di V corrisponde la base canonica (1.1) di Rn . Rimarchiamo ancora che la (1.6) vale solo nel caso in cui B sia una base ortonormale. Ci chiediamo dunque: se (V, ·) è uno spazio vettoriale euclideo di dimensione n, ed in esso è data una base B = {v 1 , ..., v n }, non ortonormale, come si tradu� �� n ui v i , w ce il prodotto scalare fra vettori nel prodotto fra n-uple? Se u = i=1 ��n � = wi v i , potremo scrivere i=1 u·w =    =   u1 u2 .. . un � n �  i=1       ·    �  �  n n n � � �   ui v i · wj v j = ui (v i · v j ) wj j=1 i=1 j=1 v1 · v1 v2 · v1 .. . v 1 · v2 v 2 · v2 .. . ··· ··· v1 · vn v2 · vn .. . vn · v1 vn · v2 · · · �� vn · vn G       �     w1 w2 .. . wn     , (1.8)  12 LEZIONI DI SISTEMI DINAMICI cioè u · w = u · Gw ≡ uT Gw, dove u, w ∈ Rn . La matrice G viene detta matrice metrica o matrice associata alla forma bilineare, oppure anche tensore metrico. Evidentemente, una volta definito il prodotto scalare, G dipende dalla base prescelta: se infatti {v 1 , ..., v n } fosse ortonormale avremo G ≡ I. Notiamo che la norma di u è 2 �u� = u · Gu ≡ uT Gu. Le principali proprietà di G sono riassunte nel seguente Teorema 1.2.3 Se (V, ·) è uno spazio vettoriale euclideo e B = {v 1 , ..., v n }, cui corrisponde la matrice G, allora: • G è simmetrica; • det G �=0, ovvero G è invertibile. Dim. La simmetria è una conseguenza banale della simmetria del prodotto scalare. Proviamo che det G �=0. Infatti se fosse det G =0, allora il sistema lineare    G  x1 x2 .. . xn     = 0,  avrebbe soluzioni non nulle. Se ne consideriamo una qualsiasi e ad essa associamo il vettore w = x1 v 1 + x2 v 2 + ... + xn v n , 2 questo è sicuramente non nullo, w · w = �w� > 0. Del resto    2 �w� = (x1 , x2 , ... , xn ) G   � che è assurdo. x1 x2 .. .     = 0,  xn �� =0 Notiamo inoltre che l’identificazione (1.7) non è in generale vera se B non è una base ortonormale. Supponendo al solito u = u1 v 1 + u2 v 2 + ... + un v n , abbiamo u · v1 = u · vn = �n i=1 .. �n . i=1 ui (v 1 · v i ) , ui (v n · v i ) ,    u · v1    .. =⇒   = G . u · vn  u1 ..  . .  un (1.9) SPAZIO AFFINE E VETTORI APPLICATI 13 In altre parole, il generico vettore u è rappresentato, rispetto alla stessa base B, da due diverse n-uple, cioè u −→    u1    �n  ..      .  , tale che u = i=1 ui v i ,     un      u · v1       ..   .   .   u · vn E’ chiaro che se B è ortonormale i due vettori di Rn coincidono. Per passare dall’uno all’altro si deve utilizzare la matrice G che, come abbiamo provato, è invertibile. Le  due n-uple  si distinguono l’una dall’altra tramite diverse denominazioni: l’n-upla u · v1   ..   viene detta n-upla delle componenti, o coordinate, covarianti di u, . u · vn   u1   mentre  ...  viene detta n-upla delle componenti, o coordinate, controvarianti un di u. La relazione che consente di passare dalle componenti controvarianti a quelle covarianti è la (1.9). L’inversa, cioè    u1 u · v1  ..   .. −1   . =G  , . u · vn un  permette invece di calcolare le componenti controvarianti a partire da quelle covarianti. Nella figura 1.1 sono riportate graficamente sia le componenti controvarianti che quelle covarianti del medesimo vettore, nel caso particolare in cui i vettori della base v 1 , v 2 siano normalizzati. In tal caso, infatti, le componenti covarianti di un vettore coincidono con le proiezioni ortogonali del vettore sugli assi della base. Questo però non è vero se i vettori della base non sono normalizzati. Tuttavia, anche se impropriamente, le componenti covarianti di un vettore sono sovente lette come le “proiezioni” del vettore sugli assi della base. Nel corso di quest’opera non staremo quasi mai a distinguere fra componenti covarianti o controvarianti di un vettore. Questo perché molto spesso avremo a che fare con basi ortonormali. Ovviamente, quando scriveremo u = u1 v 1 + u2 v 2 + ... + un v n , le componenti ui , i = 1, 2, ..., n, sono quelle controvarianti, che, per basi non ortonormali, non coincidono le “proiezioni” di u sui vettori della base. 14 LEZIONI DI SISTEMI DINAMICI componenti CONTROVARIANTI di u u v2 v1 Se |v1|=| v2 |=1, le componenti COVARIANTI di u coincidono con le proiezioni ortogonali di u sugli assi v1 e v2 u v2 v1 Figura 1.1: L’interpretazione geometrica delle componenti covarianti del vettore u è semplice nel caso in cui i vettori della base siano normalizzati, cioè |v 1 | = |v 2 | = 1. Infatti, in tal caso u · v i = |u| cos θi , i = 1, 2, essendo θi l’angolo compreso fra u e v i . In questo caso quindi le componenti covarianti altro non sono che le proiezioni ortogonali di u sugli assi v 1 e v 2 . Evidentemente se |v i | �= 1, i = 1, 2, allora u · v i = |u| |v i | cos θi , e dunque le componenti covarianti u · v i , i = 1, 2, non coincidono con le proiezioni ortogonali del vettore u sugli assi v i , i = 1, 2. 1.3 Trasformazioni di basi ortonormali In uno spazio vettoriale euclideo (V, ·) sono date due basi ortonormali B = {e1 , ..., en } e B′ = {e′1 , ..., e′n }, sì che il generico vettore x è rappresentato da due differenti n-uple, cioè    x1     x2         x =  ..  nella base B,    .      xn  x −→  ′    x1      x′2    ′    x =  .  nella base B′ .     ..     x′n Vogliamo adesso stabilire che relazione c’è fra la n-upla x e la n-upla x′ . Esprimiamo ciascun versore di B nella base B′ , ei = N � � j=1 dove N � � aij e′j , ei · e′j e′j = aij = ei · e′j , i = 1, ..., n , (1.10) j=1 i, j = 1, ..., n, (1.11) SPAZIO AFFINE E VETTORI APPLICATI cioè introduciamo la matrice  a11 · · ·  a21 · · ·  A = .  .. a1n a2n .. . ··· an1 ann 15       =   e1 · e′1 e2 · e′1 .. . ··· ··· e1 · e′n e2 · e′n .. . en · e′1 ··· en · e′n    ,  (1.12) detta matrice del cambiamento di base da B′ in B. Esprimiamo ora x nella base B x= N � i=1 xi ei , con xi = x · ei , e nella base B′ x= N � j=1 x′j e′j , con x′j = x · e′j . Riprendendo la (1.10)   N N N � � � � � xi = x · ei = x ·  aij e′j  = aij x · e′j = aij x′j , �� j=1 j=1 j=1 x′j otteniamo xi = N � j=1 aij x′j , ⇒      � x1 x2 .. .       =    xn �� x  � a11 a21 .. . ··· ··· a1n a2n .. . an1 ··· �� ann A      �� x′1 x′2 .. .    .  x′n �� x′ La proprietà fondamentale di A è quella di essere una matrice ortogonale, cioè AT A = AAT = I . Infatti, dal momento che B e B′ sono ortonormali si ha δkj = ek · e j = = N N � � s=1 i=1 = N � i=1 �N � aks e′s s=1 � � · aks aji es · ei = � �� aki aT ij , δsi N � aji e′i i=1 N � i=1 aki aji � 16 LEZIONI DI SISTEMI DINAMICI cioè AAT = I. Del resto δmn = = e′m · e′n N N s=1 r=1 = N N = · es ) es · (e′m · er ) er s=1 r=1 N (e′n asn arm a s n a r m es · er = δsr N ar n ar m r=1 aT n r ar m , r=1 e quindi AT A = I. 1.4 Spazio affine e coordinate curvilinee Definizione 1.4.1 Uno spazio affine è una terna (A, V, F ), dove: A è un insieme i cui elementi sono detti punti; V è uno spazio vettoriale sul campo reale di dimensione finita (V viene detto spazio vettoriale soggiacente lo spazio affine); F è un’applicazione F : A×A → V A×A ∋ (P, Q) F → F (P, Q) = v ∈ V, il vettore v si denota anche con (P − Q) che gode delle seguenti proprietà: 1. ∀ coppia P ∈ A, e v ∈ V, esiste uno ed un solo Q ∈ A, tale che (P − Q) = v. F (P,Q) 2. Dati comunque tre punti P , Q, S in A, vale (P − Q) + (Q − S) = (P − S) . F (P,Q) F (Q,S) F (P,S) La dimensione di uno spazio affine A è quella di V . Il generico vettore v di V viene anche detto vettore libero, mentre la coppia (P, v) ∈ A×V , viene spesso detta vettore applicato nel punto P . Se in A si fissa un punto O, allora A si identifica con V , nel senso che tutti i punti P di A sono in corrispondenza biunivoca con i vettori F (P, O) = (P − O) ∈ V . Osserviamo che uno spazio vettoriale può sempre pensarsi come spazio affine. Gli elementi di A, cioè i punti, sono i vettori. Inoltre, se P corrisponde al vettore v e Q corrisponde a u, il vettore associato a P − Q è v − u. Definizione 1.4.2 Un riferimento affine, (detto anche riferimento cartesiano) nello spazio affine4 A, è costituito da: 4 Con il termine spazio affine A, si intende sempre la terna (A, V, F ). SPAZIO AFFINE E VETTORI APPLICATI 17 • un punto O, detto origine; • una base {w1 , w 2 , ..... , wn }, di vettori di V . Per semplicità la base verrà denotata nel seguito anche come { wi } . Il riferimento cartesiano in A, si denota con {O, w1 , w 2 , ..... , wn }, o, più semplicemente, con {O, wi }. Quindi, dato un riferimento cartesiano su A, il generico punto P ∈ A si identifica con la n-upla di Rn   x1  x2     ..   .  xn che, come sappiamo, rappresenta le componenti del vettore (P − O), o anche coordinate del punto P , rispetto alla base {w i } prescelta, P − O = x1 w 1 + x2 w2 + ..... + xn wn . In sostanza, quando parliamo di spazio affine dotato di riferimento cartesiano, intervengono tre spazi: - Lo spazio affine A, o spazio dei punti P . - Lo spazio vettoriale V . - Lo spazio delle coordinate Rn . L’importanza della teoria degli spazi affini nella meccanica è giustificata dal fatto che si assume che lo spazio dove ci troviamo, ovvero lo spazio delle nostre percezioni, è uno spazio affine di dimensione tre. Definizione 1.4.3 Uno spazio affine (A, V, F ), si dice euclideo se lo spazio vettoriale V è euclideo, ovvero in esso è definito un prodotto scalare. Negli spazi affini euclidei si può definire la distanza fra punti P, Q ∈ A, come il modulo del vettore (P − Q), che spesso si denota con |P − Q|, anziché con �P − Q�. Consideriamo adesso uno spazio affine euclideo, in cui {O, ei }, è un riferimento cartesiano ortogonale, cioè la base {ei }, è una base ortonormale. Come detto, ogni punto P ∈ A è individuato da un n-upla, i cui elementi sono le componenti del vettore P − O, che, come sappiamo, coincidono anche con le proiezione ortogonali di P − O sui vettori della base. Se Q è un dominio di Rn , ovvero Q ⊂ Rn , si considera questa applicazione x : Q → D ⊂ Rn ,     x1 (q1 , q2 , ..., qn ) q1  x2 (q1 , q2 , ..., qn )   q2     x  Q ∋ q =  .  −→ x (q) =   ∈ D ⊂ Rn . ..    ..  . qn xn (q1 , q2 , ..., qn ) Il codominio D in generale è un sottoinsieme di Rn , e ad esso corrisponderà un dominio DA nello spazio affine A. Se l’applicazione x (q) gode delle seguenti proprietà: 18 LEZIONI DI SISTEMI DINAMICI 1. x (q) ∈ C 1 (Q) ; 2. ∀ q ∈ Q, l’applicazione è invertibile; allora si dice che x (q) definisce un nuovo sistema di coordinate su D, dette coordinate curvilinee. La condizione 2 è verificata se la matrice n × n,   ∂x1 ∂x1 ∂x1 ···  ∂q1 ∂q2 ∂qn   ∂x ∂x2 ∂x2  2   ···    ∂q ∂q ∂q 1 2 n , J=  . . .  .. .. ..     ∂xn ∂xn ∂xn  ··· ∂q1 ∂q2 ∂qn ha rango massimo, ovvero ∀ q ∈ Q si ha det J �= 0. In altri termini, le n funzioni  x1 = x1 (q1 , q2 , ..., qn ) ,     x2 = x2 (q1 , q2 , ..., qn ) , ..  .    xn = xn (q1 , q2 , ..., qn ) , rappresentano un sistema di coordinate curvilinee in D, se gli n vettori di V , ∂x , ∂q1 ∂x , ··· ∂q2 ∂x , ∂qn le cui componenti rispetto alla base {ei } sono i vettori di Rn      ∂x1 ∂x1 ∂x1  ∂qn  ∂q1   ∂q2   ∂x  ∂x   ∂x  2  2  2          ∂q1  ,  ∂q2  , · · ·  ∂qn  .  .   .   ..  ..   ..        ∂xn  ∂xn   ∂xn  ∂q1 ∂q2 ∂qn      ,     ∂x , i = 1, 2, ..., n, ∂qi formano un riferimento associato alle coordinate curvilinee q, e quindi una base dello spazio vettoriale V soggiacente lo spazio affine A. Tale base però cambia da punto a punto e perciò viene detta base locale o base puntuale. In generale i vettori ∂x , i = 1, 2, . . . , n, si denotano con ui , e la base puntuale con {u1 , u2 , ... , un }, o ∂qi sono linearmente indipendenti5 ∀ q ∈ Q. In tal caso diremo che 5 Infatti, scrivendo la matrice J come J= ∂x ∂x ∂x , ··· ∂q1 ∂q2 ∂qn la condizione di rango massimo implica l’indipendenza dei vettori ∂x . ∂qi SPAZIO AFFINE E VETTORI APPLICATI 19 semplicemente con {ui }. Diremo poi che le coordinate curvilinee q sono ortogonali se ui · uj = 0, se i �= j. In tal caso si usano introdurre i versori della base locale come � � ∂x �� ∂x �� , i = 1, 2, ..., n, κi = /� ∂qi ∂qi � tali che κi · κj = δij . Una proprietà importante dei vettori ui , è quella di essere punto per punto tangenti alle rispettive curve coordinate. Infatti, se fissiamo i valori di n − 1 coordinate e lasciamo variare una sola coordinata (per esempio fissiamo (q1 , q2 , ..., qi−1 , qi+1 , ..., qn ) e lasciamo “libera” la qi ), otteniamo una curva parametrizzata dalla coordinata variabi∂x le. Il vettore è tangente alla curva parametrizzata dalla coordinata qi . Da notare ∂qi che, nel caso specifico della base ortonormale {ei }, il vettore unitario ei è tangente all’i-esimo asse coordinato. In particolare, dato un generico vettore v ∈ V , questo si potrà anche esprimere sia in termini della base {ei }, che in termini della base locale {ui }. Quindi, riferendoci a quest’ultima, la n-upla   v · u1  v · u2      ..   . v · un fornisce le componenti covarianti di v rispetto alla base puntuale {ui }, cioè v = (v · u1 ) u1 + (v · u2 ) u2 + . . . + (v · un ) un . In accordo con la (1.8) si definisce la matrice metrica associata al sistema di coordinate curvilinee come   u1 · u1 · · · u1 · un  u2 · u1 · · · u2 · un    G= , .. ..   . . un · u1 · · · un · un le cui componenti variano da punto a punto. Se quindi utilizziamo la base {ui } per �n v e w tramite le loro componenti controvarianti, cioè v = �n esprimere i vettori v u e w = i i i=1 i=1 wi ui , avremo   w1 �  �  v1 · · · vn G  ...  v·w = wn = � w1 ··· wn   v1 �  .  G  ..  . vn Esempio 1.4.1 Consideriamo il piano affine A con un riferimento cartesiano ortogonale {O, ex , ey } . Poniamo Q = (0, +∞) × [0, 2π) ⊂ R2 , q1 = r, q2 = θ, e 20 LEZIONI DI SISTEMI DINAMICI consideriamo l’applicazione  x (q) =  x (r, θ) = r cos θ y (r, θ) = r sin θ   ∂x , uθ = che porta il dominio Q in DA = A − {O}. Determiniamo i vettori ur = ∂r ∂x , e verifichiamo la loro indipendenza ∀ (r, θ) ∈ Q. Infatti, dando direttamente le ∂θ loro componenti,     cos θ −r sin θ  , uθ =  , ur =  sin θ r cos θ abbiamo det J = r �= 0, ∀ (r, θ) ∈ Q. La base locale {ur , uθ } è ortogonale: ur · uθ = 0. Inoltre uθ è tangente alle linee coordinate r =cost., e θ variabile in [0, 2π), mentre ur è tangente alle linee coordinate θ =cost., r variabile in (0, ∞). ur è quindi diretto radialmente. Esempio 1.4.2 Consideriamo lo spazio tridimensionale con il riferimento cartesiano ortogonale {O, ex , ey , ez }, e le coordinate sferiche q1 = r, q2 = ϕ longitudine e q3 = θ, co-latitudine (angolo che il vettore (P − O) forma con l’asse z, vedi figura 1.2), definite nel dominio Q = (0, +∞) × [0, 2π) × (0, π) ⊂ R3 .Consideriamo poi l’applicazione   x (r, ϕ, θ) = r sin θ cos ϕ     .  y (r, ϕ, θ) = r sin θ sin ϕ x (q) =     z (r, ϕ, θ) = r cos θ che porta il dominio Q in DA = A − {asse z}. Si verifica facilmente che det J = −r2 sin θ �= 0, ∀ (r, ϕ, θ) ∈ Q. La base locale (non normalizzata) è       −r sin θ sin ϕ r cos θ cos ϕ sin θ cos ϕ                  ur =  sin θ sin ϕ  , uϕ =  r sin θ cos ϕ  , uθ =  r cos θ sin ϕ  ,       0 −r sin θ cos θ uϕ uθ , κθ = . E’ facile verificare r sin θ r che la base locale è ortogonale. Possiamo esprimere il vettore (P − O) nella base locale. Abbiamo mentre quella normalizzata è κr = ur , κϕ = (P − O) = r sin θ cos ϕex + r sin θ sin ϕey + r cos θez = r (sin θ cos ϕex + sin θ sin ϕey + cos θez ) , �� ur SPAZIO AFFINE E VETTORI APPLICATI 21 Figura 1.2: Coordinate sferiche. z P θ y O ϕ x cioè (P − O) → x =   xex + yey + zez ,  rκr , coordinate cartesiane, (1.13) coordinate sferiche. In particolare, �P − O� = r. 1.5 Prodotto vettoriale e sistemi di vettori applicati 1.5.1 Il prodotto vettoriale Si comincia con la definizione di prodotto vettoriale fra terne. Definizione 1.5.1 Se a, b ∈ R3 , si definisce prodotto vettoriale, o prodotto esterno, delle terne a e b il vettore   a2 b 3 − a3 b 2 a ∧ b =  a3 b 1 − a1 b 3  . (1.14) a1 b 2 − a2 b 1 Introducendo la base canonica (1.1) e1 , e2 ed e3 , si ha formalmente � �   � e1 e2 e3 � a 2 b 3 − a3 b 2 � � a ∧ b = �� a1 a2 a3 �� =  a3 b1 − a1 b3  . � b1 b2 b3 � a1 b 2 − a2 b 1 (1.15) E’ facile dimostrare che il prodotto vettoriale così come definito dalla (1.14) gode delle seguenti proprietà: 22 LEZIONI DI SISTEMI DINAMICI • a ∧ b = −b ∧ a ; • ∀ α, β ∈ R, (αa + βb) ∧ c = α (a ∧ c) + β (b ∧ c) ; • a ∧ b è ortogonale sia ad a che a b. Infatti (a ∧ b) · a = (a ∧ b) · b = 0 ; • e 1 ∧ e 2 = e3 , e3 ∧ e 1 = e2 , e2 ∧ e 3 = e1 ; • dati a, b e c qualunque (1.16) [a ∧ b] · c = [c ∧ a] · b = [b ∧ c] · a ; • il prodotto vettoriale soddisfa la cosiddetta identità di Jacobi a ∧ (b ∧ c) + b ∧ (c ∧ a) + c ∧ (a ∧ b) = 0. (1.17) Consideriamo adesso lo spazio affine euclideo A di dimensione 3. Sia {O, w1 , w2 , w 3 }, un un riferimento cartesiano ortonormale centrato in O. Diremo che il riferimento è positivamente orientato o che la terna {O, w1 , w2 , w3 } è levogira, o destrorsa, se w1 , w2 , w3 sono orientati come pollice, indice e medio della mano destra. In altri termini, la terna è levogira se la rotazione di π/2 che porta il primo versore sul secondo è antioraria se vista dal semispazio verso cui punta il terzo versore. In figura 1.3 sono riportate una terna ortonormale levogira ed una non levogira. e3 e3 e2 e1 e1 TERNA LEVOGIRA e2 TERNA NON LEVOGIRA Figura 1.3: Terna ortonormale levogira e terna ortonormale non levogira. Due riferimenti cartesiani ortonormali {O, w1 , w2 , w3 } e {Q, v 1 , v 2 , v 3 } si diranno concordemente orientati se la matrice del cambiamento di base A ha determinante uguale ad 1, det A = 1. I riferimenti {O, w 1 , w2 , w3 } e {Q, v 1 , v 2 , v 3 } non sono concordemente orientati se det A = −1. Nota 1.5.1 Con l’introduzione del prodotto vettoriale nello spazio affine di dimensione 3 abbiamo introdotto il concetto di destra e sinistra. Questi sono concetti puramente SPAZIO AFFINE E VETTORI APPLICATI 23 relativi, almeno nel nostro contesto. Quello che ha un significato assoluto è la differenza fra le due orientazioni. Nel caso della retta, per esempio, è possibile specificare due versi, ma definirne uno come positivo (perché diretto da “sinistra verso destra”) e l’altro come negativo si può fare solo se ci riferiamo ad un uomo che osserva la retta. Prescindendo dall’osservatore concreto quello che si può stabilire è soltanto la differenza dei due versi: dire che uno è positivo e l’altro è negativo è una pura convenzione. Nello spazio quindi esistono due tipi di riferimento cartesiano ortogonale: quelli di un tipo sono collegati fra loro da matrici con determinante uguale ad 1, mentre quelli di tipo diverso sono collegati da trasformazioni con determinante uguale a −1. In astratto non si può quindi dire quali siano gli uni e quali gli altri a meno di non ricorrere ad un osservatore concreto che confronta la base cartesiana con la sua mano destra. Consideriamo lo spazio affine euclideo di dimensione 3. In esso vale la seguente interpretazione geometrica del prodotto vettoriale: dati tre punti A, B e C, il prodotto vettoriale (A − C) ∧ (B − C), ha la direzione ortogonale al piano individuato dai vettori (A − C) e (B − C). Il verso del vettore (A − C)∧(B − C) è tale che la rotazione (di angolo inferiore a π) che porta (A − C) su (B − C) sia antioraria se vista dal semispazio che contiene il vettore (A − C) ∧ (B − C). Infine, per quel che riguarda il modulo, vale |(A − C) ∧ (B − C)| = |(A − C)| |(B − C)| sin ϕ , (1.18) dove ϕ ∈ [0, π], è l’angolo compreso fra i vettori (A − C) e (B − C). Per dimostrare tali affermazioni, consideriamo (A − C) (B − C) ∧ , |(A − C)| |(B − C)| cioè il prodotto vettoriale fra versori. Senza perdere di generalità possiamo considerare la terna ortonormale levogira {A, w1 , w2 , w3 } centrata in A, dove w1 = w2 = (A − C) , |(A − C)| versore del piano individuato dai vettori (A − C) e (B − C) , ortogonale a w 1 , (B − C) rispetto a tale base e dove w3 è dato da w3 = w 1 ∧ w 2 . Le componenti di |(B − C)| sono (B − C) = cos ϕ w1 + sin ϕ w2 , ϕ ∈ [0, 2π) , |(B − C)| per cui (B − C) (A − C) ∧ = w 1 ∧ (cos ϕ w1 + sin ϕ w 2 ) = sin ϕ w3 , |(A − C)| |(B − C)| ovvero (A − C) ∧ (B − C) = |(A − C)| |(B − C)| sin ϕw3 . Se adesso ne prendiamo il modulo otteniamo esattamente la (1.18), dove ϕ ∈ [0, π] indica l’angolo fra i due vettori. 24 LEZIONI DI SISTEMI DINAMICI 1.5.2 Vettori applicati e momento rispetto ad un polo Sia, al solitolo, A spazio spazio affine di dimensione 3 nel quale lavoriamo e sia V il soggiacente spazio vettoriale. Abbiamo già incontrato nella sezione 1.4 la definizione di vettore applicato: è la coppia (P, v) ∈ A × V . Definizione 1.5.2 Si dice momento di un vettore applicato (P, v) rispetto ad un punto O, il vettore m (O) = (P − O) ∧ v . Il punto O si dice polo o centro di riduzione. Ricordando la (1.18) e osservando la figura 1.4, si ha |m (O)| = |v| |(P − O)| sin ϕ = b |v| , b dove b si dice braccio. P v ϕ b=|(P-O)|sinϕ ϕ O Figura 1.4: Momento del vettore applicato (P, v) rispetto al polo O. Il momento ha le seguenti proprietà: • m (O) = m (O′ ), se (O − O′ ) è parallelo a v. Infatti m (O′ ) = = (P − O′ ) ∧ v = m (O) = [(P − O) + (O − O′ )] ∧ v (P − O) ∧ v + (O − O′ ) ∧ v = m (O) . =0 poiché (O−O′ ) � v Se si definisce retta d’applicazione del vettore applicato (P, v), la retta passante per P e parallela a v, il risultato appena illustrato ci dice che il momento di un vettore applicato rispetto ad un polo O, non cambia se si sposta v lungo la propria retta di applicazione. SPAZIO AFFINE E VETTORI APPLICATI 25 • In generale, se (O − O′ ) non è parallelo a v m (O′ ) = m (O) + (O − O′ ) ∧ v . (1.19) La (1.19) è nota come formula di trasposizione dei momenti. Un sistema di N vettori applicati è un insieme S = {(Pi , v i ) ∈ A × V : i = 1, ...., N } . Definizione 1.5.3 Si dice risultante del sistema S il vettore N vi , mi (O) = N R= i=1 e momento risultate rispetto al centro di riduzione O m (O) = N i=1 i=1 (Pi − O) ∧ v i . Se cambiamo polo e consideriamo O′ , applicando la (1.19) si ottiene m (O′ ) = N mi (O′ ) = i=1 N i=1 [mi (O) + (O − O′ ) ∧ v i ] = m (O) + (O − O′ ) ∧ N i=1 v i = m (O) + (O − O′ ) ∧ R . (1.20) R Quindi m (O ) = m (O), se R = 0, oppure se (O − O′ ) è parallela ad R. Inoltre, proprio dalla (1.20) discende una proprietà notevole ′ m (O′ ) · R = m (O) · R + [(O − O′ ) ∧ R] · R = m (O) · R . =0 Se quindi si introduce la quantità ℑ = m (O) · R , |R| detta invariante scalare, questa è indipendente dal polo O. In particolare, possiamo R sempre scomporre m (O) lungo il versore |R| R R R =ℑ , p = m (O) · |R| |R| |R| R e nella rimanente parte n (O) = m (O) − p = m (O) − ℑ |R| , che risulta ortogonale a p. Infatti R R R = ℑ m (O) − ℑ · n (O) · p = ℑ n (O) · |R| |R| |R| = ℑ (ℑ − ℑ) = 0 . 26 LEZIONI DI SISTEMI DINAMICI Il vettore p, detto invariante vettoriale, non dipende dal polo ma soltanto dal sistema di vettori applicati S (cioè dai vettori v i e dalla loro disposizione geometrica nello spazio). Inoltre, m (O) = p + n (O) , ⇒ |m (O)| = |n (O)|2 + ℑ2 . (1.21) Quindi, partendo da un generico punto O, si vuole trovare, se esiste, il luogo geometrico dei punti Q per i quali il momento risultante abbia modulo minimo, cioè |n (Q)| = 0. Applicando la (1.20) ed imponendo m (Q) = p, abbiamo m (Q) = m (O) + (O − Q) ∧ R = p, ovvero, supponendo O centro del sistema di riferimento ed indicando con x = (Q − O) il vettore delle coordinate di Ql, (1.22) x ∧ R + p = m (O) , che è l’equazione di una retta parallela ad R. Tale retta è detta asse centrale. Quindi, per tutti i punti Q che soddisfano la (1.22), cioè che giacciono sull’asse centrale, si ha m (Q) = p (v. figura 1.5). R R m(O) p O O x Q Posto (Q-O)=x, abbiamo che Q giace sull’asse centrale se ⋀ +  = () Figura 1.5: Asse centrale. Un particolare sistema di vettori applicata è la coppia. Definizione 1.5.4 Una coppia è un sistema di due vettori applicati S = {(P, v) , (Q, −v) } . Poiché la risultante di una coppia è nulla, il momento m (O) della coppia non dipende dal polo O. In particolare, riferendoci alla figura 1.6 |m (O)| = d |v| . SPAZIO AFFINE E VETTORI APPLICATI 27 v P d Q -v Figura 1.6: Schema di una coppia. 1.5.3 Sistemi equivalenti di vettori applicati Definizione 1.5.5 Consideriamo due sistemi di vettori applicati S = {(Pi , v i ) , i = 1, ...., N } , e S ′ = {(Aj , uj ) , j = 1, ...., M } , di risultanti R e R′ , e momento risultante m (O) e m′ (O), con O fissato. Diremo che S e S ′ sono equivalenti se R = R′ , m (O) = m′ (O) . (1.23) Osserviamo subito che se la (1.23) è vera per un generico punto O, allora è vera per tutti i punti dello spazio affine. Infatti, applicando la (1.20) m (Q) = ′ m (Q) = m (O) + (O − Q) ∧ R, m′ (O) + (O − Q) ∧ R′ , che, in virtù della (1.23), risultano esser ancora uguali. In particolare, due sistemi di vettori applicati S e S ′ sono equivalenti se possiamo trasformarli uno nell’altro mediante le seguenti operazioni: 1. rimpiazzare due o più vettori applicati in un punto con la loro risultante; 2. scomporre un vettore nelle somma di più vettori; 3. cancellare due vettori uguali ed opposti che sono applicati nello stesso punto; 4. applicare allo stesso punto due vettori uguali e contrari; 28 LEZIONI DI SISTEMI DINAMICI 5. spostare un vettore lungo la propria retta d’applicazione. Utilizzando tali operazione è facile mostrare che, dato un vettore applicato (P, v) ed un qualunque centro di riduzione O, il sistema (P, v) è equivalente, nel senso della definizione 1.5.5, ad un vettore v applicato in O e ad una coppia di momento m (O) = (P − O) ∧ v. La dimostrazione è schematicamente riportata nella figura 1.7. v = O P -v = O P v v m(O) v O P Figura 1.7: Un vettore v applicato in P è equivalente allo stesso vettore applicato in O e ad una coppia. L’utilità del concetto di equivalenza di due sistemi di vettori è evidente: l’idea infatti è quella di sostituire un sistema complesso di vettori applicati con uno molto più semplice, costituito da un solo vettore ed una sola coppia. In sostanza, il risultato che ci accingiamo a dimostrare afferma che, fissato un arbitrario polo O e dato un sistema di vettori applicati (complesso quanto si vuole) questo è equivalente ad unico vettore (la risultante) applicato proprio in O ed ad una opportuna coppia, che indicheremo con m (O). Se quindi si vuole calcolare il momento del sistema rispetto ad un altro centro di riduzione, per esempio rispetto al punto Q, si può sostituire il sistema con quello semplice: cioè con la risultante R applicata in O e la coppia m (O), per cui m (Q) = m (O) + (Q − O) ∧ R . Teorema 1.5.1 Un qualunque sistema di vettori applicati S = {(Pi , v i ) , i = 1, ...., N } , è equivalente ad un altro sistema S ′ costituito da una coppia e da un solo vettore applicato. SPAZIO AFFINE E VETTORI APPLICATI 29 Dimostriamo il teorema considerando, per semplicità, un sistema di soli tre vettori applicati (la generalizzazione ad N > 3 vettori è banale) S = {(P1 , v 1 ) , (P2 , v 2 ) , (P3 , v 3 )} . La dimostrazione è sostanzialmente grafica ed è riportata nella figura 1.8. v3 v1 P3 P1 O v2 P3 m2(O) P1 v2 O m1(O) P2 = P2 = m3(O) v3 v1 m(O) = m1(O)+m2(O)+m3(O) R = v1+ v2+ v3 O Figura 1.8: Ogni sistema di vettori applicati può essere ridotto ad una coppia e ad un vettore. Notare che, dapprima si riduce di ogni vettore applicato ad un vettore applicato in O più una coppia (vedi figura 1.7), dopodiché si considerano le risultanti di tutti i vettori applicati in O e di tutte le coppie. In particolare, se O appartiene all’asse centrale, il sistema equivalente è costituito dalla risultante R (applicata in O), mentre la coppia m (O) coincide con l’invariante vettoriale p. 1.5.4 Sistemi di vettori paralleli I vettori applicati del sistema S = {(Pi , v i ) , i = 1, ...., N }, si dicono paralleli, se esiste un vettore e, per cui v i = βi e, con fi ∈ R, i = 1, ..., N. N In questo caso, ponendo β = i=1 βi , la risultante è R = β e, ed il momento rispetto ad un qualunque polo O è N m (O) = βi (Pi − O) ∧ e . i=1 30 LEZIONI DI SISTEMI DINAMICI E’ banale provare che l’invariante scalare ℑ si annulla. Di conseguenza, ricordando la scomposizione (1.21), m (O) = n (O), e quindi m (O) = 0, se O appartiene all’asse centrale. Quindi, applicando il teorema 1.5.1, abbiamo che il sistema è equivalente ad un unico vettore (la risultante) applicato in un qualunque punto dell’asse centrale. Se quindi Q è un polo che non giace sull’asse centrale m (Q) = (Q − O) ∧ R , dove O è un qualunque punto dell’asse centrale. Quindi, se vogliamo semplificare un sistema di vettori applicati paralleli è necessario individuarne l’asse centrale. A tal proposito, vale il seguente Teorema 1.5.2 L’asse centrale di un sistema di vettori paralleli è la retta parallela a e, passante per il punto C definito da C −O = N 1 βi (Pi − O) , β i=1 (1.24) detto centro del sistema. Dim. Per provare che C appartiene all’asse centrale basta dimostrare che m (C) = 0. Dunque N N m (C) = (Pi − C) ∧ βi e = βi (Pi − C) ∧ e = 0. i=1 i=1 Infatti N i=1 βi (Pi − C) = = N i=1 βi ((Pi − O) − (C − O)) β (C − O) − N i=1 βi β (C − O) = 0 . Se poi prendiamo un altro punto Q tale che6 (Q − C) = λe, con λ ∈ R, applicando la (1.20) si ha m (Q) = m (C) + (C − Q) ∧ R = 0. =0 −λe 6 Cioè Q giace sulla retta parallela ad e passate per C. β e Capitolo 2 Equazioni differenziali 2.1 Introduzione Il problema del moto, della sua descrizione e delle sue “cause”, è il punto chiave per la comprensione di gran parte delle applicazioni della matematica al mondo fisico. La storia è lunga e va molto indietro nel tempo. In effetti questo problema aveva angustiato i pensatori greci classici (si pensi al famoso paradosso del Achille e la tartaruga, “risolto” da Zenone con la negazione della possibilità stessa del moto). Già allora era apparsa la stretta connessione del moto con la continuità, intesa come infinita (almeno potenzialmente) divisibilità dello spazio e del tempo. La questione era destinata a trascinarsi per lungo tempo: per una chiara definizione di continuità (con la definizione dei numeri reali) si dovette attendere la metà del diciannovesimo secolo. Ciò nonostante gli strumenti concettuali per la descrizione del moto si fecero strada molto prima, anche se in modo vago (come tutti i concetti degni di questo nome!). Nell’opera di Galileo la velocità appare come un concetto “primitivo”, una proprietà dei corpi in movimento, che non viene definita in funzione di altro (si indica però dei modi per calcolarla, per esempio facendo urtare un corpo contro un altro corpo fermo). La chiave della “risoluzione” si trova nel lavoro di Newton che dà origine al calcolo differenziale. La velocità (istantanea) viene identificata con la derivata del moto, inteso come la funzione che associa la posizione nello spazio al tempo in cui il “mobile” la occupa1 . 1 Per quanto questo modo di pensare possa apparire molto plausibile, in effetti maschera un bel po’ di problemi concettuali. Per parlare di velocità si deve identificare ad ogni istante il corpo in moto con un punto geometrico; ma come facciamo a sapere veramente quando il corpo sta transitando in una data posizione nello spazio? Chiaramente dobbiamo “illuminare” il corpo e misurare l’intervallo di tempo che lo stesso impiega per transitare fra due punti dello spazio. La fisica moderna, attraverso la teoria della meccanica quantistica e la teoria della relatività, ci ha fatto capire che questa procedura concettuale non è corretta quando si ha a che fare con corpi “realmente” piccoli e veloci. Infatti se “illuminiamo” un corpo piccolo, quale per esempio un elettrone, perturbiamo significativamente, ed in modo casuale, il suo moto e quindi non siamo più in grado di misurarne la velocità. Inoltre, anche restando nell’ambito puramente classico, la definizione di velocità come derivata della posizione assume che si abbia chiaro cosa si intende per “spazio” e soprattutto per “tempo”: nell’ambito della meccanica classica lo spazio è rappresentato matematicamente da uno spazio euclideo tridimensionale, il tempo da un continuo unidimensionale che, come afferma Newton, “scorre uniformemente”: “Tempus 32 LEZIONI DI SISTEMI DINAMICI L’accelerazione, che è la variazione della velocità rispetto al tempo, appare allora come la derivata della funzione che ad ogni istante associa la velocità istantanea. Conoscendo ad ogni istante l’accelerazione è possibilile ricostruire la velocità e quindi la posizione con l’operazione inversa della derivazione, l’integrazione. Ma questo sembra generare un regresso all’infinito: per conoscere l’accelazione forse dovrei conoscere la sua variazione (la “derivata terza” del moto) e così via. Il “miracolo” è che con l’accelerazione si può chiudere il regresso. Una lettura “puramente matematica” della seconda legge2 della dinamica newtoniana è che è sempre possibile trovare una funzione della posizione del corpo, della sua velocità e del tempo, che determina la sua accelerazione. Questo, insieme con le leggi che regolano la struttura delle forze (il principio di azione-reazione, le specifiche leggi per le varie forze, come la legge del quadrato inverso per la gravitazione), trasforma il problema del moto in un problema matematico ben definito: la soluzione di un’equazione differenziale, o più in generale, di un sistema di equazioni differenziali. 2.2 Considerazioni generali Cominciamo con un caso ben noto: il modello più comune per descrivere una molla è quello in cui il corpo subisce una forza di richiamo proporzionale a quanto si è allontanato da un punto fissato, il centro di attrazione. Questo si traduce nel modello matematico mẍ = −Kx (2.1) dove m denota la massa del corpo, K è una costante positiva detta costante elastica, la funzione del tempo x(t) indica la posizione del corpo e ẍ la sua derivata seconda. La (2.1) è un esempio di equazione differenziale del secondo ordine, cioè che contiene la funzione incognita e le sue derivate fino al secondo ordine. Il problema fondamentale della Meccanica si può enunciare in questi termini: date le forze, determinare il moto, ovvero espressa la forza in funzione della posizione del corpo, della sua velocità e del tempo, determinare la posizione in funzione del tempo, ovvero la funzione x (t), in modo che sia soddisfatta l’equazione ẍ = F (x, ẋ, t) . Diamo ora alcune definizioni fondamentali absolutum, verum et mathematicum in se et natura sua sine relatione ad externum quodvis, aequabiliter fluit”. Questo è il “modello” di spazio-tempo che fa da “sfondo” alla meccanica newtoniana. Oggi le nostre idee sono forse un po’ più confuse. Per esempio, secondo Roger Penrose: The temporal ordering that we ’appear’ to perceive is, I am claiming, something that we impose upon our perceptions in order to make sense of them in relation to the uniform forward time-progression of an external physical reality. Si vedano gli articoli su tempo nel sito web di storia della matematica della St.Andrews University http://www-gap.dcs.st-and.ac.uk/ history/HistTopics/Time_1.html http://www-gap.dcs.st-and.ac.uk/ history/HistTopics/Time_2.html 2 Mutationem motus proportionalem esse vi motrici impressae et fieri secundum lineam rectam qua vis illa imprimitur ovvero “la variazione del moto (accelerazione) è proporzionale alla forza applicata ed è nella direzione di tale forza”. Qui la forza è pensata come una quantità (vettoriale) nota in funzione dello stato cinematico del corpo (posizione e velocità). EQUAZIONI DIFFERENZIALI 33 Definizione 2.2.1 Sia data una funzione f : Rn+2 → R. Un’equazione differenziale (ordinaria) di ordine n è una relazione, che coinvolge una funzione incognita x (t) : R → R, assieme con le sue derivate fino all’ordine n, f (x(n) (t), x(n−1) (t), . . . , x′ (t), x(t), t) = 0 dove x(k) indica la derivata k-esima di x, che deve essere soddisfatta per ogni3 valore della variabile indipendente t. L’equazione è detta in forma normale se ha la forma x(n) = f (x(n−1) , . . . , x′ , x, t) L’equazione si dice autonoma se la funzione f non dipende da t. Accanto alle equazioni scalari possiamo anche considerare le equazioni differenziali vettoriali (dette anche sistemi di equazioni differenziali), F (x(n) , x(n−1) , . . . , x′ , x, t) = 0, (2.2) dove l’incognita x(t) è ora una funzione vettoriale a valori in Rd e la funzione F : Rd×(n+1)+1 → Rd . L’equazione vettoriale si dirà in forma normale se (2.2) può essere scritta come x(n) = F (x(n−1) , . . . , x′ , x, t). (2.3) In effetti basta limitarsi a equazioni differenziali vettoriali del primo ordine. Infatti qualsiasi equazione di ordine superiore può essere ridotta a un sistema del primo ordine introducendo un numero opportuno di variabili ausiliarie (cioè nuove funzioni incognite). Per fissare le idee vediamo come si passa da un’equazione scalare del secondo ordine a un sistema di due equazioni del primo ordine. Sia quindi data l’equazione ẍ = f (ẋ, x, t) . (2.4) y = ẋ (2.5) Poniamo avremo di conseguenza che ẍ = ẏ e possiamo scrivere la (2.4) e la (2.5) come ẋ = y, ẏ = f (y, x, t), ovvero come · x (t) = F (x (t) , t) , dove x (t) = x (t) y (t) , F (x (t) , t) = y f (x, y, t) . La generalizzazione di questa riduzione al primo ordine per sistemi di equazioni differenziali di ordine superiore è ovvia. 3 A voler essere precisi, la definizione che abbiamo dato dovrebbe essere “localizzata”: la funzione f può essere definita solo in un sottoinsieme aperto di Rn+2 , così come la eventuale soluzione x(t) può essere definita solo in un certo intervallo (t1 , t2 ). Quest’ultima limitazione è molto importante in quanto, anche per funzioni f “semplici”, p.e. f (x′ , x) = x′ − x2 , le soluzioni, che pure esistono, non sono definite per tutti i valori della variabile indipendente t ma solo in intervalli limitati. 34 LEZIONI DI SISTEMI DINAMICI 2.3 Il problema di Cauchy È quasi immediato rendersi conto che un’equazione differenziale non ha soluzione unica. Basta prendere la più semplice possibile ẋ = 0 (2.6) e verificare che tutte le funzioni costanti sono soluzioni di (2.6). L’equazione (2.6) ha però una sola soluzione che soddisfa anche la condizione x(t0 ) = x0 (2.7) dove t0 è un tempo fissato e x0 un valore fissato (la soluzione è, ovviamente, x(t) = x0 per ogni t). La condizione (2.7) si dice condizione iniziale, o di Cauchy, e determina, sotto opportune condizioni, in modo univoco la soluzione di un’equazione differenziale (del primo ordine). Il problema di determinare la soluzione di un’equazione differenziale che soddisfi a una data condizione iniziale è detto problema ai dati iniziali o problema di Cauchy. Enunciamo il teorema fondamentale sull’esistenza e unicità delle soluzioni del problema di Cauchy. Esso richiede che l’equazione sia in forma normale (2.3). Enunciamo il teorema per il semplice caso di una sola equazione differenziale, ovvero � ẋ = f (x, t) , (2.8) x (t0 ) = x0 . Teorema 2.3.1 Sia data una funzione f : R2 → R, continua rispetto alle variabili x e t e lipschitziana4 rispetto alla variabile x in un intorno di (x0 , t0 ) ∈ R2 . Esistenza: Esiste un δ > 0 e una funzione x : (t0 − δ, t0 + δ) → R, di classe C 1 in (t0 − δ, t0 + δ) che soddisfa il problema di Cauchy (2.8). Unicità: Se δ > 0 e y : (t0 − δ, t0 + δ) → R, un’altra funzione che soddisfa anch’essa (2.8), allora x (t) ≡ y (t) in (t0 − δm , t0 + δm ), con δm = min{δ, δ}. Nota 2.3.1 Una prima osservazione è che il teorema ha carattere locale ovvero non garantisce l’esistenza della soluzione per tutti i tempi t ∈ R. Questo perché per una funzione f generica, anche molto regolare, la soluzione può “esplodere” in tempo finito. Come esempio si prenda l’equazione ẋ = x2 che, se imponiamo la condizione iniziale x(0) = 1, ha per soluzione x(t) = 1/(1 − t). Questa soluzione è definita solo nell’intervallo t < 1. Concludiamo osservando che la “lipschitzianità” richiesta alla f non è un “requisito tecnico”, ma è legata alla struttura del problema di Cauchy. Se infatti consideriamo il seguente problema  √  23x ẋ = ,  x (t ) =3 0 , 0 4 Una funzione f : R → R, si dice lipschitziana (o Lipschitz continua) se esiste una costante L tale che, per ogni coppia di punti x e y ∈ R, f soddisfa la diseguaglianza |f (x) − f (y)| ≤ L |x − y|. EQUAZIONI DIFFERENZIALI 35 è banale rendersi conto che esso ha due soluzioni: x (t) ≡ 0, e x (t) = t3/2 . E infatti √ la funzione 3 x non è lipschitziana in x = 0. Nota 2.3.2 Visto che la soluzione che ci si aspetta è comunque locale, è facile capire perché le ipotesi sulla regolarità della f sono “localizzate”. Si richiede infatti che la funzione f sia continua e lipschitziana non per tutti gli (x, t) ∈ R2 , ma solo in un intorno del punto (x0 , t0 ). 2.3.1 Equazioni autonome Come abbiamo detto un’equazione differenziale, o un sistema di equazioni differenziali, in cui il tempo non compare esplicitamente si dice autonoma. Queste equazioni hanno una fondamentale proprietà detta invarianza temporale: data una soluzione x(t) e un valore del tempo T qualsiasi, allora x(t − T ) è ancora soluzione dell’equazione. Supponiamo infatti di avere il seguente problema di Cauchy dx = f (x) , (2.9) dt x (0) = a , la cui soluzione è x (t). Trasliamo temporalmente di T il problema (2.9), considerando dy = f (y) , dt y (T ) = a . (2.10) E’ facile provare che y (t) = x (t − T ) è soluzione di (2.10). Infatti dy (t) dx (t − T ) dx (t − T ) d (t − T ) = = dt dt d (t − T ) dt = f ( x (t − T )) = f (y (t)) , (2.9)1 =1 e (0) = a . y (T ) = x (t − T )|t=T = x Ancora più importante è capire come si interpreta questa proprietà. Supponiamo che, a partire da un certo istante, venga effettuato un certo esperimento su una quantità la cui evoluzione nel tempo è descritta da un’equazione differenziale autonoma. Sia x(t) la soluzione dell’equazione. Supponiamo poi di effettuare lo stesso esperimento (con le medesime condizioni iniziali) T giorni dopo (si ipotizza che il tempo sia misurato in giorni). Se nulla è cambiato nelle condizioni in cui si svolge l’esperimento5 , fisicamente ci aspettiamo che le due evoluzioni siano uguali, ovvero che coincidano se traslate temporalmente. E infatti, posto y(t) la soluzione ottenuta a partire da T , abbiamo y (t) = x(t − T ). In pratica, nelle equazioni autonome, il legame tra la funzione x e le sue derivate non dipende dalla variabile indipendente (il tempo) e di conseguenza l’equazione differenziale non cambia in forma se traslata temporalmente. 5 Qui supponiamo di poter trascurare gli “errori sperimentali”! 36 LEZIONI DI SISTEMI DINAMICI Esempio 2.3.1 Consideriamo i seguenti problemi di Cauchy ẋ = x, ẋ = tx, PB : PA : x (0) = 1, x (0) = 1. Evidentemente PA coinvolge un’equazione autonoma mentre l’equazione di PB non è autonoma. La soluzione di PA è la seguente ẋ = 1, =⇒ x t t ẋ (t′ ) ′ dt = dt′ , =⇒ x (t) = et . x (t′ ) 0 0 ln Se adesso consideriamo t x(t) =ln x(t) x(0) ẏ = y, y (T ) = 1, (2.11) è banale verificare che la soluzione è y(t) = e(t−T ) . In altri termini, la soluzione di (2.11) è la soluzione di PA traslata temporalmente di T : cioè y (t) = x (t − T ). Dunque il problema di Cauchy PA non cambia per traslazioni temporali. Consideriamo adesso il problema PB la cui soluzione è ẋ = t, =⇒ x 2 t ẋ (t′ ) ′ t ′ ′ dt , , =⇒ x (t) = exp = t dt x (t′ ) 2 0 0 t ln da cui x(t − T ) = exp x(t) x(0) =ln x(t) (t−T )2 2 ẏ = ty, y (T ) = 1. t2 2 . Risolviamo il problema PB a partire da T =⇒ y (t) = exp 12 2 t −T . 2 In questo caso x(t − T ) non è più soluzione: traslando di T la variabile temporale, otteniamo due diversi problemi di Cauchy. 2.3.2 Equazioni reversibili Un’altra classe di equazioni differenziali rilevanti nella Meccanica è quella delle equazioni dette reversibili ovvero quelle per cui se x(t) è una soluzione allora lo è anche x(−t). Questo accade in Meccanica tutte le volte che abbiamo sistemi isolati o anche in sistemi non isolati ma dove le forze esterne non dipendano dal tempo e gli effetti delle forze dissipative (dovute, per esempio, agli attriti) siano trascurabili. In questi casi le equazioni avranno la forma ẍ = f (x) di cui si verifica immediatamente la reversibilità (in effetti: cambiando il segno del tempo la derivata prima cambia di segno, ma la derivata seconda ritorna del segno di partenza). EQUAZIONI DIFFERENZIALI 37 2.3.3 Equazioni integrabili Nonostante il teorema di esistenza e unicità ci garantisca che il problema di Cauchy è univocamente risolubile (almeno localmente), tuttavia non è possibile, in generale, dare un’espressione analitica della soluzione tramite una combinazione finita di “funzioni elementari”6 e neppure trovare un algoritmo che permetta di esprimere la soluzione tramite un numero finito di operazioni di integrazione e di inversione di funzioni. Qualora questo sia possibile diremo che l’equazione differenziale è “integrabile”. Lo studio di una classe di equazioni del primo ordine (cioè che coinvolgono le sole derivate prime) integrabile sarà sviluppato nella sezione 2.4. Nei paragrafi 2.5, 2.6 analizzeremo due classi di equazioni del secondo ordine (che coinvolgono cioè soltanto derivate prime e seconde) integrabili. 2.4 Equazioni del primo ordine in forma normale In questo paragrafo analizzeremo la classe più importante delle equazioni del primo ordine in forma normale: le cosiddette equazioni a variabili separabili. Per capire cosa intendiamo per equazione a variabili separabili consideriamo la seguente equazione autonoma del primo ordine (in forma normale) (2.12) ẏ = g(y) h (t) . In questo caso l’equazione è integrabile per con il metodo di separazione delle variabili. Riscriviamo infatti (2.12) come ẏ g(y) = Introduciamo la funzione H (t) = (2.13) dy , g(y) (2.14) h (t) dt, (2.15) G(y) = 1 ,e g (y) . espressione che dipende da t espressione che dipende da y e ẏ cioè una primitiva della funzione h (t) che è una qualsiasi primitiva della funzione h (t). Basta osservare ora che il primo membro della (2.13) è la derivata rispetto al tempo della funzione G(y(t)) dG (y (t)) dG dy 1 dy = = , dt dy dt g (y) dt 6 Per “funzione elementare” si intende generalmente una funzione che appartenga al seguente “catalogo”: polinomi, funzioni razionali, funzioni trigonometriche ed esponenziali, loro inverse e tutte funzioni ottenute combinando un numero finito di queste funzioni. 38 LEZIONI DI SISTEMI DINAMICI mentre il secondo membro della (2.13) è la derivata della funzione H (t) rispetto al tempo. La (2.13) è dunque un’uguaglianza tra le derivate di due funzioni e di conseguenza le due funzioni possono al più differire per una costante G (y (t)) = H (t) + costante , (2.16) da cui, indicando con G−1 l’inversa della G, otteniamo y (t) = G−1 (H (t) + costante ) . (2.17) Vediamo adesso il caso “più semplice” delle equazioni a variabili separabili: ẏ = g(y), ⇔ ẏ = 1, g(y) (2.18) che corrisponde ad h (t) = 1, =⇒ H (t) = t. La (2.16) dà quindi luogo a G(y(t)) = t + costante , =⇒ y (t) = G−1 (t + costante). (2.19) La comparsa di una costante di integrazione non deve meravigliare: sappiamo che la (2.12) ammette un’unica soluzione soltanto qualora si specifichi il dato iniziale y(t0 ) = y0 , cosa che non abbiamo fatto quando abbiamo ricavato la (2.17). Vediamo quindi come si procede quando è noto il dato iniziale. Per semplificare il più possibile consideriamo l’equazione (2.18) con il dato iniziale y(t0 ) = y0 . Abbiamo quindi il seguente problema di Cauchy ẏ = g(y), (2.20) y (t0 ) = y0 . Adesso integriamo fra t0 e t la (2.18), tenendo conto dal dato y (t0 ) = y0 , y(t) t t dη ẏ (s) ds = t − t0 = ds = g(y (s)) g(η) η=y(s) y(t0 ) t0 t0 = G(y (t)) − G(y (t0 )), (2.14) (2.21) ottenendo G(y (t)) = G(y (t0 )) + t − t0 . Possiamo dunque scrivere la soluzione come7 y(t) = G−1 (t − to + G(y0 )) . (2.22) Abbiamo quindi espresso la soluzione dell’equazione differenziale tramite il calcolo di un integrale e l’inversione di una funzione: questo è ciò che si intende per “integrazione” di un’equazione differenziale. Il calcolo che ha portato alla risoluzione di (2.20), si generalizza al caso in cui l’equazione sia la (2.12), cioè ẏ = g(y)h (t) , (2.23) y (t0 ) = y0 . In questo caso invece della (2.21) abbiamo G(y(t)) − G(y (t0 )) = H(t) − H (t0 ), cioè 7 Notiamo y(t) = G−1 (H (t) − H (to ) + G(y0 )). dalla (2.22) è banale verificare y (t)|t=t0 = y0 . EQUAZIONI DIFFERENZIALI 39 Esempio 2.4.1 Vediamo la soluzione generale della seguente equazione a variabili separabili ẏ = λy. In questo caso, ricordando la (2.14) e la (2.15) G(y) = ln y, H (t) = λt. Di conseguenza, dalla (2.16) e (2.17) ln y = λt + cost., =⇒ λt y = eλt+cost. = ecost. e , C per cui la soluzione generale è y = C eλt . Esempio 2.4.2 Consideriamo l’equazione del tipo (2.24) ẏ = λy + f (t) . Generalizzando quanto visto nell’esempio 2.4.1 si cerca la soluzione del tipo y = C (t) eλt . Sostituendo nella (2.24) Ċeλt + Cλeλt = Cλeλt + f (t) , ⇒ Si ha quindi C (t) = t Ċ = e−λt f (t) . e−λτ f (τ ) dτ + K , 0 dove K è una generica costante di integrazione. Abbiamo quindi t y (t) = eλ(t−τ ) f (τ ) dτ + Keλt . 0 Analizziamo anche il caso particolare f (t) = Aeλt , che troveremo nel seguito. La soluzione è t t λ(t−τ ) λτ λt λt y (t) = A e e dτ + Ke = Ae dτ + Keλt = eλt (At + K) . 0 0 2.5 Equazioni del secondo ordine in forma normale del tipo q̈ = f (q̇) Una generica equazione del second’ordine, anche autonoma, non può in generale essere “integrata”. Tuttavia ci sono importanti eccezioni. La prima è quella delle equazioni della forma q̈ = f (q̇) , (2.25) che chiaramente sono equazioni del primo ordine a variabili separabili nell’incognita y (t), una volta posto y = q̇. Possiamo quindi esprimere y (t) come abbiamo fatto nella (2.18), e quindi integrare ancora rispetto al tempo, ottenendo così la q (t). 40 LEZIONI DI SISTEMI DINAMICI Esempio 2.5.1 Un esempio significativo di equazione tipo (2.25) è l’equazione che descrive il moto di un grave soggetto alla forza peso e all’attrito viscoso dell’aria (la resistenza viscosa è, in prima approssimazione, proporzionale alla velocità stessa del grave) η ḧ = −g − ḣ, (2.26) m dove h rappresenta la quota del grave, g è l’accelerazione di gravità, m la massa del grave e η, costante, è il coefficiente di attrito viscoso. Ponendo y = ḣ, e µ = η/m, la (2.26) si trasforma nella seguente equazione del primo ordine a variabili separabili ẏ = −1, =⇒ g + µy 1 d dt [ln (g + µy)] = − , µ dt dt da cui otteniamo � =⇒ ln (g + µy) = −µt + C, che scriveremo come y= � 1� −g + e−µt+C , µ g C1 −µt y (t) = − t + e , µ µ dove C1 = eC è la prima costante d’integrazione. Integrando ancora C1 g h (t) = − t − 2 e−µt + C2 , µ µ dove C2 è la seconda costante d’integrazione. In particolare, se consideriamo il problema di Cauchy   ḧ = −g − µḣ, ḣ (0) = 0,  h (0) = h0 , che corrisponde al caso del grave lasciato cadere da fermo da un altezza h0 , troviamo la seguente soluzione h (t) = − � gt g � + 2 1 − e−µt + h0 . µ µ Notiamo che, se µt è “piccolo”, ovvero stiamo considerando i primi momenti della caduta, considerando l’approssimazione 1 e−µt ≈ 1 − µt + µ2 t2 , 2 1 otteniamo h (t) ≈ h0 − gt2 , che è la formula del moto uniformemente accelerato. 2 Al contrario, se µt è “grande”, si ottiene h (t) ≈ h0 + gt g − , µ2 µ corrispondente ad un moto di caduta con velocità costante proporzionale alla massa ed inversamente proporzionale al coefficiente di attrito. EQUAZIONI DIFFERENZIALI 41 2.6 Equazioni del secondo ordine del tipo q̈ = f (q): caso conservativo Un’altra classe di equazioni del secondo ordine integrabili è quella costituita delle equazioni della forma q̈ = f (q) . (2.27) Tale classe di equazioni è fondamentale per la Meccanica poiché di questa forma sono tutte le equazioni di moto di un sistema conservativo con un solo grado di libertà. La (2.27) è riconducibile a un’equazione del primo ordine tramite la seguente osservazione: moltiplichiamo ambo i membri della (2.27) per la funzione q̇ (2.28) q̈ q̇ = f (q)q̇ , e indichiamo con V (q) = − f (q)dq, (2.29) una qualsiasi primitiva, cambiata di segno, della funzione f (q). In particolare, la (2.27) potrà essere scritta come q̈ = − dV (q) = f (q) . dq (2.30) La funzione V (q) è usualmente detta energia potenziale, anche se, a questo livello, non c’è corrispondenza fra l’equazione (2.30) ed un reale sistema fisico. Nel primo membro della (2.28) riconosciamo la derivata rispetto al tempo della funzione q̇ 2 /2. Il secondo membro è anch’esso una derivata rispetto al tempo, infatti dV (q) dq d dq dV (q (t)) =− =− − f (q)dq = f (q)q̇. − dt dq dt dq dt Possiamo quindi riscrivere la (2.28) come d q̇ 2 + V (q) = 0, dt 2 e dunque ottenere q̇ 2 = E − V (q) , 2 (2.31) dove abbiamo indicato con E il valore, arbitrario, della costante di integrazione8, che viene determinato in base alle condizioni iniziali. In genere la costante E viene detta energia meccanica. L’equazione (2.31) può essere risolta rispetto a q̇ (purché V (q) ≤ E). Supponiamo quindi di avere assegnato, per l’equazione differenziale originaria (2.27), condizioni iniziali con q(t0 ) = q0 e q̇(t0 ) = v0 > 0 (aver fissato positivo il segno di v0 non 8 Il fatto che si siano usate le lettere V ed E dovrebbe richiamare alla mente la conservazione dell’energia totale del sistema E = q̇ 2 2 + V (q). Infatti, talvolta il termine q̇ 2 2 è detto energia cinetica. 42 LEZIONI DI SISTEMI DINAMICI pregiudica la generalità di quanto segue). Possiamo quindi calcolare esplicitamente la costante di integrazione E E= v2 q̇ 2 (t0 ) + V (q0 ) = 0 + V (q0 ), 2 2 e quindi risolvere algebricamente la (2.31) ottenendo9 q̇ = 2(E − V (q)) , =⇒ q̇ 2(E − V (q)) = 1, (2.32) che è un’equazione del tipo (2.12) e quindi può essere risolta per separazione delle variabili q(t) dη t − t0 = . (2.33) 2(E − V (η)) q0 Per determinare esplicitamente la soluzione q (t), si deve risolvere l’integrale in (2.33) ed esplicitare la funzione di q(t) ottenuta dall’integrazione. Questo procedimento può scontrarsi (molto spesso) con l’impossibilità di esprimere l’integrale a secondo membro della (2.33) in termini di funzioni elementari. Questo accade, per esempio, per il moto del pendolo semplice10 . Infatti in questo caso abbiamo l’equazione di moto è θ̈ + g sin θ = 0, l (2.34) la cui soluzione, espressa nella forma (2.33), è t − t0 = θ(t) θ0 dη . g 2 η 2 E − 2 sin l 2 (2.35) Questo integrale però non può essere esplicitato tramite una combinazione finita di funzioni elementari11. Torneremo sul moto del pendolo nell’esempio 2.6.3. Anche nel caso che il processo di integrazione e inversione possa essere portato a termine, resta il fatto che non sempre un’espressione esplicita della soluzione è particolarmente facile da “decifrare”, ovvero resta il problema di capire come effettivamente si comporti la soluzione descritta da tale espressione analitica. Esempio 2.6.1 Consideriamo un punto materiale P di massa m vincolato a scorrere senza attrito lungo una retta. P è collegato tramite una molla di costante elastica k (avete massa e lunghezza a riposo trascurabili) ad un punto fisso O della retta. Se q (t) denota l’ascissa di P lungo la retta (O è l’origine), l’equazione di moto è mq̈ = −kq, 9 Avendo =⇒ q̈ = −ω 2 q, con ω 2 = k , pulsazione. m (2.36) assunto vo > 0, cioè velocità iniziale positiva, si deve considerare la radice positiva. posizione del pendolo è univocamente determinata dall’angolo (orientato) θ che il pendolo forma con la verticale. 11 Le funzioni che provengono da integrali del tipo di quello che compare nella (2.35) sono dette funzioni ellittiche. 10 La EQUAZIONI DIFFERENZIALI 43 Tale sistema è detto oscillatore armonico, e la (2.36) è l’equazione caratteristica. Ricordando la (2.29) introduciamo la funzione V (q) 2 ω2 2 q , V (q) = − −ω q dq = 2 da cui q̇ 2 ω2 2 ω2 2 + q = E, =⇒ q̇ 2 = 2 E − q . (2.37) 2 2 2 Si osserva dunque che, a meno di considerare la soluzione banale q (t) ≡ 0, l’energia E è sicuramente si determina sulla base delle condizioni ini positiva. Quest’ultima ziali: E = 1/2 q̇ 2 (t0 ) + ω 2 q 2 (t0 ) , se t0 è l’istante iniziale. Procedendo come nella (2.33) si ottiene t − t0 = Siccome q(t) q0 1 = 2 2 ω 2E − ω η dη q q0 dη . √ 2 2E − η2 ω η dη , otteniamo = arcsin a a2 − η 2 q (t) q0 arcsin √ − arcsin √ = ω (t − t0 ) . 2E/ω 2E/ω Possiamo quindi concludere che la forma generale della soluzione dell’equazione dell’oscillatore armonico è q (t) = A sin (ωt + φ) , (2.38) dove A e φ dipendono dalle condizioni iniziali mentre ω, definita nella (2.36), dipende dalle caratteristiche fisiche del sistema. In particolare, la soluzione è periodica di periodo T = 2π/ω. Osserviamo infine che la soluzione (2.38) si può anche ottenere con altri metodi (si rimanda all’esempio 2.10.4). 2.6.1 Analisi qualitativa nel caso conservativo Molte informazioni sulla soluzione possono essere ottenute tramite una “analisi qualitativa”, che prescinde dal calcolo esplicito della soluzione stessa. Cominciamo dal caso conservativo, ovvero da un’equazione nella forma (2.27). In questo caso abbiamo detto che le soluzioni dell’equazione sono tali che, al variare di t la quantità q̇ 2 + V (q) , (2.39) 2 resta costante, o, come si dice, è un integrale primo dell’equazione differenziale12. Abbiamo quindi q̇ 2 = 2[E − V (q)] , (2.40) 12 Data un’equazione differenziale q̈ = f (q̇, q, t), una funzione g(q̇, q, t) delle variabili q̇, q e t tale che = 0, per ogni funzione q(t) soluzione dell’equazione differenziale, si dice un integrale dg(q̇(t),q(t),t) dt primo. 44 LEZIONI DI SISTEMI DINAMICI Figura 2.1: Grafico della funzione energia potenziale e livelli dell’energia. z z=E (3) z=E (2) z=V(q) z=E (2) (1) qM qm q dove E è un numero che viene fissato dalle condizioni iniziali. Poiché il primo membro della (2.40) è non negativo, il moto si dovrà svolgere in un intervallo dell’asse delle q dove è soddisfatta la disuguaglianza V (q) ≤ E . (2.41) In effetti l’insieme delle soluzioni di (2.41) può essere formato da più intervalli disgiunti13 : per continuità il moto potrà svolgersi solo su una componente connessa di questo insieme. Quindi, dati V (q) ed E, possiamo avere questi casi: 1. il moto si svolge in un intervallo limitato [qm , qM ], e può essere: a. periodico; b. aperiodico, ovvero di “periodo” infinito; 2. punti di equilibrio, ovvero q (t) = costante è soluzione; 3. il moto si svolge in un intervallo illimitato della forma [qM , +∞) (oppure del tipo (−∞, qm ]) o su tutta la retta reale; 4. il moto corrisponde ad una separatrice. Caso 1.a. Moto limitato e periodico Nel primo caso abbiamo un moto limitato tra due valori, uno minimo qm e uno massimo qM , dove qm e qM sono le intersezioni del grafico z = V (q) con la retta z = E, come mostrato in figura 2.1, ovvero le soluzioni di V (q) = E. Vogliamo mostrare che in questo caso il moto è periodico e il periodo è determinato da qM dη T =2 , (2.42) 2(E − V (η)) qm 13 Per essere precisi gli intervalli disgiunti sono gli intervalli aperti delle soluzioni della disuguaglianza stretta. EQUAZIONI DIFFERENZIALI 45 se le due radici qm e qM dell’equazione V (q) = E sono semplici. Con il termine radice semplice intendiamo che la funzione (2.43) F (q) = 2(E − V (q)) ≥ 0, può essere scritta come: · F (q) = (qM − q) Φ (q), con Φ (q) ≥ α > 0, per q in un intorno di qM ; · F (q) = (q − qm ) Ψ (q), con Ψ (q) ≥ β > 0, per q in un intorno di qm . Supponiamo che a un certo istante (che possiamo prendere, senza perdere in generalità, come t = 0) il sistema si trovi nel punto q0 ∈ (qm , qM ). Essendo fissato il valore dell’energia E, il modulo della velocità |v0 | = |q̇ (0) | è determinato dalla (2.32). Ancora senza perdere di generalità possiamo assumere che v0 > 0. Il sistema si muoverà quindi verso il punto qM ; quando sarà sufficientemente vicino a qM la sua velocità comincerà a decrescere verso zero. Infatti, quando q → qM , si ha che (E − V (q)) → 0 e quindi, dalla (2.40) si deduce che q̇ → 0. Mostriamo che il sistema raggiunge il punto qM in un tempo finito. Il tempo necessario per “raggiungere” qM si ricava dalla14 (2.33) qM qM dη dη tM = = . (2.44) 2(E − V (η)) (2.43) q0 F (η) q0 Ora la funzione integranda diverge in qM , e quindi l’integrale potrebbe divergere, cosa che implicherebbe tM → ∞. Ma la convergenza dell’integrale è garantita dal fatto che qM è una radice semplice. Possiamo quindi scrivere15 qM qM qM dη dη dη 1 tM = < ∞. = ≤√ α q0 F (η) (qM − η) Φ (η) (qM − η) q0 q0 integrale convergente Il sistema quindi impiega un tempo finito per raggiungere qM . Per t = tM , abbiamo q (tM ) = qM , e q̇ (tM ) = 0. Il sistema giunge con velocità nulla in qM , dove il moto si inverte. Infatti, ricordando la (2.30) e la (2.43) abbiamo dV (q) 1 dF (q) 1 d q̈ (tM ) = − ((q = = − q) Φ (q)) M dq qM 2 dq qM 2 dq qM = 1 1 α [(qM − q) Φ′ (q) − Φ (q)]qM = − Φ (qM ) ≤ − < 0, 2 2 2 che appunto significa inversione del moto. Quindi il sistema “riparte” dalla posizione q = qM , muovendosi questa volta verso qm . La procedura si ripete per il percorso che va da q0 verso qm , e quindi otteniamo la (2.42) come formula per il tempo T impiegato 14 Si ricordi che abbiamo assunto t0 = 0. che l’integrale qqoM √qdη−η , è convergente, infatti 15 Osserviamo M qM qo dη = √ qM − η 0 qM −q0 √ ds √ = 2 qM − q0 . s 46 LEZIONI DI SISTEMI DINAMICI Figura 2.2: Moto aperiodico. V(q) qm qM q dalla soluzione per ritornare al punto di partenza. Poiché l’equazione è autonoma, le soluzioni sono invarianti per traslazioni temporali16 , ovvero la soluzione che parte da q0 con velocità v0 al tempo t = T , è ottenuta per traslazione da quella che, al tempo t = 0, partiva da q0 con la stessa velocità vo : in altri termini q(t) = q(t − T ). Ne segue che il moto è periodico. Il periodo T , ad eccezione di particolari forme di V (q) (che verranno studiate nella sezione 2.9), dipende da E. Ma poiché quest’ultimo è definito dalla posizione e velocità iniziali, avremo che T , in generale, dipende dalle condizioni iniziali. Caso 1.b. Moto aperiodico Consideriamo la figura 2.2, in cui la condizione iniziale q0 appartiene al solito intervallo limitato a sinistra da qm e a destra da qM . La soluzione q(t) non è periodica. Questo caso è caratterizzato dal fatto che un valore di energia E = V (qM ) corrispondente a un massimo relativo isolato qM . Di conseguenza qM è almeno radice doppia dell’equazione V (q) = E. Quindi, ricordando la (2.43), per q in un intorno di qM scriveremo 2 F (q) = (qM − q) Ξ (q) , con Ξ (q) ≥ 0. Vediamo qual’è il comportamento della soluzione quando q si avvicina al valore qM . Per fissare le idee supponiamo di aver scelto come condizioni iniziali, al tempo t = 0, q0 < qM e v0 > 0. Possiamo scrivere quindi la soluzione corrispondente usando la formula implicita (2.33). In particolare, sfruttando la (2.44), possiamo determinare 16 Se q(t) è soluzione di q̈ = f (q), è facile verificare che anche q(t − T ) è soluzione. EQUAZIONI DIFFERENZIALI 47 il tempo tM impiegato per “raggiungere” qM . Si ottiene17 tM = qM q0 qM dη dη 1 ≥ √ 2 max Ξ q0 qM − η (qM − η) Ξ (η) = +∞. integrale divergente Ne segue che la soluzione q (t), pur essendo monotona crescente, non raggiunge mai la posizione qM . Alla stessa conclusione saremmo arrivati se avessimo considerato v0 < 0. In questo caso la soluzione avrebbe impiegato un tempo finito per raggiungere qm (supponendo quest’ultima una radice semplice) e ritornare nella posizione q0 con velocità positiva. Dopo di che si ripete la procedura appena descritta, deducendo che la soluzione impiega un tempo infinito per giungere sino a qM . Il moto però non è monotono siccome avviene un’inversione in corrispondenza di qm . Il moto che abbiamo appena descritto verrà ripreso anche nel Caso 4, dove tratteremo il caso generale del moto lungo le separatrici. Caso 2. I punti di equilibrio I valori estremi di E che corrispondono ai valori di minimo o massimo relativo della funzione V (q) generano delle soluzioni di equilibrio ovvero delle soluzioni che sono funzioni costanti del tempo. Riferendoci alla figura 2.3 e ricordando la (2.30) abbiamo dV che q (t) = qe = costante, è soluzione dell’equazione di moto se = 0. Infatti dq qe in questo caso al sistema competono velocità e accelerazione nulle, e quindi il sistema resta fermo nel punto di estremo qe . Se poi il punto di minimo qe , è un minimo isolato (ovvero esiste un intorno q1 < qe < q2 in cui V (q) > V (qe ) per q �= qe ) allora la posizione di equilibro è stabile: ogni moto che parte “ sufficientemente vicino” a qe e con velocità “sufficientemente piccola” resta “vicino” a qe per ogni tempo t (approfondiremo questo concetto nella sezione 2.8). Questo fatto è di immediata verifica osservando che, se il moto si trova a un certo istante in un punto q0 vicino a qe , ed ha velocità v0 piccola in modulo, al valore di energia E1 = 12 v02 + V (q0 ) corrisponde un intervallo E1 ≥ V (q) che è un intorno “piccolo” di qe . Possiamo quindi concludere che il moto periodico descritto nel Caso 1.a avviene soltanto in un intorno di un punto di minimo di V (qe ), ovvero di un punto di stabilità. I massimi relativi della funzione V (q) corrispondono ancora a posizioni di equilidV brio: infatti ha ancora = 0. In questo caso però, per quanto si considerino condq qe dizioni iniziali (q0 , v0 ) “vicine” a (qe , 0), le corrispondenti soluzioni che non restano “vicine” a (qe , 0). In tal caso parleremo di equilibrio instabile. 17 L’integrale qM q0 dη qM −η qM qo è divergente. Infatti dη = qM − η 0 qM −q0 (qM − q0 ) ds = lim ln = +∞. s→0 s s 48 LEZIONI DI SISTEMI DINAMICI Figura 2.3: Punti di equilibrio e separatrici. V(q) (1) separatrice separatrice (1) (1) (2) q _ q qe q^ Caso 3. Moto illimitato Considerando la figura 2.1, questo caso corrisponde alle rette orizzontali (2) e (3). L’insieme delle q che soddisfano la (2.41) o è tutto l’asse reale (retta (3) della figura 2.1) o comunque è un intervallo illimitato a destra o a sinistra (retta (2) della figura 2.1). Nel primo caso q̇ non si annulla mai e quindi a seconda della velocità iniziale il moto si svolge nel verso delle q positive oppure nel verso di quelle negative: la soluzione q (t) è strettamente monotona. Nel secondo caso esistono valori di q (le intersezioni fra V (q) e la retta E) in cui q̇ si annulla. Tali intersezioni corrispondono comunque a radici semplici dell’equazione E = V (q), e pertanto, se la v0 (velocità iniziale) ha il segno “giusto”, possono venir raggiunte in un tempo finito. Per esempio, riferendoci alla retta (2) di figura 2.1, se q (0) = qm , e v0 > 0, la soluzione raggiunge in un tempo finito l’intersezione di sinistra fra la retta (2) e V (q), dopo di che il moto si inverte e si svolgerà nel verso delle q negative. Se viceversa avessimo avuto v0 < 0, allora q (t) decresce monotonamente senza mai invertire il moto. Per riassumere, in questo caso abbiamo che, comunque si scelgano le condizioni iniziali, limt→∞ q (t) = ±∞. In particolare, se V (q) è tale che V (q) −→ costante, allora la (2.40) comporta che anche q̇ −→ costante, quando t → ∞. |q|→∞ Caso 4. Le separatrici Volendo caratterizzare questo caso, possiamo dire che, a differenza del precedente, il moto è (o può essere) limitato (cioè |q| non tende all’infinito per t → ∞) ma non periodico. Il primo tipo di separatrice è quella descritta nel Caso 1.b, moto aperiodico, e trova rappresentazione nel segmento denotato con (2) di figura 2.3. In questo caso una EQUAZIONI DIFFERENZIALI 49 Figura 2.4: Punti di massimo relativo di V (q) con lo stesso valore dell’energia. z z=E separatrice z=V(q) q1 q2 q delle due radici di V (q) = E (o anche entrambe) corrisponde ad un massimo isolato di V (riferendoci alla figura 2.3, la radice corrispondente al massimo è q̄). La soluzione q (t), ancorché limitata, non è periodica in quanto impiega un tempo infinito per raggiungere l’estremo corrispondente al massimo isolato. Il moto può essere monotono o meno (ovvero presentare un’inversione) a seconda della condizione iniziale sulla velocità. Il secondo tipo di separatrice è quello che si ha in corrispondenza delle semirette indicate con (1) in figura 2.3. In tal caso si considerano gli intervalli illimitati (−∞, q̄), (−∞, q̂) oppure (q̂, +∞). Quindi se q0 ∈ (−∞, q̄) oppure q0 ∈ (−∞, q̂), e la velocità iniziale v0 è positiva, la soluzione q (t) è monotona crescente ma impiega un tempo infinito per raggiungere q̄, oppure q̂. In ogni caso il moto è limitato: q0 ≤ q (t) < q̄, con limt→∞ q (t) = q̄; oppure q0 ≤ q (t) < q̂, con limt→∞ q (t) = q̂. In altri termini, abbiamo a che fare con un moto del tutto analogo a quello, privo d’inversioni, descritto nel Caso 1.b. Viceversa v0 è negativa, q (t) è monotona decrescente e limt→∞ q (t) = −∞ (se ovviamente V (q) > V (q̄), per ogni q < q̄). Se q0 ∈ (q̂, ∞), e v0 < 0, allora q (t) è monotona decrescente limt→∞ q (t) = q̂. Se invece v0 > 0, allora q (t) si allontana indefinitamente da q̂ (ammesso che V (q) > V (q̂), ∀ q > q̂). Soluzioni limitate e monotone con limt→∞ q(t) = q̂1 , oppure con limt→∞ q(t) = q̂2 , si hanno quando q̂1 e q̂2 sono due punti di massimo relativo per i quali V (q̂1 ) = V (q̂2 ), vedi figura 2.4. In questo particolare caso abbiamo un moto aperiodico privo d’inversioni indipendentemente dalla velocità iniziale. Esempio 2.6.2 Calcoliamo il periodo dell’oscillatore armonico. Ricordando l’esemω2 2 q , per cui, per E > 0, l’intervallo [qm , qM ] corpio 2.6.1, abbiamo V (q) = 2 √ √ 2E 2E , (si veda la figura 2.5). Dalla (2.42) rispondente a V (q) ≤ E, è − ω ω 50 LEZIONI DI SISTEMI DINAMICI Figura 2.5: V (q) nel caso dell’oscillatore armonico e nel caso del pendolo. V (q ) = OSCILLATORE ARMONICO ω2 2 q2 E − 2E 2E ω ω PENDOLO q V (θ ) = ω 2 (1 − cosθ ) E θ m = −θ M θ θM otteniamo18 √ 2E ω T = 2 − = 4 ω √ √ 2E ω dq =4 ω2 2 q 2 E− 2 √ 2E ω √ dq 2 2E ω 0 − q2 2E ω 0 dq 2E − ω 2 q 2 √ω2E q 2π 4 arcsin √ . = = 2E ω ω ω 0 Notiamo che T non dipende da E, e quindi è indipendente dalle condizioni iniziali19 . Osserviamo che q = 0 è un minimo assoluto, isolato, per l’energia potenziale, e quindi è un equilibrio stabile. Notiamo inoltre che ω = V ′′ (0). Esempio 2.6.3 Calcoliamo il periodo del pendolo semplice. Ricordando la (2.34), calcoliamo V (θ) trovando una primitiva qualsiasi di −ω 2 sin θ, dove ω 2 = g/l. Abbiamo θ 2 ′ θ ′ 2 2 2 V (θ) = − . −ω sin θ dθ = ω (1 − cos θ) = 2ω sin 2 0 18 dx a2 −x2 √ 19 Questo = arcsin x a . fatto è ovvio se si guarda la forma della soluzione generale (2.38); è importante notare però che il risultato è stato ottenuto senza risolvere l’equazione . EQUAZIONI DIFFERENZIALI 51 e di conseguenza, se 0 ≤ E < 2ω 2 , il periodo è T =2 θM dθ , θ 2 2 2 E − 2ω sin 2 −θM (2.45) θ = E. La costante E, che corrispondove θM ∈ [0, π], è la soluzione di 2ω sin 2 de all’energia cinetica più potenziale della massa unitaria, si calcola in base ai dati iniziali θ̇2 (0) θ̇2 (0) θ (0) E= + V (0) = + 2ω 2 sin2 . 2 2 2 2 2 Quindi supponendo θ̇ (0) = 0, il pendolo parte da fermo, e θ (0) = θ0 , abbiamo E = 2ω 2 sin2 θ20 . Quindi l’intervallo, centrato nell’origine, corrispondente a V (θ) ≤ E, è [−θ0 , θ0 ]. Possiamo quindi riscrivere la (2.45) come T = 2 θ0 −θ0 = 2 ω dθ θ0 θ − 2ω 2 sin2 2 2ω 2 sin2 2 2 θ0 0 sin θo 2 dθ 1− sin2 θ 2 2 θ0 sin 2 . Ponendo β = sin θ2o < 1, ed operando il cambio di variabile y = che implica 1 cos dy = 2β sin θ2 sin θ2o = 1 sin β θ , 2 θ 1 1 θ dθ = dθ = 1 − sin2 1 − β 2 y 2 dθ, 2 2β 2 2β otteniamo la seguente espressione per il periodo T = Siccome βy = sin 4 ω 0 1 dy . 2 1 − y 1 − β2 y2 θ < 1, possiamo sviluppare in serie di Taylor 1/ 1 − β 2 y 2 , 2 1 3 β2 y2 + β 4 y 4 + ..... , =1+ 2 8 1 − β2 y2 52 LEZIONI DI SISTEMI DINAMICI ottenendo così T = = 4 ω 4 ω 1 0 0 1 3 β2y2 + β 4 y 4 + ..... dy 1+ 2 8 1 dy β2y2 2 dy + .... + ω 0 1 − y2 1 − y2 1 1 − y2 β 2 π/4 π/2 β2 2π 1+ + ..... . ω 4 Ricordando che ω = g/l, e che β = sin (θ0 /2), abbiamo 1 θ0 l 1 + sin2 + ..... , T = 2π g 4 2 = che mette in luce la ben nota non isocronia del pendolo: il periodo del pendolo, a differenza di quello dell’oscillatore armonico, dipende dal punto di partenza. E’ evidente che se θ0 ≪ 1, ovvero se il pendolo viene lasciato andare da una posizione prossima alla verticale, allora possiamo trascurare sin2 θ20 , e gli ordini superiori giungendo l . all’espressione “classica” T ≈ 2π g Osservando la figura 2.5, possiamo dedurre le seguenti proprietà qualitative del moto: (i) se 0 ≤ E < 2ω 2 , abbiamo un moto periodico e limitato (di cui abbiamo calcolato il periodo); (ii) se E = 2ω 2 abbiamo la separatrice, un moto limitato ma aperiodico; (iii) se E > 2ω 2 , il moto è illimitato. In tal caso l’energia iniziale E è “sufficiente” per far ruotare il pendolo intorno al proprio asse. Il caso (ii) corrisponde, per esempio, al caso limite in cui il pendolo parte praticamente dalla posizione verticale superiore ed impiega un tempo infinito per ritornarvici. Esempio 2.6.4 Analizziamo qualitativamente le soluzioni nel caso in cui V (q) = Vo e−2q − 2e−q , Vo > 0. (2.46) Il grafico di V (q) è riportato nella figura 2.6. Notiamo subito che E < −Vo , non è ammissibile. Per E = −Vo abbiamo un punto di equilibrio stabile, corrispondente a q = 0, mentre per −Vo < E < 0, abbiamo soluzioni periodiche limitate. E = 0, dà luogo alla separatrice, che corrisponde ad un moto illimitato ma anche aperiodico, mentre per E > 0 abbiamo moti illimitati. Calcoliamo adesso il periodo delle oscillazioni supponendo E = −βVo , con β ∈ (0, 1). Dobbiamo determinare le intersezioni di V (q) con la retta −βVo , −βVo = Vo e−2q − 2e−q . Posto ξ = eq , abbiamo questa equazione da risolvere ξ2 − 1 2 ξ+ =0 β β (2.47) EQUAZIONI DIFFERENZIALI 53 Figura 2.6: Grafico di V (q), dato dalla 2.46. V(q) q -V0 le cui soluzioni sono  √ 1+ 1−β    ξ , =   + β √   1− 1−β    ξ− = , β =⇒  √ � � 1+ 1−β   q , = ln  +   β √ � �   1− 1−β    q− = ln . β Ricordando che |E| = βVo , il periodo è dunque T =2 � q+ q− dq 2 � = � 2 [−βVo − Vo (e−2q − 2e−q )] 2 |E| � q+ q− � dq 2e−q e−2q + −1 − β β Ponendo adesso ξ = eq , e tenendo presente la (2.47), l’integrale si trasforma in 2 T =� 2 |E| � ξ+ ξ− 2π cioè T = � . 2 |E| � ξ+ dξ dξ 2 � � � � = , � 2 |E| (ξ − ξ) (ξ − ξ− ) ξ− + 1 2ξ �� + − ξ2 − β β π (integrale notevole) . 54 LEZIONI DI SISTEMI DINAMICI 2.6.2 Periodo delle oscillazioni in vicinanza di punti di equilibrio stabile Supponiamo che V (q) abbia un minimo isolato in q = qe , che per quanto accennato nel caso 2 della sezione 2.6.1, è un punto di equilibrio stabile (la definizione rigorosa di punto di equilibrio stabile sarà illustrata nel paragrafo 2.8). Il periodo di oscillazione delle soluzioni attorno ad un minimo qe di V (q), dipende, in generale, dal valore di E (e quindi dalle condizioni iniziali). Tuttavia, se E, benché maggiore di V (qe ), è “vicino” a V (qe ), è possibile trovare un’espressione approssimata del periodo (che sarà tanto più esatta quanto più E − V (qe ) è “piccolo”) indipendente da E. Considerando un intorno di qe , si approssima V (q) con il suo sviluppo di Taylor (limitato al secondo ordine) 1 V (q) ≈ V (qe ) + V ′ (qe ) (q − qe ) + V ′′ (qe ) (q − qe )2 , � �� 2 (2.48) =0 dove V ′′ (qe ) > 0 (si ricordi che qe è un minimo isolato). Gli estremi dell’intervallo dove si svolge il moto sono dati da  �  2 (E − V (qe ))   qm = qe − ,    V ′′ (qe )  1 ′′ 2 V (qe ) + V (qe ) (q − qe ) = E, =⇒ �  2   2 (E − V (qe ))    .  qM = qe + V ′′ (q ) e Quindi, introducendo ξ = q − qe , si ha la seguente espressione approssimata di T T ≈ 2 − = 2(E−V (qe )) V ′′ (qe ) � 2(E−V (qe )) V ′′ (qe ) 2 � V ′′ (qe ) Da cui, ricordando che �a −a − 2(E−V (qe )) V ′′ (qe ) √ dx a2 −x2 dξ � � � 1 2 E − V (qe ) − V ′′ (qe ) ξ 2 2 � 2(E−V (qe )) V ′′ (qe ) = arcsin � dξ . 2 (E − V (qe )) − ξ2 V ′′ (qe ) � x ��a � a −a = π, ricaviamo 2π . T ≈� V ′′ (qe ) (2.49) Quando E → V (qe ) (livello di energia della posizione di equilibrio) il periodo (approssimato) delle piccole oscillazioni non dipende da E, ma soltanto da V ′′ (qe ). In pratica, ricordando l’esempio 2.6.2, la (2.49) altro non è che il periodo di un oscillatore armonico in cui ω = V ′′ (qe ). EQUAZIONI DIFFERENZIALI 55 2.6.3 Generalizzazione del caso conservativo In questa sezione vogliamo considerare una forma più generale dell’equazione (2.27), analizzando le equazioni del tipo a (q) q̈ + a′ (q) 2 q̇ = f (q) , 2 (2.50) da (q) . Introduciamo, al dq solito, l’energia potenziale V (q) tramite la (2.29), la (2.50) potrà essere riscritta come dove a (q) è una funzione strettamente positiva, e a′ (q) = a (q) q̈ + a′ (q) 2 q̇ = −V ′ (q) , 2 (2.51) dV (q) . Procedendo come nella sezione 2.6, se moltiplichiamo la dq (2.51) per q̇, è immediato verificare che d a (q) 2 a (q) 2 q̇ + V (q) = 0, =⇒ q̇ + V (q) = E, (2.52) dt 2 2 essendo V ′ (q) = dove, al solito, l’energia E è specificata dalle condizioni iniziali q (0), e q̇ (0). Il tera (q) 2 q̇ è detto energia cinetica e viene usualmente indicato con T . Tuttavia, mine 2 a (q) 2 q̇ , al fine di evitare confusione di limitatamente a questa sezione, poniamo E = 2 simboli. Anche in questo caso il moto potrà svolgersi solo in una componente connessa di V (q) ≤ E, e la (2.33) diventa q(t) a (η) t − t0 = dη . 2(E − V (η)) q0 L’analisi effettuata per il caso a = 1, sulla periodicità o aperiodicità del moto può essere ripetuta in maniera analoga. Come vedremo nella sezione 2.8, i punti di equilibrio stabile dell’equazione (2.51) risultano essere sempre i minimi isolati di V (q). Vediamo allora come si generalizza a (q) 2 la formula (2.49) nel caso in cui l’energia cinetica sia q̇ . Se introduciamo ξ = 2 ˙ q − qe , abbiamo ξ = q̇, e sviluppando l’energia cinetica in un intorno di qe , cioè di ξ = 0, abbiamo 1 1 ′′ ′ 2 ˙2 a (qe ) + a (qe ) ξ + a (qe ) ξ ξ . E≈ 2 2 · Ora se vogliamo un’approssimazione limitata ai termini quadratici in ξ, e ξ, come si dice un’approssimazione al secondo ordine, otteniamo E≈ 1 a (qe ) ξ˙2 . 2 56 LEZIONI DI SISTEMI DINAMICI Di conseguenza, ricordando la (2.48), la riscrittura approssimata della (2.52) è 1 1 a (qe ) ξ̇ 2 + V ′′ (qe ) ξ 2 = E − V (qe ) , 2 2 che è esattamente la (2.37) dell’oscillatore armonico, se poniamo ω2 = V ′′ (qe ) , a (qe ) E − V (qe ) è l’energia meccanica. Pertanto, siccome il periodo dell’oscillatore a (qe ) armonico è 2π/ω, abbiamo che il periodo (approssimato) delle piccole oscillazioni attorno a qe è � ed T ≈ 2π a (qe ) . V ′′ (qe ) 2.7 Il piano delle fasi Abbiamo già visto che ogni equazione differenziale scalare del secondo ordine, q̈ = f (q̇, q, t) può essere sempre trasformata in un sistema di due equazioni in due incognite, semplicemente definendo v = q̇ e quindi ponendo � q̇ = v, (2.53) v̇ = f (v, q, t) . La soluzione di (2.53) è ora una coppia di funzioni (q(t), v(t)). Possiamo rappresentare la soluzione tramite un punto che si muove in un piano cartesiano di ascissa q e ordinata v. Questa rappresentazione è particolarmente utile nel caso dei sistemi autonomi, il piano (q, v) così definito è detto piano delle fasi. � q̇ = v, (2.54) v̇ = f (v, q) . Definiamo orbita del sistema il luogo dei punti del piano {(q, v) | q = q(t), v = v(t), −∞ < t < +∞}, dove (q(t), v(t)) è una soluzione di (2.54). Poiché, in virtù del teorema di esistenza e unicità, nel caso di un sistema autonomo due soluzioni (q1 (t), v1 (t)) e (q2 (t), v2 (t)) che corrispondono alle stesse condizioni iniziali assunte a due istanti diversi, t1 e t2 (cioè (q1 (t1 ) = q0 , v1 (t1 ) = v0 ) e (q2 (t2 ) = q0 , v2 (t2 ) = v0 )) sono l’una la traslata temporale dell’altra, i.e. q1 (t) = q2 (t − (t2 − t1 )), v1 (t) = v2 (t − (t2 − t1 )), ne risulta che le orbite di queste due soluzioni coincidono, ovvero un punto (q, v) appartiene all’orbita della prima soluzione se e solo se appartiene all’orbita della seconda. Di conseguenza per ogni punto del piano delle fasi passa una e una sola orbita. Nella figura 2.7 abbiamo riportato un esempio delle orbite nel piano delle fasi dell’equazione (2.27), ovvero del sistema   q̇ = v, dV (q) .  v̇ = f (q) = − dq EQUAZIONI DIFFERENZIALI 57 V(q) E CORRISPONDENTE ALLA SEPARATRICE E CORRISPONDENTE ALLA SEPARATRICE q v q SEPARATRICE Figura 2.7: Orbite sul piano delle fasi. Le orbite corrispondono al V (q) rappresentato nella parte alta della figura. In questo caso la rappresentazione delle orbite sul piano delle fasi è agevole. Infatti, sfruttando la (2.40) abbiamo v = ± 2 (E − V (q)). Le curve che rappresentano le orbite (come mostrato nella parte inferiore della figura 2.7) sono simmetriche rispetto all’asse q e si ottengono tracciando schematicamente il grafico di v = 2 (E − V (q)), e poi di v = − 2 (E − V (q)). Quest’ultimo poi si ottiene semplicemente ribaltando il primo grafico rispetto all’as se q. Evidentemente il dominio dove disegnare il grafico v = 2 (E − V (q)), sarà individuato, una volta fissato E, da punti q che soddisfano V (q) ≤ E. Inoltre, l’andamento del grafico è facilmente rappresentabile in quanto v è, in prima approssimazione, “proporzionale” alla differenza fra V (q) ed E: maggiore è tale differenza maggiore sarà v. La rappresentazione delle orbite nel caso di equazioni del tipo (2.51) non è, in generale, fattibile senza l’ausilio di un programma di calcolo. Infatti la (2.52) comporta v=± 2 (E − V (q)) . a (q) Ora, mentre è facile determinare il dominio della funzione (è esattamente lo stesso procedimento di prima, V (q) ≤ E), non è assolutamente facile tracciare il grafico di v in funzione di q. In questo caso, infatti, non c’è più “proporzionalità” fra v e la differenza fra E e V (q), a causa del fattore 1/a (q). 58 LEZIONI DI SISTEMI DINAMICI 2.8 Punti di equilibrio, stabilità Un punto del piano delle fasi (qe , ve ) si dice punto di equilibrio per il sistema autonomo (2.54) se la coppia di funzioni q(t) = qe ∀ t, e v(t) = ve ∀ t, è soluzione del sistema (2.54). In virtù della forma del sistema (2.54), si ha immediatamente ve = 0, mentre qe deve essere una soluzione dell’equazione (non più differenziale) f (qe , 0) = 0. Talvolta qe viene anche detta configurazione di equilibrio. Come abbiamo visto nelle precedenti sezioni, nel caso dell’equazione q̈ = f (q) una configurazione di equilibrio qe è un punto di massimo e minimo relativo della funzione V (q), siccome f (q) = −V ′ (q). Abbiamo già osservato che i minimi (isolati) della V sono punti di equilibrio “stabile”. Vogliamo ora precisare questo concetto introducendo la definizione di stabilità secondo Lyapunov20 . La definizione si applica in generale ai punti di equilibrio di un sistema di n equazioni differenziali in n incognite, o equazione differenziale in Rn , e quindi la daremo direttamente in questo caso generale. Consideriamo adesso un sistema di equazioni differenziali autonomo ẋ = F (x) , (2.55) dove x : t → x(t) ∈ Rn è la funzione vettoriale incognita e F : x → F (x) ∈ Rn è una funzione da Rn in Rn . In seguito indicheremo con x(t; x0 , t0 ) la soluzione al tempo t che al tempo t0 occupava il punto x0 (in altri termini la soluzione del sistema (2.55) corrispondente ai dati iniziali x(t0 ) = x0 ). Definizione 2.8.1 Il punto xe ∈ Rn si dice punto, o configurazione, di equilibrio per il sistema autonomo (2.55), se la funzione x(t) ≡ xe , è soluzione del problema di Cauchy   ẋ = F (x) ,  x(t0 ) ≡ xe . E’ immediato constatare che i punti di equilibrio xe sono tutti e soli quelle n-uple che soddisfano il sistema di equazioni  F1 (x1 , ...., xn ) = 0,     F2 (x1 , ...., xn ) = 0, F (xe ) = 0 , ⇐⇒ (2.56) ..  .    Fn (x1 , ...., xn ) = 0. Definizione 2.8.2 Un punto di equilibrio xe si dice stabile se: per ogni t0 e per ogni r > 0, esiste un r0 > 0 tale che sia verificata la disuguaglianza �x(t; x0 , t0 ) − xe � < r , per ogni t > t0 e per tutti i dati iniziali x0 che soddisfano21 20 Aleksandr 21 Si �x0 − xe � < r0 . Mikhailovich Lyapunov, matematico russo, 1857-1918 noti la somiglianza tra questa definizione e la definizione “ε-δ” di limite. EQUAZIONI DIFFERENZIALI 59 Figura 2.8: Stabilità alla Lyapunov x2 x (t) xo xe x1 Il concetto di stabilità del punto xe è schematicamente rappresentato dalla figura 2.8. Il cerchio di raggio maggiore corrisponde alla circonferenza di raggio r. Fissato r, è possibile determinare r0 tale che, una qualunque orbita che “parte” da un punto all’interno della circonferenza r0 , rimane all’interno della circonferenza di raggio r. 2.8.1 Il criterio di Lyapunov Una condizione sufficiente per stabilire se una posizione di equilibrio è stabile è data dal seguente teorema, sempre dovuto a Lyapunov. Teorema 2.8.1 Se una posizione di equilibrio xe per il sistema (2.55), cioè xe è soluzione della (2.56), ammette una funzione di Lyapunov, allora è stabile. Ovviamente per dar senso al teorema bisogna dire cosa è una funzione di Lyapunov. Definizione 2.8.3 Una funzione Λ definita in un intorno Uxe del punto xe , si dice funzione di Lyapunov per il punto di equilibrio xe se: 1. Λ : Uxe → R è una funzione di classe C 1 ; 2. Λ(xe ) = 0 e Λ(x) > 0 per ogni x �= xe ; 3. ∇Λ(x) · F (x) ≤ 0 per ogni x ∈ Uxe . Questa definizione22 necessita di qualche commento. A parte la richiesta “tecnica” di regolarità, la condizione 2 ci dice che la funzione Λ ha un minimo isolato23 nel punto di equilibrio, mentre la terza condizione implica che la funzione Λ(x(t)), ottenuta 22 Con ∂Λ ∂Λ il simbolo ∇ si indica l’operatore gradiente, quindi ∇Λ(x) = ( ∂x , . . . , ∂x ). n 1 punto xe è un minimo isolato per una funzione f se esiste un intorno di U di xe tale che f (y) > f (xe ) per ogni y ∈ U , y �= xe . 23 Un 60 LEZIONI DI SISTEMI DINAMICI componendo Λ(x) con una soluzione x(t) di (2.55), è una funzione non crescente di t. Infatti d dx Λ(x(t)) = ∇Λ(x(t)) · = ∇Λ(x(t)) · F (x(t)) ≤ 0 . (2.57) dt dt Dim. Scegliamo24 un numero R > 0 e sia Bxe (R) la sfera, aperta, di centro xe e di raggio R. Sia inoltre λ = min∂Bxe (R) Λ(x) il valore minimo assunto dalla funzione Λ sul bordo questa sfera25 ; per le nostre ipotesi si ha λ > 0. Siccome Λ è di classe C 1 , esiste finito max �∇Λ (x)�, ed è sicuramente posix∈Bxe (R) tivo26 . Poniamo pertanto G= max x∈Bxe (R) �∇Λ (x)� > 0. Dunque, ∀ x ∈ Bxe (R), abbiamo Λ (x) = Λ (x) − Λ (xe ) ≤ G �x − xe � . (2.58) =0 λ R , , e l’intorno sferico di xe di raggio r, cioè Consideriamo adesso r < min 2G 2 27 Bxe (r). E’ chiaro che Bxe (r) ⊂ Bxe (R). Inoltre, in virtù della (2.58), ∀ x ∈ Bxe (r), cioè ∀ x tale che �x − xe � < r, abbiamo λ GR λ λ R , = min , ≤ . Λ (x) ≤ G �x − xe � < G r < G min 2G 2 2 2 2 In altri termini, abbiamo che Λ (x) < λ/2, ∀ x ∈ Bxe (r). Ora, la coppia R e r soddisfa le condizioni della definizione di equilibrio stabile secondo Lyapunov. Infatti se prendiamo una condizione iniziale x0 contenuta in Bxe (r), si ha che Λ(x(t; x0 , t0 )) ≤ Λ(x0 ) < λ/2, e quindi, ∀ t > t0 , il punto x(t; x0 , t0 ) deve appartenere a Bxe (r), e di conseguenza a Bxe (R). Se infatti la soluzione x(t; x0 , t0 ) uscisse da Bxe (R), 28 allora ad un certo istante t̂ la soluzione toccherebbe il bordo di Bxe (R), e quindi Λ x(t̂; x0 , t0 ) ≥ λ. Ma ciò contraddirebbe l’ipotesi di non crescenza della funzione Λ vista come funzione del tempo dal momento che si avrebbe Λ (x0 ) = Λ (t0 ) < Λ t̂ = Λ x(t̂; x0 , t0 ) . 2.8.2 Asintotica stabilità Se xe , oltre a essere un punto di equilibrio stabile, soddisfa la seguente condizione: esiste un intorno Uxe di xe tale che per ogni t0 e per ogni x0 ∈ Uxe si ha lim x(t; x0 , t0 ) = xe t→+∞ 24 R andrà scelto in modo che Bxe (R) ⊂ Uxe che il minimo esiste perché la funzione Λ è continua e perché ∂Bxe (R) è un compatto. 26 Se infatti max �∇Λ (x)� = 0, allora ∇Λ (x) ≡ 0, e cioè Λ (x) ≡ 0, ∀x ∈ Bxe (R), in x∈Bxe (R) palese contraddizione con l’ipotesi 2. 27 In particolare B xe (r) è separato dal bordo di Bxe (R). 28 Si ricordi che λ = min ∂Bxe (R) Λ(x). 25 Notiamo EQUAZIONI DIFFERENZIALI 61 la posizione si dice di equilibrio asintoticamente stabile. Anche in questo caso abbiamo un criterio sufficiente per l’asintotica stabilità; se nella terza condizione per la funzione di Lyapunov sostituiamo il segno ≤ con la disuguaglianza stretta <, che deve valere per tutti gli x con l’eccezione di xe (dove ovviamente abbiamo il segno = poiché sia F che ∇Λ si annullano), allora la posizione di equilibrio è asintoticamente stabile. Vediamo la dimostrazione di questa versione del criterio di Lyapunov. Per prima cosa osserviamo che xe è una posizione di equilibrio stabile: dalla stabilità segue che possiamo scegliere due costanti positive R e r0 in modo che tutte le soluzioni con dato iniziale in Bxe (r0 ) siano contenute in Bxe (R) per tutti tempi successivi al tempo iniziale. Sia x(t) una tale soluzione. Poiché Λ è una funzione di Lyapunov, la funzione del tempo Λ(x(t)) è una funzione decrescente e quindi esiste limt→∞ Λ(x(t)) = λ. Poiché Λ ≥ 0 in Bxe (R), avremo λ ≥ 0. Se λ = 0, allora necessariamente x(t) → xe , poiché è l’unico punto dove Λ = 0. Supponiamo invece che sia λ > 0. Se Bxe (δ) denota la sfera di centro xe e raggio δ, scegliamo δ in modo che Λ (x) < λ/2 per ogni29 x ∈ Bxe (δ). Ora per t sufficientemente grande, x(t) non può appartenere alla sfera Bxe (δ); ovvero, per t sufficientemente grande, x(t) ∈ Bxe (R)\Bxe (δ). Ma la derivata di Λ(x(t)) è strettamente negativa per la condizione ∇Λ(x)·F (x) < 0. Infatti, poiché ∇Λ(x)·F (x) è una funzione continua30 definita sul compatto Bxe (R)\Bxe (δ), per tutti i t sufficientemente grandi d Λ(x(t)) = ∇Λ(x (t)) · F (x (t)) ≤ max ∇Λ(x) · F (x) = C < 0. dt x∈Bxe (R)\Bxe (δ) Ma questo implica limt→∞ Λ(x(t)) = −∞, il che è assurdo poiché Λ(x(t)) ≥ 0. Un esempio di configurazione di equilibrio asintoticamente stabile verrà illustrato nella sezione 2.11. Un criterio sufficiente per l’asintotica stabilità è dato dal seguente teorema di Lyapunov sulla stabilità linearizzata: Teorema 2.8.2 Sia xe un punto di equilibrio per il sistema (2.55). Sia A la matrice delle derivate parziali delle componenti di F calcolate in xe , ovvero    A=  ∂F1 ∂x1 ∂F2 ∂x1 ∂F1 ∂x2 ∂F2 ∂x2 ··· ··· ∂F1 ∂xn ∂F2 ∂xn ∂Fn ∂x1 ∂Fn ∂x2 ··· ∂Fn ∂xn .. . .. . .. .    .  Se tutti gli autovalori di A hanno parte reale negativa, la posizione di equilibrio è asintoticamente stabile. Più precisamente esiste un numero positivo δ tale che per ogni x0 ∈ Bxe (δ) sia ha �x(t; t0 , x0 ) − xe � < a�x0 − xe �e−αt , con a e α costanti indipendenti da x0 . 29 Notiamo 30 Λ che la sfera Bxe (δ) esiste per la continuità di Λ. è di classe C 1 , e, ovviamente, F è continua 62 LEZIONI DI SISTEMI DINAMICI La dimostrazione di questo teorema è piuttosto complessa (ma non specialmente “difficile”) e viene omessa: si può trovare in molti testi sulle equazioni differenziali ordinarie31 . 2.8.3 Punti di equilibrio per sistemi conservativi: il criterio di Dirichlet Torniamo alla equazione q̈ = f (q), o meglio al sistema equivalente � q̇ = v, v̇ = f (q) . (2.59) In accordo con quanto detto nel paragrafo precedente, un punto di equilibrio è dato, nel piano (v, q), da (0, qe ), dove qe è tale che f (qe ) = 0, ovvero da V ′ (qe ) = 0, dove V (q) è l’energia potenziale definita dalla (2.29). Consideriamo la seguente funzione di v e q 1 Λ(q, v) = v 2 + V (q) − V (qe ) . (2.60) 2 A questo punto possiamo enunciare il seguente Criterio di Dirichlet: Una configurazione di equilibrio qe in cui si realizza un minimo isolato dell’energia potenziale è stabile secondo Lyapunov. La dimostrazione è elementare. Infatti è sufficiente far vedere che la funzione Λ(q, v) è una funzione di Lyapunov per il punto di equilibrio (0, qe ) (i dettagli della verifica sono lasciati per esercizio). Quello che abbiamo visto per un’equazione scalare può essere generalizzato al caso vettoriale. Supponiamo di avere un sistema di equazioni del tipo    q̈1 = f1 (q1 , . . . , qn ) ,   q̈2 = f2 (q1 , . . . , qn ) , ..  .    q̈n = fn (q1 , . . . , qn ) , che, scritto in forma compatta, acquista la forma q̈ = f (q) , (2.61) dove f : Rn → Rn , e dove q (t) : R → Rn è la funzione vettoriale incognita. Diremo che il sistema è conservativo se la funzione f è il gradiente di una funzione scalare −V (q), detta sempre energia potenziale. Ovvero   ∂V (q1 , . . . , qn )    −  1 f1 (q1 , . . . , qn )  ∂V (q ∂q  , . . . , q )   1 n  f2 (q1 , . . . , qn )   −     . ∂q 2 = f (q) = −∇V (q) , cioè    ..  ..    .  .   fn (q1 , . . . , qn )  ∂V (q , . . . , q )  1 n − ∂qn (2.62) 31 Si veda p.e. L.S. Pontrjagin “Ordinary differential equations”, Reading (Mass.), Addison-Wesley, 1962. EQUAZIONI DIFFERENZIALI 63 Anche in questo caso è facile dimostrare che la funzione scalare H(q, q̇) = 1 2 |q̇| + V (q), 2 è un integrale primo, ovvero che la sua derivata lungo la soluzioni è nulla dH = q̇ · q̈ + ∇V · q̇ = q̇ · (q̈ + ∇V ) = 0. dt q̈−f (q)=0 Come conseguenza possiamo enunciare il principio di Dirichlet anche per i sistemi conservativi multidimensionali: se il punto q e è un minimo isolato per la funzione V (q) allora (0, q e ) è un punto di equilibrio stabile. In questo caso la funzione di Lyapunov è Λ(q, v) = H(q, v) − V (q e ) = 1 2 |v| + V (q) − V (q e ) . 2 Riprenderemo questo argomento della sezione 5.9 dove studieremo la stabilità dei sistemi lagrangiani. 2.9 I potenziali isocroni Abbiamo visto nell’esempio 2.6.2 che le oscillazioni di un sistema soggetto a una energia potenziale quadratica ω2 V (q) = − q 2 , (2.63) 2 (oscillatore armonico) sono isocrone. Vogliamo ora dimostrare che (2.63) è, sostanzialmente, l’unica energia potenziale che possiede questa proprietà. In altri termini dimostriamo il seguente: Teorema 2.9.1 Se tutti i moti che si svolgono sotto l’azione di una energia potenziale V (q), simmetrica rispetto al suo minimo, sono periodici e isocroni, allora esistono k > 0, q0 e U0 tali che V (q) ha la forma V (q) = k (q − q0 )2 + V0 2 (2.64) Dim32 . La costante V0 è introdotta solo per ragioni di completezza e possiamo supporla nulla senza perdere di generalità. Analogamente, con un’ovvia traslazione delle coordinate, possiamo anche assumere che q0 = 0. In altri termini, possiamo quindi limitarci a considerare energie potenziali che soddisfino V (0) = 0 . (2.65) L’ipotesi di simmetria della V (q) significa che l’energia potenziale è una funzione pari, ovvero V (q) = V (−q) . (2.66) 32 La dimostrazione è ripresa, nelle sue linee generali, da G. Gallavotti, Meccanica Elementare, Boringheri, Torino 1980 64 LEZIONI DI SISTEMI DINAMICI (vedremo poi cosa cambia quando togliamo questa limitazione). Possiamo inoltre assumere che q dV (q) > 0 , ∀ q �= 0, dq (2.67) che implica che l’origine q = 0 è un punto di minimo isolato per l’energia potenziale, e inoltre che valga lim V (q) = +∞. (2.68) |q|→∞ Infatti, se così non fosse, il sistema ammetterebbe o orbite illimitate, o orbite limitate non periodiche (dimostrarlo). Fissiamo adesso E > 0 e denotiamo con q(E) la soluzione positiva di V (q) = E. Ne segue che, in virtù dell’ipotesi fatte, e in particolare della (2.66), il periodo del moto è dato da q(E) dq T (E) = 4 . (2.69) 2(E − V (q)) 0 La funzione V è una funzione crescente di q per q > 0, e quindi possiamo invertirla ⇔ v = V (q) , q = Q (v) . (2.70) Possiamo cambiare coordinate in (2.69) ponendo s = V (q), e quindi, sfruttando la (2.70), dq = Q′ (s) ds. Otteniamo T (E) = 4 0 E Q′ (s)ds . 2(E − s) (2.71) Notiamo che la funzione T (E) in (2.71) è ora definita come una “trasformata” della 1 funzione Q′ . A parte questa osservazione, moltiplichiamo la (2.71) per √ , ed v−E integriamo in E fra 0 e v v v E T (E) 1 Q′ (s) ds √ √ √ √ dE = 4 dE v−E v−E 2 E−s 0 0 0 T (E) = 4 √ 2 v 0 0 E Q′ (s) √ √ ds dE. v−E E−s (2.72) Riferendoci alla figura 2.9, possiamo valutare l’integrale doppio che appare nella (2.72) scambiando l’ordine di integrazione: integrando cioè prima in dE fra s e v, e poi in ds fra 0 e v. Otteniamo così v v v T (E) Q′ (s) 4 √ √ √ dE = √ dE ds v−E v−E E−s 2 0 0 s v v 4 dE ′ √ √ = √ ds. Q (s) v−E E−s 2 0 s EQUAZIONI DIFFERENZIALI 65 Figura 2.9: Integrale doppio. s s v E v  v (....) dE  ds ∫0  ∫s   E (....) ds  dE ∫0  ∫0  v v E v dE √ √ , è un integrale notevole e vale π per ogni v ed s. Abbiamo v−E E−s s quindi33 v T (E) 4π v ′ 4π √ dE = √ (2.75) Q (s)dv = √ Q (v) , v−E 2 0 2 0 dal momento che Q (0) = 0. Sfruttando adesso l’ipotesi che T (E) = T , ∀ E, ed il v dE √ = 2 v, abbiamo fatto che 0 √ v−E √ v 4π dE 2 √ √ T v. = √ Q (v) , =⇒ Q (v) = T 2π v−E 2 0 Ora √ 2 v Quindi ricordando che q = Q (v) è l’inversa di v = V (q), possiamo scrivere √ 2 √ 2π 2 q = Q (v) = T v, , =⇒ v = V (q) = 2 q 2 . 2π T (2.76) 33 La (2.75) è un caso particolare dell’equazione di Abel t ψ(τ )dτ φ(t) = (t − τ ) 0 la cui soluzione è data da ψ(t) = 1 π φ(0) + t1/2 0 t φ′ (τ )dτ (t − τ ) (2.73) si veda J.R. Cannon, The one-dimensional heat equation, Addison-Wesley, Menlo Park, CA, 1984. (2.74) 66 LEZIONI DI SISTEMI DINAMICI Possiamo ora vedere cosa succede se eliminiamo l’ipotesi (2.66). In questo caso V : R −→ [0, +∞), non è simmetrica rispetto all’origine e dunque porremo34  +  V (q) , se q ≥ 0, V (q) =  − V (q) , se q ≤ 0, con V + (0) = V − (0) = 0. Dato E > 0, Indichiamo con q + (E) la soluzione di V + (q) = E, mentre q − (E) denota la soluzione di V − (q) = E. Ovviamente q + (E) > 0, mentre q − (E) < 0. In generale, q + (E) �= |q − (E)|, dal momento che la V non è più simmetrica rispetto all’origine. Introduciamo anche le inverse di V + e V − , ponendo Q+ Q+ : [0, +∞) −→ [0, +∞), v −→ q = Q+ (v) > 0, Q− Q− : [0, +∞) −→ [0, −∞), v −→ q = Q− (v) < 0. Il periodo è dato da T (E) = 2 � q+ (E) q− (E) = 2 �� 0 q− (E) = 2 �� dq � 2(E − V (q)) dq � + 2(E − V − (q)) q+ (E) 0 che ci consente di scrivere dq � � − 2(E − V + (q)) q+ (E) 0 dq � 2(E − V + (q)) � |q− (E)| 0 ds � � � (2.77) , 2(E − V − (−s)) � � T (E) = 2 T + (E) − T − (E) , dove T + (E) = � 0 q+ (E) dq � , 2(E − V + (q)) T − (E) = � |q− (E)| 0 dq � . 2 (E − V − (−q)) Quindi, a parte il fattore 4, T + (E) e T − (E), altro non sono che la (2.69). Ora se imponiamo che né T + (E) né T − (E) dipendano da E, possiamo procedere esattamente come prima giungendo a √ 2√ + − Q (v) − Q (v) = v, (2.78) π Quindi abbiamo infinite energie potenziali non simmetriche isocrone, ma ciascuna di esse è ottenuta “deformando” un’energia della forma (2.76) in modo √ che, ∀ v > 0, la differenza fra Q+ (v) e Q− (v) si mantenga sempre proporzionale a v. 34 V + (q) e V − (q) sono comunque positive e strettamente monotone. EQUAZIONI DIFFERENZIALI 67 Figura 2.10: Grafico di Q+ (v) e Q− (v), dati dalla (2.79). Q+(v) q v Q- (v) Esempio 2.9.1 Se consideriamo √ v 2√ + , Q (v) = v− 2 2π v +1 √ v 2√ Q (v) = − , v− 2 2π v +1 − (2.79) i cui grafici sono riportati nella figura 2.10, abbiamo che la (2.78) è soddisfatta, ed inoltre sia Q+ che Q− sono due funzioni monotone e quindi invertibili. Invertendole otteniamo √ 2√ v + q = Q (v) = , v = V + (q) definita per q > 0, v− 2 2π v +1 √ 2√ v , v = V − (q) definita per q < 0, q = Q− (v) = − v− 2 2π v +1 da cui possiamo ricostruire V (q) 2.10 Sistemi lineari bidimensionali Per lo studio dei sistemi di equazioni differenziali autonome ẋ = F (x) è fondamentale la comprensione del caso lineare, cioè del caso in cui la funzione F (x) è una funzione lineare. Ci limiteremo al caso di sistemi bidimensionali, in quanto per essi è possibile scrivere delle formule generali per la soluzione ed è possibile visualizzare bene le soluzioni nel piano delle fasi. 68 LEZIONI DI SISTEMI DINAMICI Tuttavia il caso bidimensionale non è del tutto rappresentativo di cosa avviene per dimensioni superiori (già da d = 3). La principale ragione è di ordine topologico. Ricordiamo che per un sistema autonomo da ogni punto dello spazio delle fasi passa una e una sola orbita (in virtù del teorema di unicità e dell’invarianza temporale delle soluzioni). Questo implica che ogni orbita nel piano delle fasi (d = 2) divide il piano stesso stesso in due regioni (“dentro” e “fuori” per un orbita chiusa, “riva destra” e “riva sinistra” per una soluzione con orbita illimitata) che non possono essere connesse da una soluzione del sistema. Questo non è più vero già per d = 3. Vediamo ora come si trova la soluzione di un sistema di equazioni differenziali della forma ẋ = ax + by, (2.80) ẏ = cx + dy, che scriveremo in forma vettoriale (2.81) ẋ = Ax, dove A è la matrice A= e x il vettore x= a c b d . x y (2.82) , (2.83) Consideriamo adesso un cambiamento di variabili, dato dalla seguente trasformazione invertibile35 x (t) α β ξ (t) = , (2.84) y (t) γ δ η (t) dove α, β, γ e δ sono costanti. La (2.84) può essere anche scritta nella seguente forma compatta x (t) = Vξ (t) , ⇔ ξ (t) = V−1 x (t) . Siccome i coefficienti della matrice V sono indipendenti dal tempo ẋ = Vξ̇, ξ̇ = V−1 ẋ. ⇔ Quindi, moltiplicando a destra per V−1 entrambe i membri della (2.81) si ottiene −1 −1 −1 V−1 x= V−1 AV V−1 x , V ẋ = V Ax = V AV · ξ I ξ cioè ξ̇ = V−1 AV ξ . (2.85) Se adesso scegliamo opportunamente la matrice V, potremo, almeno in certi casi, fare in modo che V 35 L’invertibilità −1 AV = λ1 0 della (2.84) è garantita dal fatto che det 0 λ2 α γ β δ . = 0. EQUAZIONI DIFFERENZIALI 69 Se così fosse, il sistema (2.85) diventa   ξ̇ = λ1 ξ , la cui integrazione è immediata36    ξ = C1 eλ1 t ,  (2.86) η̇ = λ2 η , (2.87) η = C2 eλ2 t , dove C1 e C2 sono due opportune costanti di integrazione. Ora, il fatto che V−1 AV possa, o non possa, esser ricondotta ad una forma diagonale dipende dalla diagonalizzabilità, o meno, della matrice A. Quindi, se λ1 e λ2 sono i due autovalori di A, e se supponiamo, per il momento, che det A �= 0 (che implica37 λ1 λ2 �= 0), possiamo distinguere quattro casi: 1. la matrice A ha due autovalori reali distinti λ1 e λ2 ; 2. la matrice A ha due autovalori reali coincidenti λ1 = λ2 con molteplicità geometrica due; 3. la matrice A ha due autovalori reali coincidenti λ1 = λ2 con molteplicità geometrica uno; 4. la matrice A ha due autovalori complessi coniugati λ1 = α + iβ e λ2 = α − iβ. � � � xλ1 xλ2 , xλ2 = i due autovettori corrispondenti a λ1 Caso 1. Siano xλ1 = yλ1 yλ2 e λ2 . I due vettori xλ1 , xλ2 sono linearmente indipendenti38 e possiamo considerarli normalizzati. Introduciamo la matrice V, le cui colonne sono rispettivamente xλ1 e xλ2 � � � � xλ1 xλ2 , V = xλ1 xλ2 = yλ1 yλ2 � abbiamo det V �= 0, e quindi V−1 è ben definita. Non solo, ma è facile verificare che � � � � � � � � λ1 0 AV = Axλ1 Axλ2 = λ1 xλ1 λ2 xλ2 = xλ1 xλ2 , 0 λ2 36 Si veda l’esempio 2.4.1. sappiamo det A = λ1 λ2 . 38 Se x , x λ1 λ2 non fossero linearmente indipendenti potremmo supporre xλ1 = βxλ2 . Tuttavia Axλ1 = λ1 xλ1 , Axλ2 = λ2 xλ2 , comporta λ2 /λ1 = 1, che contraddice l’ipotesi λ1 �= λ2 . Infatti λ1 xλ1 = Axλ1 = βAxλ2 = βλ2 xλ2 , che confrontata con xλ1 = βxλ2 , implica λ2 λ2 xλ2 , =⇒ = 1. xλ1 = β λ1 λ1 37 Come =β Di conseguenza xλ1 , xλ2 sono linearmente indipendenti. 70 LEZIONI DI SISTEMI DINAMICI cioè AV = V e quindi V−1 AV = (2.88) λ1 0 −1 V V I 0 λ2 λ1 0 (2.88) , 0 λ2 . (2.89) Dunque le nuove variabili dipendenti ξ (t) e η (t) soddisfano il sistema (2.86), la cui soluzione è (2.87). In pratica il sistema (2.80) è stato disaccoppiato, in quanto l’equazione per ξ̇ dipende solo da ξ, e quella per η̇ solo da η. Per ritornare alle variabili x (t) e y (t) usiamo la (2.84), ottenendo C1 eλ1 t x (t) = xλ1 xλ2 , λ t y (t) C2 e 2 V x(t) ξ(t) che, scritta in forma più compatta, diventa x (t) = xλ1 C1 eλ1 t + xλ2 C2 eλ2 t . (2.90) E’ facile verificare che (2.90) fornisce, al variare delle costanti C1 e C2 , tutte le soluzioni dell’equazione (2.81). Per dimostrare ciò bisogna infatti far vedere che, per ogni condizione iniziale x0 , è possibile determinare le costanti C1 e C2 in modo che C1 xλ1 + C2 xλ2 = x0 . (2.91) Ma l’equazione (2.91) nelle incognite C1 e C2 si scrive anche così C1 = x0 , V C2 ed ha sempre una e una sola soluzione dal momento che det V �= 0. Caso 2. Adesso consideriamo il caso λ1 = λ2 = λ, a cui corrispondono due autovettori indipendenti x1 e x2 (che costituiscono la base dell’autospazio relativo a λ). Consideriamo adesso il generico vettore v = αx1 + βx2 , Av = A (αx1 + βx2 ) = λ (αx1 + βx2 ) . Ovvero, ∀ v ∈ R2 abbiamo Av = λv. Pertanto A = λI, la matrice A è un multiplo dell’identità. Il sistema (2.80) di fatto si scrive così ẋ = λx, x = x0 exp {λt} , =⇒ y = y0 exp {λt} . ẏ = λy, xλ l’unico (a meno di multipli reali) autovettore corriCaso 3. Sia xλ = yλ spondente λ = λ1 = λ2 . Supponiamo |xλ | = 1, e indichiamo con all’autovalore y1 ∈ R2 un vettore, di modulo unitario, cioè | y | = 1, ortogonale a xλ , y = y2 EQUAZIONI DIFFERENZIALI 71 xλ · y = 0. Quindi la coppia {xλ , y} costituiscono una base ortonormale di R2 . Al solito si introduce la matrice � � V = xλ y , (2.92) il cui determinante è ovviamente non nullo perché (xλ e y sono linearmente indipendenti). Introducendo � � � � xλ yλ , y T = y1 y2 , xT λ = è facile vedere che  V−1 =  xT λ yT   = xλ yλ y1 y2  . Infatti, eseguendo il prodotto righe per colonne, si ha     T  xλ · y xλ · xλ xλ � 1 � =  xλ y = V−1 V =  yT y·y xλ · y 0 0 1  . Si passa quindi alle variabili ξ (t), η (t) introducendo la solita trasformazione (2.84). Il sistema nelle nuove variabili è dato da ξ̇ = V−1 ẋ = V−1 AVξ , (2.93) dove adesso dobbiamo calcolare V−1 AV. Cominciamo con � � � � � AV = A xλ y = Axλ Ay = λxλ Ay � . Per quanto riguarda Ay, possiamo esprimerlo sulla base {xλ , y}, scrivendo39 Ay = αxλ + βy, � � dove α e β sono numeri reali. Quindi AV = λxλ αxλ + βy , e di conseguenza V−1 AV = =   � yT  λ 0 α β xT λ  � λxλ � αxλ + βy � = � λxλ · xλ xλ · y xλ · (αxλ + βy) y · (αxλ + βy) � . Ora i due autovalori di A sono coincidenti, e quindi det A = λ2 . D’altra parte � � det V−1 AV = det A = λ2 , ma anche � � det V−1 AV = det � λ 0 α β � = λβ. 39 Notiamo che se fosse α = 0, allora y sarebbe anch’esso un autovettore, linearmente indipendente con xλ , contro l’ipotesi di molteplicità geometrica uno. 72 LEZIONI DI SISTEMI DINAMICI Per cui, confrontando, abbiamo β = λ, ed allora40 λ α V−1 AV = . 0 λ Possiamo allora riscrivere il sistema (2.93) nelle nuove variabili ξ (t), η (t) λ α ξ ξ˙ ξ˙ = λξ + αη, = , =⇒ 0 λ η η̇ η̇ = λη, V−1 AV e risolverlo nella η (t), cioè η = C2 eλt . L’equazione per la ξ ξ̇ = λξ + α C2 eλt , (2.94) η(t) rientra nella classe di quelle analizzate nell’esempio 2.4.2, la cui soluzione è41 ξ (t) = eλt (C1 + C2 αt) . Tornando alle variabili dipendenti originarie, cioè x (t) e y (t) , abbiamo eλt (C2 αt + C1 ) x (t) xλ y = y (t) C2 eλt V x(t) ξ(t) = eλt (C2 αt + C1 ) xλ + C2 eλt y. (2.95) Caso 4. Analizziamo adesso il caso degli autovalori complessi coniugati. Siano quindi α + iβ e α − iβ, i due autovalori di A. Poiché sono due autovalori distinti (β �= 0 ovviamente), ad essi corrisponderanno due autovettori linearmente indipendenti una volta che si consideri la matrice A come matrice complessa 2 × 2. Indichiamo con z l’autovettore associato a α + iβ: è immediato verificare se z = x + iy, con x1 y1 x= , y= , x2 y2 vettori reali, allora il vettore z = x − iy è un autovettore associato all’autovettore α − iβ. Inoltre, analogamente a quanto succede nel caso reale, i due vettori z e z sono linearmente indipendenti (sul campo complesso). Questo implica che i vettori reali x e y sono, al loro volta, linearmente indipendenti sul campo reale. Infatti, se così non 40 Questa forma della matrice V−1 AV viene detta forma canonica di Jordan. senza “scomodare” l’esempio 2.4.2, siosserva che moltiplicando la (2.94) per e−λt , si ottied ξe−λt ne ξ̇e−λt − λe−λt ξ = αC2 , ovvero = αC2 , la cui soluzione si ricava con una semplice dt integrazione ξe−λt = C1 + αC2 t, =⇒ ξ (t) = eλt (C1 + αC2 t) . 41 Anche EQUAZIONI DIFFERENZIALI 73 fosse avremmo y = γx (si può ovviamente assumere che x �= 0) da cui si ricava (1 − iγ) z, in z = x + iy = (1 + iγ)x, e z = x − iy = (1 − iγ)x e quindi z = (1 + iγ) contrasto con l’indipendenza lineare (sui complessi) dei due autovettori di A. Calcolando Az si ottiene Az = Ax + iAy = (α + iβ)(x + iy) = (αx − βy) + i(αy + βx), da cui otteniamo   Ax = αx − βy ,  (2.96) Ay = αy + βx . Introduciamo le nuove variabili dipendenti ξ (t) e η (t), tramite la trasformazione (2.84), dove la matrice V è data da42 � � V= x y . Riscrivendo il sistema (2.81) nelle nuove variabili otteniamo al solito la (2.93), dove, come nel caso precedente, dobbiamo valutare V−1 AV. Svolgendo i calcoli � � � � αx − βy αy + βx AV = A [x y] = Ax Ay = (2.96) = e dunque � � x �� V y � � � α −β V−1 AV = V−1 V � β α � α −β , β α � = � α −β β α � . Di conseguenza, nelle nuove variabili ξ ed η, il sistema di equazioni differenziali (2.81) diventa � � �� α β ξ ξ˙ = αξ + βη , ξ˙ = (2.97) ovvero −β α η η̇ = −βξ + αη, η̇ La soluzione di questo sistema diventa agevole passando alle coordinate polari, ovvero al sistema di variabili (ρ, θ) tale che ξ = ρ cos θ, η = ρ sin θ. Infatti, moltiplicando la prima equazione per ξ, la seconda per η e sommando otteniamo d 2 (ξ + η 2 ) = 2α(ξ 2 + η 2 ), dt (2.98) ovvero dρ2 = 2αρ2 , dt che si integra immediatamente, ottenendo ρ(t) = ρ0 eαt = ρ0 exp {(Re λ) t} . 42 Evidentemente V è invertibile dal momento che x, y sono indipendenti. (2.99) (2.100) 74 LEZIONI DI SISTEMI DINAMICI L’equazione per θ si ottiene invece moltiplicando la (2.97)1 per η, la (2.97)2 per ξ e sottraendo. Si ottiene in questo modo ˙ − η̇ξ = β (ξ 2 + η 2 ), ξη � �� (2.101) ρ2 che possiamo riscrivere come ξ̇η − η̇ξ = β. ρ2 (2.102) E’ facile verificare che il primo membro della (2.102) è la derivata, cambiata di segno, di θ(t) dθ = −β, (2.103) dt da cui otteniamo θ(t) = −βt + θ0 = − (Im λ) t + θ0 . (2.104) Tornando ora alle variabili ξ (t) e η (t), scriveremo la soluzione come � ξ(t) = ρ0 eαt cos(−βt + θ0 ), η(t) = ρ0 eαt sin(−βt + θ0 ), dove i coefficienti ρ0 e θ0 sono legati alle condizioni iniziali da � η0 ρ0 = ξ02 + η02 , θ0 = arctg . ξ0 (2.105) (2.106) Infine, per ritornare alle variabili originarie x (t) e y (t), si applica la (2.84) ottenendo � � � � � � ρ0 eαt cos(−βt + θ0 ), x (t) x y = ρ0 eαt sin(−βt + θ0 ), y (t) = ρ0 eαt [cos(−βt + θ0 ) x+ sin(−βt + θ0 )y] . (2.107) Vediamo adesso cosa succede nel caso in cui la matrice A abbia determinante nullo. Il fatto di avere determinante nullo implica che almeno un autovalore della matrice, diciamo λ1 , sia nullo. Si hanno quindi due casi: (A). λ1 = 0, λ2 �= 0; (B). λ1 = 0, è autovalore doppio con molteplicità geometrica pari ad 1. Caso (A). In questo caso caso possiamo pensare al kernel di A come al sottospazio associato all’autovettore nullo. Sia quindi xλ1 il relativo autovettore e xλ2 , quello relativo a λ2 . Introduciamo la trasformazione (2.84) e, operando come nel Caso 1 giungiamo alla (2.86) che adesso si scrive così    ξ (t) = ξ0 ,  ξ˙ = 0, =⇒   η (t) = η0 eλ2 t . η̇ = λ2 η . EQUAZIONI DIFFERENZIALI 75 Ricordando poi la (2.90), la soluzione è x (t) = xλ1 ξ0 + xλ2 η0 eλ2 t . Caso (B). Se λ = 0 è un autovettore doppio, abbiamo ancora due possibilità. La prima, banale, è che A sia la matrice nulla. Ovviamente la soluzione del sistema in questo caso è x(t) ≡ x0 e y(t) ≡ y0 . L’altra possibilità è che la molteplicità geometrica di λ = 0 sia uno. Questo è ancora una forma particolare del Caso 3 che abbiamo già visto. Infatti se xλ è l’autovettore unitario relativo a λ = 0, e y è un vettore unitario ortogonale ad xλ , operando la solita trasformazione (2.84) con V data da (2.92), giungiamo a questo sistema nelle nuove variabili ξ (t) e η (t) 0 α ξ ξ̇ = αη, ξ˙ = , =⇒ 0 0 η η̇ = 0, η̇ la cui soluzione è ξ (t) = ξ0 + αη0 t, η (t) = η0 . Applicando infine la (2.95) con λ = 0, abbiamo la soluzione del sistema (2.90) x (t) = (η0 αt + ξ0 ) xλ + η0 y. Esempio 2.10.1 Determiniamo la soluzione generale di ẋ 1 2 x = ẏ 2 1 y 1 2 In questo caso A = , ed i suoi autovalori sono 2 1 2 det (A − λI) = 0, ⇒ (1 − λ) − 4 = 0, λ = −1, 3. Si determinano poi i rispettivi autovettori Ax1 = −x1 , Ax2 = 3x2 , richiedendo |x1 | = |x2 | = 1. Si ha 1 1 −1 1 , x2 = √ . x1 = √ 1 1 2 2 Si introduce quindi la matrice V= x1 x2 1 =√ 2 −1 1 1 1 , e si considera il cambio di variabili ξ =V−1 x, x=Vξ . Nelle nuove variabili ξ (t), η (t) l’equazione differenziale ẋ=Ax, si riscrive come · −1 0 ξ ξ (t) C1 e−t ξ = , ⇒ = . · 0 3 η η (t) C2 e3t η 76 LEZIONI DI SISTEMI DINAMICI Quindi, in termini di x (t), la soluzione generale del sistema si può riscrivere come � � �� 1 1 −1 1 ξ (t) −C1 e−t + C2 e3t x (t) , =√ = Vξ (t) = √ 1 1 η (t) C1 e−t + C2 e3t y (t) 2 2 ovvero x (t) = C1 e−t x1 + C2 e3t x2 . Le costanti c1 e c2 si determinano in base alle condizioni iniziali. Esempio 2.10.2 Scriviamo la soluzione generale di � �� 1 5 1 x ẋ . = −1 3 y ẏ 2 � � 1 5 1 , e det (A − λI) = 0, dà λ1 = λ2 = 2. Abbiamo quindi un Adesso A = −1 3 2 � � 1 1 √ solo autovettore x = 2 . Si considera un vettore unitario y ortogonale ad −1 x, � � 1 1 . y= √ 1 2 � � � � 1 1 1 Si introduce la matrice V = x y = √ , la cui inversa è −1 1 2 � � � T � 1 1 −1 x −1 T =√ . V =V = 1 1 yT 2 � � ξ (t) Al solito si introducono le nuove variabili dipendenti ξ (t) = , come combiη (t) nazione lineare delle x (t) e y (t), x (t) = Vξ (t), ξ (t) = VT x (t). Nelle variabili ξ (t), il sistema si riscrive come � �� 2 1 ξ (t) T ξ̇ = V AVξ = . 0 2 η (t) Quindi, abbiamo questo sistema   ξ˙ (t) = 2ξ (t) + η (t) ,  η̇ (t) = 2η2 (t) , ⇒   ξ˙ (t) = 2ξ (t) + C2 e2t ,  η (t) = C2 e2t . Moltiplicando la prima equazione per e−2t , possiamo riscriverla come d � −2t � ξe = C2 , ⇒ dt ξ (t) = (C1 + C2 t) e2t . Abbiamo quindi x (t) = (C1 + C2 t) e2t x + C2 e2t y. Esempio 2.10.3 Analizziamo la soluzione di � � � �� ẋ 2 1 x = . ẏ −1 2 y (2.108) EQUAZIONI DIFFERENZIALI 77 2 1 Gli autovalori di A = , sono λ1 = 2 + i, λ2 = 2 − i, cioe Re λ = 2, e −1 2 Im λ = 1. Determinando un autovettore complesso, per esempio quello relativo a λ1 , A = (2 + i) z , si ottiene 1 1 0 z= = +i . i 0 1 x y 1 0 , che quindi coincide con l’iden0 1 tità, cioè ξ (t) ≡ x (t). Passando direttamente alle coordinate polari x (t) ρ (t) cos θ (t) = , y (t) ρ (t) sin θ (t) Si introduce la matrice V = x y = otteniamo ρ (t) = ρo e(Re λ)t = ρo e2t , θ (t) = − (Im λ) t + θo = −t + θo . da cui x (t) y (t) = ρo e2t cos (−t + θo ) ρo e2t sin (−t + θo ) . Esempio 2.10.4 Analizziamo adesso, facendo uso del formalismo dei sistemi lineari 2 bidimensionali,l’equazione dell’oscillatore armonico ẍ = −ω x. Considerando le x (t) solite variabili , l’equazione può essere riscritta come y (t) ẋ x 0 1 = . ẏ y −ω 2 0 ẋ x A Gli autovalori di A, sono λ1 = −iω, λ2 = iω. In particolare, un autovettore relativo a −iω è 1 1 0 z= = +i , −iω 0 −ω per cui la matrice V è data da V= 1 0 0 −ω . Introducendo le nuove variabili dipendenti ξ (t) e η (t), e ricordando la (2.105), abbiamo ξ (t) ρo cos (ωt + θo ) = . η (t) ρo sin (ωt + θo ) Per cui, tornando alle variabili originali x (t) 1 0 ξ (t) ξ (t) = = , y (t) 0 −ω η (t) −ωη (t) 78 LEZIONI DI SISTEMI DINAMICI ossia   x (t) = ρo cos (ωt + θo ) ,  · y (t) = −ωρo sin (ωt + θo ) = x (t) , che è proprio la (2.38). 2.11 Moto armonico smorzato Consideriamo l’oscillatore armonico dell’esempio 2.6.1 soggetto ad una forza di attrito viscoso, cioè proporzionale, in prima approssimazione, alla velocità del punto materiale (si veda anche l’esempio 2.5.1). Denotando con x (t) l’ascissa del punto materiale, l’equazione di moto è mẍ = (−k x) + (−η ẋ) , � �� molla attrito dove η è il coefficiente di attrito viscoso. Seguendo le notazioni degli esempi 2.6.1 e η K 2.5.1, si introduce ω 2 = , µ = , e l’equazione si riscrive come m m ẍ + µẋ + ω 2 x = 0, (2.109) che poi si trasforma nel seguente sistema lineare � � � � � �� ẋ = y x ẋ 0 1 . ⇒ = ẏ = −µy − ω 2 x y ẏ −ω 2 −µ �� (2.110) A Si determinano gli autovalori di A, λ2 + µλ + ω 2 = 0, ovvero λ= Si hanno quindi tre casi. � � 1� −µ ± µ2 − 4ω 2 . 2 Caso I. µ2 − 4ω 2 > 0 (smorzamento forte). I due autovalori, entrambi negativi, sono λ1 = � � 1� −µ − µ2 − 4ω 2 , 2 λ2 = � � 1� −µ + µ2 − 4ω 2 . 2 Ricordando la (2.90), x (t) è di questo tipo: √ √ µ µ 1 1 2 2 2 2 x (t) = (xλ1 C1 )e− 2 t− 2 µ −4ω t + (xλ2 C2 )e− 2 t+ 2 µ −4ω t � �� c1 = e −µ 2t c2 � √ 2 √ 2 � 1 1 2 2 c1 e− 2 µ −4ω t + c2 e 2 µ −4ω t , dove con c1 e c2 sono le costanti di integrazione da determinarsi in base alle condizioni iniziali. Notiamo che i due autovalori sono negativi e quindi abbiamo due esponenziali decrescenti: x (t) −→ 0. t→∞ EQUAZIONI DIFFERENZIALI 79 Caso II. µ2 − 4ω 2 = 0 (smorzamento critico). Questo caso corrisponde al Caso 3 della sezione 2.10: un solo autovalore con molteplicità geometrica pari a uno. La soluzione è data dalla (2.95), per cui x (t) è di questo tipo x (t) = = µ µ e− 2 t (C2 αt + C1 ) xλ + C2 e− 2 t y1 µ µ e− 2 t (C1 xλ + C2 y1 ) + e− 2 t (C2 αxλ ) t c1 = e −µ 2t c2 [c1 + c2 t] , dove al solito c1 e c2 sono le costanti di integrazione. Al solito, limt→∞ x (t) = 0. Caso III. µ2 − 4ω 2 < 0 (oscillazioni smorzate). Gli autovalori sono complessi λ1 = 1 1 −µ − i 4ω 2 − µ2 , λ2 = −µ + i 4ω 2 − µ2 . 2 2 Quindi, rifacendosi al Caso 4 della sezione 2.10, abbiamo µ α = Re λ1 = − , 2 β = Im λ1 = − 1 2 4ω − µ2 . 2 La forma generale della soluzione è data dalla (2.107). Di conseguenza nel nostro caso abbiamo µ 1 1 x (t) = ρo e− 2 t x1 cos 4ω 2 − µ2 t + θ0 + y1 sin 4ω 2 − µ2 t + θ0 , 2 2 che, definendo opportunamente le costanti c1 e c2 , potremo scrivere come µ 1 1 4ω 2 − µ2 t + c2 sin 4ω 2 − µ2 t . x (t) = e− 2 t c1 cos 2 2 Notiamo ancora la presenza dell’esponenziale negativo che quindi “smorza” l’ampiezza delle oscillazioni. Di solito ci si riferisce a questo caso come caso periodico in quanto la soluzione ha un comportamento periodico, ma di ampiezza smorzata dal fattore esponenziale. Per contrapposizione, ci si riferisce al primo e al secondo caso come casi aperiodici. Per concludere, rimarchiamo alcune proprietà generali facilmente deducibili dalle forma esplicita della soluzione: Primo. La soluzione generale della (2.109) è sempre data dalla combinazione lineare di due soluzioni “fondamentali”, ovvero di due qualsiasi soluzioni linearmente indipendenti43 tra loro. Secondo. Per t “sufficientemente grande” la soluzione si annulla, e di conseguenza anche limt→∞ ẋ = 0: il punto materiale tende alla quiete ed alla posizione x = 0, che rappresenta, nel senso della (2.56), la configurazione di equilibrio del sistema (2.110). 43 Due, o più, funzioni si dicono linearmente indipendenti quando l’unica loro combinazione lineare a coefficienti costanti identicamente nulla è quella con tutti i coefficienti nulli. 80 LEZIONI DI SISTEMI DINAMICI Terzo. Se calcoliamo l’energia meccanica E tramite la formula (2.31), otteniamo E= ẋ2 + V (x) , 2 con V (x) = ω2 2 x . 2 Derivando quindi E rispetto al tempo si ha � � dE = ẋ ẍ + ω 2 ẋx = ẋ ẍ + ω 2 x = −µẋ2 ≤ 0, dt (2.109) l’energia meccanica non si conserva più. In particolare, siccome limt→∞ ẋ = 0, anche l’energia meccanica si annullerà per t → ∞. Concludiamo quindi che l’oscillatore armonico smorzato non è un sistema conservativo ma dissipativo. Ovviamente l’energia meccanica non viene “distrutta”, ma viene trasformata dall’attrito in calore (cioè in energia termica). Quarto. La configurazione di equilibrio (x, y) ≡ (0, 0) del sistema (2.110) è una configurazione di equilibrio asintoticamente stabile nel senso del criterio di Lyapunov illustrato nella sezione 2.8.2. Infatti se consideriamo Λ (x, y) = y2 ω 2 2 µ2 2 µ + x + x + xy 2 2 4 2 = ω2 2 1 y2 2 x + (µx + y) + , 2 4 4 è banale verificare che Λ > 0, al di fuori di x = 0 e y = 0. Inoltre, siccome  �  � µ µ2   2 ω x + y + y   2 2     ∇Λ · F (x) =  ·   µ −µy − ω 2 x y+ x 2 � µ� 2 2 = − ω x + y2 , 2 abbiamo ∇Λ ·F (x) < 0, ad eccezione del punto di equilibrio. Pertanto (x, y) ≡ (0, 0) è asintoticamente stabile. 2.12 Moto armonico smorzato con forzante esterna Consideriamo adesso un’equazione scalare del second’ordine lineare, non omogenea44 ẍ + ν ẋ + ω 2 x = f (t) , (2.111) che corrisponde, dal punto di vista fisico, ad un oscillatore armonico smorzato soggetto ad una forza f (t) variabile nel tempo, usualmente detta forzante esterna, o termine forzante. La soluzione generale di (2.111) si ottiene sommando una qualsiasi soluzione di (2.111) alla soluzione generale dell’equazione lineare omogenea (2.109) che abbiamo analizzato nella sezione 2.11. 44 In · questa sezione adottiamo la notazione “standard” in cui il coefficiente di x viene denotato con ν, anziché con µ. EQUAZIONI DIFFERENZIALI 81 In questo paragrafo analizzeremo il caso particolare in cui il termine forzante di tipo sinusoidale f (t) = a cos(ωf t), con ωf pulsazione della forzante. Non occorre introdurre una fase specifica per il termine forzante, basta considerare t = 0 quando la forza raggiunge il suo massimo. Riscriviamo quindi la (2.111) nella forma ẍ + ν ẋ + ω 2 x = a cos(ωf t) . (2.112) Il caso speciale ν = 0 corrisponde ad un oscillatore armonico soggetto ad una forza esterna. Determiniamo ora una soluzione particolare della (2.112), cercandola nella forma xP (t) = c1 sin(ωf t) + c2 cos(ωf t) . Sostituendo xP (t) nella (2.112) otteniamo ωf2 [−c1 sin(ωf t) − c2 cos(ωf t)] + νωf [c1 cos(ωf t) − c2 sin(ωf t)] +ω 2 [c1 sin(ωf t) + c2 cos(ωf t)] = a cos(ωf t) , che è soddisfatta se e solo se i coefficienti di cos(ωf t) e sin(ωf t) sono nulli, ovvero se i coefficienti c1 e c2 soddisfano il sistema   (ω 2 − ωf2 )c1 − νωf c2 = 0, (2.113)  νωf c1 + (ω 2 − ωf2 )c2 = a. Il sistema (2.113) ha sempre soluzione eccettuato il caso in cui ωf = ω e ν = 0, ovvero nel caso di un oscillatore armonico privo di attrito a cui sia applicata una forzante della stessa frequenza delle oscillazioni libere del sistema45 . La soluzione di (2.113) è data da c1 = ν 2 ωf2 c2 = aνωf �2 , � + ω 2 − ωf2 a(ω 2 − ωf2 ) �2 , � ν 2 ωf2 + ω 2 − ωf2 da cui possiamo ricostruire la la soluzione particolare. E’ tuttavia più interessante riscrivere la soluzione particolare nella forma A cos(ωf t− β), dove A e detta ampiezza A, e β ritardo di fase. Abbiamo quindi �� a νωf . (2.114) xP (t) = � �2 cos ωf t − arctan ω 2 − ω 2 � f 2 2 2 2 ν ωf + ω − ωf 45 Questo fenomeno viene detto risonanza. In questo caso la soluzione particolare è data da xP (t) = Ct cos(ωt), C = costante, ovvero un’oscillazione con ampiezza che cresce linearmente nel tempo. 82 LEZIONI DI SISTEMI DINAMICI Figura 2.11: Ampiezza A data dalla (2.115) in funzione di ωf , per diversi valori di ν, considerando ω = 2. 5 ν = 0.1 ν = 0.2 4 ν = 0.6 3 ν=1 2 1 0 1 1.5 2 2.5 3 Di conseguenza A = β = a 2 , 2 2 2 2 ν ωf + ω − ωf arctan νωf ω 2 − ωf2 . (2.115) (2.116) E’ importante notare, come abbiamo sottolineato nella sezione 2.11, che la soluzione generale dell’equazione omogenea, che sommata a (2.114) ci fornisce la soluzione generale della (2.112), decade esponenzialmente a zero. Questo significa che dopo un tempo sufficientemente “lungo” (ma in realtà “breve” nella scala dei tempi in gioco46 , e tanto più breve quanto ν è “grande”) la soluzione che “rimane” (ovvero quella che è “osservabile”dal punto di vista fisico) è data dalla soluzione particolare, indipendentemente dalla condizioni iniziali del moto. Le figure 2.11 e 2.12 mostrano rispettivamente i grafici del rapporto tra l’ampiezza della soluzione e l’ampiezza del termine forzante e del ritardo di fase al variare della frequenza forzante ωf per un valore fissato di ω e per diversi valori del coefficiente di smorzamento ν. Si osserva che il valore massimo dell’ampiezza A, data dalla (2.115), viene assunto per ωf = ω 2 − ν 2 /2 (che è un numero reale se ν è sufficientemente piccolo), e può superare 1 se è soddisfatta da disuguaglianza 2 1 > ν 2 ωf2 + ω 2 − ωf2 , ovvero se ν 2 ω 2 < 1. In questo caso l’ampiezza della “risposta” è maggiore di quella del termine forzante. In altre parole, il sistema funziona da amplificatore del termi46 Il tempo caratteristico del fenomeno è dato dal periodo dell’oscillazione forzante, ovvero T = 2π/ωf . EQUAZIONI DIFFERENZIALI 83 Figura 2.12: Ritardo di fase, per diversi valori di ν, con ω = 2 π ν = 0.1 ν = 0.2 ν = 0.6 ν=1 ω f ω ne forzante. Questo fenomeno, detto risonanza, è particolarmente interessante nelle applicazioni elettrotecniche. Infatti l’equazione (2.111) è anche l’equazione per l’intensità di corrente in un circuito RLC soggetto ad una tensione f (t). 2.13 Sistemi lineari n−dimensionali Nella sezione 2.10 abbiamo visto la soluzione dei sistemi lineari 2 × 2, tuttavia la “strategia” di risoluzione si estende a sistemi di qualsiasi dimensione Ẋ = AX (2.117) dove X(t) ∈ Rn e A ∈ Rn×n . In questa sezione però affrontiamo la soluzione del sistema lineare (2.117) con un approccio alternativo, che evidentemente vale anche nel caso bidimensionale (ovvero nel caso in cui A è una matrice 2 × 2 e X(t) ∈ R2 ). Sia X 0 il dato iniziale (a t = 0) per il vettore X(t), e integriamo la (2.117) fra 0 e t, ottenendo t X(t) = X 0 + AX(s) ds. (2.118) 0 Tentiamo poi di costruire la soluzione di (2.117) “per approssimazioni successive”, ossia costruendo la successione X n (t) definita per ricorrenza t X n+1 (t) = X 0 + AX n (s) ds, n = 1, 2, 3, . . . (2.119) 0 È chiaro che se la successione X n (t) ammette limite, ponendo X(t) = lim Xn (t), n→∞ allora, almeno formalmente, la X(t) soddisfa la (2.118). Derivando quest’ultima otteniamo (2.117): il limite X(t) è dunque la soluzione cercata. Dalla (2.119) si ottiene, 84 LEZIONI DI SISTEMI DINAMICI ricorsivamente, X 1 (t) = X0 + t AX 0 ds = X 0 + tAX 0 , 0 X 2 (t) = X0 + t AX 1 (s) ds = X 0 + tAX 0 + t2 2 A X0 , 2 AX 2 (s) ds = X 0 + tAX 0 + t2 2 t3 A X 0 + A3 X 0 , 2 6 0 X 3 (t) = X0 + t 0 ··· , ovvero X n (t) = n tk k=0 k! Ak X 0 . Si può facilmente dimostrare che la serie converge uniformemente (su intervalli di tempo limitati) e che il suo limite X(t) = ∞ k t k=0 risolve la (2.117). La matrice viene indicata con etA ∞ k! tk k k=0 k! A etA = Ak X 0 , (2.120) è detta esponenziale della matrice A e ∞ k t k A . k! (2.121) k=0 Dunque possiamo concludere in generale che la soluzione del problema di Cauchy Ẋ = AX, X (0) = X 0 , è data dalla matrice esponenziale di A applicata al vettore dei dati iniziali: X(t) = etA X 0 . (2.122) Nota 2.13.1 Osserviamo che se X λ è un autovettore di A con autovalore λ allora X λ è anche autovettore di etA con autovalore etλ . Infatti etA X λ = ∞ k t k=0 k! Ak X λ = ∞ k t k=0 k! λk X λ = etλ X λ . È facile ritrovare per questa via le soluzioni ottenute nel caso bidimensionale. In particolare, è istruttivo costruire la matrice esponenziale nel caso in cui A abbia due autovalori complessi coniugati. Sappiamo già che in questo caso, introducendo, tramite la (2.84), le nuove variabili ξ (t) e η (t), possiamo riscrivere il sistema di partenza nella forma (2.97). In particolare, denotando con B la matrice V−1 AV, cioè α β B= −β α EQUAZIONI DIFFERENZIALI 85 abbiamo B = αI + βJ, dove J = � 0 1 −1 0 � , I= � 1 0 0 1 � , e pertanto la soluzione di (2.97) potrà essere scritta come � � � � ξo ξ (t) tB , =e ηo η (t) con etB = lim n→∞ n � tk k=0 k! Bk = lim n→∞ n � tk k=0 k! (αI + βJ)k . Applichiamo adesso la formula del binomio di Newton47 � � k � k k (αI + βJ) = (αI)j (βJ)k−j , j j=0 � �� k! j!(k−j)! ottenendo n � tk k=0 k! Bk = n � tk k=0 = k!  k �  j=0 n � k � k=0 j=0 =  k! (αI)j (βJ)k−j  j! (k − j)! k=j n n � j+r � j=0 r=0 n n �� tk tk (αI)j (βJ)k−j = (αI)j (βJ)k−j j! (k − j)! j! (k − j)! j=0 t (αI)j (βJ)r = j! r! n j � j=0 n � t tr (αI)j (βJ)r , j! r! r=0 dove si è utilizzato il cambio di indice r = k − j. Dunque, per n → ∞ si ha etB = eαt I etβJ = eαt etβJ , dal momento che lim n→∞ n � tj j=0 j!  (αI)j =  lim n→∞ n � αj tj j=0 j! (2.123)   I =eαt I . Quindi, per completare il calcolo di etB dobbiamo valutare esplicitamente etβJ . Come passo preliminare, osserviamo che J2 = −I e dunque � �k J2k = J2 = (−1)k I, J2k+1 = J2k J = (−1)k J, k = 0, 1, 2, . . . . �� (−1)k I 47 Si osservi che possiamo applicare la formula del binomio di Newton perché le matrici I e J commutano, cioè IJ = JI. Infatti, date due matrici qualsiasi P e Q, (P + Q)2 = P2 + Q2 + PQ + QP. La classica formula del quadrato del binomio si ha solamente se PQ = QP. 86 LEZIONI DI SISTEMI DINAMICI Pertanto 2n (tβ)k k! k=0 Jk = n (tβ)2k k=0 = (2k)! J2k + somma sugli indici pari n (−1)k k=0 n−1 k=0 (tβ)(2k+1) (2k+1) J (2k + 1)! somma sugli indici dispari n−1 (tβ)(2k) (tβ)(2k+1) I+ J. (−1)k (2k)! (2k + 1)! k=0 Consideriamo adesso il limite per n → ∞, ricordando gli sviluppi in serie di Taylor delle funzioni sin tβ e cos tβ. Abbiamo ∞ ∞ ∞ (2n) (2n+1) (tβ)k k n (tβ) n (tβ) J = (−1) I+ (−1) J, k! (2n)! (2n + 1)! n=0 n=0 k=0 etβJ sin tβ ovvero e tβJ = cos(tβ)I + sin(tβ)J = cos tβ cos(tβ) − sin(tβ) sin(tβ) cos(tβ) Sostituendo quest’ultima nella (2.123) abbiamo cos(tβ) sin(tβ) tB αt , e =e − sin(tβ) cos(tβ) . che ci fa ritrovare la soluzione data dalla (2.105) (a meno delle costanti ρ0 e θ0 che sono legate ai dati iniziali, ovvero a X 0 ). Capitolo 3 Le Equazioni di Lagrange Questo capitolo è dedicato all’introduzione della formulazione lagrangiana della meccanica che di fatto è un formalismo “potente” per ottenere le equazioni di moto di sistemi meccanici anche molto complessi1 . In tutto questo capitolo considereremo un solo punto materiale non soggetto ad alcun vincolo. Prima di introdurre le equazioni di Lagrange, discuteremo la cinematica del punto materiale quando i vettori velocità ed accelerazione vengono espressi rispetto ad una base locale. Passeremo poi alle forze, introducendo il concetto di forze conservative e quindi vedremo il metodo di Lagrange per giungere alle equazioni di moto. Come applicazione illustreremo il moto di un punto materiale libero soggetto ad una forza di tipo centrale, quale, per esempio, quella di attrazione gravitazionale. 3.1 Cinematica del punto Consideriamo uno spazio affine euclideo2 A con dimensione 3 in cui è definito un riferimento cartesiano ortogonale. Il moto di un punto viene rappresentato da una curva parametrizzata dal tempo t, ovvero I ∋ t → P (t) ∈ A, dove I ⊂ R, è un intervallo temporale. Ad ogni istante t corrisponde un punto dello spazio affine. L’immagine in A di questa applicazione si chiama traiettoria, o orbita, di P . Ad ogni istante t ∈ I corrisponde un vettore (P (t) − O), che denoteremo semplicemente con x (t). Se {ex , ey , ez }, è una base ortogonale di V , x (t) è individuato dal seguente vettore3 di R3   x (t)  y (t)  , ⇔ x (t) = x (t) ex + y (t) ey + z (t) ez . z (t) 1 Tale formalismo fu introdotto da J. L. Lagrange (Torino 1736 – Parigi 1813), matematico e astronomo italiano, che svolse la sua attività scientifica a Berlino e a Parigi. Infatti, nell’introduzione del suo trattato Méchanique analytique, pubblicato nel 1788, Lagrange scrive: Je me suis proposé de réduire la théorie de cette Science, et l’art de résoudre le problèmes qui s’y rapportent, à des formules générales, dont le simple développement donne toute les équations nécessaires pour la solution de chaque problème. 2 Più precisamente con A intenderemo sempre la terna (A, V, F ) dove A è l’insieme dei punti, V è lo spazio vettoriale soggiacente lo spazio affine e F è l’applicazione che alla coppie di punti associa i rispettivi vettori di V . In A è definito il prodotto scalare · . 3 Si assume che le funzioni x (t), y (t) e z (t) siano almeno C 2 ( I ). 88 LEZIONI DI SISTEMI DINAMICI La velocità e l’accelerazione del punto P , sono definite come i vettori · dx (t) = ẋ (t) ex + ẏ (t) ey + ż (t) ez , dt ·· d 2 x (t) (P (t) − O) = = ẍ (t) ex + ÿ (t) ey + z̈ (t) ez . dt2 Supponiamo adesso che sia definito, in un dominio DA ⊂ A, un sistema di coordinate curvilinee   q1 x R3 ⊃ Q ∋ q =  q2  −→ x (q) . q3 (P (t) − O) = Quindi il moto del punto, fino a quando avvine in DA , potrà anche essere rappresentato dando le tre funzioni (q1 (t) , q2 (t) , q3 (t)), ovvero q (t). Avremo pertanto  x = x (q (t)) = x (q1 (t) , q2 (t) , q3 (t))      y = y (q (t)) = y (q1 (t) , q2 (t) , q3 (t)) P − O = x (q (t)) , ⇔      z = z (q (t)) = z (q1 (t) , q2 (t) , q3 (t)) Il vettore velocità si potrà anche scrivere come segue ẋ = ∂x ∂x ∂x q̇1 + q̇2 + q̇3 , ∂q1 ∂q2 ∂q3 �� u1 u2 (3.1) u3 dove {u1 , u2 , u3 } è la base locale (v. capitolo 1, sezione 1.4). Quindi, rispetto alla base locale, il vettore velocità è rappresentato dalla terna   q̇1 (t)  q̇2 (t)  . q̇3 (t) Per esser più precisi, riferendoci sempre alla sezione 1.4, la terna delle q̇i , i = 1, 2, 3, è la terna delle componenti controvarianti del vettore velocità rispetto alla base locale (evidentemente se la base locale è ortonormale questa precisazione è inutile). Definizione 3.1.1 Se il punto P ha massa m, si definisce energia cinetica di P � �2 � m� � dx (t) � . T = � 2 dt � Calcoliamo adesso l’energia cinetica di P considerando le coordinate curvilinee q (t). Otteniamo � 3 � � 3 � � m � T = uh q̇h · uk q̇k 2 h=1 = m 2 3 � h,k = 1 k=1 (uh · uk ) q̇h q̇k , EQUAZIONI DI LAGRANGE 89 che viene anche scritta come4 T = 3 1 � ahk q̇h q̇k , dove ahk = m uh · uk . 2 (3.2) h,k = 1 In particolare, se la base locale è ortogonale, avremo5 T = �2 3 � � m �� ∂x � q̇h2 . � 2 ∂qh � h=1 In generale abbiamo6 ahk = ahk (q), e, introducendo la matrice simmetrica7 A, le cui componenti aij , sono definite nella (3.2),   u1 · u1 u1 · u2 u1 · u3 A (q) =m  u2 · u1 u2 · u2 u2 · u3  , (3.3) u3 · u1 u3 · u2 u3 · u3 potremo scrivere T = 1 T q̇ A (q) q̇, 2 con q̇ T = � q̇1 q̇2 q̇3 � , e (3.4)  q̇1 q̇ =  q̇2  . q̇3  Per quanto riguarda l’accelerzione, abbiamo questo risultato fondamentale che cond 2 x (t) nella base locale {u1 , u2 , sente di esprimere le componenti8 del vettore m dt2 u3 }. Teorema 3.1.1 Se T è l’energia cinetica di P , allora � � ∂T d ∂T d 2 x (t) − · u = , m k dt2 dt ∂ q̇k ∂qk i = 1, 2, 3. (3.5) L’espressione di destra nella (3.5) viene usualmente detta binomio di Lagrange. Dim. Prima di iniziare la dimostrazione è interessante osservare che la (3.5) ha una struttura completamente diversa dalla (3.1). Infatti, per calcolare nella base puntuale 4 Evidentemente ahk = akh . ∂x , i = 1, 2, 3, siano normalizzati. ∂qi 6a hk (q) è una scrittura sintetica per esprimere ahk = ahk (q1 , q2 , q3 ). 7 Osserviamo che la matrice A è, a parte il coeficiente m, la matrice metrica G della base locale, definita, nel capitolo 1, dalla (1.8). 5 Ricordiamo 8 Per che, in generale, non è detto che ui = la precisione la formula (3.5) dà le componenti covarianti di m ovvero fornisce le proiezioni ortogonali del vettore m d sezione 1.4). 2 x(t) dt d2 x(t) dt rispetto alla base locale, sui vettori della base locale (v. capitolo 1, 90 LEZIONI DI SISTEMI DINAMICI d 2 x (t) dobbiamo tener presente che i vettori della base locale cambiano da punto a dt2 punto e quindi cambieranno durante il moto. Abbiamo   3 � ∂T ∂ ẋ ∂  q̇j uj  · ẋ . = m · ẋ = m ∂ q̇k ∂ q̇k ∂ q̇k j=1 (3.1) = per cui d dt Adesso calcoliamo ∂T ∂qk muk · ẋ , � ∂T ∂ q̇k = = � =m duk · ẋ + muk · ẍ . dt � � dx ∂ ẋ ∂ · ẋ · ẋ = m ∂qk ∂qk dt � � d ∂x duk m · ẋ . · ẋ = m dt ∂qk dt � �� (3.6) m (3.7) uk Da un semplice confronto delle (3.6) e (3.7), si ricava � � d ∂T ∂T = + muk · ẍ , dt ∂ q̇k ∂qk da cui la (3.5) discende banalmente. Esempio 3.1.1 Vediamo che la (3.5) fornisce le componenti del vettore accelerazione anche rispetto al riferiemento cartesiamo ortonormale {O, ex , ey , ez }. Infatti x (t) = x (t) ex + y (t) ey + z (t) ez , ⇒ ẋ (t) = ẋ (t) ex + ẏ (t) ey + ż (t) ez , � m� 2 per cui T = ẋ + ẏ 2 + ż 2 , ovvero 2     m 0 0 ẋ � � 1 ẋ ẏ ż  0 m 0   ẏ  , T = 2 0 0 m ż � �� A=mI da cui otteniamo mẍ · ex = mẍ · ey = mẍ · ez = � ∂T ∂ ẋ � − ∂T = mẍ, ∂x � � d ∂T − dt ∂ ẏ � � d ∂T − dt ∂ ż ∂T = mÿ, ∂y ∂T = mz̈. ∂z d dt EQUAZIONI DI LAGRANGE 91 Esempio 3.1.2 Riferendoci all’esempio 1.4.1 del capitolo 1, consideriamo le coordinate polari nel piano       cos θ −r sin θ x (r, θ) = r cos θ  , uθ =  .  , ⇒ ur =  x (q) =  sin θ r cos θ y (r, θ) = r sin θ Supponiamo adesso che P = P (t), ovvero r = r (t), θ = θ (t). Il vettore velocità · ẋ = (P − O), può essere espresso sia rispetto alla base {ex , ey }, � � � � ẋ = ṙ cos θ − rθ̇ sin θ ex + ṙ sin θ + rθ̇ cos θ ey , sia rispetto alla base locale {ur , uθ } ẋ = ṙur + θ̇uθ . In particolare, introducendo la base locale normalizzata, κr = ur , e uθ = rκθ , avremo ẋ = ṙκr + rθ̇κθ . Quindi, se m è la massa di P , l’energia cinetica sarà T = �2 � m� 2 m� ṙκr + rθ̇κθ = ṙ + r2 θ̇2 , 2 2 ovvero, ricordando la (3.3) e la (3.4) 1� T = ṙ 2 θ̇ � � � m 0 � � � ṙ 0 . mr2 θ̇ �� A Possiamo quindi determinare la componente dell’accelerazione lungo ur , ovvero la componente radiale, e quella tangenziale � � � � ∂T d ∂T mẍ · ur = − = m r̈ − rθ̇2 , dt ∂ ṙ ∂r � � d ∂T ∂T = mr2 θ̈ + 2mrṙ θ̇ . mẍ · uθ = − dt ∂ θ̇ ∂θ Esempio 3.1.3 Consideriamo adesso l’esempio 1.4.2 delle coordinate sferiche   x (r, ϕ, θ) = r sin θ cos ϕ     , y (r, ϕ, θ) = r sin θ sin ϕ x (q) =      z (r, ϕ, θ) = r cos θ 92 LEZIONI DI SISTEMI DINAMICI la cui base locale (ortogonale ma non normalizzata) è      sin θ cos ϕ −r sin θ sin ϕ r cos θ cos ϕ               ur =   sin θ sin ϕ  , uϕ =  r sin θ cos ϕ  , uθ =  r cos θ sin ϕ      cos θ 0 −r sin θ    ,   uθ uϕ mentre quella normalizzata è κr = ur , κϕ = , κθ = . Se r, ϕ, e θ r sin θ r dipendono dal tempo t, esprimendo il vettore velocità di P nella base locale abbiamo ẋ = ṙur + ϕ̇uϕ + θ̇uθ = ṙκr + rϕ̇ sin θ κϕ + rθ̇κθ , da cui otteniamo la seguente espressione dell’energia cinetica     ṙ m 0 0 � � 1 T = 0   ϕ̇  ṙ ϕ̇ θ̇  0 mr2 sin2 θ 2 0 0 mr2 θ̇ �� (3.8) A = m� 2 � ṙ2 + r2 ϕ̇2 sin2 θ + r2 θ̇2 . (3.9) Valutando adesso le componenti di mẍ rispetto alla base locale {ur , uϕ , uθ }, si ha � � � � �� ∂T d ∂T − = m r̈ − r ϕ̇2 sin2 θ + θ̇2 , mẍ · ur = dt ∂ ṙ ∂r � � ∂T d � 2 2 � d ∂T − =m r sin θϕ̇ , mẍ · uϕ = dt ∂ ϕ̇ ∂ϕ dt � � � � � � d d ∂T ∂T 2 2 2 =m r θ̇ − r ϕ̇ sin θ cos θ . mẍ · uθ = − dt ∂ θ̇ ∂θ dt 3.2 Forze conservative 3.2.1 Campi scalari e gradiente Cominciamo con l’introdurre i concetti di campi scalari, campi vettoriali e campi gradiente. Si lavora in uno spazio affine euclideo (A, V, F ) dove A è l’insieme dei punti, V è lo spazio vettoriale soggiacente lo spazio affine e F è l’applicazione che alla coppie di punti associa i rispettivi vettori di V . In A è definito il prodotto scalare “ · ”. Definizione 3.2.1 Dato uno spazio affine euclideo di dimensione n si dice campo scalare su A un’applicazione f da A in R, f : A → R, che opera così f P −→ f (P ) ∈ R. EQUAZIONI DI LAGRANGE 93 In generale un campo scalare f è una funzione di x, ossia delle coordinate cartesiane. Quando sono definite coordinate curvilinee q = (q1 , q2 , ..., qn ), f può essere visto come funzione delle q, vale a dire fˆ (q) = f (x (q)). Il campo si dice di classe C k se ammette derivate parziali continue fino all’ordine k. Definizione 3.2.2 Sia dato un campo scalare f di calsse C 1 , e un riferimento cartesiano ortogonormale {O, ei }. Si dice gradiente del campo scalare f , o semplicemente gradiente, il vettore ∇f , le cui componenti rispetto alla base {O, ei } sono ∇f = ∂f ∂f ∂f e1 + e2 + .... + en . ∂x1 ∂x2 ∂xn (3.10) La derivata di f lungo la direzione n, è la proizione ortogonale di ∇f lungo n, cioè ∂f = ∇f · n. ∂n ∂x ∂x , i = 1, 2, ..., n una base locale (normalizSia adesso κi = ui / |ui | = ∂q / ∂qi i zata) associata alle coordinate curvilinee q, ci chiediamo: come può essere generalizzata la definizione (3.10) alla base locale {κi }? O meglio: quali sono nle coponenti del vettore ∇f nella base {κi }? Certamente potremo scrivere ∇f = i=1 (∇f · κi ) κi , cioè n n n ui 1 ∇f = κi = (∇f · ui ) κi . ∇f · (∇f · κi ) κi = �ui � �ui � i=1 i=1 i=1 Ma se fˆ (q) = f (x (q)), si ha ∂ fˆ (q1 , q2 , ..., qn ) ∂qi = ∂ f (x1 (q1 , q2 , ..., qn ) , ... , xn (q1 , q2 , ..., qn )) ∂qi = ∂f ∂x2 ∂f ∂xn ∂f ∂x1 + + ... + ∂x1 ∂qi ∂x2 ∂qi ∂xn ∂qi (3.11) = ∇f · ui , e quindi9 1 ∂ fˆ ∇f = κi . �ui � ∂qi i=1 n (3.12) ∇f ·κi Esempio 3.2.1 Consideriamo il piano con le coordinate polari, la cui base locale nor1 malizzata è κr = ur , e κϕ = uϕ . Sia f (x, y) un campo scalare, che espresr so rispetto alle coordinate polari, si scriverà come fˆ (r, ϕ) = f (x (r, ϕ) , y (r, ϕ)). L’espressione del gradiente di f rispetto alla base locale è ∇f = ∂ fˆ 1 ∂ fˆ κr + κϕ , ∂r r ∂ϕ 9 Osserviamo che la (3.12) fornisce un’espressione delle componenti covarianti del gradiente ∇f rispetto alla base locale (cioè delle proiezioni ortogonali del vettore ∇f sui vettori della base κi ). 94 dove κϕ . LEZIONI DI SISTEMI DINAMICI ∂ fˆ ∂r , e 1 ∂ fˆ r ∂ϕ rappresentano le proiezioni ortogonali di ∇f rispettivamente su κr e Esempio 3.2.2 Consideriamo le coordinate sferiche x = r sin θ cos ϕ, y = r sin θ sin ϕ, uϕ uθ , κθ = . Al z = r cos θ, la cui base locale normalizzata è κr = ur , κϕ = r sin θ r solito, se f (x, y, z) è un campo scalare, fˆ (r, θ, ϕ) = f (x (r, θ, ϕ) , y (r, θ, ϕ) , y (r, θ, ϕ)) è la sua espressione in termini delle coordinate sferiche, si ha ∇f = ∂ fˆ 1 ∂ fˆ 1 ∂ fˆ κr + κθ + κϕ ∂r r ∂θ r sin θ ∂ϕ (3.13) 3.2.2 Campi vettoriali e campi gardiente Definizione 3.2.3 Un campo vettoriale su uno spazio affine A è un’applicazione χ : A → V , che ad ogni punto P ∈ A, associa un vettore χ (P ) ∈ V , applicato in P . Se in A è dato un riferimento {O, ui }, il campo χ può essere così rappresentato χ = χ1 u1 + χ2 u2 + ..... + χn un , dove ciascuna χi è un campo scalare, ovvero χi = χi (x), i = 1, 2, ..., n. In altri termini il campo vettoriale χ è rappresentato dalla seguente funzione vettoriale     χ1 (x1 , x2 , ... , xn ) χ1 (x)  χ2 (x)   χ2 (x1 , x2 , ... , xn )      χ (P ) −→ χ (x) =  . = .. ..     . . χn (x1 , x2 , ... , xn ) χn (x) Il campo si dirà di classe C k se ogni componente χi è almeno di classe C k . Nello spazio affine A una curva Γ è un’applicazione Γ : I ⊂ R → A, che al generico η ∈ I, associa un punto P (η) ∈ A. Se in A è dato un sistema cartesiano {O, ei }, la curva si rappresenta come un’applicazione da I ⊂ R → Rn , cioè Γ η −→ x (η) = x1 (η) e1 + x2 (η) e2 + ... + xn (η) en , intendendo con x (η), la n-upla di funzioni xi (η), i = 1, ..., n, che rappresentano le componenti del vettore (P (η) − O). La funzione x (η) a valori in Rn viene anche detta parametrizzazione della curva Γ. La curva si dice regolare se xi (η), i = 1, 2, .., n, è derivabile e �x′ (η)� �= 0, dove x′ (η) = x′1 (η) e1 + x′2 (η) e2 + ... + x′n (η) en . Definizione 3.2.4 Data una curva regolare10 Γ ed un campo vettoriale χ , si definisce integrale curvilineo del campo lungo la curva Γ � � χ= χ (x (η)) · x′ (η) dη. (3.14) Γ I 10 E’ sufficiente richiedere che Γ sia regolare a tratti, ossia regolare eccetto che in un numero finito di punti. EQUAZIONI DI LAGRANGE E’ facile provare che della curva. � Γ 95 χ è indipendente dalla parametrizzazione (a meno del segno) Definizione 3.2.5 Un campo vettoriale χ si dice campo gradiente se esiste un campo scalare f di classe C 1 , tale che χ = ∇f . f viene usualmente detta potenziale del campo vettoriale χ. Evidentemente non tutti i campi vettoriali sono anche campi gardienti. Le condizioni che caratterizzano i campi gradienti sono riassunte nel seguente Teorema 3.2.1 Sia χ un campo vettoriale continuo definito in un aperto connesso U ⊆ A. Le seguenti affermazioni sono equivalenti: (a) χ è un campo gradiente. (b) L’integrale curvilineo lungo una qualunque curva che collega i punti P0 e P1 è indipendente dalla curva, ma dipende soltanto dagli estremi. (c) L’integrale curvilineo lungo una qualunque curva chiusa regolare a tratti è nullo. Dim. Dimostriamo solo l’implicazione (a) ⇒ (b), da cui poi discende (c). Sia infatti x (η) , η ∈ (ηo , η1 ), la parametrizzazione di una curva regolare Γ che collega P0 con P1 . Abbiamo � χ = Γ = � � η1 ηo η1 ηo χ (x (η)) · x′ (η) dη = n � i=1 η1 ηo ∂f (x (η)) ′ · xi (η) dη = ∂xi = f (x (η1 )) − f (x (ηo )) . � �� f (P1 ) � ∇f (x (η)) · x′ (η) dη � η1 ηo df dη dη (3.15) f (P1 ) Vediamo una caratteristica dei campi vettoriali gradiente. Supponiamo di fissare un riferimento cartesiano ortogonale {O, ex , ey , ez }, in cui χ si possa scrivere come χ = χx (x, y, z) ex + χy (x, y, z) ey + χz (x, y, z) ez . Se f (x, y, z) è il potenziale abbiamo  ∂f  = χx (x, y, z) ,    ∂x      ∂f = χy (x, y, z) , (3.16)  ∂y         ∂f = χ (x, y, z) . z ∂z 96 LEZIONI DI SISTEMI DINAMICI Ora, se χ è di classe C 1 , applicando il Teorema di Schwarz, si ha ∂χy ∂ ∂f ∂ ∂f ∂χx = = , ⇔ ∂y ∂x ∂x ∂y ∂y ∂x χx ∂ ∂z ∂ ∂z χy ∂f = ∂x χx ∂f = ∂y χy ∂ ∂f , ⇔ ∂x ∂z ∂χz ∂χx = ∂z ∂x χz ∂ ∂y ∂f , ⇔ ∂z ∂χz ∂χy = ∂z ∂y χz Ma allora, definendo il rotore del campo χ come ∂χy ∂χz ∂χx ∂χz ∂χx ∂χy − e1 + − e2 + − e3 , ∇∧χ = ∂y ∂z ∂z ∂x ∂x ∂y che può essere ottenuto formalmente tramite il seguente “determinate simbolico” e1 e2 e3 ∂ ∂ ∂ ∇∧χ= , ∂x ∂y ∂z χ χ χ x y z si ha Proposizione 3.2.1 Se χ è un campo gradiente allora ∇ ∧ χ = 0, ovvero, come si usa spesso dire, χ è irrotazionale In generale il viceversa non è vero. Non è vero cioè che se ∇ ∧ χ = 0, allora χ è un campo gradiente. La prova di questo fatto è data dal seguente Esempio 3.2.3 Consideriamo il campo vettoriale −y x χ= e e2 . + 1 x2 + y 2 x2 + y 2 definito ovunque eccetto che in x = 0, y = 0. E’ facile verificareche ∇ ∧ χ = 0, ma che non è un campo gradiente. E’ infatti sufficiente calcolare Γ χ dove Γ è la circonferenza centrata nell’origine di raggio R Γ : [0, 2π) −→ A, x (η) = R cos η e1 + R sin η e2 , e rendesi conto che Γ χ �= 0. Infatti 2π χ = χ (x (η)) · x′ (η) dη Γ 0 = 2π 0 = 0 sin η cos η e1 + e2 · (−R sin η e1 + R cos η e2 ) dη − R R 2π dη = 2π . EQUAZIONI DI LAGRANGE 97 Allora χ non soddisfa il punto (c) del teorema 3.2.1, e quindi non è un campo gradiente. In effetti, la possibilità di invertire la proposizione χ campo gradiente =⇒ ∇ ∧ χ = 0, risiede nelle caratteristiche del dominio dove è definito χ . A tal proposito abbiamo il seguente Teorema. Sia χ un campo vettoriale definito in un dominio semplicemente connnesso11 e sia ∇ ∧ χ = 0. Allora χ è un campo gradiente, ovvero esiste un potenziale f definito in tutto il dominio per cui χ = ∇f . Dunque in un dominio semplicemente connesso campo gradiente ⇔ campo irrotazionale. In generale, per determinare la funzione potenziale f di un campo gradiente (alternativamente alla risoluzione di (3.16)) conviene scegliere un percorso regolare a tratti Γ particolarmente semplice che unisca un punto P0 ≡ (xo , yo , zo ), fissato una volta per tutte, con il generico punto P ≡ (x, y, z). 3.2.3 Forza posizionale e forza conservativa Dato uno spazio affine A, una forza posizionale, o campo di forza, è un campo vettoriale definito su un aperto connesso U ⊆ A, ovvero un’applicazione F : U → V , che alla posizione P associa la forza F (P ) . Un punto materiale che si trova nella posizione P è dunque soggetto alla forza F (P ). Se {O, ei } è un riferimento cartesiano A, scriveremo F = F1 (x) e1 + F2 (x) e2 + F3 (x) e3 , dove, al solito, con x indichiamo le coordinate del punto12 P . Se F è un campo gradiente allora, ricordando la definizione 3.2.5, esiste un campo scalare V (x), usualmente detto energia potenziale, per cui13 F = −∇V. (3.17) Una forza posizionale F di tipo campo gradiente, viene detta forza conservativa. Adesso, sfruttando il teorema 3.2.1 vogliamo leggere le proprietà dei campi gradienti in termini più fisici. A tal scopo introduciamo il concetto di lavoro compiuto da una forza F su un punto materiale ad essa soggetto. 11 Un aperto connesso C di uno spazio topologico si dice semplicemente connesso se, fissati comunque due punti A, B in C e scelte arbitrariamente due curve Γ1 (λ), Γ2 (λ), con λ ∈ [λ− , λ+ ], che collegano A = Γ1 (λ− ) = Γ2 (λ− ) con B = Γ1 (λ+ ) = Γ2 (λ+ ), esiste una trasformazione continua (omotopia) di una curva nell’altra. Formalmente, deve esistere una funzione continua ψ : [λ− , λ+ ] × [0, 1] → C, tale che ψ (λ, 0) = Γ1 (λ), ψ (λ, 1) = Γ2 (λ), ψ (λ− , ν) = A, ψ (λ+ , ν) = B, per ogni λ ∈ [λ+ , λ− ], ν ∈ [0, 1]. 12 Vale a dire le componenti del vettore (P − O). 13 L’energia potenziale V (x) corrisponde al potenziale, cambiato di segno, della definizione 3.2.5. 98 LEZIONI DI SISTEMI DINAMICI Definizione 3.2.6 Data una forza14 F , il lavoro compiuto da F nell’unità di tempo su punto materiale, ovvero la potenza, è definito come W = F · ẋ, dove ẋ è la velocità del punto materiale. Il lavoro compiuto da F nell’intervallo di tempo (t0 , t1 ) è dato da15 t1 L (t0 , t1 ) = F (x (τ )) · ẋ (τ ) dτ . (3.18) t0 Nella formula (3.18) si riconosce l’integrale curvilineo di F lungo la traiettoria parametrizzata col tempo. Quindi, considerando le forze posizionali ed applicando semplicemente il teorema 3.2.1, abbiamo la ben nota caratterizzazione delle forze conservative Teorema 3.2.2 Una forza posizionale F definita in U ⊆ A, U aperto connesso, è conservativa se e sole se il lavoro compiuto da F in un qualsiasi intervallo di tempo (t0 , t1 ) è indipendente dalla traiettoria. Sia ora F una forza conservativa che, per semplicità, supponiamo definita su tutto lo spazio, ci chiediamo: come possiamo determinarne la relativa energia potenziale? Se F = −∇V (x), si fissa un punto Po , le cui coordinate sono identificate dal vettore xo , dopo di che si considera il generico punto P le cui coordinate sono date dal vettore x. Sia poi Γ(Po ,P ) una generica curva regolare a tratti che connette Po con P , cioè [ηo , η1 ] Abbiamo Γ(P,Po ) F Γ(Po ,P ) −→ = − = − e quindi V (x) = − x (η) , tale che x (ηo ) = xo , x (η1 ) = x . Γ(P,Po ) η1 ηo ∇V = − (3.14) η1 ηo ∇V (x (η)) · x′ (η) dη dV (x (η)) dη = −[ V (x (ηo )) − V (x (η1 )) ], dη xo x F + V (xo ). Chiaramente V (xo ) è una costante che Γ(P,Po ) quindi possiamo porre uaguale a zero (l’energia potenziale è definita a meno di una costante). Pertanto, se Γ (P, Po ) è una qualsiasi curva regolare a tratti che, partendo da Po giunge sino al punto P , si ha F . (3.19) V (x) = − Γ(P,Po ) 14 Osserviamo che la definzione di lavoro prescinde dal fatto che la forza F sia o meno posizionale: la definizione si applica a qualsiasi forza. 15 E’ ovviamente sottinteso che x (t) ∈ U , ∀ t ∈ [t , t ], essendo U il dominio dove è definta F . 0 1 EQUAZIONI DI LAGRANGE 99 Concludiamo questa sezione osservando come il senso fisico della definizione 3.2.6 può essere chiarito pensando a cosa succede quando solleviamo un corpo pesante (di massa m). Supponiamo di sollevare il peso di una altezza h lungo la verticale e supponiamo di farlo in modo da mantenere la velocità del peso costante per la maggior parte della ascesa. Questo significa che dovremo applicare, nell’intervallo di tempo in cui il corpo sale con velocità costante, una forza F uguale e opposta alla forza peso mg agente sul corpo (la forza dovrà essere inizialmente maggiore del peso per mettere in moto il corpo, e sarà poi minore del peso se riportiamo il corpo allo stato di quiete alla nuova quota). In questo caso, se T è il tempo impiegato per sollevare il peso, il lavoro effettuato dalla forza F sarà T L= F · ẋdt = �F � �ẋ� T = �F � h, 0 h dove h è proprio l’innalzamento subito dal corpo (forza e velocità costante sono paralleli e concordi). Il lavoro misura in questo caso “quanta fatica si è dovuta fare per alzare il peso”. La definizione di lavoro è strettamente legata allo studio delle macchine semplici (la leva, il piano inclinato, le pulegge). Vediamo cosa succede se solleviamo il solito peso servendoci di un piano inclinato. Supponendo di poter trascurare l’attrito del peso con il piano inclinato, abbiamo ora che la forza necessaria per sollevare il peso (se esercitata nella direzione parallela al piano inclinato stesso) deve compensare la sola componente del peso parallela al piano: la componente normale verrà fornita “gratuitamente” dalla reazione di appoggio sul piano inclinato. Questo fa sì che la forza necessaria per sollevare il peso sia minore di quella necessaria per sollevarlo lungo la verticale. In compenso il cammino compiuto sarà maggiore. E’ facile vedere che nei due casi è uguale il lavoro compiuto (e quindi la “fatica spesa”). Esempio 3.2.4 Vediamo alcuni esempi di forze posizionali conservative nello spazio affine tridimensionale. Forza uniforme, F = p, campo vettoriale costante. Questo è il caso della forza peso che è data da mg , dove m è la massa del corpo e g l’accelerazione di gravità definita su tutto lo spazio. Consideriamo un riferimento cartesiano ortogonale {O, ex , ey , ez }, e supponiamo che p = pez , con p costante. Sia x : [to , t1 ] −→ R3 , (3.20) x (t) = x (t) ex + y (t) ey + z (t) ez , una generica curva regolare che connette i punti Po e P , cioè x (to ) = xo = xo ex + yo ey + zo ez , x (t1 ) = x = xex + yey + zez . Applichiamo la (3.18) e calcoliamo il lavoro F = pez , lungo la curva t1 pez · (ẋ (t) ex + ẏ (t) ey + ż (t) ez ) dt = p L (t0 , t1 ) = t0 = p (z − zo ) . Dal teorema 3.2.2 segue che F è conservativa. (3.21) t1 ż (t) dt t0 (3.22) 100 LEZIONI DI SISTEMI DINAMICI Per calcolarne l’energia potenziale è sufficiente considerare ∇V (x) = −F = −pez , cioè  ∂V = 0,     ∂x      ∂V V (x, y, z) = −pz + C, = 0,  ∂y        ∂V = −p,  ∂z dove C è una qualsiasi costante che, per semplicità, poniamo uguale a zero. Otteniamo dunque V (x, y, z) = −p z. Notiamo che saremmo potuti giungere allo stesso risultato ricorrendo alla (3.19) e sfruttando la (3.22). Infatti V (x, y, z) − V (xo , yo , zo ) = −L (t0 , t1 ) = −p (z − zo ) , (3.19) (3.22) da cui, ponendo V (xo , yo , zo ) = 0 e scegliendo il punto Po in modo che zo = 0, otteniamo di nuovo V (x, y, z) = −p z. In particolare, se F = −mgez , cioè se p = −mg, l’energia potenziale dovuta alla forza peso è V = mgz. Forza di richiamo elastica verso il punto O, F = −k (P − O). Tale forza è quella dovuta ad una molla di lunghezza a riposo trascurabile, rigidezza (o costante elastica) k, con un estremo fisso nel punto O. F è definita su tutto lo spazio e, scrivendola in componenti, abbiamo F = −kx = −k (xex + yey + zez ) , Si dimostra che la forza è conservativa applicando il teorema 3.2.2. Infatti, se x (t) è la curva (3.20) che connette i punti Po e P1 , dati da (3.21), si ha � t1 L (t0 , t1 ) = F (x (t)) · ẋdt t0 � � k t1 d � 2 x + y 2 + z 2 dt = −k (xẋ + y ẏ + z ż) dt = − 2 dt t0 t0 � � k 2 2 |x1 | − |xo | . = − 2 Il lavoro è pertanto indipendente dalla curva che connette Po e P1 . La relativa energia potenziale può essere calcolata come nel caso precedente ottenendo � t1 V (x, y, z) = � k� 2 x + y2 + z 2 . 2 k L’espressione di V in coordinate sferiche è banalmente V (r) = r2 . In particolare, 2 ricordando la (3.13) abbiamo F =− ∂V (r) κr = −krκr . ∂r EQUAZIONI DI LAGRANGE 101 Forza centrale di tipo F (P ) = f (| �P − O�) vers(P − O), dove O è un punto fisso dello spazio. Tale forza è analoga, in forma, a quella di richiamo elastica, ma adesso la costante elastica non è uniforme, dipendendo dalla distanza di P dall’origine. In più, la funzione f potrebbe non essere definita nell’origine: questo è il caso, per esempio, della forza di attrazione gravitazionale o della forza elettrostatica. In ogni caso, anche escludendo l’origine, il dominio dove la forza è definita è comunque semplicemente connesso. Per mostrare che la F è conservativa facciamo vedere che F soddisfa il punto (c) del teorema 3.2.1. Infatti, ricordando la (1.13) dell’esempio 1.4.2, possiamo scrivere F = f (r) κr . Fissiamo quindi un punto Po , cioè (Po − O) = ro κr , e consideriamo un generico (P − O) = rκr . Adesso, lavorando in coordinate polari sferiche, consideriamo una generica curva Γ(Po ,P ) regolare a tratti che connette Po e P , cioè x (η) = r (η) sin θ (η) cos φ (η) ex + r (η) sin θ (η) sin φ (η) ey + r (η) cos θ (η) ez . Dalla (3.14) abbiamo F = Γ(Po ,P ) η1 ηo F (x (η)) · x′ (η) dη. Siccome x′ (η) = r′ (η) κr + θ′ (η) uθ + φ′ (η) uφ , il precedente integrale diventa η1 η1 d ′ [V (r (η))] ds, F = f (r (η)) r (η) dη = − Γ(Po ,P ) ηo ηo dη dove V (r) = − r f (s) ds. (3.23) ro Per cui, se la curva è chiusa, cioè r = ro , si ha Γ(Po ,Po ) F = 0, e dunque la forza è conservativa. Si noti che la (3.23) è l’espressione per l’energia potenziale V (che dipende soltanto dalla coordinata radiale r). In particolare, ricordando la (3.13), abbiamo r ∂ ∇V (r) = − f (s) ds κr = −f (r) κr , ⇒ −∇V (r) = F . ∂r ro Nel caso della forza di attrazione gravitazionale, la forza con cui il punto materiale P1 di massa m1 , attrae il punto materiale P2 di massa m2 è m1 m2 F = −G 2 κr , r dove G è la costante di gravitazione universale, G = 6.67 × 10−11 N m2 /kg 2 . Quindi focalizzandoci sul punto P2 , la forza cui lo stesso è soggetto è scrivibile come F = m2 K − 2 κr , dove K = Gm1 , la cui energia potenziale, in coordinate polari sferiche, è r r mK mK mK + − 2 ds = − . V (r) = − s r ro ro Considerando ro → ∞, abbiamo V (r) = − mK . r 102 LEZIONI DI SISTEMI DINAMICI 3.3 Equazioni di Lagrange per un punto materiale Consideriamo adesso il moto di un punto materiale che si muove nello spazio soggetto ad una forza posizionale conservativa F , la cui energia potenziale è V . Il moto, in accordo con la seconda legge di Newton, è descritto dall’equazione m ẍ = F = −∇V (x) . (3.24) L’equazione vettoriale (3.24) si può scrivere in un sistema di coordinate cartesiane ortogonali e da essa si ottiene il sistema ẍi = Fi (x1 , x2 , x3 ) = − ∂V , ∂xi i = 1, 2, 3 , (3.25) In molti casi è però preferibile usare un sistema di coordinate locali, per esempio le coordinate sferiche se il campo di forza ha una simmetria centrale rispetto a un punto fisso dello spazio. La riscrittura di (3.24) in un diverso sistema di coordinate locali richiede una scomposizione diversa dalla (3.25). Vediamo come sia possibile costruire una “ricetta” per la scrittura “automatica” di un sistema di equazioni scalari di moto equivalente alla (3.25) in un qualsiasi sistema di coordinate. Tale procedura inoltre si generalizza a sistemi meccanici composti da un numero qualsiasi di punti materiali interagenti tra loro e con l’esterno ed eventulamente soggetti a limitazioni al loro moto “naturale” espresse da “vincoli olonomi lisci” (il senso esatto di queste espressioni verrà chiarito nel capitolo 4). Supponiamo che siano date le coordinate curvilinee q = (q1 , q2 , q3 ),  x = x (q1 , q2 , q3 ) ,      y = y (q1 , q2 , q3 ) , x = x (q) , ⇔      z = z (q1 , q2 , q3 ) , e che {u1 , u2 , u3 } sia la relativa base locale. Sia inoltre V̂ (q1 , q2 , q3 ) = V (x (q1 , q2 , q3 ) , y (q1 , q2 , q3 ) , z (q1 , q2 , q3 )) . Adesso proiettiamo16 la (3.24) lungo i vettori della base locale m ẍ · ui = −∇V (x) · ui , i = 1, 2, 3. (3.26) Ricordando (3.11) abbiamo ∂ V̂ (q1 , q2 , q3 ) = ∇V · ui , ∂qi mentre dal teorema 3.1.1 otteniamo mẍ · ui = d dt � ∂T ∂ q̇i � − i = 1, 2, 3, ∂T , i = 1, 2, 3. ∂qi 16 Proiettare l’equazione (3.24) lungo {u , u , u } significa determinare le componenti covarianti 1 2 3 dell’accelerazione e della forza rispetto alla base locale. EQUAZIONI DI LAGRANGE 103 Quindi la (3.26) si riscrive così d dt � ∂T · ∂ qi � − ∂T ∂ V̂ (q1 , q2 , q3 ) = , ∂qi ∂qi i = 1, 2, 3, o anche come � � �  � ∂ T − V̂ ∂ T − V̂ d  − = 0, · dt ∂qi ∂ qi i = 1, 2, 3, dal momento che V̂ non dipende dalle q̇i . Ma allora, se introduciamo la funzione di Lagrange, o semplicemente Lagrangiana, L (q, q̇) = T (q, q̇) − V̂ (q) , (3.27) la scrittura dell’equzione mẍ = F rispetto alla base locale diventa d dt � ∂L ∂ q̇i � − ∂L = 0, ∂qi i = 1, 2, 3. (3.28) A questo punto dovrebbe essere chiara la ricetta “automatica”: si scelgono le variabili (q1 , q2 , q3 ), dette anche coordinate lagrangiane, si esprime la velocità v, e quindi l’energia cinetica T e l’energia potenziale V rispetto a queste variabili, si somma T a −V e si inserisce la funzione Lagrangiana così ottenuta nella (3.28). Il risultato sono le equazioni di moto nel sistema di coordinate scelto. Notiamo infine che, ricordando l’espressione di T tramite la (3.4), con A data dalla (3.3), possiamo riscrivere la Lagrangiana (3.27) nella seguente forma “compatta” L (q, q̇) = 1 T q̇ A (q) q̇ − V̂ (q) . 2 3.3.1 Conservazione dell’energia, variabili cicliche e funzione di Routh Si definisce funzione di Hamilton17 , o semplicemente Hamiltoniana, H (q, q̇) = 3 � i=1 q̇i ∂L −L. ∂ q̇i (3.29) 17 Sir William Rowan Hamilton (Dublino 1805 - Dublino 1865). Fisico matematico e professore di astronomia al Trinity College di Dublino. 104 LEZIONI DI SISTEMI DINAMICI Ricordando la (3.2) abbiamo18 3 � ∂L q̇i ∂ q̇i i=1 = = = =   3 3 � ∂T ∂ 1 � q̇i = q̇i ah k (q) q̇h q̇k  ∂ q̇i ∂ q̇i 2 i=1 i=1 3 � h,k = 1   � � 3 � ∂ q̇ 1 ∂ q̇ h k  ah k (q) q̇k + q̇h q̇i  2 ∂ q̇ ∂ q̇ i i i=1 3 � h,k = 1   3 � 1 q̇i  ah k (q) (δhi q̇k + q̇h δki ) 2 i=1 3 � h,k = 1 3 3 3 3 1� � 1� � ai k (q) q̇i q̇k + ah i (q) q̇i q̇h = 2T, 2 i=1 2 i=1 k=1 h=1 � �� T per cui T H (q, q̇) = 2T − L = T + V̂ . (3.27) (3.30) L’Hamiltoniana di un punto materiale soggetto soltanto a forze conservative del tipo (3.17) è la somma dell’energia cinetica di quella potenziale: coincide quindi con l’energia meccanica totale del punto materiale. Proposizione 3.3.1 L’Hamiltoniana H (q, q̇) è costante durante il moto o, come si usa dire, è un’integrale primo del moto. Dim. Dobbiamo provare che dH dt = dH = 0. Infatti dalla (3.29) dt 3 � q̈i 3 � q̈i i=1 = i=1 ∂L · ∂ qi + q̇i � � d ∂L dL (q (t) , q̇ (t)) − dt ∂ q̇i dt � �� ∂L = ∂q i v. formula (3.28) ∂L · ∂ qi 3 + q̇i ∂L � ∂L ∂L − q̈j + q̇j = 0 . ∂qi j=1 ∂ q̇j ∂qj 18 Il risulatato n-esimo grado f 3 · q ∂T = · i=1 i ∂ q i (x1 , x2 , ..., xk ), 2T , altro non è che il teorema di Eulero per una funzione omogenea di k ∂f xi = n f . ∂xi i=1 EQUAZIONI DI LAGRANGE 105 La proposizione appena illustrata mette in luce, dato il significato energetico della H, una proprietà molto importante: in particolari condizioni (punto materiale non vincolato e soggetto soltanto a forze conservative) l’energia meccanica si conserva. In particolare, nella sezione 5.7 daremo la definizione di Hamiltoniana per un sistema di N punti materiali, soggetto a m vincoli e vedremo che la relazione H = T + V̂ , non è vera in generale, lo è soltanto nel caso di vincoli fissi. Analizzeremo inoltre i dH casi in cui = 0. dt Oltre all’energia può accadere che esistano anche altre quantità che rimangono costanti durante il moto: è il caso, per esempio, delle variabili cicliche o ignorabili. Definizione 3.3.1 La variabile qi si dice ciclica19 , o ignorabile, se ∂L = 0, ∂qi cioè qi non compare esplicitamente nella Lagrangiana L, mentre compare la q̇i . E’ immediato vedere che se qi è ciclica e il moto è governato dalle equazioni (3.28), allora d ∂L ∂L = 0, =⇒ = costante. dt ∂ q̇i ∂ q̇i Definizione 3.3.2 Si dice momento coniugato o momento generalizzato, la quantità pi = ∂L . ∂ q̇i (3.31) Abbiamo quindi la seguente Proposizione 3.3.2 Se qi è ciclica e il moto è goveranto dal sistema (3.28), allora pi è costante durante il moto ed è quindi un integrale primo. Il punto adesso è il seguente: se sono presenti variabili cicliche come possono essere utilizzate per semplificare le equazioni di moto (3.28)? Una possibilità evidentemente è questa: si scrivono esplicitamente quelle equazioni del sistema (3.28) non relative alle variabili cicliche e si cerca di semplificarle sfruttando il fatto che pi = costante. Questo, per esempio, è il metodo che adotteremo nel paragrafo 3.4.1, quando studieremo l’equazione che regola il moto di un punto materiale dall’origine sotto l’azione di una forza conservativa di tipo centrale. Tuttavia questa non è la sola possibilità: si possono infatti utilizzare le variabili cicliche per “semplificare” la funzione Lagrangiana. La procedura però è delicata e merita qualche commento. Infatti, supponiamo che la q1 sia ciclica, cioè L (q̇1 , q̇2 , q̇3 , q2 , q3 ). Se siamo in grado di invertire la (3.31), scriveremo q̇1 = q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , 19 L’espressione coordinate cicliche fu coniata da Helmholtz; come sinonimo si trova spesso l’espressione variabili ignorabili e nel testo del Lanczos si parla di kinosthenic coordinates che non osiamo tradurre. 106 LEZIONI DI SISTEMI DINAMICI dove sappiamo che p1 è costante (e quindi è determinata dalle condizioni iniziali). Quindi, sostituendo nella L otteniamo L q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 = L̂ (p1 , q̇2 , q̇3 , q2 , q3 ) , dove, lo rammentiamo ancora, p1 è una costante e non una variabile. Parrebbe quindi di aver eliminato una variabile e, di conseguenza, di aver semplificato il sistema. Tuttavia la Lagrangiana L̂ così ottenuta non conduce alle equazioni del moto corrette: cioè d ∂ L̂ ∂ L̂ − = 0, i = 2, 3, dt ∂ q̇i ∂qi non sono le giuste equazioni di moto. Infatti ∂ L̂ ∂ q̇2 = ∂ L̂ ∂q2 = q̇ 1 ∂ q̇ ∂L ∂ ∂L ∂L + = p1 1 + , ∂ q̇ ∂ q̇ ∂ q̇ ∂ q̇2 2 2 2 ∂ q̇1 q̇ 1 ∂ q̇ ∂L ∂ ∂L ∂L + = p1 1 + , ∂q2 ∂q2 ∂q2 ∂ q̇1 ∂q2 · e analoghe equazioni si trovano per q 3 , e q3 . Di conseguenza d ∂ L̂ q̇1 ∂ L̂ d ∂ ∂ q̇ 1 d ∂L ∂L − − + − = p1 dt ∂ q̇2 ∂q2 dt ∂ q̇2 ∂q2 dt ∂ q̇2 ∂q2 =0 = p1 d dt ∂ q̇1 ∂ q̇2 − ∂ q̇ 1 , ∂q2 ed analogamente per q3 . Si conclude quindi che L̂ non è la Lagrangiana effettiva del sistema semplificato. La funzione che invece soddisfa le equazioni di moto, poste nella ∂ d ∂ 20 forma dt ∂ q̇i − ∂qi = 0, i = 2, 3, è la funzione di Routh , o Routhiana R (q̇2 , q̇3 , q2 , q3 ) = L̂ (p1 , q̇2 , q̇3 , q2 , q3 ) − p1 q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) = L q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 − q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) . p1 Proposizione 3.3.3 La funzione Routhiana soddisfa le equazioni d ∂R ∂R − = 0, i = 2, 3. dt ∂ q̇i ∂qi Dim. La dimostrazione è una semplice riscrittura dei passaggi sopra illustrati. 20 Edward John Routh (Québec, 1831 – Cambridge, 1907) è stato un matematico inglese. (3.32) (3.33) EQUAZIONI DI LAGRANGE 107 Generalizzando la procedura21 al caso in cui ci siano due variabili cicliche, per esempio q1 e q2 (cioè al caso in cui né q1 né q2 compaiono esplicitamente nella Lagrangiana L) si procede introducendo i momenti coniugati pi , i = 1, 2, tramite  ∂L (q̇1 , q̇2 , q̇3 , q3 )   p = ,   1 ∂ q̇1     p2 = ∂L (q̇1 , q̇2 , q̇3 , q3 ) , ∂ q̇2 che si sfruttatano per esprimere q̇1 e q̇2 , in funzione di p1 , p2 , q̇3 e q3 , q̇i = � q̇ i (p1 , p2 , q̇3 , q3 ) , i = 1, 2. La funzione Routhina è dunque R (q̇3 , q3 ) = L̂ (p1 , p2 , q̇3 , q3 ) − � i=1,2 pi � q̇ i (p1 , p2 , q̇3 , q3 ) , (3.34) � � q̇ 1 (p1 , p2 , q̇3 , q3 ) , � q̇ 2 (p1 , p2 , q̇3 , q3 ) , q̇3 , q3 . dove L̂ (p1 , p2 , q̇3 , q3 ) = L � Concludiamo la sezione osservando che la presenza di una, o più variabili cicliche non ha alcun effetto sulla funzione Hamiltoniana. Infatti, se per esempio la variabile q1 non compare nella L (cioè è ciclica), data la definizione (3.29), non comparirà neppure nell’Hamiltoniana H, cioè H = H (q̇1 , q̇2 , q̇3 , q2 , q3 ). Di conseguenza se introduciamo � � � (p1 , q̇2 , q̇3 , q2 , q3 ) = H � H q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 , (3.35) è facile vedere che � (p1 , q̇2 , q̇3 , q2 , q3 ) = H 3 � ∂R i=2 ∂ q̇i q̇i − R , dove R è data dalla (3.34). Svolgendo i calcoli sul membro di destra si ottiene ∂R ∂ q̇i = = � � ∂ � �� L q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 − p1 � q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) ∂ q̇i q̇ 1 ∂� q̇ ∂L ∂L ∂L ∂� + − p1 1 = , ∂ q̇i ∂ q̇i ∂ q̇i ∂� q̇1 ∂ q̇i �� i = 2, 3, (3.36) p1 21 Per ulteriori approfondimenti si rimanda al capitolo 3, del testo: P. Biscari, C. Poggi, E. G. Virga, Mechanics Notebook, Liguori Editore, Napoli 1999. 108 LEZIONI DI SISTEMI DINAMICI da cui 3 3 ∂R ∂L q̇i − R = q̇i − L + p1 q̇1 ∂ q̇i ∂ q̇i (3.34) i=2 i=2 ∂L ∂ q̇1 = 3 ∂L q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 ∂ q̇i i=1 q̇i − L q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 (p1 , q̇2 , q̇3 , q2 , q3 ) . = H q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) , q̇2 , q̇3 , q2 , q3 = H Quindi per ottenere una versione “semplificata” dell’energia meccanica è sufficiente inserire direttamente l’espressione di q1 = q̇ 1 (p1 , q̇2 , q̇3 , q2 , q3 ) nella Hamiltoniana H, come mostrato dalla (3.35). La generalizzazione al caso di N punti materiali sarà illustrata nella sezione 5.6, dove considereremo l variabili q, cioè (q1 , ..., ql ), di cui v ≤ l, cicliche. Nota 3.3.1 Come già osservato la sostituzione di una variabile ciclica nella funzione di Lagrange conduce ad una L non “corretta”, cioè una Lagrangiana che genera equazioni di moto non corrette. Per rendere ancor più evidente questo fatto, tentiamo di sfruttare la conservazione dell’energia meccanica. Ricordando la (3.30) e la proposizione 3.3.1, abbiamo H = T + V = E, con E costante. Pertanto, sfruttando tale relazione nella Lagrangiana, potremmo scrivere L = T − V = T − (E − T ) = 2T − E, e le equazioni di Lagrange (3.28) si ridurrebbero a d ∂T ∂T − = 0, i = 1, 2, 3, dt ∂ q· ∂qi i ovviamente non corrette (basti pensare al semplice oscillatore armonico). Se, nell’ambito del formalismo lagrangiano, si vuole tener conto del fatto che T + V = costante, bisogna introdurre una opportuna funzione di Routh. Tale problema verrà discusso nella sezione 8.5: l’ambito naturale dove sviluppare questo tema è infatti quello dei metodi variazionali. 3.4 Il moto centrale Vediamo ora un’applicazione importante delle equazioni di Lagrange: il moto di un punto materiale di massa m sotto la sola azione di una forza centrale del tipo F = f (�P − O�) vers(P − O), ⇔ F = f (r)ur , (3.37) come quella già vista nell’esempio 3.2.4. Introduciamo il sistema di coordinate sferiche (r, θ, ϕ) (ovviamente centrate in O). Sappiamo che una forza della forma (3.37) è EQUAZIONI DI LAGRANGE 109 conservativa e che la sua energia potenziale è data dalla (3.23). Per scrivere la funzione Lagrangiana basta quindi ricordare l’esempio 3.1.3, dove si trova l’espressione esplicita dell’energia cinetica del punto materiale (v. formula (3.9)). La funzione di Lagrange è quindi r 1 2 2 2 2 2 2 L = T − V (r) = m ṙ + r θ̇ + r sin θ ϕ̇ + f (s) ds . 2 ro Si noti che la ϕ è una coordinata ciclica (v. definizione 3.3.1). Questo implica, in virtù della proposizione 3.3.2, che il momento coniugato pϕ = ∂L · ∂ϕ = m r2 sin2 θ ϕ̇ , è costante durante il moto, ovvero un suo integrale primo. Per integrare le equazioni è bene scegliere in modo opportuno il sistema di riferimento (si noti che le equazioni che abbiamo scritto valgono per qualsiasi riferimento purché abbia origine in O; ci resta quindi la libertà di ruotare gli assi come più ci fa comodo). Posizioniamo quindi l’asse delle x in modo che P si trovi, all’istante iniziale, su questo asse. Ciò significa che al tempo iniziale (che possiamo prendere, senza π perdere in generalità, come t = 0) si ha ϕ(0) = 0 e θ(0) = (la prima condizione 2 iniziale è ovvia, per la seconda si osservi che l’asse delle x appartiene al piano z = 0 comunque siano posizionati gli assi). Ora ruotiamo il sistema di riferimento attorno all’asse x finchè la velocità iniziale v 0 si trovi nel piano z = 0. Questa scelta è univoca se la velocità iniziale non è parallela al vettore P0 − O che individua la posizione iniziale, P (t = 0) = P0 , ovvero se v 0 ∧ (P0 − O) �= 0. Questa è detta condizione di non degenerazione del problema del moto in un campo centrale. E’ facile vedere che se questa condizione è violata, il moto si riduce a un moto unidimensionale sulla retta individuata dai punti P0 e O. Notiamo poi che la condizione P0 ≡ O deve essere eslcusa in molti casi perché la forza non è definita in O. Inoltre se P0 ≡ O, il sistema di coordinate lagrangiane non è definito22 . Con questa scelta degli assi si ha che, nel punto P0 , ur = e1 , uθ = −e3 , uϕ = e2 , dove e1 , e2 , e3 , sono i versori degli assi x, y e z, rispettivamente. Di conseguenza abbiamo θ̇(0) = 0. π Vogliamo ora far vedere che θ(t) ≡ è compatibile con le equazioni di moto. 2 Scriviamo infatti l’equazione di Lagrange per la variabile θ d ∂L ∂L = mθ̈ + 2mr ṙ θ̇2 − mr2 ϕ̇2 cos θ sin θ = 0, − dt ∂ θ̇ ∂θ π ed osserviamo che è sempre soddisfatta prendendo θ(t) = costantemente23, qualun2 que siano le funzioni (incognite) r(t) e ϕ(t). Ne segue che il moto avviene nel piano 22 Si ricordi l’esempio 1.4.2, det J = − r 2 sin θ, si annulla per r = 0. fatto che l’angolo θ(t) sia sempre uguale a π2 implica che il moto avviene nel piano z = 0, con la nostra scelta degli assi. La cosa fisicamente significativa è che il moto avviene su un piano, non che questo sia il piano z = 0! Ma questo potevamo dedurlo a priori senza far intervenire alcun sistema di coordinate: ·· infatti poiché il moto è centrale, abbiamo sempre x ∧ (P − O) = 0 (la forza, e quindi l’accelerazione, è diretta come la congiungente di P con O) da cui si deduce che v ∧ (P − O) = L, è un vettore costante. Di conseguenza il moto avviene nel piano (fisso) passante per O e perpendicolare a L. 23 Il 110 LEZIONI DI SISTEMI DINAMICI z y z’ vo y’ Po x Figura 3.1: Posizionamento del piano coordinato θ = π/2, ovvero dal piano determinato dal centro del moto O, dalla posizione iniziale P0 e dalla direzione della velocità iniziale v 0 . Inoltre, posto θ = π/2 nelle altre due equazioni, otteniamo un sistema di due equazioni differenziali per le sole r e ϕ, che possiamo risolvere con le opportune condizioni iniziali, ottenendo la soluzione del sistema nella forma r = r(t), θ = π/2 e ϕ = ϕ(t). Riscriviamo quindi la Lagrangiana del problema tenendo conto del fatto che θ ≡ π/2 (cioè del fatto che il moto avviene su di un piano) L= 1 2 m ṙ + r2 ϕ̇2 − V (r) . 2 Ricordando che ϕ è ciclica, cioè che pϕ = m r2 ϕ̇ = costante , (3.38) possiamo introdurre la quantità Ȧ = 1 2 r ϕ̇ , 2 ⇔ pϕ = 2mȦ, (3.39) detta velocità areolare, e immediatamente dedurre che mȦ = cost. =⇒ Ȧ = cost. Tale risultato, cioè la conservazione della quantità Ȧ, si può interpretare osservando che 12 r2 ϕ̇ rappresenta la variazione rispetto al tempo dell’area spazzata dal raggio vettore P − O, ovvero dell’area del settore di piano compreso tra i vettori P (t1 ) − O e P (t0 ) − O e la traiettoria sul piano del punto P (t) per t ∈ [t0 , t1 ]. Abbiamo così EQUAZIONI DI LAGRANGE 111 dimostrato la seconda legge di Keplero24 (che vale per qualsiasi forza centrale del tipo (3.37)): Il raggio vettore spazza aree uguali in tempi uguali. Nota 3.4.1 Ricordando la definizione (3.29), o meglio la (3.30), calcoliamo l’Hamiltoniana del sistema H=T +V = 1 2 m ṙ + r2 ϕ̇2 + V (r). 2 Adesso, tenendo conto del fatto che la ϕ è ciclica, l’Hamiltoniana “semplificata” è 2 2 = m ṙ + m 2Ȧ + V (r), H 2 r2 (3.40) 2 p2 = m ṙ + 1 ϕ + V (r). ovvero H 2 2r2 m Esempio 3.4.1 Vediamo come si giunge alla conservazione della velocità areolere per punti materiali in campi centrali tramite il metodo del momento angolare del punto materiale rispetto ad O, definito come LO = x∧ mẋ. Se l’unica forza agente sul punto materiale P è di tipo centrale come la (3.37), è facile provare che L̇O = 0. Infatti ˙ L̇O = x∧ mẋ + x∧ mẍ =0 = x∧ f (r)ur = 0, (3.37) dal momento che, in coordinate sferiche, x = rur . Pertanto LO (t) = LO (0), ∀ t ≥ 0. Ci sono quindi due possibilità: 1. LO (0) �= 0 . 2. LO (0) = 0 . Nel primo caso il punto materiale non transita mai per l’origine (se infatti P transitasse per O si avrebbe LO (0) = 0). Il moto inoltre avvine su di un piano che contiene il punto O, dal momento che, ∀ t ≥ 0, x · LO (t) = x · LO (0) = 0. Ma x · LO (0) = 0, scritta in coordinate cartesiane, è proprio l’equazione di un piano che passa per l’origine O, ed è perpendicolare al vettore LO (0). Quindi, operando in coordinate sferiche, orientiamo il sistema di riferimento affinchè il piano del moto coincida con θ = π/2. Ricordando la (3.8), scriviamo il momento angolare in coordinate sferiche LO (0) = mrκr ∧ (ṙκr + rϕ̇ sin θ κϕ ) = mr2 ϕ̇κr ∧ κϕ , e quindi �LO � = costante, =⇒ mr2 ϕ̇ = costante, 24 Johannes von Kepler (Weil der Stadt, 1571 – Ratisbona, 1630) fu un astronomo, matematico e musicista tedesco. 112 LEZIONI DI SISTEMI DINAMICI che è esattamente la (3.38). Nel secondo caso abbiamo che x (t) e ẋ (t) sono costantemente paralleli. Utilizzando ancora le coordinate sferiche si ottien mrϕ̇ur ∧ uϕ = 0, ⇒ ϕ̇ = 0, 0 = mrur ∧ ṙur + ϕ̇uϕ + θ̇uθ , =⇒ ⇒ θ̇ = 0, mrθ̇ur ∧ uθ = 0, e quindi ϕ (t) = ϕo , θ (t) = θo . Il moto avviene quindi sulla retta che passa per l’origine ed è caratterizzata dagli angoli ϕo , e θo . 3.4.1 L’equazione per r Scriviamo ora l’equazione per la variabile r (t) tenendo conto del fatto che θ ≡ π/2, d ∂L ∂L ∂V (r) − = mr̈ − mrϕ̇2 + = 0. (3.41) dt ∂ ṙ ∂r ∂r Possiamo ora riscrivere la (3.41) eliminando la dipendenza da ϕ̇ tramite la (3.39). Si ha quindi (2Ȧ)2 ∂ (2Ȧ)2 ∂V (r) mr̈ − m 3 + = 0, ⇒ mr̈ = − m + V (r) (3.42) r ∂r ∂r 2r2 che ci dice che, in un moto centrale, il raggio evolve come la posizione di un punto materiale che si muove su una retta sotto l’azione di una energia potenziale (spesso detta energia potenziale efficace) data da 2 2Ȧ V (r) = m 2 + V (r) . (3.43) r Possiamo quindi studiare l’evoluzione di r(t) usando le tecniche sviluppate per i moti unidimensionali nella sezione 2.6 del capitolo 2. Infatti moltiplicando la (3.42) per ṙ, si ottiene d m 2 m 2 ṙ + V (r) = 0, =⇒ ṙ + V (r) = E, (3.44) dt 2 2 dove E è l’energia, che si mantiene costante durante il moto. Notiamo che tale risultato 2 discende dalla proposizione 3.3.1, dal momento che m 2 ṙ + V (r) , altro non è che data dalla (3.40). l’Hamiltoniana “semplificata” H Nota 3.4.2 Possiamo ricavare l’equazione (3.42) anche col metodo della funzione di Routh illustrato nella sezione 3.3.1. Dalla (3.38) abbiamo pϕ ϕ̇ (pϕ , r) = , m r2 per cui R (ṙ, r) = L (ϕ̇ (pϕ , r) , ṙ, r) − pϕ ϕ̇ ϕ ,ṙ,r) L(p = = p2ϕ m 2 m 2 pϕ 2 ṙ + r − V (r) − 2 2 m r2 m r2 2 m 2 1 pϕ ṙ − 2 − V (r). 2 2r m EQUAZIONI DI LAGRANGE 113 Dalla formula (3.33) deduciamo 2 2Ȧ ∂V ∂V 1 p2ϕ + = 0, ⇔ mr̈ − m = 0, + mr̈ − 3 3 r m ∂r r ∂r che è proprio l’equazione (3.42). 3.4.2 Il problema di Keplero Il problema di Keplero è il moto di una massa m l’azione di una forza centrale di questo tipo mK F =− 2 vers (P − O) , con K = costante > 0. �P − O� che scritta in coordinate sferiche diventa F =− mK ur . r2 L’energia potenziale è dunque (si veda l’esempio 3.2.4) V (r) = − mK . r (3.45) L’energia potenziale efficace per r è quindi data da 2Ȧ2 mK V (r) = m 2 − , r r (3.46) il cui grafico (v. figura 3.2) presenta un asintoto verticale in r = 0 (limr→0 Ṽ = +∞), Ȧ)2 ha limite 0− per r → +∞ ed ha un minimo negativo per r = (2K , con valore dell’energia 1 mK 2 (2Ȧ)2 E0 = Ṽ =− < 0. (3.47) K 2 (2Ȧ)2 Si noti che il valore E0 dipende da Ȧ Al livello di energia minimo corrisponde un’orbita circolare, in quanto r resta costante durante il moto. La risultante soluzione (r(t), ϕ(t)) del problema di Keplero è dunque periodica nel tempo poiché, dalla (3.38), anche ϕ̇ = cost., cioè il punto materiale ruota con velocità angolare costante attorno al centro d’attrazione O. Ai livelli di energia E compresi tra E0 e 0 corrispondono intervalli rm ≤ r (t) ≤ rM , limitati di soluzioni della diseguaglianza Ṽ < E, quindi soluzioni r(t) periodiche rispetto a t. Ricordiamo poi che, fissato E ∈ (E0 , 0), i limiti rm , rM dell’intervallo dove varia r (t) si trovano risolvendo l’equazione algebrica25 25 Nota V (r) = E, =⇒ E= mK 2mȦ2 , − r2 r che E < 0 e quindi le due radici della (3.48) sono positive. (3.48) 114 LEZIONI DI SISTEMI DINAMICI 0 Figura 3.2: Grafico della funzione energia potenziale efficace V (r) per il problema di Keplero. mentre il periodo di “oscillazione” di r (t) (distanza dal centro di attrazione), che è dato da (v. sezione 2.6.1, formula (2.42)) rM dr . T =2 rm (2Ȧ)2 E 2K 2 − + m r2 r Ora, il fatto che r (t) sia periodica non è sufficiente per affermare che la soluzione (r(t), ϕ(t)) dell’intero problema sia periodica. Infatti durante il periodo l’angolo subisce una variazione ∆ϕ che può essere calcolata a partire dalla conservazione della velocità angolare espressa dalla (3.39) T 2Ȧ 2Ȧ ϕ̇ (t) = 2 , ⇒ ϕ (T ) − ϕ (0) = dt. (3.49) 2 (t) r (t) r 0 ∆ϕ Il moto risulterà periodico solo se l’incremento ∆ϕ subito dall’angolo nel singolo periodo T (che lo ricordiamo ancora è il periodo di oscillazione della distanza r dal centro) è un multiplo razionale di 2 π. Infatti se ∆ϕ = 2k π, N allora dopo un tempo N T (cioè dopo N periodi) abbiamo r(N T ) = r(0) e ϕ(N T ) = ϕ(0) + N ∆ϕ = ϕ(0) + 2 k π, ovvero il punto materiale ha compiuto k giri attorno ad O. Il punto si trova nella stessa posizione (e con la stessa velocità) che aveva al tempo t = 0. EQUAZIONI DI LAGRANGE 115 L’integrale (3.49) tramite cui si calcola ∆ϕ ha il difetto di essere un integrale nella variabile temporale, e quindi per calcolarlo si deve conoscere l’espressione esplicita di r (t), che però non abbiamo. Quindi, anziché ∆ϕ calcoliamo ∆ϕ/2 T /2 ∆ϕ 2Ȧ = dt, (3.50) 2 2 r (t) 0 e nell’integrale e operiamo la seguente sostituzione di variabile ρ = r (t) , ⇒ dρ = ṙ (t) dt. Se sfruttiamo la (3.44) per esprimere ṙdt in termini di r (t), e di conseguenza in termini di ρ dρ 2 E − V (ρ) dt, ⇒ dt = dρ = . m (3.44) 2 E − V (ρ) ṙ m 26 la (3.50) può essere così riscritta rM rM ∆ϕ 2Ȧ dρ 2Ȧ dρ = = . (3.51) 2 2 2 ρ ρ 2 rm rm 2E (2Ȧ)2 2K E − V (ρ) − + m m ρ2 ρ L’integrale (3.51) si calcola facilmente cambiando variabile z = 2Ȧ rm ∆ϕ = 2 2Ȧ rM 2Ȧ , da cui si ottiene ρ dz , 2E K 2 −z + z m Ȧ (3.52) 2Ȧ 2Ȧ e ) sono le due radici del trirM rm nomio che compare a denominatore. Infatti, siccome rM e rm sono le due radici della (3.48), abbiamo 2 E 2Ȧ2 2Ȧ 2E K K 2Ȧ 2 − 2 − − = 0, =⇒ = 0, − m rm rm m rm Ȧ rm Osserviamo che i limiti di integrazione (ovvero e analogamente 2 2Ȧ2 2Ȧ 2E K K 2Ȧ E − 2 − − = 0, =⇒ = 0. − 2 m rM rM m rM Ȧ rM Pertanto, ponendo zM = (3.52) 2Ȧ 2Ȧ , e zm = , con zM < zm , possiamo così riscrivere la rM rm ∆ϕ = 2 z m zM 26 Ovviamente dz . (zm − z) (z − zM ) r (0) = rm , mentre r (T /2) = rM . 116 LEZIONI DI SISTEMI DINAMICI Ora, come già osservato nella sezione 2.9, notevole e vale π. Quindi � zm zM √ dz √ , è un integrale zm − z z − zM (3.53) ∆ϕ = 2π , Possiamo quindi affermare che il moto, per valori negativi di E, è un moto periodico, e che la traiettoria è una curva semplice (senza auto-intersezioni) che contiene il centro del moto al suo interno27. Esempio 3.4.2 Consideriamo il caso di una forza di richiamo elastica del tipo F = k −krur , dove k è la costante elastica. L’energia potenziale è V (r) = − r2 , mentre, 2 ricordando la (3.43), il potenziale efficace 2Ȧ2 ω2 2 k r , dove, al solito, ω 2 = . V� (r) = m 2 + m r 2 m (3.54) � In figura 3.3 è riportato l’andamento di V� (r). Si può � notare che V (r) ha un asintoto � � �2 � � � 4 2Ȧ � � � verticale per r = 0, e presenta un minimo in re = , dove vale V = 2 �Ȧ� ω. e ω2 Quindi se E > Ve il moto in r è periodico e si svolge all’interno dell’intervallo [rm , rM ], dove rm e rM sono le due soluzioni di cioè � � 2 E − V� (r) = 0, =⇒ rm rM = = 2E − m � �2 2Ȧ r2 − ω 2 r2 = 0, (3.55) �   � � �2 � � � � � E  2Ȧω  � � � mω 2 1 − 1 − E/m  , �   � � �2 � � � � � E  2Ȧω  � � � mω 2 1 + 1 − E/m  . 27 Nel dimostrare questo risultato abbiamo usato lo stesso argomento che ci aveva permesso di dimostre l’isocronia del moto armonico. In quel caso avevamo anche mostrato un risultato di “unicità” dei potenziali isocroni: il solo potenziale (simmetrico) isocrono è quello elastico. Anche per i moti centrali vale un teorema analogo, noto come Teorema di Bertrand che afferma che i soli potenziali centrali che ammettano moti periodici per ogni condizione iniziale sono quello elastico e quello kepleriano (in questo caso soltanto per E < 0). Per la dimostrazione, se ci limitiamo ad energie potenziali della forma V (r) = −k r α , α �= 0 e kα < 0 (per avere una foza attrattiva) oppure V (r) = −k ln r, k > 0, basta osservare che il caso α = −1 e α = 2 sono i soli in cui si possa riportare l’integrale rM 2Ȧ dr ∆ϕ = 2 r2 (2Ȧ)2 2 rm 2E/m − r 2 − m V (r) alla forma (3.53) tramite un opportuno cambiamento di variabile. EQUAZIONI DI LAGRANGE 117 V( r ) r Figura 3.3: Grafico di V (r), data dalla (3.54). Calcoliamo adesso, sfruttando la (3.51), la variazione dell’angolo ϕ in un semiperiodo rM ∆ϕ 2Ȧ dρ = . 2 2 2 ρ rm 2Ȧ 2E − − ω 2 ρ2 m ρ2 Introducendo al solito z = 2Ȧ , otteniamo ρ 2Ȧ ∆ϕ = 2 rm 2Ȧ rM zdz 2 , 2E 2 z − z 4 − ω 2 2Ȧ m che a sua volta, ponendo u = z 2 /2, si riscrive così um du ∆ϕ = 2 , 2 4E uM 2 2 u − 4u − ω 2Ȧ m 2 2 1 2Ȧ 1 2Ȧ , um = . E’ facile vedere che quest’ultimi sono le dove uM = 2 rM 2 rm radici del trinomio che appare sotto radice. Infatti sostituendo si ottiene proprio la 118 LEZIONI DI SISTEMI DINAMICI (3.55). Quindi possiamo scrivere um du = 2π, ∆ϕ = 2 (u − u uM m ) (uM − u) π e dunque concludere che il moto del punto materiale è periodico. 3.4.3 L’orbita del problema di Keplero Vogliamo adesso determinare l’equazione dell’orbita del punto materiale. Cerchimo quindi di esprimere r in funzione dell’angolo ϕ, cioè r = r (ϕ). La conservazione della velocità areolare ci permette di eliminare il tempo dalle due equazioni del moto · (la (3.42) e la (3.39)). Infatti abbiamo che ϕ è sempre diversa da zero e quindi la ϕ è una funzione monotona del tempo. Possiamo quindi invertire ϕ = ϕ(t) ed esprimere il tempo, e tutte le funzioni del tempo, e quindi la stessa r (t), come funzioni di ϕ. Cominciando con r, cerchiamo r = r (t (ϕ)) e d2 r d = dt2 dt 1 , r dr dr dϕ = dt dϕ dt (3.39) d 1 (2Ȧ)2 d2 1 −2Ȧ =− 2 . dϕ r r dϕ2 r dr dt = d dt 2Ȧ dr d = −2Ȧ r2 dϕ dϕ = Sostituendo nella (3.42) dove V (r) è data dalla (3.45), otteniamo, dopo ovvie semplificazioni, d2 1 K 1 + − = 0, (3.56) 2 dϕ r r (2Ȧ)2 cioè d2 dϕ2 K 1 − r (2Ȧ)2 =− K 1 − r (2Ȧ)2 , che, posto y (ϕ) = 1 K − , r (ϕ) (2Ȧ)2 è un equazione del tipo y ′′ = −y: l’equazione dell’oscillatore armonico, la cui generica soluzione è y (ϕ) = y0 cos(ϕ + β). In particolare, ponendo y0 = K e, avremo (2Ȧ)2 K 1 = [1 + e cos(ϕ + β)] , r (ϕ) (2Ȧ)2 (3.57) dove e > 0 e β ∈ [0, 2π) sono due costanti determinate dalle condizioni inziali r (t = 0) = r0 e ṙ (0) = ṙ0 . Per quanto riguarda ϕ ricordiamo che abbiamo già EQUAZIONI DI LAGRANGE 119 scelto ϕ(t = 0) = 0, quindi ϕ = 0, sarà l’angolo iniziale. Inserendo quindi le condir2 ϕ̇0 e la definizione di E data dalla (3.48), cioè zioni iniziali ϕ0 = 0, r0 , ṙ0 e Ȧ = 0 2 2 2mȦ mK E= , otteniamo − 2 r0 r0 tan β = e = ṙ0 1 , 2Ȧ 1 − K r0 (2Ȧ)2 � E (2Ȧ)2 1+2 . m K2 (3.58) (3.59) Osserviamo poi che possiamo sempre orientare l’asse x in maniera da avere β = 0. Pertanto, ponendo 1 K = , (3.60) p (2Ȧ)2 l’equazione dell’orbita (3.57) si riscrive così p = 1 + e cos ϕ. r (ϕ) (3.61) Al variare di e > 0, abbiamo tre possibili casi. Primo caso. 0 < e < 1. Riscrivendo la (3.61) otteniamo r (ϕ) = p , 1 + e cos ϕ (3.62) che implica rm ≤ r ≤ rM , dove 1 rm = , p 1+e rM 1 = . p 1−e (3.63) E’ facile convincersi che, ricordando la sezione 3.4.2, questo caso corrisponde al caso − |E0 | < E < 0, dove E0 è dato dalla (3.47). Infatti dalla (3.59) e dalla (3.47) otteniamo28 � |E| < 1. (3.64) e= 1− |E0 | Notiamo inoltre che risolvendo la (3.48), si ottengono rm e rM , cioè   � � � � 1 1 1 K  |E| (2Ȧ)2  |E| 1+ 1− = (1 − e) , = 1+ 1−2 = 2 2 rm m K (3.47) p |E | (3.64) p (2Ȧ) 0 (3.60)  1 K  = 1− rM (2Ȧ)2 �  � � � 1 1 |E| (2Ȧ)2  |E| 1− 1− = (1 + e) , 1−2 = (3.47) p m K2 |E0 | (3.64) p (3.60) 120 LEZIONI DI SISTEMI DINAMICI y P F ϕ 2δ O H x Figura 3.4: Ellisse in coordinate polari. che coincidono esattamente con (3.63). Vediamo adesso che l’equazione (3.62), nel caso e < 1, rappresenta un’ellisse in cui il punto O, centro attrattore, occupa uno dei due fuochi. Infatti, osservando la figura 3.4, l’ellisse con fuochi F e O è il luogo dei punti P tali che29 (3.65) P F + P O = 2d, dove d è un parametro fissato maggior di δ, distanza fra i fuochi. Ora dalla figura 3.4 deduciamo 2 2 2 PF = F O + OH + P H = (2δ + r cos ϕ) + r2 sin2 ϕ 4δ 2 + 4δr cos ϕ + r2 . = Quindi sostinutendo nella (3.65) 4δ 2 + 4δr cos ϕ + r2 = 2d − r, ed elevando al quadrato si ha r (d + δ cos ϕ) = d2 − δ 2 , ⇒ r = 28 Si p , 1 + e cos ϕ ricordi che E < 0. con questo calcolo otteniamo un’ellisse il cui asse maggiore coincide con l’asse polare. Quindi l’afelio, ovvero il punto più distante dall’origine, corrisponde all’angolo ϕ = π, come nella figura, oppure ϕ = 0 se invertiamo i fuochi. In altre parole questa rappresentazione corrisponde a un angolo β = π (β = 0) nella (3.57). Questo in generale non sarà vero per il moto in quanto, avendo scelto ϕ(0) = 0, non possiamo anche assumere che ṙ(0) = 0 come si ha nei punti di massima distanza dal centro del moto 29 Ovviamente EQUAZIONI DI LAGRANGE se poniamo e = δ/d, e p = prima legge di Keplero: 121 1 d2 − δ 2 = 1 − e2 . Possiamo quindi enunciare la d d Il pianeta percorre un orbita ellittica di cui il Sole occupa uno dei fuochi. Secondo caso. e = 1. Ricordando la (3.64), e = 1 ⇒ E = 0, e quindi un’orbita aperta, rM → ∞ (v. figura 3.2). In questo caso l’orbita è una parabola. Infatti dalla (3.62) si deduce r + r cos ϕ = p. (3.66) Se adesso si passa a coordinate cartesiane, cioè P − O = xe1 + ye2 , =⇒ r = x2 + y 2 , e r cos ϕ = x. Quindi elevando al quadrato la (3.66) si ottiene x=− y2 p + , 2p 2 cioè una parabola il cui asse coincide con l’asse x e vertice in x = p/2. E’ abbastanza semplice verificare che la (3.57) è l’equazione di una conica (basta esprimere r e cos ϕ, sin ϕ in coordinate cartesiane e razionalizzare). Terzo caso. e > 1. Ricordando la (3.59), questo caso corrisponde ad E > 0, e quindi ad orbite aperte. Se e > 1, esistono angolo “proibiti” che sono tutti quelli che soddisfano la disuguaglianza 1 cos ϕ > − . e L’orbita (3.62) si riduce ad un ramo di iperbole (la dimostrazione viene lasciata per esercizio). 3.4.4 La terza legge A partire dall’equazione per l’orbita possiamo calcolare le lunghezze dei semiassi maggiore a e minore b dell’ellisse nel caso e < 1. Abbiamo infatti, posto rm e rM il minimo e il massimo raggio, a = b = 1 1 p (rm + rM ) = , 2 (3.63) 2 (1 − e2 ) a 1 − e2 . (3.67) (3.68) Possiamo ora calcolare in termini dei parametri fisici l’area spazzata dal raggio vettore in una rivoluzione, ovvero l’area dell’ellisse T area ellisse = πab = Ȧ dt = ȦT, (3.69) 0 122 LEZIONI DI SISTEMI DINAMICI siccome la velocità areolare è costante. Nella (3.69) possiamo eliminare b πa2 1 − e2 = Ȧ T , da cui elevando al quadrato T2 = cioè π2 3 p π2 4 a 1 − e2 = a (3.67) Ȧ2 2 Ȧ2 = a3 (3.60) 4π 2 , K T2 4π 2 = , a3 K che è la terza legge di Keplero: I quadrati dei periodi di rivoluzione dei pianeti stanno tra loro nel rapporto dei cubi dei semiassi maggiori delle orbite. Notiamo infine che la terza legge afferma (indirettamente) che il rapporto pendente dal pianeta considerato e dalle condizioni iniziali. T2 a3 è indi- Capitolo 4 Sistemi vincolati e coordinate lagrangiane Molti esempi di sistemi meccanici quali il moto di un punto su una traiettoria assegnata, il moto di un pendolo semplice, etc. prevedono una descrizione in questi termini: il “corpo” è rappresentato tramite un punto materiale; ad esso sono applicate delle forze specificate in funzione della sua posizione e velocità; si richiede infine che il moto soddisfi a delle limitazioni a priori sulle sue possibili posizioni e velocità. Per esempio, nel caso del pendolo semplice, il moto deve avvenire in modo che il punto mantenga invariata la sua distanza da un punto fisso. Nel caso dei sistemi rigidi le limitazioni al moto consistono nell’assumere che le mutue distanze dei punti restino costanti durante il moto del corpo. Vogliamo qui dare uno schema matematico per il trattamento di un sistema (finito) di punti materiali soggetti a tali limitazioni, che chiameremo vincoli. Per questo è necessario iniziare dallo studio della cinematica. 4.1 Sistemi olonomi Consideriamo uno spazio affine euclideo A di dimensione 3 in cui è definito un riferimento cartesiano ortogonale {O, ex , ey , ez }. E’ poi dato un sistema di N punti materiali {Pi , i = 1, 2, .... N } i cui vettori posizione sono xi , i = 1, . . . , N , xi = xi ex + yi ey + zi ez . · Al solito indichiamo con xi = dxi il vettore velocità del punto Pi . dt Definizione 4.1.1 Si dice vincolo cinematico per il sistema una qualsiasi relazione tra le posizioni, le velocità e il tempo del tipo · · F (x1 , . . . , xN , x1 , . . . , xN , t) = 0 , che chiameremo equazione vincolare. (4.1) 124 LEZIONI DI SISTEMI DINAMICI Definizione 4.1.2 Diremo che un sistema di punti è vincolato se i vettori posizione e velocità dei punti che lo compongono sono soggetti a uno o più vincoli della forma (4.1), ovvero sono assegnate m equazioni vincolari · · gk (x1 , . . . , xN , x1 , . . . , xN , t) = 0 , (4.2) k = 1, . . . , m . Nella quasi totalità dei sistemi di interesse fisico, le equazioni in (4.2) hanno una forma semplificata in quanto le velocità compaiono linearmente nelle funzioni gk , · · gk (x1 , . . . , xN , x1 , . . . , xN , t) = hk (x1 , . . . , xN , t) + n � i=1 · bi (x1 , . . . , xN , t) · xi . (4.3) In molti casi, poi, è possibile integrare queste equazioni vincolari, determinando un insieme di funzioni fk , k = 1, . . . , m, per cui sia abbia  f1 (x1 , . . . , xN , t) = 0,           f2 (x1 , . . . , xN , t) = 0,  ..   .        fm (x1 , . . . , xN , t) = 0, (4.4) e le equazioni (4.3) siano conseguenza (tramite una semplice derivazione rispetto al tempo) delle (4.4). Un esempio di vincolo imposto sulla velocità, che però può essere “integrato” e quindi si traduce in un vincolo sulle coordinate, è il vincolo di rotolamento puro che verrà analizzato nell’esempio 4.1.2. Definizione 4.1.3 Se tutti gli m vincoli cui il sistema è soggetto sono espressi nella forma (4.4) allora diremo che il sistema è olonomo. Quando invece i vincoli sono nella forma generale (4.2) e non possono esser tutti ricondotti alla forma (4.4), parleremo di vincoli anolonomi. Diremo infine che un vincolo è fisso se il vincolo non dipende dal tempo1 , cioè se la funzione vincolare non dipende esplicitamente dal tempo fk (x1 , . . . , xN ) = 0, ∀ k = 1, . . . , m. Da ora in poi ci limitiamo a trattare di sistemi di vincoli olonomi, ovvero del tipo (4.4), eventualmente dipendenti dal tempo. 1 I vincoli fissi sono di gran lunga i più comuni. Inoltre la dipendenza esplicita delle equazioni vincolari dal tempo complica un po’ la trattazione: si consiglia di “leggere” tutto questa trattazione almeno una volta supponendo i vincoli fissi, ovvero eliminando le dipendenze esplicite dal tempo. SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 125 R3N C(t1) C(t2) Figura 4.1: Rappresentazione schematica dello spazio delle configurazioni C(t), a due diversi istanti di tempo t1 e t2 . la 3N -upla costituita dalle Nel seguito, per ragioni di brevità, denoteremo con x coordinate degli N punti, cioè = (x1 , . . . , xN ) = (x1 , y1 , z1 , ... , xN , yN , zN ) ∈ R3N . x x1 (4.5) xN Iniziamo con il formulare alcune richieste sulle funzioni fk : 1. Il sistema (4.4), inteso appunto come sistema di m equazioni in 3N incognite, (le coordinate dei punti Pi ), abbia soluzioni per ogni tempo t, o in altri termini, che ∈ R3N , per cui (4.4) è soddisfatto, sia non ad ogni istante t, l’insieme delle x vuoto. Questa è l’ovvia richiesta che il sistema di punti “possa stare da qualche parte!”. Indicheremo con C(t) ⊂ R3N , l’insieme delle soluzioni del sistema (4.4), e lo chiameremo spazio delle configurazioni all’istante t ∈ R3N : x è soluzione di (4.4) al tempo t . C(t) = x Gli elementi di C(t), ovvero le 3N -uple soluzioni di (4.4), vengono detti configurazioni. Ovviamente l’insieme C(t) evolve nel tempo poiché i vincoli variano in t. Se i vincoli sono tutti fissi, allora C è un insieme fissato indipendente dal tempo. 2. Le funzioni fk siano “abbastanza” regolari in C(t) ⊂ R3N , per ogni t, e altrettanto come funzioni di t. In pratica, chiederemo tutte le fk abbiano derivate seconde continue. 126 LEZIONI DI SISTEMI DINAMICI 3. I vincoli che abbiamo imposto siano tutti effettivi, ovvero che non ci siano nel sistema (4.4) equazioni vincolari implicate da altre (per esempio, non ci siano equazioni che sono combinazioni lineari di altre). Il teorema della funzione implicita (o teorema del Dini2 ) ci fornisce la condizione per cui tale richiesta è soddisfatta. Costruiamo la matrice jacobiana delle derivate prime delle fk rispetto a tutte le 3N variabili (che possiamo pensare di aver ordinato (x1 , y1 , z1 , ... , xN , yN , zN )). Abbiamo una matrice di m righe e 3N colonne  ∂f1 ∂f1 ∂f1 ∂f1 ∂f1 ∂f1  . . . ∂x ∂x1 ∂y1 ∂z1 ∂yN ∂zN N  ... ... ... ... ... ... ...   . (4.6)  ... ... ... ... ... ... ...  ∂fm ∂fm ∂fm ∂fm ∂fm ∂fm . . . ∂x ∂x1 ∂y1 ∂z1 ∂yN ∂zN N I vincoli saranno tutti effettivi se, per ogni tempo t, il rango di questa matrice è massimo3 . Denotiamo, d’ora in poi, con ∂fk = ∂xj � ∂fk ∂fk ∂fk , , ∂xj ∂yj ∂zj � , (4.7) il vettore gradiente di fk rispetto alle coordinate (xj , yj , zj ), coordinate del j-esimo punto materiale ed introduciamo, in R3N , i vettori gradiente � � ∂fk ∂fk � , ··· , ∇fk = ∂x1 ∂xN � ∂f ∂f ∂f ∂fk ∂fk ∂fk � k k k , k = 1, 2, ..., m.(4.8) , ··· , , , , , = ∂x1 ∂y1 ∂z1 ∂xN ∂yN ∂zN � �� ∂fk ∂x1 ∂fk ∂xN Osserviamo quindi che la condizione di rango massimo, ovvero la condizione 3, equivale ad affermare che gli m vettori gradiente � 1 , ∇f � 2 , . . . , ∇f � m, ∇f sono linearmente indipendenti per ogni punto di C(t) e per ogni tempo t. Se le condizioni 1, 2 e 3 sono soddisfatte, il teorema della funzione implicita ci � 0 ∈ C(t0 ), possiagarantisce che fissato un tempo t0 ed una generica configurazione x � 0 , e un intervallo I contenente t0 , tale che, mo trovare un intorno B (� x0 ) ∈ C(t0 ), di x limitatamente a B (� x0 ) e all’intervallo I, è possibile isolare l = 3N − m, (4.9) coordinate indipendenti ed esprimere tutte le altre in termini di tali l coordinate. Per � ∈ essere più precisi, è possibile, almeno per t ∈ I, esprimere le configurazioni x 2 Ulisse Dini (Pisa 1845 – Pisa 1918) è stato un matematico italiano. il rango non può essere maggiore del massimo tra m e 3N , quindi abbiamo implicitamente assunto che m ≤ 3N . Se m = 3N la condizione di rango massimo implica che C si riduce a un insieme di punti isolati di R3N e di conseguenza il sistema non possiede libertà di movimento. Nel seguito assumeremo sempre che m < 3N . 3 Ovviamente SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 127 B ( x0 ) soltanto in funzione di l variabili indipendenti, le quali, a loro volta, variano in un opportuno aperto U ⊂ Rl , e non necessariamente coincidono con le coordinate cartesiane. Quindi, in generale, il teorema della funzione implicita garantisce l’esistenza di un aperto U ⊂ Rl , di un intervallo I contenente t0 , e di un’applicazione differenziabile da U × I in R3N che, fissato t ∈ I, opera così4 ( q1 , q2 , · · · , ql , t ) ∈U ovvero ∈I −→ =x (q1 , q2 , · · · , ql , t) , x (q1 , q2 , · · · , ql , t) −→ (x1 (q1 , q2 , · · · , ql , t) , . . . , xN (q1 , q2 , · · · , ql , t)) , (4.10) ∈ U ×I e gode delle seguenti proprietà: • per ogni t ∈ I, l’applicazione tra U e B ( x0 ) ∩ C(t) è biunivoca; • le 3N funzioni xi (q1 , · · · , ql , t) = (xi (q1 , · · · , ql , t) , yi (q1 , · · · , ql , t) , zi (q1 , · · · , ql , t)) , i = 1, ..., N , sono di classe C 1 nelle variabili q1 , q2 , · · · , ql , e t; • ∀ (q1 , q2 , · · · , ql ) ∈ U , e ∀ t ∈ I , fk (x1 (q1 , · · · , ql , t) , . . . , xN (q1 , · · · , ql , t) , t) = 0 , ∀ k = 1, 2, ..., m . Diremo che le (q1 , . . . , qn ) sono un sistema di coordinate locali adattate a C(t), e le chiameremo coordinate lagrangiane, o parametri lagrangiani. Per brevità denote la l-upla costituita dalle coordinate lagrangiane, cioè remo con q = (q1 , q2 , · · · , ql ) . q Il numero l di parametri lagrangiani viene anche detto numero di gradi di libertà del sistema. stiano in un aperto U di Rl significa che le Nota 4.1.1 Il fatto che le coordinate q stesse possono variare arbitrariamente in U mantenendo, al tempo stesso, i punti x1 (q1 , q2 , · · · , ql , t), . . . , xN (q1 , q2 , · · · , ql , t), nello spazio delle configurazioni C(t) ∈ U , si ha per ogni t ∈ I. In altri termini, avviene che, ∀ t ∈ I, comunque si scelga q 4 La notazione x (q1 , ..., ql , t) sta ad indicare che le coordinate x degli N punti materiale dipendono sia dai parametri lagrangiani (q1 , ..., ql ) (i quali a loro volta dipenderanno dal tempo) sia esplicitamente dal tempo t, a causa del moto dei vincoli. Infatti, anche se le coordinate lagrangiane (q1 , ..., ql ) rimangono costanti nel tempo, le posizioni x1 , . . . , xN , dei punti materiali possono evolvere a causa del moto dei vincoli. 128 LEZIONI DI SISTEMI DINAMICI che il sistema di vincoli (4.4) è soddisfatto, cioè  f1 (� x (� q , t) , t) = 0,         x (� q , t) , t) = 0,   f2 (�  ..   .        fm (� x (� q , t) , t) = 0. Nota 4.1.2 E’ importante rimarcare il fatto che l’applicazione che consente di esprime � (� le coordinate x1 , ..., xN , in termini dei parametri lagrangiani q1 , ..., ql , cioè x q , t), è locale. Non è detto, in generale, che esista un’unica applicazione che permetta di � ∈ C(t), in funzione delle stesse q �. esprimere tutte le configurazioni x Nota 4.1.3 E’ opportuno osservare che le coordinate lagrangiane q1 , ..., ql , sono indipendenti, cioè possono variare ad arbitrio all’interno dell’aperto U ⊂ Rl . Non sarebbe così se, per esempio, il sistema fosse soggetto ad un ulteriore vincolo olonomo del tipo fm+1 (x1 , ..., xl ) = 0. E’ evidente che potremmo sempre utilizzare tale ulteriore vincolo per ridurre i parametri lagrangiani5, portandoli ad (l − 1), tuttavia in talune circostanze (che, per esempio, vedremo nella sezioni 5.3.2 e 8.4.1) questa strada può non essere la migliore. In questo caso allora le q1 , ..., ql , variabili lagrangiane non sono indipendenti, ma devono soddisfare una condizione del tipo (4.11) Φ (q1 , ..., ql ) = fm+1 (x1 (� q ) , ..., xl (� q )) = 0. Dunque q1 , ..., ql , non possono variare ad arbitrio nell’aperto U ⊂ Rl , dovendo essere soddisfatta la (4.11). Esempio 4.1.1 Sono dati due punti materiali P1 e P2 . Il primo punto materiale P1 è vincolato sull’asse z, mentre il secondo sulla circonferenza giacente sul piano (x, y), centrata nell’origine, il cui raggio r varia nel tempo secondo la legge r (t) = αt. Si vuole determinare l’equazione dei vincoli, il numero dei gradi di libertà e selezionare i parametri lagrangiani. Cominciando dalla (4.5), abbiamo N = 2 punti materiali � = (x1 , x2 ) = (x1 , y1 , z1 , x2 , y2 , z2 ) . x Quindi, prescindendo dai vincoli, abbiamo bisogno di 3N = 6 parametri per individuare la posizione dei due punti materiali rispetto al sistema di riferimento prescelto. Adesso consideriamo i vincoli che, nello stile della (4.21), scriveremo come   x, t) = f1 (x1 , x2 , t) = 0, =⇒ x1 = 0,  f1 (�   P1 vincolato     asse z    x, t) = f2 (x1 , x2 , t) = 0, =⇒ y1 = 0, f2 (�     x, t) = f4 (x1 , x2 , t) = 0, =⇒ x22 + y22 − α2 t2 = 0,   f3 (�        x, t) = f3 (x1 , x2 , t) = 0, =⇒ z2 = 0, f4 (� 5 Si P2 vincolato circonferenza piano (x, y) sottintende che gli m + 1 vincoli soddisfino sempre le sopraelencate proprietà 1, 2 e 3. SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 129 I vincoli dunque sono 4, e banalmente soddisfano i requisiti 1, 2. Dobbiamo verificare se i vincoli sono effettivi, cioè se il requisito 3 è soddisfatto. In questo caso la matrice (4.6) è     � 1 ∇f 1 0 0 0 0 0 0  �  0 1 0 0 0 0 0   ∇f2   ,  � =  0 0 0 0 2x2 2y2 0   ∇f3  0 0 0 0 0 0 1 � 4 ∇f il cui rango è 4. Infatti, poiché x22 + y22 = α2 t2 , sicuramente uno fra x2 e y2 , è non nullo. Supponendo che x2 �= 0, dalla matrice 4 × 6, possiamo estrarre il minore 4 × 4   1 0 0 0  0 1 0 0     0 0 2x2 0  , 0 0 0 1 il cui determinante è non nullo. I 4 vincoli sono dunque effettivi e allora, applicando (4.9), possiamo individuare l = �� 3N − �� m = 2, 6 4 coordinate lagrangiane. Quindi, come parametri lagrangiani, possiamo utilizzare: ( i ) z1 = q1 ∈ R, e x2 = q2 , con q ∈ (−αt, αt) , da cui � � α2 t2 − q22 , nel semipiano y2 > 0, � y2 = 2 2 2 − α t − q2 nel semipiano y2 < 0. Osserviamo, come rimarcato nella nota 4.1.2, la parametrizzazione non è globale. Infatti non abbiamo un’unica espressione per y2 in funzione x2 , ma ne abbiamo due che si applicano “localmente”. ( ii ) z1 = q1 ∈ R, e y2 = q2 , con q2 ∈ (−αt, αt) , da cui � � α2 t2 − q22 , nel semipiano x2 > 0, � x2 = 2 2 2 − α t − q2 nel semipiano x2 < 0. ( iii ) z1 = q1 ∈ R, e l’angolo q2 ∈ [0, 2π), che il vettore (P2 − O) forma con l’asse delle ascisse. In tal caso x2 = αt cos q2 , y2 = αt sin q2 . Pertanto, utilizzando la parametrizzazione (iii), quando scriviamo esplicitamente la (4.10) abbiamo U = R× [0, 2π), I = (0, +∞), � (q1 , q2 , t) = (x1 (q1 , q2 , t) , x2 (q1 , q2 , t)) , (q1 , q2 , t) −→ x � �� ∈ U ×I 130 LEZIONI DI SISTEMI DINAMICI che nello specifico vuol dire x1 (q1 , q2 , t) = = x2 (q1 , q2 , t) = = (x1 (q1 , q2 , t) , y1 (q1 , q2 , t) , z1 (q1 , q2 , t)) (0, 0, q1 ) , (x2 (q1 , q2 , t) , y2 (q1 , q2 , t) , z2 (q1 , q2 , t)) (αt cos q2 , αt sin q2 , 0) . = (q1 , q2 ), si ha E quindi, se q (4.12) ( x q , t) = (0, 0, q1 , αt cos q2 , αt sin q2 , 0) . Esempio 4.1.2 Un esempio di vincolo (4.3) che coinvolge le derivate rispetto al tempo ma che si può integrare è il vincolo di rotolamento puro. Consideriamo un disco di raggio R che rotola lungo una guida rettilinea. Il sistema, a priori, ha solo due gradi di libertà: l’ascissa x del centro O, e l’angolo di rotolamento ϕ. Quest’ultimo, y S ϕ O ey Ω ex C x Figura 4.2: Disco di raggio R che rotola senza strisciare (rotolamento puro) sulla guida orizzontale x. riferendoci alla figura 4.2, si misura così: si fissa sul bordo del disco un punto S (identificandolo, per esempio, con un “puntino di vernice”). L’angolo ϕ è quello formato dal raggio SO con una retta fissata (per esempio la retta verticale). In particolare ϕ sarà positivo se corrisponde a rotazioni antiorarie, negativo altrimenti (è il caso dell’angolo rappresentato in figura). Se C denota il punto di contatto fra disco e guida, diremo che il disco rotola senza strisciare o rotola di rotolamento puro, se v C = 0, SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 131 cioè se, ad ogni istante, la velocità del punto di contatto è nulla. Per calcolare v C , applichiamo la formula dei moti rigidi (6.32) del paragrafo 6.3 · · vC vO (C − Ω) = (O − Ω) + ω ∧ (C − O) . � �� Ora, (O − Ω) = xex + Rey , =⇒ v O = ẋex , (C − O) = −Rey , e ω = ϕ̇ez , da cui, imponendo v C = 0, otteniamo (ẋ + Rϕ̇) ex = 0, =⇒ ẋ = −Rϕ̇, (4.13) cioè una relazione vincolare che coinvolge le derivate rispetto al tempo dei due gradi di libertà. La (4.13) può però essere integrata, x = xo − R (ϕ − ϕo ) , dove xo è l’ascissa di O che corrisponde all’angolo di rotolamento iniziale ϕo . Siccome possiamo sempre scegliere la configurazione iniziale in modo che xo = 0 e ϕo = 0, abbiamo x = −Rϕ, (4.14) che è una relazione che lega l’ascissa x del centro O e l’angolo di rotazione ϕ. E’ quindi sufficiente un solo parametro ad identificare le configurazioni del disco. Notiamo che la (4.14) è coerente dal punto di vista dei segni: se ϕ < 0, il disco ruota un senso orario e x > 0. Se invece il disco ruota in senso antiorario l’ascissa x è negativa. Non solo ma la (4.14) ha anche un chiaro significato fisico: infatti, prescindendo dal segno, Rϕ rappresenta la lunghezza dell’arco CS, che è uguale alla lunghezza del segmento CΩ. Ricaviamo infine la curva x (ϕ (t)), y (ϕ (t)) descritta dal punto S nel suo moto. Sfruttando ancora formula dei moti rigidi (6.32) abbiamo vS = v O + ϕ̇ez ∧ (S − O) = −Rϕ̇ex + ϕ̇ez ∧ (R sin ϕex − R cos ϕey ) , da cui, supponendo ϕ (0) = 0, otteniamo  dx (ϕ (t))   = −Rϕ̇ + Rϕ̇ cos ϕ, dt ⇒ x (ϕ (t)) = −R [ϕ (t) − sin ϕ (t)] , (4.15)   x (0) = 0,  dy (ϕ (t))   = Rϕ̇ sin ϕ, dt ⇒ y (ϕ (t)) = R [1 − cos ϕ (t)] . (4.16)   y (0) = 0, Notiamo infine che, ponendo ψ = −ϕ (t) e considerando −π ≤ ψ ≤ π, la curva descritta dal sistema (4.15), (4.16) può scriversi come x (ψ) = R(ψ + sin ψ) , Tale curva viene detta cicloide. z (ψ) = R(1 − cos ψ), −π ≤ ψ ≤ π . (4.17) 132 LEZIONI DI SISTEMI DINAMICI Esempio 4.1.3 Consideriamo un disco di raggio r che, come in figura 4.3, si mantiene verticale e rotola senza strisciare sulla circonferenza del piano x, y, centrata in O e avente raggio R . Il sistema, a priori, possiede due gradi di libertà identificati z y O’ Q O r θ ϕ C R x Figura 4.3: Disco di raggio r che, mantenendosi verticale rotola senza strisciare sulla circonferenza di raggio R. dall’angolo θ, e dall’angolo di rotolamento ϕ. Le coordinate del centro del disco sono Q − O = R cos θ ex + R sin θ ey + Rez , si che v Q = −Rθ̇ sin θ ex + Rθ̇ cos θ ey . (4.18) ω = ϕ̇ cos θ ex + ϕ̇ sin θ ey + θ̇ez , (4.19) Le componenti della velocità angolare nel SdR della figura 4.3, sono6 dove ϕ è l’angolo di rotolamento (misurato come nell’esempio 4.1.2). Applicando (6.32) (vedi sezione 6.3) ed imponendo v C = 0 (vincolo di rotolamento puro) si ottiene 0 cioè = v C = v Q + ω ∧ (C − Q) = −Rθ̇ − rϕ̇ sin θex + Rθ̇ + rϕ̇ cos θey , θ̇ = − 6 La r ϕ̇, =⇒ R formula (4.19) viene dimostrata nell’esempio 6.8.1. θ=− r ϕ, R (4.20) SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 133 dove, al solito, abbiamo orientato gli assi x e y e in modo che θo = ϕo = 0. Ancora una volta, quindi, un vincolo che coinvolge derivate rispetto al tempo si traduce in un vincolo olonomo. 4.1.1 Spostamenti virtuali in funzione delle coordinate lagrangiane Nella formulazione della meccanica dei sistemi vincolati è essenziale caratterizzare tutte le possibili variazioni di configurazione che un sistema di punti può effettuare a partire da una configurazione data. Per fissare le idee supponiamo per il momento che il sistema sia soggetto soltanto a m vincoli fissi  f1 (x1 , . . . , xN ) = 0,           f2 (x1 , . . . , xN ) = 0,  ..   .        fm (x1 , . . . , xN ) = 0. (4.21) Sia C ⊂ R3N , lo spazio delle configurazioni. Sia B ⊆ C, un sottoinsieme di C, tale che le coordinate di ogni suo punto possano essere espresse univocamente in termini � = (q1 , q2 , · · · , ql ) parametri lagrangiani, i quali, a loro volta, variano nell’aperto di q U ⊂ Rl . Quindi, ricordando quando visto nella sezione 1.4 del capitolo 1, abbiamo che l’applicazione    �= U ∋q  q1 q2 .. . ql       � (� q) =   −→ x    x1 (q1 , q2 , ..., ql ) x2 (q1 , q2 , ..., ql )    ∈ B ⊆ C ⊂ R3N , ..  . xN (q1 , q2 , ..., ql ) gode delle seguenti proprietà: � (� 1. x q ) ∈ C 1 (U ) . � ∈ U , l’applicazione è invertibile. 2. ∀ q � (� Sappiamo allora che x q ) definisce un sistema di coordinate curvilinee su B, e vale il seguente 134 LEZIONI DI SISTEMI DINAMICI Teorema 4.1.1 Gli l vettori di R3N ,      � ∂x �1 = u =  ∂q1    ∂x1 (q1 , q2 , ..., ql ) ∂q1 ∂x2 (q1 , q2 , ..., ql ) ∂q1 .. . ∂xN (q1 , q2 , ..., ql ) ∂q1           .. .  ∂x1 (q1 , q2 , ..., ql ) ∂ql ∂x2 (q1 , q2 , ..., ql ) ∂q1 .. . ∂xN (q1 , q2 , ..., ql ) ∂ql     � ∂x �l = u =  ∂ql    (4.22)      ,     sono linearmente indipendenti e costituiscono quindi la base locale relativa alle varia� i è ortogonale ad ogni vettore gradiente bili q1 , q2 , ..., ql . Non solo, ma ogni vettore u � k , cioè ∀ i = 1, 2, ... , l, e ∀ k = 1, 2, ..., m, vale7 ∇f � k � i • ∇f u = N � ∂xs s=1 = ∂qi · ∂fk ∂xs N � � ∂xs ∂fk s=1 ∂ys ∂fk ∂zs ∂fk + + ∂qi ∂xs ∂qi ∂ys ∂qi ∂zs � = 0. (4.23) � i , i = 1, 2, ... , l, sono linearmente indiDim. Cominciamo col provare che i vettori u pendenti. Supponiamo per semplicità che l sia multiplo di 3 e, sempre per semplicità, supponiamo che, applicando il teorema di funzione implicita, le coordinate lagrangiane 7 Con R3 . “ • ” indichiamo il prodotto scalare in R3N , che è appunto la somma di N prodotti scalari “ · ” in SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 135 q1 , ... , ql , siano le prime l coordinate cartesiane dei primi l/3 punti materiali, cioè x1 = q1 , y1 = yl/3 = q2 , .. . ql−1 , zl/3 xl/3+1 = = ql xl/3+1 (q1 , q2 , ..., ql ) , yl/3+2 = yl/3+2 (q1 , q2 , ..., ql ) , .. . zN = zN (q1 , q2 , ..., ql ) . Consideriamo adesso la matrice l × 3N , le cui righe sono le componenti dei vettori � ∂x �i = u , i = 1, ..., l, ∂qi   � ∂x  ∂q1          ∂x    �       ∂q2   = =      .    .    .          ∂x �    M ∂ql         =         ∂x1 ∂q1 ∂y1 ∂q1 ∂z1 ∂q1 ··· ∂zl/3 ∂q1 ∂xl/3+1 ∂q1 ··· ∂x1 ∂q2 ∂y1 ∂q2 ∂z1 ∂q2 ··· ∂zl/3 ∂q2 ∂xl/3+1 ∂q2 ··· .. . .. . .. . .. . .. . ∂x1 ∂ql ∂y1 ∂ql ∂z1 ∂ql ∂zl/3 ∂ql  ∂xl/3+1 ∂ql 1 0 0 ··· 0 ∂xl/3+1 ∂q1 ··· 0 1 0 ··· 0 ∂xl/3+1 ∂q2 ··· .. . .. . 0 0 0 ∂xl/3+1 ∂ql ··· .. . .. . ··· 1 ··· ∂zN ∂q1    ∂zN    ∂q2  .  ..   .    ∂z  ···  ∂zN ∂q1    ∂zN    ∂q2    ..   .    ∂z  N ∂ql N ∂ql Siccome è immediato verificare che le prime l colonne corrispondono alla matrice identità deduciamo che matrice ha rango massimo, cioè l. Ma questo vuol dire che gli l � � ∂x ∂x � 1 , ...., u � l , sono linearmente indipendenti. vettori , ..., , ovvero u ∂q1 ∂ql Questo si estende anche al caso, più generale, in cui le variabili lagrangiane non coincidano con le prime l coordinate dei primi l/3 punti esi� materiali, ma comunque � sta una corrispondenza biunivoca fra (q1 , q2 , ...., ql ) e x1 , y1 , ...., zl/3 . Questo, per 136 LEZIONI DI SISTEMI DINAMICI esempio, accade se (q1 , q2 , ...., ql ) sono le coordinate polari sferiche dei primi l/3 punti. In tal caso la matrice jacobiana l × l  ∂yl/3 ∂zl/3  ∂x1 ∂y1 ∂z1 ···  ∂q1 ∂q1 ∂q1 ∂q1 ∂q1       ∂x ∂yl/3 ∂zl/3  ∂y1 ∂z1   1 ···    ∂q2 ∂q2 ∂q2 ∂q2 ∂q2   J=    .  . . . .  .  . . . . . . . .  .       ∂x ∂yl/3 ∂zl/3  ∂y1 ∂z1 1 ··· ∂ql ∂ql ∂ql ∂ql ∂ql è invertibile, ovvero det J �= 0. E’ quindi immediato rendersi conto che le prime l colonne della matrice M coincidono con J. Siamo allora di nuovo in grado di isolare in M un minore l × l con determinante non nullo e pertanto concludere che gli l vettori � 1 , ...., u � l , sono linearmente indipendenti. Evidentemente tutto ciò si genedi R3N , u ralizza anche al caso in cui l non sia multiplo di 3 e le coordinate (q1 , ..., ql ) non siano le l coordinate cartesiane dei primi punti materiali. Proviamo adesso la (4.23). Partendo dalla k-esima equazione vincolare (4.21), abbiamo fk (x1 (� q ) , . . . , xN (� q )) = fk (x1 (q1 , q2 , ..., ql ) , . . . , xN (q1 , q2 , ..., ql )) = 0, � = (q1 , q2 , ..., ql ) ∈ U . Ma allora se deriviamo rispetto alla generica qi per ogni q otteniamo N 0= ∂fk (x1 (q1 , q2 , ..., ql ) , . . . , xN (q1 , q2 , ..., ql )) � ∂fk ∂xs � k •u �i . = · = ∇f ∂qi ∂xs ∂qi s=1 Il precedente teorema si estende con facilità anche al caso di vincoli mobili. In tal caso, �1, u � 2 , ...., u � l , variano nel tempo ma, ad ogni istante fissata la configurazione, i vettori u t, sono linearmente indipendenti. Definizione 4.1.4 Si dice spostamento virtuale8 del sistema di N punti materiale re- 8 Una piccola divagazione storica per spiegare l’origine del nome “spostamenti virtuali”. Il nome è legato al cosiddetto Principio dei lavori virtuali, condizione per caratterizzare le configurazioni di equilibrio di un sistema vincolato; ecco come lo riassume Lagrange nella Méchanique Analytique: Se un sistema qualsiasi di corpi o punti soggetti a delle forze qualsiasi, è in equilibrio, e si impone a questo sistema un piccolo spostamento qualsiasi, in virtù del quale ogni punto percorre uno spazio infinitamente piccolo che sarà espresso dal suo spostamento virtuale, la somma delle forze, ognuna moltiplicata per lo spazio su cui essa è applicata, percorso secondo la direzione stessa della forza, sarà sempre uguale a zero, prendendo per positivi gli spazi percorsi nel senso della forza per negativi quelli percorsi nel senso opposto. (ovviamente possiamo semplificare la frase di Lagrange usando i prodotti scalari tra le forze e gli spostamenti, ovvero il lavoro delle forze.) L’idea che c’è sotto è che si “saggia” una posizione di equilibrio “provando a spostare” il sistema dall’equilibrio stesso, in modo “infinitesimo”. Questo è ciò che si fa quando vogliamo farsi un idea di quanto pesi una valigia: la si “prova a sollevare” da terra di un’altezza impercettibile, lo sforzo esercitato dal nostro braccio dovrà equilibrare quello esercitato dalla forza peso. SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 137 lativo alla generica configurazione x, un qualsiasi vettore δ x ∈ R3N δ x = (δx1 , . . . , δxN ) = (δx1 , δy1 , δz1 , ...., δxN , δyN , δzN ), δx1 tale che9 k= δ x • ∇f N s=1 δxs · δxN ∂fk = 0, ∀ k = 1, 2, ...., m, ∂xs (4.24) k , k = 1, ..., m, il gradiente calcolato nella configurazione x. Il vettore di essendo ∇f 3 R , δxi , i = 1, ...., N , viene detto spostamento virtuale del i-esimo punto materiale Pi . 1 , ..., ∇f m. Indichiamo con10 N , il sottospazio di R3N generato dagli m gradienti ∇f Diremo dunque che il vettore δx ∈ R3N è spostamento virtuale se δx appartiene al sottospazio ortogonale ad N , cioè se δx ∈ N⊥ . Abbiamo quindi il seguente Teorema 4.1.2 Ogni spostamento virtuale può esprimersi come combinazione lineare 1 , ..., u l , cioè degli l vettori u δ x= l s=1 s , con δqs ∈ R. δqs u (4.25) In particolare, lo spostamento virtuale dell’i-esimo punto materiale è δxi = l ∂xi s=1 ∂qs δqs , i = 1, 2, ...., N. (4.26) Dim. Dalla definizione 4.1.4 sappiamo che se δ x è spostamento virtuale allora soddisfa k , k = 1, ...., m, sono la (4.24) per ogni k = 1, 2, ...., m. Ora, siccome i gradienti ∇f linearmente indipendenti, ne deduciamo che il vettore δ x = (δx1 , . . . , δxN ) deve appartenere al sottospazio N⊥ , la cui dimensione è l = 3N − m di R3N . Siccome una l } (vedi teorema 4.1.1), avremo la (4.25). base di N⊥ è { u1 , ..., u Volendo far riferimento alla sezione 1.4, la l-upla (δq1 , ..., δql ), rappresenta la l-upla delle componenti controvarianti del vettore δ x rispetto alla base locale. 9 Attenzione ancora una volta alla notazione: nella formula che segue, e nel resto del capitolo, abbiamo usato la (4.7) per indicare il gradiente (tridimensionale) della funzione fk rispetto alle coordinate del punto ∂fk k , ∂fk , ∂fk è un vettore di R3 e possiamo farne il prodotto scalare = ∂f materiale Ps . Quindi ∂x ∂x ∂y ∂z s s s s con δxs ∈ R3 . Ricordiamo poi che • denota il prodotto scalare in R3N , ovvero la somma degli N prodotti scalari di R3 . 10 Il significato geometrico di N verrà chiarito nella definizione 4.1.6. 138 LEZIONI DI SISTEMI DINAMICI Nota 4.1.4 Osserviamo che la definizione 4.1.4 scaturisce da semplici considerazioni fisiche. Un cambiamento di configurazione xi → x̂i , i = 1, 2, ..., N , sarà compatibile con i vincoli se anche le nuove posizioni x̂i , i = 1, 2, ..., N , soddisfano le equazioni vincolari, ovvero fk (x̂1 , . . . , x̂N ) = 0 , ∀ k = 1, . . . , m . (4.27) Qui però siamo interessati a variazioni infinitesime delle configurazioni, ovvero a “tendenze al moto” più che al moto effettivo: useremo la notazione δxi per indicare queste variazioni. Esse possono essere caratterizzate matematicamente chiedendo che le configurazioni “variate” xi + δxi soddisfino le equazioni vincolari al prim’ordine nel loro sviluppo di Taylor attorno alla configurazione (x1 , . . . , xN ). Avremo quindi una caratterizzazione per i δxi , cioè 0 = fk (x̂1 , . . . , x̂N ) = fk (x1 + δx1 , . . . , xN + δxN ) = fk (x1 , . . . , xN ) + � �� =0 N � ∂fk i=1 ∂xi · δxi , e quindi otteniamo la (4.24). Nota 4.1.5 Riprendendo l’osservazione 4.1.3, vogliamo puntualizzare meglio la tesi del teorema 4.1.2. La (4.25) è vera soltanto se le variabili lagrangiane q1 , ..., ql sono indipendenti, cioè non soggette ad alcun ulteriore vincolo (come, ad esempio, quello dato dalla (4.11)). Se le variabili (q1 , ..., ql ) sono vincolate (e non si vuole “eliminare” tale vincolo passando ad (l − 1) coordinate lagrangiane) la (4.25) non rappresenta più il generico spostamento virtuale del sistema soggetto ad (m + 1) vincoli. Infatti, applicando la definizione 4.1.4, i vettori δ� x ∈ R3N sono spostamenti virtuali soltanto � m+1 = 0. Detto se, oltre alla condizione (4.24), soddisfano anche la condizione δ� x • ∇f 3N in altri termini, se N denota il sottospazio di R generato dagli (m + 1) gradienti � m , ∇f � m+1 , δ� � 1 , ..., ∇f x ∈ R3N è spostamento virtuale se δ� x ∈ N⊥ . Il punto è ∇f � 1 , ..., u � l , non coincide più con N⊥ . Infatti che adesso il sottospazio generato da u � l } = 3N − m, mentre dim N⊥ = 3N − (m + 1). Quindi la generica dim {� u1 , ..., u �l � s non individua più uno spostamento virtuale. combinazione lineare s=1 δqs u La procedura fin qui analizzata si estende anche al � 1 , ...., u � l , definiti adesso come t ∈ I, i vettori u  ∂x 1 (q1 , q2 , ..., ql , t)  ∂qj  ∂x 2  (q1 , q2 , ..., ql , t)  � ∂x ∂q  j �j = u = ∂qi  .. .   ∂x N (q1 , q2 , ..., ql , t) ∂qj caso di vincoli mobili. Per ogni       , j = 1, 2, ..., l,     formano ancora la base locale relativa alle variabili (q1 , q2 , ..., ql ). Adesso però, fissata una qualsiasi configurazione, la base locale cambia da un istante all’altro. In ogni istante però vale sempre la (4.23), cioè � k = 0, ∀ j = 1, ..., l; ∀ k = 1, .., m; e ∀ t ∈ I. � j • ∇f u (4.28) SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 139 Quindi nel caso dei vincoli mobili, lo spazio degli spostamenti virtuali varierà non solo da posizione a posizione ma anche al variare del tempo. Esempio 4.1.4 E’ dato un solo punto materiale P di massa m vincolato su una circonferenza verticale centrata in O, di raggio R, che ruota attorno all’asse z. Si vogliono determinare le equazioni vincolari, assumendo un sistema di riferimento fisso in cui l’asse delle z è la verticale ascendente passante per O. Il sistema è costituito da un solo punto materiale P soggetto a due vincoli: (1) P deve stare a distanza fissata R da un punto fisso O; (2) P appartiene a un piano verticale che ruota attorno alla verticale condotta per il punto O. La circonferenza ruotante può quindi essere vista come l’intersezione di due vincoli indipendenti (v. figura 5.1): (i) una sfera fissa di raggio R centrata nell’origine, la cui equazione implicita è f1 (x, y, z) = x2 + y 2 + z 2 − R2 = 0; (ii) un piano ortogonale al piano x, y che ruota attorno all’asse z, la cui equazione è f2 (x, y, z) = −x sin ϕ (t) + y cos ϕ (t) = 0, essendo ϕ (t) l’angolo di rotazione che è una funzione assegnata del tempo. In questo caso lo spazio delle configurazioni C(t) è la circonferenza ruotante C(t) = {f1 (x, y, z) = 0} ∩ {f2 (x, y, z) = 0} . E’ facile verificare che ∇f1 , e ∇f2 , sono indipendenti e quindi il teorema di funzione implicita consente di individuare un solo parametro per descrivere (almeno localmente) C(t). Ovviamente varie scelte sono possibile, ma quella forse più conveniente consiste nel prendere come coordinata lagrangiana l’angolo θ ∈ (−π, π] formato dal vettore (P − O) con l’asse z, (v. ancora figura 5.1). Operando così abbiamo x (θ, t) = x (θ, t) ex + y (θ, t) ey + x (θ, t) ez , dove  x (θ, t) = R sin θ cos ϕ (t) ,      y (θ, t) = R sin θ sin ϕ (t) ,      z (θ, t) = −R cos θ. (4.29) E’ banale verificare che f1 (x (θ, t)) = 0, come del resto f2 (x (θ, t)) = 0. Il vettore che costituisce la base locale di C(t) è uθ = ∂x = R cos θ cos ϕ (t) ex + R cos θ sin ϕ (t) ey + R sin θez , ∂θ che, chiaramente, fissato θ, varia nel tempo. Lo spostamento virtuale è δx = uθ δθ. Viene infine lasciata come esercizio la verifica che uθ · ∇f1 = uθ · ∇f2 = 0. �2 e � 1, e u Esempio 4.1.5 Riprendendo l’esempio 4.1.1, vogliamo adesso determinare u gli spostamenti virtuali δx1 e δx2 dei due punti materiali nell’ipotesi che si faccia uso della parametrizzazione (iii). Dalle (4.22) e (4.12), abbiamo �1 u �2 u = = � ∂x = (0, 0, 1, 0, 0, 0) , ∂q1 � ∂x = (0, 0, 0, −αt sin q2 , αt cos q2 , 0) . ∂q2 140 LEZIONI DI SISTEMI DINAMICI Figura 4.4: Sfera di raggio R e piano ruotante. L’angolo di rotazione ϕ (t) è assegnato. 2 sono linearmente indipendenti dal momento che 1 e u E’ facile rendersi conto che u la matrice 2 × 6 0 0 1 0 0 0 0 0 0 −αt sin q2 αt cos q2 0 ha sempre un minore 2 × 2 con determinante non nullo. Inoltre è facile provare che k = 0, ∀ i = 1, 2, e ∀ k = 1, ..., 4. Gli spostamenti virtuali dei punti materiali i • ∇f u P1 e P2 sono dati dalla (4.26), cioè δx1 = ∂x1 ∂x1 δq1 + δq2 ∂q1 ∂q2 = ∂ [x1 (q1 , q2 , t) ex + y1 (q1 , q2 , t) ey + z1 (q1 , q2 , t) ez ] δq1 + ∂q1 + δx2 ∂ [x1 (q1 , q2 , t) ex + y1 (q1 , q2 , t) ey + z1 (q1 , q2 , t) ez ] δq2 ∂q2 = ez δq1 = ∂ [x2 (q1 , q2 , t) ex + y2 (q1 , q2 , t) ey + z2 (q1 , q2 , t) ez ] δq1 + ∂q1 + = ∂ [x2 (q1 , q2 , t) ex + y2 (q1 , q2 , t) ey + z2 (q1 , q2 , t) ez ] δq2 ∂q2 (−αt sin q2 ex + αt cos q2 ey ) δq2 . SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 141 Se invece vogliamo lo spostamento virtuale come vettore di R6 , ricordando la (4.25), abbiamo δ� x � 1 δq1 + u � 2 δq2 = u = ( 0, 0, δq1 , −δq2 αt sin q2 , δq2 αt cos q2 , 0 ). � �� δx1 δx2 4.1.2 Velocità ed energia cinetica Un moto qualsiasi del sistema degli N punti materiali, compatibile con i vincoli, è determinato dall’assegnazione delle funzioni del tempo q1 (t), . . . , ql (t), e quindi dalle relazioni xi (t) = xi (q1 (t), . . . , ql (t), t) , i = 1, 2, ... , N. (4.30) Derivando la (4.30) rispetto al tempo, determineremo quindi il legame tra le velocità dei punti del sistema e le coordinate lagrangiane11 ẋi (t) = l � ∂xi s=1 ∂qs (q1 (t), . . . , ql (t), t)q̇s + ∂xi (q1 (t), . . . , ql (t), t), ∂t i = 1, ... , N. (4.31) In particolare, possiamo introdurre la velocità come vettore di R3N   ẋ1  ẋ2   � = ẋ  ..  ,  .  ẋN e, ricordando le definizioni (4.22), scrivere  ∂x 1   ẋ1  ∂qs l  ..  �   ..  . =  . s=1  ∂xN ẋN ∂qs cioè � = ẋ l � s=1 La velocità ha dunque due componenti: • • �l s=1        q̇s +      � s q̇s + u � ∂x . ∂t ∂x1 ∂t .. . ∂xN ∂t     ,   (4.32) � s q̇s , che rappresenta la velocità dei punti materiali rispetto ai vincoli. u � ∂x , detta velocità di trascinamento. Tale componente è dovuta al moto dei ∂t vincoli. 11 Fare attenzione alla somiglianza formale tra la (4.31) e la (4.26): c’è però una sostanziale differenza tra queste formule e non si dovrebbe procedere oltre senza averla capita! 142 LEZIONI DI SISTEMI DINAMICI Possiamo ora utilizzare la (4.31) per esprimere l’energia cinetica T in funzione delle coordinate lagrangiane. Avremo T = N l 1 � 1� mi ẋ2i = T2 + T1 + T0 = ahk (q1 (t), . . . , ql (t), t)q̇h q̇k + 2 i=1 2 h,k=1 � �� T2 l � bh (q1 (t), . . . , ql (t), t)q̇h + h=1 � �� T1 = N � mi ∂xi ∂xi · , ∂qh ∂qk (4.34) N � mi ∂xi ∂xi , · ∂qh ∂t (4.35) N � mi ∂xi ∂xi · . ∂t ∂t (4.36) i=1 bh = i=1 c = (4.33) T0 dove i termini ahk , bh e c sono dati da12 ahk 1 c(q1 (t), . . . , ql (t), t) , �2 �� i=1 Per quanto riguarda T1 , introducendo  b1 (q1 , ..., ql , t)  b2 (q1 , ..., ql , t)  � b (� q , t) =  ..  . bl (q1 , ..., ql , t) possiamo anche scrivere    ,  · �. T1 = � b•q (4.37) La parte T2 può anche essere scritta come T2 = dove 1� T � q̇ Aq̇ , 2   � = q̇   q̇1 q̇2 .. . q̇l    ,  e A = A (q1 (t), . . . , ql (t), t), è una matrice simmetrica l × l, le cui componenti ahk = ahk (q1 , . . . , ql , t) , h, k = 1, ...., l sono date dalla (4.34). 12 Si raccomanda di fare il calcolo delle (4.34)-(4.36), e non procedere oltre se non lo si sa fare! (4.38) (4.39) SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 143 Teorema 4.1.3 La forma bilineare (4.38) è definita positiva, cioè T2 > 0, e T2 = 0 � = 0. soltanto se q̇ Dim. Facciamo vedere che det A �= 0. Infatti se per assurdo det A = 0, deve esi� ∈ Rl , w � �= 0 il relativo stere almeno un autovalore nullo, per cui, denotando con w autovettore (non nullo), abbiamo � =0 Aw l � =⇒ akh wh = 0, k = 1, 2, ...., l. h=1 Tuttavia, ricordando la (4.34), possiamo anche scrivere 0 T � Aw � = = w = akh wk wh h=1 k=1 �N l l � � � ∂xi ∂xi mi · ∂qh ∂qk i=1 h=1 k=1 = l � l � N � mi i=1 �� l � h=1 ∂xi wh ∂qh � � � · wk wh l � k=1 ∂xi wk ∂qk Ma allora, per ogni i = 1, 2, ...., N , il vettore 0 = � = � l � ∂xi wh ∂qh �2 l � ∂xi wh ∂qh �2 h=1 h=1 + � l � h=1 �� l h=1 ∂yi wh ∂qh = mi i=1 wh �2 N � � l � h=1 ∂xi wh ∂qh ∂xi è nullo, cioè ∂qh + � l � h=1 ∂zi wh ∂qh �2 Dunque tutti gli N vettori, i = 1, ...., N , l � ∂xi wh ∂qh h=1 = � l � h=1 + � ∂xi wh ∂qh l � h=1 � ∂yi wh ∂qh ex � ey + � l � h=1 devono essere nulli. Esiste quindi una l-upla non nulla    w1    � =  ...  = w �  wl  0 ..  , .  0 ∂zi wh ∂qh � ez , . �2 . 144 LEZIONI DI SISTEMI DINAMICI per cui  � 1 + .... + wl u �l w1 u   ∂x1  ∂q1    ∂x   2       ∂q1  + .... + wl  = w1   .    ..       ∂xN   ∂q1  �l  ∂x1 wh    h=1 ∂qh 0  �l  ∂x2   0 wh    h=1 ∂qh = =   ..   ..    . .   0  �l  ∂xN wh h=1 ∂qh ∂x1 ∂ql ∂x2 ∂ql .. . ∂xN ∂ql              .  � j , j = 1, 2, ..., l, non sono linearmente inIn altri termini, gli l vettori di R3N , u dipendenti e ciò contraddice il teorema 4.1.1. Abbiamo quindi provato che la forma bilineare (4.38) non può essere degenere. Il fatto che sia definita positiva discende banalmente dalla definizione di energia cinetica. Infatti, supponendo di “congelare” i � T Aq̇ � > 0, se per q̇ � vincoli13 , si deduce, dall’espressione di T (4.33), che la matrice q̇ non nullo. La forma quadratica (4.38) è dunque definita positiva. Osserviamo infine che, sfruttando la (4.37) e la (4.38) possiamo riscrivere l’energia cinetica nella seguente forma compatta 1� T � � � (4.40) q̇ Aq̇ + b • q̇ + T0. 2 Esempio 4.1.6 Riferendoci all’esempio 4.1.4, vogliamo adesso determinare la velocità e l’energia cinetica del punto materiale. La velocità del punto materiale P discende dalla (4.29) ∂x ẋ = θ̇uθ + , ∂t dove ∂x dϕ (t) dϕ (t) = −R sin θ sin ϕ (t) ex + R sin θ cos ϕ (t) ey , ∂t dt dt rappresenta la velocità di trascinamento, mentre θ̇uθ è la velocità rispetto al vincolo. dϕ è la velocità assegnata Lo ricordiamo ancora: ϕ (t) è una funzione nota, e dunque dt di rotazione del vincolo. L’energia cinetica del punto materiale è � � � �2 � � m dϕ mR2 2 2 2 T θ, θ̇, t = |ẋ| = θ̇ + sin θ . (4.41) 2 2 dt T = 13 Per “congelare”, o meglio, immobilizzare i vincoli è sufficiente considerare nulla la velocità di ∂x = 0. trascinamento, cioè porre ∂t SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 145 2 mR2 dϕ 2 dove sin θ è la parte di energia cinetica dovuta al moto del vincolo. 2 dt In particolare, confrontando la (4.41) con la (4.33), abbiamo mR2 2 mR2 T θ, θ̇, t = θ̇ + 2 2 T2 4.1.3 Punto vincolato sulla superficie dϕ dt 2 T0 sin2 θ . (4.42) Come primo esempio di cinematica di un sistema vincolato vediamo, in dettaglio, il caso di un solo punto materiale vincolato a una superficie fissa (quindi non dipendente dal tempo) che viene assegnata come insieme di livello di una funzione. Pertanto, data f : W → R, funzione (o campo scalare) definita su un sottoinsieme aperto W di A, spazio tridimensionale affine euclideo, la superficie è l’insieme dei punti P ∈ W , tali che f (P ) = 0. In simboli {P ∈ U : f (P ) = 0} . Supponiamo che in A sia dato un riferimento cartesiano ortonormale {O, ex , ey , ez }, sì che ogni punto P è identificato dal vettore (P − O) = x, con x = xex + yey + zez . La superficie allora si identifica come14 C = x ∈ R3 : f (x) = 0 . (4.43) L’insieme C ⊂ R3 , la superficie appunto, è dunque lo spazio delle configurazioni, che ovviamente assumiamo non vuoto15. In particolare, se f è di classe16 C 2 la superficie si dice regolare (o non singolare) in x0 ∈ C, se17 ∇f (x0 ) �= 0, ovvero se 2 |∇f (x0 )| = ∂f (x0 ) ∂x 2 + ∂f (x0 ) ∂y 2 + ∂f (x0 ) ∂z 2 �= 0. (4.44) La superficie si dirà poi globalmente regolare (o globalmente non singolare) se è regolare in ogni punto di C. Supponiamo quindi di aver a che fare con una superficie globalmente regolare. Tale potesi consente l’applicazione del teorema della funzione implicita per ogni x ∈ C. In base a tale teorema f (x, y, z) = 0 è localmente il ∂f grafico di una funzione. Se, ad esempio, �= 0, in x0 , allora, sul piano (x, y) ∂z esiste un intorno aperto U di (xo , yo ), per cui la superficie può localmente scriversi come grafico, z = z (x, y). In altri termini, il teorema del Dini consente di individuare un’applicazione che ai parametri (q1 , q2 ) ∈ U , con U ⊂ R2 , intorno aperto di (xo , yo ), 14 Anche adesso con x intendiamo la terna (x, y, z). Quindi f (x) = f (x, y, z). 1 del paragrafo 4.1. Infatti, se per esempio avessimo 15 Richiesta f (x, y, z) = x2 + y 2 + z 2 + 16, è chiaro che l’insieme C ⊂ R3 , costituito dei punti (x, y, z) tali che f (x, y, z) = 0, sarebbe vuoto. 16 Proprietà di regolarità del vincolo (richiesta 2 del paragrafo 4.1). 17 Richiesta 3 del paragrafo 4.1. 146 LEZIONI DI SISTEMI DINAMICI associa il vettore x (q1 , q2 ) (q1 , q2 ) → x (q1 , q2 ) = q1 ex + q2 ey + z (q1 , q2 ) ez   x = q1 , y = q2 , ⇔  z = z (q1 , q2 ) . Questo significa che, localmente18 , la superficie può essere espressa in forma parametrica mediante i parametri19 (q1 , q2 ). Si introducono i due vettori ui = ∂x ∂x ∂y ∂z (q1 , q2 ) = ex + ey + ez , ∂qi ∂qi ∂qi ∂qi i = 1, 2, (4.45) detti vettori tangenti alla superficie. Nel caso specifico essi sono u1 = ex + ∂z (q1 , q2 ) ∂z (q1 , q2 ) ez , u 2 = ey + ez , ∂q1 ∂q2 dove, sfruttando ancora il teorema della funzione implicita, � � � � ∂f ∂f ∂z (q1 , q2 ) ∂z (q1 , q2 ) ∂x ∂y = −� �, = −� �. ∂f ∂f ∂q1 ∂q2 ∂z ∂z E’ facile provare che u1 , u2 sono linearmente indipendenti. Infatti, la matrice 2 × 3 formata delle componenti di u1 , u2 ,      ha rango massimo 1 0 0 1  ∂z ∂q1   , ∂z  ∂q2 Nota 4.1.6 Allo stesso risultato saremmo potuti giungere anche mostrando che u1 ∧ u2 �= 0. Infatti, u1 ∧ u2 ∂z ∂z ex − e y + ez ∂q1 ∂q2 � � ∂f 1 1 ∂f ∂f � � ex + ey + ez = � � ∇f . ∂f ∂f ∂x ∂y ∂z ∂z ∂z = − = Pertanto u1 ∧ u2 è parallelo a ∇f , che è non nullo dal momento che la superficie è regolare. 18 E’ importante osservare che, in generale, la parametrizzazione non è globale. a questo livello, q1 e q2 altro non sono che le variabili x, y. 19 Ovviamente, SISTEMI VINCOLATI E COORDINATE LAGRANGIANE Inoltre abbiamo 147 �  ∂f � �   ∂f ∂f ∂f ∂x  � � e e e e e − + + u1 · ∇f =  · z x y z = 0,  x ∂f ∂x ∂y ∂z ∂z �  ed analogamente u2 · ∇f = 0. Quindi, volendo generalizzare, il teorema della funzione implicita garantisce che, per ogni punto della superficie regolare, esiste un intorno in cui la superficie è rappresentabile come l’immagine di un aperto U di R2 . Ovvero esistono tre funzioni x(q1 , q2 ), y(q1 , q2 ) e z(q1 , q2 ) di due variabili (le variabili lagrangane o parametri lagrangani) (q1 , q2 ) ∈ U ⊂ R2 , tali che Le curve f (x(q1 , q2 ), y(q1 , q2 ), z(q1 , q2 )) = 0 , per ogni (q1 , q2 ) ∈ U. q1 → (x(q1 , q2 ), y(q1 , q2 ), z(q1 , q2 )) , q2 = costante, e q2 → (x(q1 , q2 ), y(q1 , q2 ), z(q1 , q2 )) , q1 = costante. formano il reticolo di linee coordinate sulla superficie f = 0. Introducendo poi i vettori tangenti alla superficie ui = ∂x (q1 , q2 ) ∂y (q1 , q2 ) ∂z (q1 , q2 ) ex + ey + ez , ∂qi ∂qi ∂qi i = 1, 2, (4.46) è facile provare che sono linearmente indipendenti e che ui · ∇f = 0, i = 1, 2. Nota 4.1.7 E’ opportuno rimarcare ancora che la parametrizzazione della superficie non è univoca. Per intendersi, anziché usare i parametri (q1 , q2 ) ∈ U ⊂ R2 , potremmo descrivere la superficie utilizzando i parametri (s1 , s2 ) ∈ W ⊂ R2 , ammesso che esista un’applicazione biunivoca che ci consenta di scrivere q1 = q1 (s1 , s2 ) , q2 = q2 (s1 , s2 ) , (4.47) e le loro inverse: s1 = s1 (q1 , q2 ), s2 = s2 (q1 , q2 ). Utilizzando le variabili (s1 , s2 ), la superficie viene vista come l’immagine dell’aperto W , attraverso le tre funzioni x(s1 , s2 ), y(s1 , s2 ) e z(s1 , s2 ). L’invertibilità della trasformazione (4.47) è garantita dalla condizione det J �= 0, dove, in questo caso, J è la matrice jacobiana   ∂q1 ∂q1  ∂s1 ∂s2    (4.48) J= .  ∂q2 ∂q2  ∂s1 ∂s2 Definizione 4.1.5 Si definisce piano tangente, Π (P0 ) , alla superficie nel punto20 P0 , il piano per P0 i cui punti sono ortogonali a ∇f (P0 ). In simboli Π (P0 ) = {Q ∈ A : (Q − P0 ) · ∇f (P0 ) = 0} . 20 La superficie è regolare in P. (4.49) 148 LEZIONI DI SISTEMI DINAMICI Definizione 4.1.6 Si definisce spazio normale alla superficie S nel punto P0 , e lo si denota con N (P0 ), il complemento ortogonale dello spazio tangente, ovvero il sottospazio di21 V formato da tutti i vettori ortogonali a Π (P0 ) , N (P0 ) = {v ∈ V, : v = λ∇f, con λ ∈ R} . (4.50) In particolare se il punto P0 è identificato dal vettore (P0 − O) = x0 , avremo che il punto Q, identificato dal vettore (Q − O) = x, giace sul piano tangente se (x − x0 ) · ∇f (x0 ) = 0. Evidentemente, una definizione equivalente di piano tangente può essere anche data in termini dei due vettori u1 e u2 , Π (P0 ) = {Q ∈ A : (Q − P0 ) = α1 u1 + α2 u2 , con αi ∈ R, i = 1, 2} , mentre una definizione equivalente di spazio normale è N (P0 ) = {v ∈ V, : v = λ (u1 (P0 ) ∧ u2 (P0 )) , con λ ∈ R} . Possiamo quindi concludere che ogni spostamento virtuale relativo alla generica configurazione x è un vettore del piano tangente, cioè δx = u1 δq1 + u2 δq2 , (4.51) dove δq1 , δq2 sono numeri reali qualsiasi. Definiamo poi, in ogni punto della superficie, la matrice simmetrica i cui elementi sono i prodotti scalari dei vettori tangenti (4.46)   u1 · u1 u2 · u1 , A= (4.52) u1 · u2 u2 · u2 � � E F 22 , che viene detta prima forma quadratica fondausualmente denotata F G mentale della superficie. Osserviamo che la matrice A non è altro che la matrice metrica (1.8) relativa alla base {u1 , u2 }. Infatti, la restrizione del prodotto scalare al piano tangente dà luogo ad una forma bilineare simmetrica definita positiva. In altre parole, se π 1 = α1 u1 + α2 u2 , e π2 = β1 u1 + β2 u2 , sono due vettori del piano tangente, allora π1 · π2 = = = 21 Ricordiamo (α1 u1 + α2 u2 ) · (β1 u1 + β2 u2 ) = � � �� E F β1 α1 α2 F G β2 � � �� E F α1 β1 β 2 . F G α2 (4.53) che V è lo spazio vettoriale che soggiace allo spazio affine euclideo A. faccia attenzione al fatto che le componenti della matrice E, F e G sono, in generale, funzioni di (q1 , q2 ), ovvero E = E (q1 , q2 ), F = F (q1 , q2 ) e G = G (q1 , q2 ). 22 Si SISTEMI VINCOLATI E COORDINATE LAGRANGIANE 149 La forma è definita positiva proprio perché il prodotto scalare è definito positivo. Infatti, per ogni vettore π = α1 u1 + α2 u2 �= 0 del piano tangente potremo scrivere (assumendo, per esempio, α2 �= 0) � � α1 π · π = α22 Eξ 2 + 2F ξ + G , con ξ = . α2 Ora il trinomio in ξ è sempre positivo dal momento che il discriminante è � � F 2 − GE = − |u1 ∧ u2 |2 < 0, (v. formula (4.57)). Nota 4.1.8 Osserviamo che la forma bilineare (4.53) è indipendente dalla parametrizzazione della superficie. Infatti, rifacendoci alla nota 4.1.7, se al posto di (q1 , q2 ) ∂x ∂x facciamo uso della coppia (s1 , s2 ), i cui vettori tangenti sono h1 = , h2 = , ∂s1 ∂s2 la matrice della forma bilineare, rispetto alla nuova base h1 , h2 , è data da M̂ = � Ê F̂ F̂ Ĝ � F̂ Ĝ � = � h1 · h1 h1 · h2 h1 · h2 h1 · h2 � . Si può facilmente dimostrare che � Ê F̂ =J T � E F F G � (4.54) J, dove J è data dalla (4.48). In particolare, dati due vettori π 1 , π 2 sullo spazio tangente, tali che  � � � �  α1 u1 + α2 u2 δ1 α1 π1 → =J , con α2 δ2  δ1 h1 + δ2 h2 π2 →   β1 u1 + β2 u2  γ1 h1 + γ2 h2 con � β1 β2 � =J � γ1 γ2 � , mostriamo che π1 · π 2 è indipendente dalla base prescelta. Infatti, indicando con (π 1 · π 2 )(u1 ,u2 ) , la forma bilineare espressa nella base u1 , u2 , e con (π1 · π2 )(h1 ,h2 ) , l’espressione della forma rispetto a h1 , h2 , proviamo che (π1 · π 2 )(u1 ,u2 ) = (π 1 · π2 )(h1 ,h2 ) . 150 LEZIONI DI SISTEMI DINAMICI Dalla23 (4.53) (π1 · π2 )(u1 ,u2 ) = = = δ1 (4.54) δ2 δ1 JT δ2 α2 α1 E F Ê F̂ E F F G β1 β2 γ1 J γ2 F̂ γ1 = (π 1 · π 2 )(h1 ,h2 ) . γ2 Ĝ F G Ora, i parametri lagrangiani (q1 , q2 ) saranno, in generale, funzioni del tempo. Scriveremo pertanto x (t) = x (q1 (t) , q2 (t)) ex + y (q1 (t) , q2 (t)) ey + z (q1 (t) , q2 (t)) ez . Il vettore velocità del punto materiale è ∂x ∂y ∂z ex + ey + ez q̇i (t) ẋ (t) = ∂qi ∂qi ∂qi i=1,2 ui = q̇1 (t) u1 + q̇2 (t) u2 . (4.55) · tangente e le sue componenti, rispetto alla base Quindi x (t) è un vettore dello spazio q̇1 . u1 , u2 , sono date dalla coppia q̇2 m · 2 |ẋ| . Siccome x è un vettore del piano L’energia cinetica del punto è T = 2 tangente facciamo uso della forma bilineare (4.53) per calcolarne la norma, cioè E F m 2 m q̇1 q̇1 q̇2 |ẋ| = T = F G q̇2 2 2 m 2 E q̇1 + 2F q̇1 q̇2 + Gq̇22 . (4.56) = 2 Concludiamo mostrando come, nel caso di un solo punto materiale vincolato su una superficie regolare, il teorema 4.1.3 sia facilmente dimostrabile. Infatti det A = = 2 2 2 EG − F 2 = |u1 | |u2 | − (u2 · u1 ) (4.57) 2 2 2 2 2 |u1 | |u2 | 1 − cos2 θ = |u1 | |u2 | sin2 θ = |u1 ∧ u2 | > 0, dal momento che u1 e u2 non sono paralleli. 23 Ricordiamo che T α1 = α2 α1 α2 T δ1 JT δ2 δ1 δ2 Capitolo 5 Le equazioni di moto per sistemi vincolati Sia {Pi , mi , i = 1, . . . , N }, un sistema di punti materiali, che supponiamo soggetto a un sistema di m vincoli olonomi fk (x1 , ...., xN , t) = 0 , k = 1, . . . , m . (5.1) Supponiamo poi che il sistema di punti materiali sia soggetto a delle forze, indipendentemente dal fatto che il suo moto debba risultare a priori vincolato. Indicheremo con F i la risultate delle forze applicate al punto Pi . Chiameremo queste forze direttamente applicate. Sotto l’azione di tali forze il moto del sistema retto dalle equazioni mi ẍi = F i , i = 1, ...., N , non risulterà in genere incompatibile con le equazioni vincolari (5.1). Per esempio si pensi a un punto appoggiato su un piano orizzontale: in questo caso la forza direttamente applicata è la forza peso, e il punto abbandonerà il piano orizzontale durante il moto sotto l’azione di questa forza, violando così il vincolo che gli impone a rimanere sul piano orizzontale. Se vogliamo salvaguardare i vincoli e le equazioni di Newton, dobbiamo supporre che i vincoli “esercitino” delle forze Ri sui punti del sistema in modo che le soluzione delle equazioni mi ẍi = F i + Ri , i = 1, . . . , N , (5.2) risultino compatibili con le equazioni vincolari (5.1). Chiameremo le forze Ri , dovute ai vincoli, reazioni vincolari. Le (5.1) assieme alle (5.2) formano un sistema di 3N + m equazioni da cui dovremmo ricavare sia le incognite di moto (le 3N coordinate dei punti Pi ) sia le 3N componenti delle reazioni vincolari Ri . Poiché m < 3N , il sistema risulta indeterminato, ovvero non possiamo da queste sole “informazioni” determinare la soluzione completa del problema del moto vincolato (a meno di non caratterizzare maggiormente le reazioni Ri ). 152 LEZIONI DI SISTEMI DINAMICI 5.1 Dinamica di un punto vincolato sulla superficie. Iniziamo esaminando il caso più semplice di un solo punto materiale (P, m) vincolato a muoversi su una superficie fissa regolare (vincolo olonomo fisso) data dalla (4.43). Come abbiamo già detto le equazioni di moto (5.3) m ẍ = F + R , dovranno contenere la forza R incognita, il cui scopo è quello di far sì che la soluzione di (5.3) soddisfi, ad ogni istante t, la condizione vincolare f (x, y, z) = 0. Ciò ci dà un sistema indeterminato, avendo solo quattro equazioni per determinare sei incognite, le coordinate di P e le componenti di R. L’indeterminatezza del problema così formulato è dovuta al fatto che non abbiamo specificato “come” il vincolo, nella sua realizzazione fisica, intervenga per assicurarci il soddisfacimento della condizione f (x, y, z) = 0. Pensiamo per esempio, ad un oggetto appoggiato su di un tavolo: il piano del tavolo impedisce all’oggetto di cadere, in termini più formali, genera quella forza necessaria a contrastare l’effetto della forza peso. Quindi una componente della forza vincolare R è tale da impedire al corpo di abbandonare il vincolo. Ma cosa succede se tentiamo di muovere l’oggetto sul piano stesso? Ogni vincolo “reale” si opporrà a tale moto: è l’effetto che va sotto il nome di attrito. Questo effetto viene schematizzato tramite una componente di R che ha sempre direzione e verso opposti alla velocità del corpo. Ora, siccome la velocità del punto materiale giace sul piano tangente, la componente di R dovuta all’attrito starà sul piano tangente. Potremo quindi effettuare questa scomposizione (5.4) R = R � + R⊥ , dove R� giace nel piano tangente (e dunque sarà esprimibile come combinazione lineare di u1 e u2 ) mentre R⊥ giace nello spazio tangente, per cui, ricordando la (4.50), R⊥ = λ∇f, (5.5) dove λ ∈ R, è un parametro incognito, detto moltiplicatore di Lagrange, il cui valore dipenderà dalla posizione e dalla velocità del punto. La forza R� è causata dell’attrito. Essa viene generalmente espressa in termini di altre quantità dinamiche (es. velocità, R⊥ , etc.) e di parametri fisici (coefficienti di attrito, etc.). Ovviamente, per R� esistono vari modelli di attrito1 o, come si usa dire in meccanica, varie equazioni costitutive. Una volta selezionato il modello il vettore R� viene espressa (in maniera più o meno complicata) in funzione di altre quantità. La forza R⊥ rappresenta la componente della forza vincolare che la superficie (il vincolo) esercita sulla particella per mantenerlo su di essa. Notiamo che, in generale, R⊥ è incognita (cioè, data la (5.5), λ è incognito). Infatti, a differenza di R� , non esiste alcuna espressione costitutiva per R⊥ , dal momento che essa deve poter assumere qualunque valore necessario per non far allontanare il punto materiale dalla superficie. In molti casi possiamo ridurre l’intensità di R� (componente di R dovuta all’attrito), e pensare ad un modello ideale in cui questa resistenza al moto viene a mancare 1 Ad · esempio, il modello di attrito viscoso prevede che R� = −ηx, dove η viene detto coefficiente di attrito viscoso. LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 153 del tutto. Chiameremo ideale o liscio un vincolo per cui (5.6) R = 0. La caratterizzazione del vincolo liscio è immediata. Poiché, come detto, il vettore R giace, istante per istante, sul piano tangente, avremo che il vincolo è liscio se e solo se R · δx = 0 , per ogni δx ∈ Π (P ) , (5.7) e di conseguenza2, ricordando la definizione 4.1.6, R ∈ N (P ) ⇔ R = λ∇f . (5.8) Nota 5.1.1 E’ opportuno chiarire il significato fisico della (5.7). Se consideriamo un intervallo di tempo δt “molto piccolo”, il lavoro δL infinitesimo, detto anche lavoro virtuale, fatto dalla forza R durante tale intervallo temporale è (si ricordi la definizione 3.2.6) δL = W δt = R · ẋδt . Se adesso applichiamo la (4.55) si ottiene δL = R · [u1 q̇1 (t) δt + u2 q̇2 (t) δt ] � �� δq1 δq2 = R · [u1 δq1 + u2 δq2 ] = R · δx . Dunque, in termini fisici la (5.7) può esprimersi così: il lavoro della forza vincolare R è nullo per ogni spostamento virtuale. Quindi, nel caso in cui la superficie sia liscia, l’equazione di moto (5.3) e l’equazione del vincolo danno luogo ad un sistema, dette equazioni di Lagrange di prima specie,   m ẍ = F + λ∇f, (5.9)  f (x) = 0, di quattro equazioni nelle quattro incognite x = (x, y, z) e λ. Vediamo adesso come si determina λ nel caso del singolo punto materiale vincolato su una superficie regolare. Partendo dalla (5.9)1 , si ha 2 λ |∇f | = (mẍ − F ) · ∇f, da cui λ= (mẍ − F ) · ∇f |∇f |2 (5.10) , dove il termine ẍ · ∇f può essere ulteriormente elaborato. Considerando il vettore posizione x come funzione del tempo3 x = x (t), avremo f (x (t)) = 0, ⇒ 2 Se d df (x (t)) = 0, ⇔ f (x (t) , y (t) , z (t)) = 0, dt dt vogliamo anche la (5.8) è un’assunzione costitutiva: si dà a priori la forma della forza vincolare. pur sapendo che x = x (q1 (t) , q2 (t)), considerare x = x (t) significa “dimenticarci” della “mediazione” di q1 e q2 e leggere x direttamente come funzione del tempo. 3 In altri termini, 154 LEZIONI DI SISTEMI DINAMICI da cui, ricordando la regola di derivazione di funzione composta, ∂f ∂f ∂f d ẋ + ẏ + ż = 0, ⇔ ∇f · ẋ = 0 ⇒ (∇f · ẋ) = 0. ∂x ∂y ∂z dt Svolgendo la derivata rispetto al tempo si ottiene � � � � d ∇f d ∇f ∇f · ẍ + · ẋ = 0, ⇒ ∇f · ẍ = − · ẋ. dt dt ∇f Dobbiamo quindi calcolare d dt � d ∇f d ∂f (x (t) , y (t) , z (t)) = ex dt dt ∂x = ∂f (x (t) , y (t) , z (t)) ∂f (x (t) , y (t) , z (t)) ey + ex + ∂y ∂z � 2 � ∂2f ∂2f ∂ f ẋ + ẏ + ż ex + ∂x2 ∂y∂x ∂z∂x � 2 � ∂ f ∂2f ∂2f ẋ + ż ey + ẏ + ∂x∂y ∂y 2 ∂z∂y � 2 � ∂ f ∂2f ∂2f ẋ + ẏ + 2 ż ez . ∂x∂z ∂y∂z ∂z (5.11) � Per cui, introducendo la matrice H ( f ) delle derivate seconde della f , detta matrice hessiana,   ∂2f ∂2f ∂2f  ∂x2 ∂y∂x ∂z∂x     ∂2f ∂2f  ∂2f  , (5.12) H( f ) =  ∂y 2 ∂z∂y   ∂x∂y  2 2 2  ∂ f ∂ f ∂ f  ∂x∂z si ottiene     d ∇f =  dt   � ∂2f ∂x2 ∂2f ∂x∂y ∂2f ∂x∂z ∂y∂z ∂2f ∂y∂x ∂2f ∂y 2 ∂2f ∂y∂z �� ∂2f ∂z∂x ∂2f ∂z∂y ∂2f ∂z 2 H( f ) Di conseguenza � � d ∇f · ẋ = (H ( f ) ẋ) · ẋ, dt ∂z 2 ⇒ (5.11)         � �  · x ·  y . · z �� · x ∇f · ẍ = −ẋ · H ( f ) ẋ. Abbiamo quindi determinato λ λ=− mẋ · H ( f ) ẋ + F · ∇f |∇f | 2 , (5.13) LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 155 in termini della forza F , della velocità ẋ, e delle caratteristiche geometriche del vincolo. L’estensione al caso di una superficie mobile (e quindi dipendente dal tempo) è immediata. Anche in questo caso la definizione di vincolo liscio è data dalla (5.6) o, equivalentemente, dalla (5.7). Ma, anche se il “lavoro virtuale”, ovvero il prodotto scalare della reazione con un qualsiasi δx del piano tangente è nullo, la forza vincolare R può effettuare un lavoro effettivo non nullo. Per chiarire questo punto si pensi a un corpo che si muova sul piano di un ascensore in movimento. Ovviamente la condizione di “vincolo liscio” deve solo tener conto che tra il piano dell’ascensore e il corpo in moto non c’è attrito, indipendentemente dal fatto che l’ascensore stia salendo, scendendo o sia fermo. Quindi la reazione vincolare deve risultare ortogonale al piano dell’ascensore (condizione garantita dalla (5.7)). Tuttavia, quando l’ascensore sta salendo (o scendendo) la reazione vincolare compierà un lavoro “effettivo” non nullo (un ascensore che sale fa aumentare l’energia potenziale del punto, anche se questo sta fermo sul piano dell’ascensore). Questo, come vedremo, ha per conseguenza che, nel caso dei vincoli mobili, non si ha, in generale, la conservazione dell’energia meccanica anche in presenza di forze di tipo conservativo. 5.2 L’equazione simbolica della dinamica La generalizzazione della definizione di vincolo liscio si ottiene in analogia con la (5.7). Sia, al solito, {Pi , mi }, i = 1, . . . N , un sistema di punti materiali soggetti � ∈ R3N , il vettore delle N reazioni agli m vincoli olonomi (5.1). Indichiamo con R vincolari   R1 .  � = R (5.14)  ..  , RN intendendo con Ri , i = 1, 2, ..., N , la forza vincolare (o meglio reazione vincolare) che agisce sull’i-esimo punto generata al complesso degli m vincoli. Anche in questo caso, il sistema formato dalle (5.2) e (5.1) è indeterminato, contando 6N incognite contro le 3N + m equazioni, a meno che non si facciano ipotesi costitutive sulle reazioni vincolari. L’ipotesi più semplice è quella di vincoli lisci, che così definiamo in generale: � • δ� Definizione 5.2.1 Diremo che i vincoli sono lisci quando R x = 0, per ogni spostamento virtuale δ� x, cioè quando le reazioni vincolari Ri soddisfano la condizione N � i=1 Ri · δxi = 0 , per ogni sistema di (δx1 , .... , δxN ) . (5.15) Riferendoci alla nota 5.1.1, esprimeremo la (5.15) dicendo che il lavoro virtuale delle reazioni vincolari è nullo per ogni sistema di spostamenti virtuali. Vediamo come l’assunzione di vincoli lisci ci permetta di ridurre ad m il numero delle � ∈ N , dove, incognite dovute alle reazioni vincolari. Infatti, la (5.15)) implica che R 156 LEZIONI DI SISTEMI DINAMICI � � � 1 , ∇f � 2 , . . . , ∇f � m , cioè lo ricordiamo, N è il sottospazio la cui base è ∇f � = R m � k=1 � k, λk ∇f � significa che, tradotta nelle singole “componenti” di R Ri = m � k=1 λk ∂fk , ∂xi i = 1, ...., N , (5.16) (5.17) ∂fk è definito dalla (4.7) e dove λk , k = 1, . . . , m, sono parametri arbitrari ∂xi (moltiplicatori di Lagrange). Sostituendo le espressioni (5.17) nelle equazioni di moto (5.2) e considerando anche le (5.1), otteniamo il seguente sistema, dette ancora equazioni di Lagrange di prima specie,  �m ∂fk  λk , i = 1, . . . , N ,  mi ẍi = F i + k=1 ∂xi (5.18)   k = 1, . . . , m . fk (x1 , ...., xN , t) = 0, dove Lo ribadiamo ancora: le N equazioni (5.18)1 sono valide solo nell’ipotesi di vincoli lisci. Il processo di eliminazione delle λk in (5.18), possibile in linea di principio, è, nel caso di N > 1 punti materiali, algebricamente molto complesso. Torneremo sulla questione delle equazione di Lagrange di prima specie nella sezione 5.3.2. Vediamo adesso come sia possibile percorrere un’altra strada che conduce direttamente ad un sistema di tante equazioni quanti sono i gradi di libertà. Prima di sviluppare tale procedura è opportuno analizzare più in dettaglio F i , i = 1, .... , N , risultante di tutte le forze, non vincolari, che agiscono sull’i-esimo punto materiale. Dividiamo quindi le forze che agiscono sull’i-esimo punto materiale in due categorie: 1. Forze conservative (o di tipo gradiente), la cui risultante indicheremo con F i, cons . In tal caso sappiamo che esiste una funzione, detta energia potenziale, V = V (x1 , ...., xN ) , che, per brevità di notazione indicheremo anche con V = V (� x), per cui F i, cons = − ∂V (x1 , ...., xN ) , ∂xi (5.19) ∂ , rappresenta il gradiente rispetto alle coordinate (xi , yi , zi ), come ∂xi espresso dalla (4.7). dove 2. Tutte le altre forze che non sono né conservative né dovute all’interazione coi vincoli. La loro risultante viene denotata con S i . LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 157 Ritornando alle (5.18)1 ed applicando la suddivisione appena illustrata F i = F i, cons + S i = − ∂V + Si, ∂xi (5.20) scriveremo mi ẍi = − �m ∂V (� x) ∂fk + Si + λk , k=1 ∂xi ∂xi i = 1, . . . , N . (5.21) Moltiplichiamo ora scalarmente, in R3 , ognuna delle equazioni per lo spostamento virtuale δxi dell’i-esimo punto materiale e sommiamo le N equazioni scalari così ottenute. In virtù della assunzione di vincoli lisci, ovvero della (5.15), le reazioni vincolari “scompaiono” dalla somma, e abbiamo � N � � ∂V (� x) mi ẍi + −S i · δxi = 0 , ∀ (δx1 , ...., δxN ) , ∂xi i=1 (5.22) che è nota con il nome di equazione simbolica della dinamica. E’ interessante scrivere la (5.22) nel formalismo compatto di R3N . Infatti introducendo   S1 .  � = S  ..  , SN e, ricordando la (5.19) e la (4.8), � cons F   =   F 1, cons    ..  =  .   F N, cons − ∂V (� x) ∂x1 .. .    � (�  = −∇V x) ,   ∂V (� x) − ∂xN il sistema (5.21) di N equazioni vettoriali (e quindi 3N equazioni scalari) può esser scritto come   m1 ẍ1 m �   � .. �− � k = 0, + ∇V (� x ) − S λk ∇f (5.23)   . mN ẍN k=1 � Se adesso dove abbiamo sfruttato la (5.17) per esprimere le reazioni vincolari R. 3N moltiplichiamo scalarmente in R la (5.23) per il generico spostamento virtuale δ� x∈ R3N , cioè    m1 ẍ1 m �   �  .. � k • δ� � λk ∇f x = 0, (5.24) + ∇V (� x ) − S • δ� x −    . k=1 mN ẍN � �� =0 otteniamo, sviluppando il prodotto scalare • di R3N in somma di N prodotti scalari · di R3 , l’equazione simbolica della dinamica (5.22). 158 LEZIONI DI SISTEMI DINAMICI Nota 5.2.1 Osserviamo che� la (5.24) si presta ad un’interessante lettura “energetica”. l � i , con δqi , i = 1, ...., l, “infinitesimi”, sappiamo Infatti, considerando δ� x = i=1 δqi u che δ� x rappresenta di fatto uno “spostamento infinitesimo” del sistema degli N punti materiali compatibile con i vincoli. Ricordando la nota 5.1.1, il lavoro virtuale δL compiuto da tutte le forze (comprese le forze d’inerzia, ovvero −mi ẍi , i = 1, ...., N ) durante lo spostamento virtuale δ� x, è    m1 ẍ1   � .. � −S � δL =  x.  + ∇V − R  • δ� . mN ẍN La (5.24) comporta dunque δL = 0. Ciò significa che il lavoro virtuale compiuto da tutte le forze su un qualsiasi spostamento virtuale del sistema degli N punti materiali è nullo, ovvero i lavori compiuti dalle singole forze si bilanciamo perfettamente sì che δL si annulla. L’equazione δL = 0, prende il nome di principio dei lavori virtuali. Osserviamo adesso che la (5.24) vale per ogni δ� x. Avremo pertanto    m1 ẍ1   � .. � � j = 0, ∀ j = 1, 2, ..., l , x) − S  •u  + ∇V (� . mN ẍN (5.25) dal momento che, in virtù del teorema 4.1.2, o meglio della (4.25), ogni spostamento � 1, u �2, virtuale può essere espresso come combinazione degli l vettori indipendenti u � N . Quindi, in definitiva, l’equazione simbolica della dinamica (5.24) si tra....., u duce nel sistema di l equazioni indipendenti (5.25), che sono le proiezioni di (5.23) � N }. lungo i vettori della base locale {� u1 , ..., u Nella sezione 5.3 vedremo come esprimere il prodotto scalare (in R3N )   m1 ẍ1   .. �j ,  •u . mN ẍN in termini dell’energia cinetica del sistema di punti materiali. In altri termini dimostreremo una generalizzazione del teorema 3.1.1 illustrato nel capitolo 3. Per far ciò utilizzeremo l’energia cinetica del sistema espressa tramite le coordinate lagrangiane. Esempio 5.2.1 Mostriamo che il vincolo di rigidità che lega due punti è un vincolo liscio nel senso della definizione 5.2.1. Consideriamo due punti materiali P1 e P2 , le cui coordinate sono rispettivamente date da x1 e x2 , vincolati a mantenere costante la loro distanza d, cioè 2 f (x1 , x2 ) = |x1 − x2 | − d2 = 0, che scriveremo esplicitamente come 2 2 2 f (x1 , x2 ) = (x1 − x2 ) + (y1 − y2 ) + (z1 − z2 ) − d2 . LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 159 Indichiamo poi con d, il vettore (P1 − P2 ), cioè d = (x1 − x2 ) ex + (y1 − y2 ) ey + (z1 − z2 ) ez , mentre il vettore (P2 − P1 ) sarà −d. Abbiamo poi  ∂f   2d  ∂x1    � = , ∇f =   ∂f  −2d ∂x2  dal momento che ∂f = 2 (x1 − x2 ) ex + 2 (y1 − y2 ) ey + 2 (z1 − z2 ) ez , e analoga∂x1 ∂f . Denotiamo adesso con R1 la forza vincolare che agisce su P1 , mentre ∂x2 quella che agisce su P2 è R2 . Ora la forza R1 è dovuta al punto P2 , mentre R2 , forza che agisce su P2 , è originata da P1 . Di conseguenza R1 e R2 sono forze interne, l’una l’opposta dell’altra per il principio di azione e reazione, e, sempre per la terza legge di Newton, sono parallele al vettore (P1 − P2 ). Scriveremo dunque mente per R1 = αd, e R2 = −R1 = −αd, con α ∈ R, per cui  � = R R1 R2   = αd −αd  . Consideriamo adesso un qualsiasi spostamento virtuale   δx1 . δ� x= δx2 In virtù della definizione 4.1.4 abbiamo     2d δx1 •  = 2 (δx1 − δx2 ) · d. 0= δx2 −2d � �� δ x ∇f Ma allora  � • δ� R x= αd −αd   • δx1 δx2   = α (δx1 − δx2 ) · d = 0, � soddisfa la (5.15): il vincolo è liscio. Tale risultato è estendibile anche a sistemi cioè R di N > 2 punti, a due a due vincolati dal vincolo di rigidità. 160 LEZIONI DI SISTEMI DINAMICI 5.3 Le equazioni di Lagrange Consideriamo il solito sistema di N punti materiali vincolato4, le cui configurazioni siano descritte tramite un insieme di coordinate lagrangiane (q1 , ...., ql ). Come abbiamo già visto, il legame tra le coordinate cartesiane dei punti e le coordinate lagrangiane sarà espresso dalle relazioni xi = xi (q1 , . . . , ql , t) , (5.26) i = 1, 2, ...., N , nelle quali, come sappiamo, il tempo potrà comparire esplicitamente quando i vincoli sono mobili. Teorema 5.3.1 Per ogni j = 1, 2, ...., l vale la seguente relazione   m1 ẍ1 � � ∂T d ∂T   .. �j = − ,  •u . dt ∂ q̇j ∂qj mN ẍN (5.27) essendo T l’energia cinetica del sistema di N punti materiali data dalla (4.33). Dim. Partendo dalla (4.33) abbiamo N � ∂ ẋi ∂T = mi ẋi · . ∂ q̇j ∂ q̇j i=1 Dalla (4.31) ricaviamo come ∂xi ∂ ẋi = , e quindi riscriviamo la precedente uguaglianza ∂ q̇j ∂q j N � ∂xi ∂T = mi ẋi · . ∂ q̇j ∂q j i=1 (5.28) Se deriviamo adesso la (5.28) rispetto al tempo si ottiene d dt � ∂T ∂ q̇j � N � N ∂xi � d = mi ẍi · mi ẋi · + ∂q dt j i=1 i=1 � ∂xi ∂q j � . Chiaramente il primo addendo è il termine di sinistra nella (5.27)   ∂x1    ∂qj  m1 ẍ1 N   � ∂xi   .   . .. = mi ẍi ·  •  ..  ,   ∂q j i=1  ∂xN  mN ẍN ∂qj � �� j u mentre, per quel che riguarda il secondo addendo, possiamo ricorrere al fatto che nell’espressione di xi , in funzione delle coordinate lagrangiane, le variabili qj hanno un ruolo 4 Le considerazioni ovviamente valgono anche per un sistema libero, ovvero non soggetto a vincoli LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 161 di variabili indipendenti rispetto al tempo. E’ dunque possibile scambiare la derivata � � ∂xi ∂ ẋi 5 d = . rispetto a tempo con la derivata parziale rispetto a qj e ottenere dt ∂q j ∂qj Abbiamo quindi N � i=1 mi ẋi · d dt � ∂xi ∂q j � = N � i=1 = mi ẋi · ∂ ẋi ∂qj N � ∂ ẋ 2 ∂ mi i = ∂q ∂q j j i=1 � N � mi ẋ2i i=1 � = ∂T . (5.29) ∂qj Quindi, riunendo tutti i termini otteniamo   m1 ẍ1 � � d ∂T ∂T   .. �j + = , •u . dt ∂ q̇j ∂qj mN ẍN da cui la (5.27) discende banalmente. La (5.27) viene usualmente detta identità di Lagrange, mentre il secondo membro è generalmente noto con il nome di binomio di Lagrange. Torniamo adesso al sistema di l equazioni (5.25) ed applichiamo la (5.27). Otteniamo � � d ∂T ∂T � (� � •u �j − S � j = 0, j = 1, 2, ...., l . − + ∇V x) • u (5.30) dt ∂ q̇j ∂qj Ora, consideriamo l’energia potenziale come funzione delle variabili lagrangiane q1 , ..., ql , cioè V̂ (� q , t) = V (� x (� q , t)) = V (x1 (q1 , . . . , ql , t), ...., xN (q1 , . . . , ql , t)) , e deriviamo rispetto a qj . Troviamo   N � ∂V ∂xi  ∂ V̂ = · =  ∂qj ∂xi ∂qj  i=1 Introduciamo inoltre 5 Questo � � •u �j = Ξj = S ∂V ∂x1 .. . ∂V ∂xN �� ( ∇V x) N � i=1   ∂x 1 ∂q   j   .. • .      ∂x N ∂qj � � �� Si · j u     .   (5.31) � ∂xi , ∂qj passaggio è stato ampiamente illustrato nella dimostrazione del teorema 3.1.1. (5.32) 162 LEZIONI DI SISTEMI DINAMICI detta componente Lagrangiana della forza S. Possiamo dunque riscrivere il sistema (5.30) nella forma nota sotto il nome di equazioni di Lagrange di seconda specie o, più semplicemente, equazioni di Lagrange ∂ T − V̂ d ∂T − = Ξj , j = 1, 2, ...., l . (5.33) dt ∂ q̇j ∂qj La funzione energia potenziale V non dipende da q̇i , i = 1, ..., N . Si introduce quindi, come nella sezione 3.3, la funzione di Lagrange o Lagrangiana del sistema L(q1 , . . . , ql , q̇1 , . . . , q̇l , t) = T (q1 , . . . , ql , q̇1 , . . . , q̇l , t) − V̂ (q1 , . . . , ql , t) , (5.34) e si riscrivono le equazioni di Lagrange nella forma compatta d ∂L ∂L − = Ξj , j = 1, 2, ...., l , dt ∂ q̇j ∂qj (5.35) che, lo ricordiamo ancora, valgono nel caso in cui tutti i vincoli siano olonomi e lisci. Se poi le forze cui è sottoposto il sistema sono soltanto quelle vincolari, del tipo = 0, oppure se S •u j = 0, ∀ j = 1, ..., l, allora il (5.16), e conservative, cioè S sistema (5.35) si semplifica in ∂L d ∂L − = 0, j = 1, 2, ...., l . (5.36) dt ∂ q̇j ∂qj Nota 5.3.1 Rimarchiamo ancora che le equazioni di Lagrange (5.35) discendono dalla (5.25). Ma allora, riferendoci alla sezione 1.4, le l equazioni (5.35) possono essere lette come le componenti covarianti di F = ma, rispetto alla base locale. Nota 5.3.2 Ricordando la scomposizione (4.33) dell’energia cinetica T come T = T2 + T1 + T0 , osserviamo che la componente T1 = li=1 bi q̇i , è completamente ininfluente ai fini delle equazioni di moto se: (i) se tutti i bi = bi (q1 , ...ql ), i = 1, ..., l, non ∂b ∂bi , ∀ i, j = 1, ..., l. Nelle equazioni dipendono esplicitamente dal tempo; (ii) ∂qji = ∂q j ∂T d 1 1 − ∂T di moto il termine T1 dà luogo all’espressione dt ∂ q̇j ∂qj , che si annulla. Infatti d dt ∂T1 ∂ q̇j − ∂T1 ∂qj l dbj (q1 (t) , ...ql (t)) ∂bi − q̇i dt ∂qj i=1 l l ∂bj ∂bi q̇i − = q̇i = 0. ∂qi ∂q i=1 i=1 j = 5.3.1 Equazioni di Lagrange e statica del punto materiale sulla superficie Continuiamo con l’esempio di un solo punto materiale vincolato a muoversi una superficie fissa, riscrivendo la (5.3), nella quale teniamo conto della scomposizione (5.20), cioè mẍ = F cons + R + S . (5.37) −∇V LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 163 Se adesso proiettiamo la (5.37) nello spazio tangente, otteniamo due equazioni m ẍ · ui = −∇V · ui + R · ui + S · ui , i = 1, 2. (5.38) Se adesso la superficie è liscia, cioè vale la (5.8), sfruttando ∂T d ∂T m ẍ · ui = − , i = 1, 2, dt ∂ q̇i ∂qi e ∇V · ui = abbiamo ∂ V̂ , ∂qi d dt i = 1, 2, con V̂ (q1 , q2 ) = V (x (q1 , q2 )) , ∂L ∂ q̇i − ∂L = Ξi , ∂qi (5.39) i = 1, 2. dove Ξi = S · ui , i = 1, 2, e dove L = L (q1 , q2 , q̇1 , q̇2 ) = T (q1 , q2 , q̇1 , q̇2 ) − V̂ (q1 , q2 ) . Le due equazioni (5.39) rappresentano quindi le equazioni di moto (5.35) per un punto materiale vincolato su una superficie regolare liscia. Nota 5.3.3 Notiamo che nelle due equazioni di moto (5.39) intervengono le componenti di R e di S rispetto alla base {u1 , u2 } dello spazio tangente. L’equazione (5.37) può essere infatti scomposta nella parte ortogonale al piano tangente ed in quella che giace sul piano tangente −mẍ� + (F cons )� + R� + S � + [−mẍ⊥ + (F cons )⊥ + R⊥ + S ⊥ ] = 0, dove, ẍ = ẍ� + ẍ⊥ , con ẍ� ∈ Π (P ) e ẍ⊥ ∈ N (P ). Perciò moltiplicando scalarmente la (5.37) per ui , i = 1, 2, si isola la parte [· · · ] e si ottengono, sotto l’ipotesi (5.8), le equazioni di moto (5.39). Questa è una notevole semplificazione dal momento che si “elimina” tutta la parte [· · · ]⊥ . Rimane quindi da analizzare la parte [· · · ]⊥ . Per far ciò, assumendo R⊥ = λ∇f , è sufficiente moltiplicare scalarmente la (5.37) per ∇f (−mẍ + F cons + λ∇f + S) · ∇f = 0, (5.40) da cui discende la (5.10). La (5.40) è, come illustrato nella sezione 5.1, il punto di partenza per la determinazione di λ, ossia di R. Le equazioni (5.38) possono essere anche raggruppate in un’unica equazione 2 i=1 (−m ẍ − ∇V + R + S) · ui = 0, da cui discende l’equazione simbolica della dinamica ( −m ẍ forza inerzia − ∇V forza conservativa + R reazione vincolare + S altre forze ) · δx = 0, (5.41) 164 LEZIONI DI SISTEMI DINAMICI nel momento in cui si considera il generico spostamento virtuale (4.51). Analizziamo adesso la statica del punto materiale. Se, ∀ t > 0, ẍ ≡ ẋ ≡ 0, la (5.37) diventa F cons + R + S = 0, (5.42) � �� −∇V e le (5.38) si riducono a   (−∇V + R + S) · u1 = 0,  (5.43) (−∇V + R + S) · u2 = 0, che, assumendo al solito la superficie priva di attrito, si traducono in  ∂ V̂    − + S · u1 = 0,   ∂q1    ∂ V̂   − + S · u2 = 0. ∂q2 (5.44) Quindi, data S, le soluzioni (q̄1 , q̄2 ), ammesso che esistano6 , del sistema (5.44) rappresentano le configurazioni di equilibrio del punto materiale sulla superficie. La (5.44) può anche essere utilizzata come formula per determinare la forza S che deve essere applicata al punto materiale affinché esso sia in equilibrio in (q̄1 , q̄2 ). In tal caso le incognite sono le due componenti di S nel piano tangente, cioè u2 u1 S = S1 κ1 + S2 κ2 , dove, al solito, κ1 = , κ2 = . |u1 | |u2 | Siccome κi · ui = ui · ui = |ui |, i = 1, 2, la (5.44) equivale al seguente sistema |ui |  ∂ V̂    − + S1 |u1 | = 0,   ∂q1 (5.45)    ∂ V̂   − + S2 |u2 | = 0. ∂q2 Si noti che in presenza di sole forze conservative, ovvero nel caso in cui S = 0, le posizioni di equilibrio sono date dalle soluzioni di ∂ V̂ ∂ V̂ = 0, e = 0, ∂q1 ∂q2 che quindi corrispondono ai punto di estremo locale dell’energia potenziale. Le configurazioni stabili corrisponderanno ai minimi isolati dell’energia potenziale (criterio di Dirichlet), come proveremo nella sezione 5.9.1. Sempre assumendo la superficie liscia, dalla (5.42), si ricava R = −S − F cons . �� λ∇f 6 In generale, il sistema (5.44) può avere più di una soluzione, ma anche non averne. (5.46) LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 165 Moltiplicando scalarmente la (5.46) per ∇f otteniamo λ=− (F cons + S) · ∇f |∇f | 2 che, nel caso in cui S = 0, si semplifica in λ = − , F cons · ∇f |∇f | 2 . Esempio 5.3.1 Consideriamo il moto di un punto materiale di massa m su una sfera liscia di raggio R, soggetto alla sola forza peso. La sfera è definita implicitamente da f (x, y, z) = x2 + y 2 + z 2 − R2 = 0. Escludendo i poli7 , può essere così parametrizzata   x = R sin θ cos φ, y = R sin θ sin φ,  z = R cos θ, dove i parametri sono la colatitudine θ ∈ (0, π), e la longitudine φ ∈ (0, 2π], come mostrato nella figura 5.1. I vettori tangenti sono uθ = R cos θ cos φex + R cos θ sin φey − R sin θez , uφ = −R sin θ sin φex + R sin θ cos φey . Si verifica facilmente che |uθ ∧ uφ | = R4 sin2 θ. Quindi la parametrizzazione è regolare ovunque eccetto ai poli. Calcolando la matrice A data dalla (4.52) si ha � � � 2 � R 0 E F = F G 0 R2 sin2 θ e pertanto, sfruttando la (4.56), l’energia cinetica del punto materiale è � �� R2 m� mR2 � 2 0 θ̇ θ̇ + φ̇2 sin2 θ . T = = θ̇ φ̇ 2 2 0 R sin θ φ̇ 2 2 La forza peso è F peso = −mgez , la cui energia potenziale è V (z) = mgz, e quindi V̂ (θ, φ) = mgR cos θ. La funzione di Lagrange è � m � L = T − V̂ = R2 θ̇2 + φ̇2 sin2 θ − mgR cos θ 2 e le equazioni del moto sono � � 2 � � · d ∂L g ∂L = 0, ⇒ θ̈ − φ sin θ cos θ + sin θ = 0, (5.47) − dt ∂ θ̇ ∂θ R � � � � d ∂L d ∂L = 0, ⇒ mR2 φ̇ sin2 θ = 0. (5.48) − dt ∂ φ̇ ∂φ dt 7 Una rappresentazione regolare della sfera necessita di due parametrizzazioni come quelle fornite dalla cosiddetta proiezione stereografica. 166 LEZIONI DI SISTEMI DINAMICI Figura 5.1: Sfera di raggio R. Se vogliamo, la (5.48) è ovvia dal momento che la φ è coordinata ciclica. Abbiamo quindi ∂L (5.49) = mR2 φ̇ sin2 θ = Ao , ∂ φ̇ dove Ao è una costante indipendente dal tempo. Dalla (5.49) ricaviamo subito che se φ̇ = 0, allora Ao = 0, e la (5.47) si riduce all’equazione del pendolo di lunghezza R, g θ̈ − sin θ = 0. R Ao Utilizzando la (5.49) per esprimere φ̇ = , e sostituirlo nella (5.47) 2 mR sin2 θ otteniamo 2 cos θ g Ao + sin θ, θ̈ = 3 2 mR sin θ R che possiamo anche scrivere come θ̈ = − dVeff (θ) 1 , con Veff (θ) = dθ 2 Ao mR2 2 g 1 + cos θ, 2 sin θ R (5.50) energia potenziale efficace. Il grafico di Veff (θ) per θ ∈ (0, π) è riportato in figura 5.2, e mostra due asintoti verticali ed un minimo in corrispondenza di θ̄, soluzione 2 Ao cos θ̄ g di + sin θ̄ = 0. Se θ (t) = θ̄, la particella percorre un’orbita 3 2 mR R sin θ̄ circolare che risulta stabile (in quanto θ̄ è minimo di Veff ) In particolare, moltiplicando LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 167 la (5.50) per θ̇, è facile ottenere d dt θ̇2 + Veff (θ) 2 = 0, ⇒ θ̇ = ± 2 (E − Veff (θ)), (5.51) con E costante corrispondente all’energia meccanica. Figura 5.2: Energia potenziale Veff (θ). Dall’analisi qualitativa si deduce che θ (t) è periodica e, fissato il livello energetico E, il moto si svolge fra θm e θM . Il periodo di oscillazione è T =2 θM θm du . 2 (E − Veff (u)) Il moto complessivo non è necessariamente periodico. Ponendo φ = φ (θ), si ha 168 φ̇ = LEZIONI DI SISTEMI DINAMICI dφ θ̇, da cui dθ dφ φ̇ = dθ θ̇ Ao 1 � . mR2 sin2 θ 2 (E − Veff (θ)) = (5.51) Il moto sarà effettivamente periodico se, durante l’oscillazione compiuta fra θm e θM (andata e ritorno) la coordinata angolare φ ha subito una variazione pari ad un frazione di π, ovvero 2 (φ (θM ) − φ (θm )) = � �� 2 θM dφ dθ dθ θm ∆φ = � 2Ao mR2 � θM θm 1 dθ r � = 2π, 2 s sin θ 2 (E − Veff (θ)) con r, s ∈ N. Se è così allora, dopo s oscillazioni la traiettoria si chiude dal momento che l’angolo ∆φ “spazzato” è 2πr. Lasciamo infine come esercizio la dimostrazione che Ao è, a parte il segno, la componente lungo l’asse z del momento angolare della particella calcolato rispetto ad O. Esempio 5.3.2 Consideriamo il moto di un punto materiale su un cono liscio soggetto z2 alla sola forza peso. L’equazione implicita del cono è x2 + y 2 = 2 . Il cono quindi c è regolare ovunque, eccetto che nell’origine. Possiamo esprimere la superficie nella seguente forma parametrica (si considera solo z > 0)   x = r cos φ, y = r sin φ, φ ∈ (0, 2π] , r ∈ (0, +∞) .  z = cr, I vettori che costituiscono la base del piano tangente sono ur = cos φex + sin φey + cez , uφ = −r sin φex + r cos φey . L’energia cinetica del punto è m� T = ṙ 2 φ̇ � � 1 + c2 0 0 r2 �� ṙ φ̇ � = � � m �� 1 + c2 ṙ2 + r2 φ̇2 . 2 L’unica forza “attiva” - cioè non dovuta al vincolo - che agisce sulla particella è il peso la cui energia potenziale è V (x, y, z) = mgz, per cui V̂ (r, φ) = mgcr. La funzione Lagrangiana è dunque � � m �� 1 + c2 ṙ2 + r2 φ̇2 − mgcr. L = T − V̂ = 2 LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 169 Scriviamo adesso le equazioni del moto tenendo costo del fatto che φ è coordinata ciclica, cioè ∂L ∂φ = 0, ∂L = Ao = costante, ∂ φ̇ mr 2 φ̇ d dt ∂L ∂ ṙ − ∂L = 0, ∂r ⇒ che possiamo anche scrivere così r̈ = 1 + c2 r̈ − rφ̇2 + gc = 0, 2a dVeff (r) −b=− r3 dr dove Veff (r) = a + br. r2 2 1 gc Ao , b = . Il grafico di Veff (r), riportato in figura con 2a = m 1 + c2 1 + c2 5.3, evidenzia la presenza di un minimo che corrisponde ad un orbita circolare stabile. In generale il moto è periodico e si può trovare un’espressione del periodo T corrispondente al livello energetico E. Figura 5.3: Energia potenziale Veff (r) nel caso di una particella, soggetta soltanto alla forza peso, vincolata su un cono. 170 LEZIONI DI SISTEMI DINAMICI Esempio 5.3.3 E’ dato un punto materiale, soggetto alla sola forza peso, posto su un cilindro liscio il cui asse è orizzontale. Si vuol determinare: 1. le equazioni di moto; 2. la reazione vincolare in condizioni dinamiche; 3. la forza S che deve essere applicata al punto materiale affinché la configurazione (xo , θo ) sia posizione di equilibrio. Si vuole calcolare anche la corrispondente reazione vincolare. 1. La forma implicita dell’equazione del cilindro è f (x, y, z) = y 2 + z 2 − R2 = 0, dove R è il raggio. Una parametrizzazione della superficie è dunque la seguente   x ∈ R, y = R cos θ, con − π < θ ≤ π.  z = R sin θ, Figura 5.4: Cilindro orizzontale di raggio R. Abbiamo poi ux = e1 , uθ = −R sin θe2 + R cos θe3 . (5.52) L’energia cinetica della particella è T = � m� 2 ẋ + R2 θ̇2 , 2 mentre l’energia potenziale relativa alla forza peso è V̂ = mgR sin θ. La Lagrangiana è � m� 2 L= ẋ + R2 θ̇2 − mgR sin θ, 2 LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 171 da cui si nota immediatamente che la x è ciclica, cioè � � d ∂L ∂L = 0, ⇒ = 0, ⇒ ẋ = cost. . ∂x dt ∂ ẋ Per quanto riguarda l’equazione per θ, abbiamo � � d ∂L g ∂L = 0, ⇒ θ̈ = − cos θ, − dt ∂ θ̇ ∂θ R la cui interpretazione fisica è immediata: la particella trasla con velocità longitudinale costante e contemporaneamente oscilla come un pendolo di lunghezza R. In particoπ lare, se ẋ = 0, la posizione θ = − , che corrisponde al punto materiale nella parte 2 bassa del cilindro, è posizione di equilibrio stabile. 2. Si parte dalla formula (5.13). Siccome � � 2 ∇f = 2yey + 2zez , | ∇f | = 4 y 2 + z 2 = 4R2 , abbiamo ∇f · F = (2yey + 2zez ) · (−mgez ) = −2zmg = −2mgR sin θ, mentre la matrice (5.12) è data da   0 0 0 H( f ) =  0 2 0  0 0 2 Dobbiamo quindi esprimere ẋ rispetto alla base ortonormale {e1 , e2 , e3 }, ẋ = ẋux + θ̇uθ = = ẋex + θ̇ (−R sin θey + R cos θez ) . (5.52) Quindi mẋ · H ( f ) ẋ = 2mR2 θ̇2 , mRθ̇2 − mg sin θ ,e 2R � � R = −λ∇f = − mRθ̇2 − mg sin θ (cos θey + sin θez ) . da cui λ = − 3. L’incognita adesso è S, o meglio, le componenti di S sul piano tangente S = Sx κx + Sθ κθ , con κx = uθ ux uθ = ex , κ θ = = . |ux | |uθ | R Dalla (5.45) abbiamo  ∂ V̂     − ∂x + Sx = 0     − ∂ V̂ + S R = 0 θ ∂θ ⇒   Sx = 0  Sθ = mg cos θo (5.53) 172 LEZIONI DI SISTEMI DINAMICI Volendo esprimere S rispetto alla base cartesiana {ex , ey , ez } si ha S = mg cos θo uθ R = mg cos θo (− sin θo ey + cos θo ez ) . (5.52) π Notiamo che S si annulla se θo = ± . Per quanto riguarda la reazione vincolare R, 2 F cons · ∇f sfruttando λ = − , abbiamo |∇f |2 λ= mg sin θ , ⇒ R = mg sin θ (cos θey + sin θez ) 2R che coincide con la (5.53) in caso θ̇ = 0. 5.3.2 Equazioni di Lagrange di prima specie Riprendiamo quanto visto nell’osservazione 4.1.3 della sezione 4.1, supponendo che il sistema meccanico con l gradi di libertà sia soggetto all’ulteriore vincolo olonomo (4.11), che per brevità indicheremo anche con Φ (� q ) = 0. Evidentemente, come già osservato, si può procedere come nella sezione 4.1 e sfruttare l’equazione vincolare per ridurre i gradi di libertà passando così da l ad (l − 1). Tuttavia si può evitare tale strada (che, in taluni casi, può essere estremamente complicata), tenendo conto del vincolo in un altro modo. Assumendo che il nuovo vincolo sia liscio, consideriamo le forze vincolari agenti sui punti materiali. Queste, riprendendo la notazione della (5.14), verranno così indicate �T = R � +R � nv , R � ∈ R3N è dato dalla (5.14) e rappresenta le forze (o meglio le rezioni) vincolari dove R dovute agli m vincoli olonomi (4.4), mentre   R1, nv  .. � nv =  R  , . RN, nv rappresenta le forze vincolari dovute al nuovo vincolo Φ (� q ) = 0. Siccome tutti i vin� T deve appartenere al coli sono lisci, applicando la definizione 5.2.1, deduciamo che R 3N � � � � sottospazio di R la cui base è { ∇f1 , ∇f2 , ..., ∇fm , ∇fm+1 }. Pertanto, ricordando la (5.16), scriveremo m � �T = � m+1 . � k + λ∇f R λk ∇f k=1 La (5.23) diventa quindi   � �m m1 ẍ1 �   � .. � m+1 = 0. � k + λ∇f �− λk ∇f x) − S   + ∇V (� . mN ẍN � k=1 �� T R � (5.54) LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 173 k , k = 1, ..., l, e applichiamo la Se adesso moltiplichiamo scalarmente la (5.54) per u (5.27), la (5.31), la (5.32) e la (4.23) otteniamo l equazioni del tipo d ∂T ∂T ∂ V m+1 • u k = 0. − + − Ξk − λ∇f (5.55) dt ∂ q̇k ∂qk ∂qk In particolare, ricordando sia la definizione (5.34) sia l’espressione (4.11) del nuovo vincolo, che consente di scrivere N ∂fm+1 ∂xi ∂Φ m+1 • u k , = · = ∇f ∂qk ∂x ∂q i k i=1 abbiamo che il sistema (5.55) può essere posto nella seguente forma ∂L d ∂L ∂Φ − = Ξk + λ , k = 1, ..., l . dt ∂ q̇k ∂qk ∂qk (5.56) anche dette equazioni di Lagrange di prima specie. La (5.56) è un sistema di l equazioni differenziali a cui va aggiunta l’equazione del vincolo Φ ( q ) = 0, nelle (l + 1) incognite q1 (t), ..., ql (t) e λ (t). k , avremmo potuto Osserviamo che anziché moltiplicare scalarmente la (5.54) per u l s , e poi selezionare, di moltiplicarla per la generica combinazione lineare s=1 δqs u s ai singoli vettori u k, volta in volta, i coefficienti δqs in modo da ridurre ls=1 δqs u l s è, come rimarcato k = 1, ..., l. La peculiarità della combinazione lineare s=1 δqs u nella nota 4.1.5, che questa non rappresenta uno spostamento virtuale del sistema l soggetto agli (m + 1) vincoli. Pertanto • R u δq , s s T non si annulla, ma s=1 genera il contributo l l l ∂Φ nv = λ m+1 = λ s • R s • ∇f δqs u δqs u δqs . ∂qs s=1 s=1 s=1 La procedura illustrata si estende facilmente anche al caso in cui si abbiamo n > 1 vincoli olonomi lisci supplementari del tipo (4.11), ed anche al caso in questi dipendano dal tempo, cioè Φj (q1 , ...., ql , t) = 0, j = 1, ..., n. (5.57) In tal caso il sistema di equazioni di Lagrange di prima specie diventa n d ∂L ∂Φj ∂L − = Ξk + λj , k = 1, ..., l , dt ∂ q̇k ∂qk ∂qk j=1 (5.58) ovvero un sistema di l equazioni differenziali accoppiato con le n equazioni vincolari (5.57). Abbiamo così un sistema di (l + n) equazioni nelle (l + n) incognite q1 (t), ..., ql (t) e λ1 (t), ... , λn (t). Rimandiamo alla sezione 8.4.1 per l’illustrazione di un esempio di applicazione delle equazioni di Lagrange di prima specie. n ∂Φ Si conclude con un’osservazione sul significato dei termini j=1 λj ∂qkj che appaiono nella (5.58). In tal senso proprio la forma della (5.58) è illuminante: i termini n ∂Φj j=1 λj ∂qk si assimilano, seguendo la definizione (5.32), alle componenti Lagran nv dovuta all’ulteriore vincolo. giane della forza R 174 LEZIONI DI SISTEMI DINAMICI 5.4 Risolubilità delle equazioni di Lagrange Abbiamo annunciato che le equazioni di Lagrange, che sono equivalenti all’equazione simbolica della dinamica, sono sufficienti per determinare la dinamica di un sistema meccanico8. Questo significa che possiamo determinare, almeno per un tempo “piccolo” in accordo con la teoria delle equazioni differenziali, le quantità qj (t), j = 1, ...., l, una volta assegnate delle condizioni iniziali qj (t0 ) e q̇j (t0 ), j = 1, ...., l . Osserviamo per prima cosa che le (5.35) sono un sistema di equazioni differenziali ordinarie del secondo ordine, in quanto le derivate di ordine massimo che � compaiono � d ∂L quando si sviluppa la derivata totale rispetto al tempo nel termine sono dt ∂ q̇k 9 derivate seconde. Per la forma di T (vedi la (4.33)), abbiamo � � � � d ∂L d ∂T = dt ∂ q̇k dt ∂ q̇k � l � d � = ahk (q1 (t), . . . , ql (t), t)q̇k + bk (q1 (t), . . . , ql (t), t) . dt h=1 Eseguendo quindi la derivazione rispetto al tempo compaiono le derivate seconde l � ahk (q1 (t), . . . , ql (t), t)q̈h , h=1 e il sistema di equazioni di Lagrange ha dunque la forma l � ahk q̈h = Gk (q1 (t), . . . , ql (t), q̇1 (t), . . . , q̇l (t), t) , k = 1, ..., l, (5.59) h=1 che, in forma matriciale compatta, si scriverà     � G1 (� a11 · · · a1l q (t) , q̇(t), t) q̈1  .. ..   ..  =  ..   . .  .  . � q̈l al1 · · · all q (t) , q̇(t), t) Gl (� � �� A q̈ ( G q (t), q̇(t),t)   . � Ricordando il teorema 4.1.3, che la matrice A è definita positiva e quindi invertibile. Possiamo pertanto risolvere algebricamente le (5.59) rispetto alle derivate seconde q̈h , h = 1, ..., l, ottenendo un sistema di equazioni differenziali ordinarie in forma normale corredate con dati iniziali  � = A−1 G � (� � q̈ q (t) , q̇(t), t),      � 0 ) = q̇ �0 , (5.60) q̇(t      �0 . � (t0 ) = q q 8 Purché soggetto a vincoli lisci. consiglia di non procedere oltre se non si ha chiara questa prima derivazione rispetto a q̇k . Si noti in particolare che il fattore 21 scompare per la simmetria della matrice ahk . 9 Si LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 175 Il problema (5.60) è un tipico problema di Cauchy al quale possiamo applicare la teoria � godono delle opporsviluppata nella sezione 2.3, e così affermare che, se le funzioni G tune regolarità, per ogni insieme di dati iniziali q1 (t0 ), . . . , ql (t0 ), q̇1 (t0 ), . . . , q̇l (t0 ), esiste un’unica soluzione (locale) del sistema. 5.5 Invarianza delle equazioni di Lagrange Supponiamo che (q1 , ... , ql ) siano le l coordinate lagrangiane utilizzate per descrivere il sistema di N punti materiali soggetto a m vincoli lisci. Sia L (q1 , ... , ql , q̇1 , ... , q̇l , t) la relativa funzione di Lagrange. Supponiamo adesso di individuare altri l parametri lagrangiani (η1 , ... , ηl ), legati alle (q1 , ... , ql ) tramite la trasformazione qi = qi (η1 , ... , ηl ) , i = 1, 2, ..., l, (5.61) ηj = ηj (q1 , ... , ql ) , j = 1, 2, ..., l, (5.62) e tale che det J�=0, dove      J=     ∂q1 ∂η1 ∂q1 ∂η2 .. . ∂q1 ∂ηl ∂q2 ∂η1 ∂q2 ∂η2 .. . ∂q2 ∂ηl ... ... ... ∂ql ∂η1 ∂ql ∂η2 .. . ∂ql ∂ηl      .     Le coordinate xi dell’i-esimo punto sono date da10 xi = xi (� q , t), oppure xi = xi (� η , t), dove xi (� η , t) = xi (� q (� η ) , t) , e viceversa. Avremo poi q̇i = l � ∂qi η̇κ , ∂ηk i = 1, ...., l, (5.63) i = 1, ...., l, (5.64) k=1 η̇i = l � ∂ηi q̇κ , ∂qk k=1 · · · = (η1 , η2 , ....., ηl ), e = (q1 , q2 , ...., ql ) e q = q 1 , ...., q l , poniamo adesso η che q · · · ( = η1 , ....., η l . Inoltre con q η ) intendiamo q ( η ) = (q1 (η1 , ... , ηl ) , ... , ql (η1 , ... , ηl )). η 10 Ricordando 176 LEZIONI DI SISTEMI DINAMICI e l � ∂xi · q ∂qs s s=1 = l l � ∂xi � ∂qs · η ∂qs ∂ηk κ s=1 k=1 = l � k=1 = l � k=1 � l � s=1 ∂xi ∂qs ∂qs ∂ηk � · ηκ ∂xi · η , ∂ηk k · per cui xi potrà essere espressa sia in termini delle coordinate q che in termini delle η,  �l ∂xi ∂xi   , q̇s +   s=1 ∂qs ∂t ẋi =  �l  ∂xi ∂xi   , η̇k + k=1 ∂ηk ∂t Notiamo poi che dalla (5.63) discende11 l � ∂qi ∂ η̇κ ∂ q̇i ∂qi = = . ∂ η̇j ∂ηk ∂ η̇j ∂ηj k=1 � �� (5.65) δkj La funzione di Lagrange nelle variabili η si ottiene a partire dalla L, ovvero12     l l � � � �   ∂q1 ∂ql � , t = L q  � � , η̇ (� η ) , L η η̇ , ... , η̇ , t κ κ .  ∂ηk ∂ηk   k=1 k=1 � �� q̇1 (5.66) q̇l Dimostriamo adesso che L, data dalla (5.66), soddisfa le equazioni di Lagrange � � d ∂L ∂L − = 0, i = 1, 2, ... , l, (5.67) dt ∂ η̇i ∂ηi se L soddisfa le (5.36), Si comincia col valutare l � ∂L = ∂ηk i=1 11 Si ricorda ancora che δkj = � ∂L ∂qi ∂L ∂ q̇i + ∂qi ∂ηk ∂ q̇i ∂ηk   1 se k = j � ,  0 se k �= j che questo ci dice che le funzioni L e L sono funzionalmente diverse: l’uguaglianza L = L deve essere intesa come uguaglianza dei valori delle due funzioni quando sono calcolate rispettivamente nelle coordinate che rappresentano lo stesso stato cinematico. 12 Si noti LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 177 e poi l � ∂L ∂ q̇i ∂L = ∂ η̇k ∂ q̇i ∂ η̇k i=1 l � ∂L ∂qi . (5.65) ∂ q̇i ∂ηk i=1 = Abbiamo quindi d dt � ∂L ∂ η̇k � = � � � �� l � � ∂L d ∂qi d ∂L ∂qi + dt ∂ q̇i ∂ηk ∂ q̇i dt ∂ηk i=1 � � � l � � ∂L ∂ q̇i d ∂L ∂qi , + = dt ∂ q̇i ∂ηk ∂ q̇i ∂ηk i=1 da cui si ricava facilmente la tesi. Infatti d dt � ∂L ∂ η̇k � − � � � � l � ∂qi d ∂L ∂L ∂L − = = 0, ∂ηk ∂ηk dt ∂ q̇i ∂qi i=1 � �� k = 1, 2, ..., l. =0 Non solo, ma abbiamo ottenuto anche           ∂q1 ∂η1 ∂q1 ∂η2 .. . ∂q1 ∂ηl ∂q2 ∂η1 ∂q2 ∂η2 .. . ∂q2 ∂ηl ... ... ... ∂ql ∂η1 ∂ql ∂η2 .. . ∂ql ∂ηl            � � d ∂L − dt � ∂ q̇1 � d ∂L − dt ∂ q̇2 .. � .� d ∂L − dt ∂ q̇l ∂L ∂q1 ∂L ∂q2             =       ∂L   ∂ql � � d ∂L − dt � ∂ η̇1 � d ∂L − dt ∂ η̇2 .. � .� d ∂L − dt ∂ η̇l ∂L ∂η1 ∂L ∂η2       .    ∂L  ∂ηl Per cui se uno dei due vettori colonna è nullo lo è anche l’altro dal momento che det J �= 0. Vale dunque il seguente Teorema 5.5.1 Le soluzioni di (5.67) si ottengono dalle soluzioni di (5.36) tramite le trasformazioni (5.62), (5.64). Questo risultato è, in un certo qual senso, ovvio: il moto è lo stesso, indipendentemente dal sistema di coordinate scelto. Di più, tutto il formalismo lagrangiano è stato, fin dall’inizio, concepito per scrivere le equazioni di moto con la stessa ricetta in qualsiasi sistema di coordinate. Quindi tale teorema è, se vogliamo, una verifica a posteriori della correttezza del formalismo stesso. Tuttavia questa invarianza “analitica” è importante quando si voglia introdurre un nuovo sistema di coordinate a partire da un preesistente sistema, senza “ritornare” al sistema meccanico, cioè senza tornare a ricalcolare la funzione di Lagrange dalla sua definizione meccanica. Questo risultato si enuncia anche dicendo che le equazioni di Lagrange sono invarianti per cambiamento di coordinate. 178 LEZIONI DI SISTEMI DINAMICI 5.6 Coordinate cicliche In questa sezione vogliamo generalizzare al caso di N punti materiali i concetti già introdotti nel paragrafo 3.3.1. Come già visto, sappiamo che in certi casi una delle coordinate lagrangiane, diciamo qi , non compaia esplicitamente nella funzione di Lagrange L (ma la q̇i deve comparire), cioè ∂L = 0. ∂qi (5.68) Se ciò accade, ricordando la (5.35), si ha d ∂L = 0, dt ∂ q̇j ≡ 0). Quindi, se Ξj ≡ 0, per ogni j = 1, 2, ...., l (il che avviene, per esempio, se S riprendendo la definizione 3.3.1 del capitolo 3, diremo che la coordinata qi è ciclica, se ≡ 0, abbiamo (5.68) è verificata. Ricordando la proposizione 3.3.2 ed assumendo S ∂L che la funzione · è una costante del moto13 (o integrale primo), ∂ qi ∂L = costante , ∂ q̇i dove “costante” significa costante rispetto al tempo. In accordo con la definizione 3.3.2 ∂L (ovvero con la definizione 9.0.1), è detta momento coniugato alla variabile qi . ∂ q̇i Il punto che adesso vogliamo approfondire è una procedura, definita nell’ambito generale di sistemi con l gradi di libertà, che consenta di sfruttare efficacemente le variabili cicliche al fine di semplificare le equazioni di Lagrange (5.36). Ovviamente la strada è già stata tracciata nelle sezione 3.3.1. Adesso vogliamo generalizzarla supponendo che esistano 0 < ν ≤ l, variabili cicliche. Assumiamo quindi che: • qα , α = 1, ...., ν, siano variabili cicliche. Ciò implica che L non dipende esplicitamente dalle qα , cioè L = L (q̇1 , ..., q̇l , qν+1 , ...., ql , t) . • qi , i = ν + 1, ....., l, siano non cicliche. Abbiamo quindi ν momenti coniugati pα = ∂L (q̇1 , ..., q̇l , qν+1 , ...., ql , t) , ∂ q̇α α = 1, ...., ν, (5.69) che sono costanti. Vale questa importante Proposizione 5.6.1 Le ν relazioni (5.69) possono essere invertite e da esse si possono ricavare le q̇α , α = 1, ...., ν, in funzione: 13 Stiamo assumendo di aver a che fare con un sistema di N punti materiali soggetto a vincoli olonomi ≡ 0). lisci e sottoposto all’azione di forze puramente conservative (per intenderci, S LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 179 • dei ν momenti coniugati pα , α = 1, ...., ν; • delle rimanenti l − ν, q̇i , cioè delle q̇i , i = ν + 1, ....., l; • di tutte le qi non cicliche, cioè di qi , i = ν + 1, ...., l; • del tempo t. Dim. Scriviamo le (5.69) in forma estesa    p1 = Φ1 (q̇1 , ..., q̇ν , q̇ν+1 , ..., q̇l , qν+1 , ...ql , t) ,   p2 = Φ2 (q̇1 , ..., q̇ν , q̇ν+1 , ..., q̇l , qν+1 , ...ql , t) , ..  .    pν = Φν (q̇1 , ..., q̇ν , q̇ν+1 , ..., q̇l , qν+1 , ...ql , t) , (5.70) ∂L , α = 1, ...., ν. Adesso guardiamo al sistema (5.70) come ad una ∂ q̇α relazione fra la ν-upla (p1 , ..., pν ) e la ν-upla (q̇1 , ..., q̇ν ). Evidentemente tale relazione sarà biunivoca, e quindi invertibile, se la relativa matrice jacobiana dove Φα =  ∂Φ 1  ∂ q̇1  . J=  ..  ∂Φ 1 ∂ q̇ν ··· ··· ∂Φν ∂ q̇1 .. . ∂Φν ∂ q̇ν    ,   è invertibile, ovvero se det J �= 0. Ora, ricordando l’espressione delle Φα , si ha   ∂2L ∂L ···  ∂ q̇ 2 ∂ q̇1 ∂ q̇ν  1     .. . .. J= , .   2  ∂2L ∂ L  ··· ∂ q̇ν ∂ q̇1 ∂ q̇ν2 da cui, data la (5.34) con T espressa dalla (4.33), ricaviamo   a11 · · · a1ν  ..  , J =  ... .  aν1 ··· aνν cioè J coincide con un minore di ordine ν della matrice dell’energia cinetica A, le cui componenti sono definite dalla (4.34). Ora il teorema 4.1.3 garantisce che det A �=0, e di conseguenza anche14 det J �= 0. 14 Ricordiamo che se con Aj denotiamo il minore di ordirne j di una matrice A, vale il seguente: Teorema. Sia A una matrice simmetrica di ordine n. La forma quadratica relativa alla matrice A è definita positiva se e solo se det Aj > 0, per ogni j ≤ n. 180 LEZIONI DI SISTEMI DINAMICI Applicando quindi tale proposizione, potremo scrivere q̇ α (p1 , ..., pν , q̇ν+1 , ..., q̇l , qν+1 , ...ql , t) , q̇α = α = 1, ...., ν, (5.71) e, ricordando la definizione (3.34) della sezione 3.3.1, introdurre la funzione di Routh15 R = L − ν α=1 pα q̇ α , (5.72) dove, in analogia con la sezione 3.3.1, L denota la funzione di Lagrange L, in cui, al posto delle ν variabili q̇α , α = 1, ...., ν, sono state sostituite le espressioni (5.71) q̇ (p1 , ., pν , q̇ν+1 , ., q̇l , qν+1 , ., ql , t) L q̇ 1 (p1 , ., pν , q̇ν+1 , ., q̇l , qν+1 , ., ql , t) , ., ν q̇α viste come funzioni delle rimanenti q̇, delle p e di tutte le q non cicliche q̇ν+1 , ....., q̇l , qν+1 , ....., ql , t . rimanenti q̇ (5.73) tutte le q non cicliche Di conseguenza R = R (p1 , ..., pν , q̇ν+1 , .., q̇l , qν+1 , ...ql , t) . (5.74) Lo ricordiamo ancora, p1 , ..., pν , sono costanti il cui valore è stabilito dalle condizioni iniziali. In particolare abbiamo che le equazioni per le l − ν, coordinate non cicliche sono d dt ∂R ∂ q̇i − ∂R = 0, ∂qi i = ν + 1, ...., l . (5.75) Infatti, come già provato nella proposizione 3.3.3, considerando i > ν, abbiamo ν ν ∂ L ∂ q̇ q̇α ∂ L̂ ∂ L ∂ ∂ L pα α + = + · = , ∂ q̇i α=1 ∂ ∂ q̇i ∂ q̇i q̇α ∂ q̇i ∂ q i α=1 pα ν ν ν ∂ L̂ ∂ L ∂ q̇α q̇ ∂ L ∂ ∂ L = + = pα α + , ∂qi α=1 α=1 ∂ ∂ q̇i α=1 ∂qi ∂qi q̇α ∂qi pα 15 Osserviamo Routh, ovvero che se qα è ciclica per la Lagrangiana, cioè ∂R ∂qα ∂L ∂qα = 0, cioè R non dipende esplicitamente da qα . = 0, è ciclica anche per la funzione di LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 181 e quindi16 d dt ∂ L̂ · ∂ qi ∂ L̂ − ∂qi ν = pα α=1 = d dt = d dt ∂ q̇ α · ∂ qi ∂ q̇ α + − ∂qi ∂ L̂ ∂ L̂ − ∂ q̇i ∂qi =0 ν ∂ q̇α ∂ q̇ − pα pα α ∂ q̇ ∂q i i α=1 α=1 ν ν ∂ ∂ d − pα pα q̇ α q̇ α . dt ∂ q̇i α=1 ∂qi α=1 d dt ν Pertanto, per ogni i = ν + 1, ...., l, cioè per ogni coordinata non ciclica, possiamo scrivere ν ν d ∂ ∂ L̂ − − L̂ − pα q̇ α pα q̇ α = 0, dt ∂ q̇i ∂qi α=1 α=1 cioè le (5.75). Si può provare, seguendo essenzialmente lo stesso procedimento illustrato nella sezione 5.4, che il sistema di l − ν equazioni differenziali (5.75) ammette (almeno localmente) un’unica soluzione. Possiamo quindi, almeno in linea di principio, risolverlo e determinare le qi non cicliche, cioè qi = qi (t), i = ν + 1, ...., l. Rimane ancora da determinare l’evoluzione delle ν coordinate cicliche. Possiamo utilizzare le ν equazioni (5.71) che costituiscono un sistema del prim’ordine in forma normale per le ν variabili qα . Non solo, ma siccome la parte di destra della (5.71) non dipende dalle coordinate cicliche qα , α = 1, ..., ν, possiamo integrarla e così, per ogni α = 1, ..., l, ottenere qα (t) = qα (0) + 0 t q̇ α (p1 , ..., pν , q̇ν+1 (τ ) , .., q̇l (τ ) , qν+1 (τ ) , ...ql (τ ) , τ ) dτ. (5.76) E’ infine interessante notare che le funzioni q̇ α , α = 1, ...., ν, si possono derivare direttamente dalla funzione R. Infatti, tenendo conto delle (5.71) e (5.73), derivando la (5.72) rispetto a pα , abbiamo − ∂R ∂pα = q̇ α + = q̇ α + 16 Si ricordi che pα è costante, per cui ν pβ ν pβ β=1 β=1 dpα dt ∂ q̇ β ∂ L − ∂pα ∂pα ν ∂ q̇ β q̇ β ∂ L ∂ − = q̇ α . ∂pα ∂p α q̇ β=1 β pβ = 0, e ∂pα ∂qi = 0. 182 LEZIONI DI SISTEMI DINAMICI Quindi ∂R , q̇α = − ∂pα α = 1, ...., ν . (5.77) q̇α In definitiva, se il sistema presenta ν ≤ l, variabili cicliche, il problema della determinazione del moto diminuisce di complessità. Infatti, introducendo la funzione di Routh (5.72), abbiamo l − ν (anziché l) equazioni di tipo lagrangiano, cioè le (5.75), che governano l’evoluzione delle l − ν variabili non cicliche, mentre l’evoluzione delle ν variabili cicliche è data dalla (5.76), che, sfruttando la (5.77), può anche essere così riscritta t ∂R qα (t) = qα (0) − dτ , α = 1, ...., ν. ∂p α 0 5.7 La funzione Hamiltoniana e la conservazione dell’energia Proseguiamo nella generalizzazione dei risultati della sezione 3.3.1 considerando un sistema caratterizzato da l parametri lagrangiani. Introduciamo la funzione Hamiltoniana la cui definizione, nel caso di un singolo punto materiale è data dalla (3.29), mentre per un sistema con l gradi di libertà è H(q1 , ..., ql , q̇1 , ..., q̇l , t) = l ∂L q̇i − L. ∂ q̇i i=1 (5.78) Calcolando la derivata totale di H si ottiene l l l l ∂L dq̇i ∂L dq̇i ∂L dH d ∂L ∂L = − − . (5.79) q̇i + q̇i − dt dt ∂ q̇ ∂ q̇ dt ∂ q̇ dt ∂q ∂t i i i i i=1 i=1 i=1 i=1 Il secondo e terzo addendo si elidono a vicenda mentre il primo e il quarto termine generano, in virtù delle equazioni di Lagrange (5.35), l l ∂L d ∂L − q̇i = Ξi q̇i . dt ∂ q̇i ∂qi i=1 i=1 Ne segue che, se qi (t), i = 1, ..., l, soddisfano il sistema (5.35), allora l dH ∂L = , Ξi q̇i − dt ∂t i=1 e di conseguenza (5.80) dH = 0, (5.81) dt l se la funzione Lagrangiana non dipende esplicitamente dal tempo e se i=1 Ξi q̇i = 0. In particolare, dalla (5.32) otteniamo l l l i q̇i , i q̇i = S • u Ξi q̇i = S • u i=1 i=1 i=1 LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 183 dove, al solito • è il prodotto scalare in R3N . Ora, ricordando la formula (4.32) e le l i q̇i rappresenta la velocità del sistema degli considerazioni ad essa successive, i=1 u N punti materiali rispetto ai vincoli. Quindi, denotando con vcl = ẋ l i=1 i q̇i , u la velocità del sistema rispetto ai vincoli, possiamo riscrivere la (5.80) in questa forma più compatta dH • ẋ vcl − ∂L , =S (5.82) dt ∂t la cui interpretazione fisica sarà evidente una volta chiarita l’interpretazione fisica di H. Vogliamo quindi dare, come nella sezione 3.3.1, un’interpretazione fisica della funzione H. Partendo dalla definizione (5.34) e ricordando la (4.33), abbiamo L = T2 + T1 + T0 − V. Eseguendo passaggi analoghi a quelli sviluppati nella sezione 3.3.1, è facile provare che17 l l ∂L ∂ (T2 + T1 + T0 ) q̇i = q̇i = 2T2 + T1 , (5.83) ∂ q̇ ∂ q̇i i i=1 i=1 per cui, H = 2T2 + T1 − (T2 + T1 + T0 − V ) = T2 + V − T0 . (5.84) In particolare, se T0 ≡ 0, la funzione H corrisponde alla somma dell’energia cinetica e dell’energia potenziale. Abbiamo quindi questa semplice Proposizione 5.7.1 Nel caso di un sistema olonomo a vincoli fissi, la funzione H, corrisponde all’energia meccanica totale, cioè H = T + V. (5.85) Dim. Nel caso in cui la Lagrangiana provenga da un sistema meccanico soggetto a vincoli fissi, abbiamo L = T2 − V , cioè T ≡ T2 , da cui discende immediatamente la (5.85). La (5.85) è stata già incontrata nel paragrafo 3.3.1, dove avevamo a che fare con un solo punto materiale libero, cioè privo di vincoli. Tuttavia sottolineiamo ancora che, in generale, H = � T + V , l’uguaglianza vale soltanto se T ≡ T2 . Prima di continuare, confrontando la (5.84) con la (5.85), viene naturale introdurre la cosiddetta energia potenziale efficace Veff = V − T0 , (5.86) 17 Questo calcolo è un caso particolare di un teorema sulle forme quadratiche (detto “di Eulero” ) che n dice che, data la forma quadratica A( ξ, ξ) = i,j=i aij ξi ξj con (aij ) matrice simmetrica, allora n ∂A k=i ∂ξ ξk = 2 A( ξ, ξ). k 184 LEZIONI DI SISTEMI DINAMICI ed interpretare la (5.84) come (5.87) H = T2 + Veff , cioè come energia meccanica totale di un sistema soggetto a forze la cui energia potenziale è (5.86). Prima di procedere è tuttavia necessario rimarcare la differenza fra i due termini che compongono Veff . Infatti V è proprio l’energia potenziale dovuta a forze conservative prodotte da ben precisi agenti fisici (il peso, una o più molle, interazioni elettrostatiche, etc.), −T0 non è invece generata da nessun agente fisico se non dal moto dei vincoli. Questi, trascinando con il loro moto il sistema di punti materiali, sono i responsabili delle forze d’inerzia (rappresentate nell’Hamiltoniana H proprio da −T0 ). Tornando alla (5.82), la conseguenza “fisica” di tale formula è evidente: la variazione nell’unità di tempo dell’energia meccanica di un sistema è imputabile a due termini: • ẋ vcl , lavoro fatto, nell’unità di tempo (e quindi la potenza) dalle forze che (i) S non sono conservative18 (e che quindi che non ammettono energia potenziale); (ii) ∂L , che, in generale, è non nullo nel caso di vincoli mobili (anche se in taluni ∂t casi particolari può annullarsi pur avendo a che fare con vincoli in movimento). Quindi, tornando all’energia meccanica totale espressa dalla (5.87) possiamo conclu∂L • ẋ vcl = 0. dere che essa si conserva se = 0, e se S ∂t Nota 5.7.1 Osserviamo che il termine T1 , cioè il termine omogeneo di primo grado · nelle q i , non ha alcuna influenza sull’Hamiltoniana H. Nella nota 5.3.2 abbiamo osservato che T1 non influisce nelle equazioni di Lagrange soltanto se non dipende ∂b ∂bi esplicitamente dal tempo e se ∂qji = ∂q , ∀ i, j = 1, ..., l. Invece, per quel che j riguarda la H, T1 è sempre ininfluente, indipendentemente dalla sua forma. Proseguendo il confronto con la sezione 3.3.1, concludiamo il paragrafo illustrando come sfruttare le eventuali coordinate cicliche anche nell’Hamiltoniana. Supponiamo, come nella sezione 5.6, di aver a che fare con un sistema olonomo a vincoli lisci sog ≡ 0, e che qα , α = 1, ...., ν, siano cicliche getto soltanto a forze conservative, cioè S ∂L (cioè ∂q = 0, ∀ α = 1, ...., ν). Deduciamo allora che le qα , α = 1, ...., ν, sono α 19 cicliche anche per la funzione Hamiltoniana . Infatti, dalla definizione (5.78), l ∂ ∂H = ∂qα ∂qα i=1 ∂L ∂ q̇i l ∂ ∂L ∂L q̇i − = q̇i = 0. ∂qα ∂ q̇i ∂qα i=1 =0 =0 18 Osserviamo che le forze di attrito possono essere inserite in S. Si tratta soltanto definire come reazioni quella componente delle forze vincolari per cui R • δ vincolari R x = 0, per ogni spostamento virtuale δ x. insieme a tutte In tale “riclassificazione” delle forze le forze vincolari dovute all’attrito si inseriscono in S, le altre (eventuali) forze che non sono conservative. 19 Come del resto lo sono anche per la funzione di Routh R (vedi nota 15) a piè di pagina. LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 185 Procediamo quindi come nella sezione 3.3.1, introducendo (p1 , ., pν , q̇ν+1 , ., q̇l , qν+1 , ., ql , t) = H H q̇ 1 (p1 , ., pν , q̇ν+1 , ., q̇l , q1 , ., ql , t) , ..., q̇ ν (p1 , ..., pν , q̇ν+1 , .., q̇l , q1 , ...ql , t) , q̇ν+1 , .., q̇l , qν+1 , ...ql , t . (5.88) Dimostriamo che (p1 , ..., pν , q̇ν+1 , .., q̇l , qν+1 , ...ql , t) = H l ∂R q̇i − R , ∂ q̇i i=ν+1 dove R è la funzione di Routh, data dalla (5.72), che dipende da pα , α = 1, ...., ν, e dalle variabili non cicliche (si veda la (5.74)). Con gli stessi passaggi illustrati nella formula (3.36), si prova che ∂R ∂ L = , ∂ q̇i ∂ q̇i i = ν + 1, ...., l, dove L è data dalla (5.73). Quindi, osservando che ν l l ∂L ∂L ∂L q̇i − L = q̇α + q̇i − L H = ∂ q̇i ∂ q̇α ∂ q̇i α=1 i=1 i=ν+1 = ν α=1 pα q̇α + l ∂L q̇i − L, ∂ q̇i i=ν+1 abbiamo l ∂ L q̇i − L ∂ q̇ i α=1 i=ν+1 ν l ∂L = q̇i − L − pα q̇ α ∂ q̇ i α=1 i=ν+1 ∂R (p1 , ..., pν , q̇ν+1 , .., q̇l , qν+1 , ...ql , t) = H ν pα q̇ α + ∂ q̇i R La versione “semplificata” dell’energia meccanica si ottiene inserendo q̇ α , α = 1, che ...., ν, nella Hamiltoniana H. Così facendo si ottiene la nuova Hamiltoniana H, dipende soltanto dalle l − ν variabili non cicliche e dalle ν costanti pα , α = 1, ...., ν. Esempio 5.7.1 Proseguiamo con lo studio del moto di un punto materiale P su una circonferenza ruotante, moto già trattato negli esempi 4.1.4 e 4.1.6, determinando la funzione Hamiltoniana nell’ipotesi che il vincolo sia liscio e che l’unica forza non vincolare agente su P sia la forza peso diretta nel verso opposto dell’asse z. L’energia potenziale della forza peso è data da V (x, y, z) = mgz, ⇒ V̂ (θ) = −mgR cos θ, 186 LEZIONI DI SISTEMI DINAMICI e quindi, ricordando la (4.41), la funzione Lagrangiana è � � � �2 dϕ mR2 2 θ̇ + sin2 θ + mgR cos θ, L θ, θ̇, t = T − V̂ = 2 dt � � dϕ dϕ che può dipendere esplicitamente dal tempo tramite . Evidentemente se è codt dt stante, il che vuol dire che la circonferenza ruota uniformemente attorno all’asse z, cioè dϕ = ω, ⇔ ϕ (t) = ωt + ϕ0 , dt allora la funzione L non dipende esplicitamente dal tempo t. Sfruttando la (5.84) e la (4.42) dove sono specificate T2 e T0 , abbiamo H = = T2 + V − T0 mR2 mR2 2 θ̇ − mgR cos θ − 2 2 � dϕ dt �2 sin2 θ. � �2 mR2 dϕ Quindi Veff = V − T0 = −mgR cos θ − sin2 θ. La variazione nel 2 dt tempo di H è data dH dϕ d2 ϕ ∂L sin2 θ, =− = mR2 dt ∂t dt dt2 dϕ d2 ϕ dH = 0, se ≡ 0, cioè vincolo è fisso, o se 2 ≡ 0, cioè la rotazione e quindi dt dt dt è uniforme. Notiamo che H si conserva anche se il vincolo è mobile, a patto che la rotazione sia uniforme. Esempio 5.7.2 E’ dato un punto materiale P vincolato a muoversi su una superficie di rotazione ottenuta ruotando attorno all’asse z la curva z = f (x). La superficie è priva di attrito ed il punto è soggetto alla forza peso ed a quella esercitata da una molla di costante elastica k, ed avente lunghezza a riposo e massa trascurabili, il cui secondo estremo è fissato in O. � � La forma implicita della superficie è z = f x2 + y 2 . Una descrizione parametrica può essere data in termini di r = x2 + y 2 , distanza di P dall’asse z, e dell’angolo φ che la proiezione del vettore (P − O) sul piano (x, y), forma con l’asse x,   x = r cos φ, y = r sin φ,  z = f (r) , φ ∈ (−π, π] , r > 0. I vettori base del piano tangente sono ur = cos φe1 + sin φe2 + f ′ (r) e3 , uφ = −r sin φe1 + r cos φe2 , LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 187 2 per cui |ur ∧ uφ | = r2 f ′ 2 + 1 �= 0, se r �= 0. L’energia cinetica del punto è T = = 1 + (f ′ (r))2 0 m ṙ ṙ φ̇ φ̇ 0 r2 2 m 2 1 + (f ′ (r)) ṙ2 + r2 φ̇2 , 2 mentre l’energia potenziale dovuta al peso è Vpeso (x, y, z) = mgz, e quindi V̂peso = k 2 x + y 2 + z 2 , ovvero V̂molla = mgf (r), e quella dovuta alla molla è Vmolla = 2 k 2 2 r + f (r) . La Lagrangiana è 2 k 2 m 2 1 + (f ′ (r)) ṙ2 + r2 φ̇2 − mgf (r) − r + f 2 (r) . L= 2 2 La coordinata φ è ciclica. Infatti d ∂L ∂L ∂L = 0, ⇒ = Ao = costante. − dt ∂ φ̇ ∂φ ∂ φ̇ =0 mr 2 φ̇ L’equazione per r è k 2 (r + f ′ f ′′ ) = 0, 1 + (f ′ (r)) r̈ + f ′ f ′′ ṙ2 − rφ̇2 + gf ′ + m che scriveremo così A2 k 2 1 + (f ′ (r)) r̈ + f ′ f ′′ ṙ2 − 2o 3 + gf ′ + (r + f ′ f ′′ ) = 0. m r m (5.89) La (5.89) rientra nella classe di equazioni del secondo ordine analizzate nella sezione 2.6.3. Dobbiamo quindi scrivere la (5.89) nella corrispondente forma conservativa, individuando l’energia meccanica, ossia la funzione di Hamilton H= ∂T ∂T ṙ + φ̇ − L. ∂ ṙ ∂ φ̇ dH = 0. Scriveremo quindi dt · 2 m k 2 2 · 2 ′ 2 H= 1 + (f (r)) r + r φ + mgf (r) + r + f 2 (r) . 2 2 Infatti, essendo il vincolo liscio e fisso, (5.90) Lo studio qualitativo può essere svolto a partire direttamente dalla (5.90). Infatti, · Come caso particolare consideriamo sostituendo φ in termini di Ao e r, otteniamo H. 2 f (r) = cr , e supponiamo k = 0 (assenza della molla), per cui 2 m A2o 2 2 1 + 4c r ṙ + 2 2 + mgcr2 = E, H (ṙ, r) = 2 m r 188 LEZIONI DI SISTEMI DINAMICI dove E è costante e si calcola a partire dalle condizioni iniziali. Avremo quindi � � � � 2 E 1 A2o 2 2 2 − V̂ef f (r) , con V̂ef f (r) = mgcr + . (5.91) 1 + 4c r ṙ = m m 2mr2 In particolare, siccome il segno del primo membro della (5.91) è sempre non negativo, E gli r “accessibili” sono quelli per cui su cui V̂ef f (r) ≤ . m Esempio 5.7.3 Consideriamo un punto materiale P vincolato a muoversi su una superficie di rotazione ottenuta ruotando attorno all’asse z la curva x = h (z), con h (z) ≥ 0. La superficie è liscia ed il punto è soggetto alla forza peso diretta nel verso opposto a quello dell’asse z. Una descrizione parametrica della superficie è   z∈R x = h (z) cos ϕ,  y = h (z) sin ϕ, dove ϕ è l’angolo che la proiezione del vettore (P − O) sul piano x, y forma con l’asse x. La forma implicita della superficie è f (x, y, z) = x2 + y 2 − h 2 (z) = 0. I vettori base del piano tangente sono uz = h′ (z) cos ϕe1 + h′ (z) sin ϕe2 + e3 , uϕ = −h (z) sin ϕe1 + h (z) cos ϕe2 , per cui l’energia cinetica è T = = �� 1 + (h ′ (z))2 m� ż 0 ż ϕ̇ ϕ̇ 0 h2 (z) 2 �� m 2 1 + (h ′ (z)) ż 2 + h2 (z) ϕ̇2 . 2 L’energia potenziale è Vpeso (x, y, z) = mgz, e quindi V̂peso = mgz, che comporta la seguente funzione di Lagrange � � m �� 2 L= 1 + (h ′ (z)) ż 2 + h2 (z) ϕ̇ − mgz. 2 Da essa si ricava immediatamente che ϕ è ciclica, cioè ϕ = Ao 1 , m h2 (z) con Ao = costante. La funzione di Hamilton è dunque � � m �� 2 1 + (h ′ (z)) ż 2 + h2 (z) ϕ̇2 − mgz, H= 2 (5.92) LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 189 che, sostituendo ϕ̇ con l’espressione data dalla (5.92), assume questa forma 2 (ż, z) = m 1 + (h ′ (z))2 ż 2 + Ao 1 + mgz. H 2 2m h2 (z) L’energia potenziale efficace è dunque Veff (z) = A2o 1 + mgz. 2m h2 (z) Esempio 5.7.4 Come ultimo esempio consideriamo quello di un punto materiale vincolato a stare sulla cicloide (4.17) e rappresentata nella figura 5.5. In tal caso la z x Figura 5.5: Rappresentazione della curva (4.17), detta cicloide. particella ha un solo grado di libertà: ψ. Si suppone che il vincolo sia liscio e che il punto materiale, la cui massa è m, sia soggetto soltanto all’azione della forza peso diretta nel verso opposto dell’asse z. E’ facile scrivere la funzione Hamiltoniana dal momento che T = mR2 ψ̇ 2 (1 + cos ψ) , V = mgR(1 − cos ψ), (5.93) e quindi H = mR2 ψ̇ 2 (1 + cos ψ) + mgR(1 − cos ψ). Se poniamo q 2 = R(1 − cos ψ), Derivando (5.94) si ottiene R2 ψ̇ 2 = 4 (5.94) q 2 q̇ 2 , sin2 ψ (5.95) e sostituendo nella (5.93) T = 4m q 2 q̇ 2 (1 + cos ψ) = 4mRq̇ 2 , sin2 ψ V = mgq 2 , (5.96) da cui si ricava H = 4mRq̇ 2 + mgq 2 , che è la funzione di Hamilton dell’oscillatore armonico, q̇ 2 + ω 2 q 2 , se ω 2 = g/4R2 . Si deduce quindi che le oscillazioni della particella sotto l’azione della sola forza peso non dipendono dall’energia. La variabile q compie un’oscillazione armonica di 190 LEZIONI DI SISTEMI DINAMICI periodo T = 4π R g , indipendente dalle condizioni iniziali ovvero dalla quota massima (purché minore di R) che si raggiunge durante il moto. Durante una oscillazione completa della variabile q la variabile z = q 2 compie due oscillazioni complete (una quando q > 0 e una quando q < 0) e quindi il periodo di oscillazione del punto sulla cicloide è dato da T /2 = 2π R g. 5.8 Il teorema di Noether La conservazione dei momenti coniugati20 pα , α = 1, ...., ν, nel caso delle variabili cicliche e la conservazione della funzione Hamiltoniana, sono legati alle proprietà di invarianza della funzione di Lagrange. Nel caso di una coordinata ciclica qh , la ∂L condizione di ciclicità, ∂q = 0, ci dice che comunque si “trasli” la coordinata qh la h funzione Lagrangiana rimane immutata (in questo caso la cosa è “ovvia” visto che la Lagrangiana non dipende da qh ). Cerchiamo di chiarire questo punto con qualche esempio. Come primo esempio consideriamo il moto centrale analizzato nella sezione 3.4. In questo caso la variabile ϕ è ciclica. Questo semplicemente traduce il fatto che, essendo tutto il sistema simmetrico per rotazioni attorno all’asse perpendicolare al piano del moto. La variabile ϕ non deve intervenire nella dinamica: solo la sua variazione nel tempo, cioè ϕ̇, ha importanza. Un secondo esempio è quello del punto materiale libero (cioè una particella a cui non sono applicate forze). In tal caso la Lagrangiana è L≡T = 1 m(ẋ2 + ẏ 2 + ż 2 ). 2 Qui tutte e tre le coordinate (x, y, z) sono cicliche. E questo è la “conseguenza” della omogeneità dello spazio: ogni punto dello spazio è indistinguibile dagli altri. In termini matematici apparentemente più raffinati, il problema del moto del punto libero deve essere invariante per traslazione (o meglio ancora, per l’azione del gruppo delle traslazioni dello spazio euclideo). Anche la conservazione dell’energia, seppur meno palesemente, è legata a un’invarianza traslazionale: quella delle traslazioni temporali (cioè della variabile t). Per generalizzare queste osservazioni occorre formalizzare meglio il concetto di invarianza. Per evitare complicazioni limitiamoci soltanto a funzioni Lagrangiane indipendenti dal tempo. La funzione L è quindi una funzione definita su un insieme S = D × Rl dove D ⊂ Rl è un aperto, ed è il dominio delle coordinate lagrangiane21 = = (q1 , . . . , ql ), mentre il secondo Rl è il dominio delle velocità lagrangiane q̇ q (q̇1 , . . . , q̇l ). Definizione 5.8.1 Uno pseudo-gruppo22 ad un parametro di diffeomorfismi di D è un’applicazione da Φ : I × D → D, dove I ⊂ R è un intervallo contenente lo zero e 20 Si veda la formula (5.69). per semplicità, la notazione introdotta nella sezione 4.1. 22 Il nome “pseudo-gruppo” proviene dal fatto che in genere I = R e quindi la terza proprietà richiesta è solo “localmente” una proprietà di gruppo. Nel seguito, per non appesantire, elimineremo il prefisso “pseudo” 21 Utilizziamo, LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 191 D è un aperto di Rl ) (s, q (s,(q1 ,...,ql )) Φ ) , Φ2 (s, )) ∈ D ⊂ Rl , −→ Φ (s, q ) = (Φ1 (s, q q ) , ... , Φl (s, q che gode delle seguenti proprietà: 1. per ogni s ∈ I la mappa Φ(s, ·) : D → D è un diffeomorfismo (ovvero è un’applicazione biunivoca da D in D, differenziabile con inversa differenziabile); per ∈ D la mappa Φ(·, q ) : I → D è differenziabile; ogni q per ogni 2. Φ(0, ·) : D → D è la trasformazione identica, cioè Φ(0, q) = q ∈ D, ; q 3. per ogni s1 , s2 ∈ I tali che s1 + s2 ∈ I, vale Φ(s1 , Φ(s2 , ·)) = Φ(s2 , Φ(s1 , ·)) = Φ(s1 + s2 , ·). ∈ D, Nota 5.8.1 Fissato un qualunque punto di D, ovvero una qualunque l-upla q ) : I → D, cioè s → Φ(s, q ). Questa rappreconsideriamo l’applicazione Φ(s, q ∈ D passa una sola curva del senta una “curva” in D. Evidentemente, per ogni q ). Tuttavia la “rappresentazione” della curva non è univoca a causa della tipo Φ(s, q proprietà di traslazione al punto 3. Esempio 5.8.1 Mostriamo che la traslazione della coordinata lagrangiana q1 , ovvero l’applicazione Φ : R×Rl −→ Rl , così definita Φ (s, (q1 , . . . , ql )) −→ (q1 + s, q2 , . . . , ql ) è un gruppo a un parametro. Le proprietà 1 e 2 sono soddisfatte. Proviamo la proprietà 3. Abbiamo )) Φ(s1 , Φ(s2 , q = Φ (s1 , (q1 + s2 , q2 , . . . , ql )) = (q1 + s2 + s1 , q2 , . . . , ql ) = Φ (s1 + s2 , (q1 , q2 , . . . , ql )) , e )) Φ(s2 , Φ(s1 , q = Φ (s2 , (q1 + s1 , q2 , . . . , ql )) = (q1 + s1 + s2 , q2 , . . . , ql ) = Φ (s1 + s2 , (q1 , q2 , . . . , ql )) , e quindi la proprietà 3 è verificata. ) è un gruppo ad un parametro, allora Nota 5.8.2 E’ facile verificare che se Φ(s, q ) è l’applicazione inversa di Φ(s, q ), ovvero che Φ(−s, Φ(s, q )) = q . AppliΦ(−s, q )) = Φ(s − s, q ) = Φ(0, q ), che, cando infatti la proprietà 3 abbiamo Φ(−s, Φ(s, q per la proprietà 2, è proprio l’identità. 192 LEZIONI DI SISTEMI DINAMICI Definizione 5.8.2 Sia Φ un gruppo a un parametro nel senso della definizione 5.8.1. Chiameremo rilevamento del gruppo allo spazio S = D × Rl ⊂ R2l il gruppo a un parametro T Φ : I × S → S, così definito: � � � = T Φ (s, (q1 , . . . , ql , q̇1 , . . . , q̇l )) �, q̇ T Φ s, q � � l l � � ∂Φ1 ∂Φl �) , . . . , Φl (s, q �) , (5.97) q̇k , . . . , q̇k = Φ1 (s, q ∂qk ∂qk k=1 k=1 �), j = 1, ..., l, della l-upla Notiamo che se leggiamo la generica componente Φj (s, q �) come la j-esima coordinata di una particella che si “muove” sotto l’azione del Φ(s, q �l ∂Φj gruppo di diffeomorfismi, allora q̇k , altro non è che la velocità della partik=1 ∂qk cella lungo la j-esima coordinata. Infatti, tornando alla sezione 4.1.2, se le coordinate dell’i-esimo punto materiale xi (� q ) = (xi (� q ) , yi (� q ) , zi (� q )) non dipendono esplicitamente dal tempo, allora considerando, a titolo di esempio, la componente yi del vettore �l ∂yi posizione, la velocità del punto materiale rispetto ad y è data da ẏi = q̇k . k=1 ∂qk Quindi, volendo proseguire questa analogia, se le (q1 , . . . , ql ) vengono mappate dal � �) (che leggiamo come l-upla delle coordinate) è ovvio che le q̇ gruppo nelle Φ(s, q �l ∂Φj dovranno essere mappate nelle “velocità”, ovvero in q̇k , j = 1, ..., l. k=1 ∂qk Proposizione 5.8.1 Il rilevamento di un gruppo a un parametro è esso stesso un gruppo a un parametro che agisce sui vettori di R2l . Dim.� Per prima � cosa bisogna mostrare che, fissato un qualunque s ∈ I, l’applicazione � : S → S, è invertibile, sapendo che Φ (s, q �, q̇ �) è un gruppo ad un paraT Φ s, q metro e che quindi soddisfa la proprietà 1 della definizione 5.8.1. Proprio in virtù di � ∈ D, det JΦ �= 0 dove JΦ è la tale proprietà, abbiamo che, per ogni s ∈ I e per ogni q matrice jacobiana  ∂Φ ∂Φl  1 ···  ∂q1 ∂q1   . ..    JΦ =  .. . .  ∂Φ ∂Φl  1 ··· ∂ql ∂ql Se calcoliamo la matrice jacobiana dell’applicazione T Φ abbiamo � � JΦ D JT Φ = , 0 JΦ dove D è la seguente matrice l × l  � l ∂ 2 Φ1 q̇k  k=1 ∂q1 ∂qk   .. D= .   �l ∂ 2 Φ1 q̇k k=1 ∂ql ∂qk ··· �l ··· �l k=1 k=1 ∂ 2 Φl q̇k ∂q1 ∂qk .. . ∂ 2 Φl q̇k ∂ql ∂qk     .   LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 193 2 Sfruttando le proprietà delle matrci triangolari a blocchi, det JT Φ = (det JΦ ) �= 0, e quindi T Φ è invertibile. , abbiamo Passiamo adesso alla proprietà 2. Siccome Φ(0, q) = q l ) ∂Φ1 (0, q TΦ , q̇ ) , ... , Φl (0, q ), 0, q q̇k , .. −→ (Φ1 (0, q ∂qk k=1 (q1 , ..., ql ) .., l ) ∂Φl (0, q q̇k . ∂qk k=1 l ) ∂Φj (0, q ) = qj , e quindi Ora, per ogni j = 1, ..., l , si ha Φj (0, q q̇k = k=1 ∂qk l δjk q̇k = q̇j . Dunque k=1 TΦ −→ , q̇ 0, q (q1 , ..., ql , q̇1 , ...., q̇l ) , è l’identità. , q̇ ovvero T Φ 0, q Mostriamo infine la proprietà 3, provando che T Φ(s1 , T Φ(s2 , ·)) = T Φ(s1 + s2 , ·). Il passaggio T Φ(s1 , T Φ(s2 , ·)) = T Φ(s2 , T Φ(s1 , ·)) è banale. Dalla (5.97) l l ∂Φ (s , q ) ∂Φ (s , q ) 1 2 l 2 = Φ (s2 , q , q̇ ) , q̇k , ..., q̇k T Φ s2 , q ∂qk ∂qk k=1 k=1 e quindi l l ) ) ∂Φ1 (s2 , q ∂Φl (s2 , q ) , q̇k , ..., q̇k T Φ s1 , Φ (s2 , q ∂qk ∂qk k=1 k=1 · = q T Φ s2 , q, )) , Φ (s1 , Φ (s2 , q .., l k=1 l )) ∂Φ1 (s1 , Φ (s2 , q q̇k , .. ∂qk k=1 )) ∂Φl (s1 , Φ (s2 , q q̇k ∂qk , che, sfruttando la proprietà 3 della definizione 5.8.1, diventa l l ) ) ∂Φ1 (s1 + s2 , q ∂Φl (s1 + s2 , q ) , = Φ (s1 + s2 , q q̇k , ..., q̇k ∂qk ∂qk k=1 k=1 . , q̇ = T Φ s1 + s 2 , q 194 LEZIONI DI SISTEMI DINAMICI Esempio 5.8.2 Riprendendo l’esempio 5.8.1, il rilevamento della “traslazione” è dato da TΦ (s, q1 , . . . , ql ; q̇1 , . . . , q̇l ) −→ (q1 + s, . . . , ql ; q̇1 , . . . , q̇l ). ) = qj , se j = 2, ..., l, e Φ1 (s, q ) = q1 + s, abbiamo Infatti, dal momento che Φj (s, q l l ) ∂Φj (s, q q̇k = δjk q̇k = q̇j , j = 2, ..., l , ∂qk k=1 k=1 e l l ) ∂Φ1 (s, q ∂ (q1 + s) q̇k = q̇k = q̇1 . ∂qk ∂qk k=1 k=1 Definizione 5.8.3 Un gruppo a un parametroΦ si dice una simmetria per la funzione , q̇ ∈ S vale Lagrangiana L se per ogni s ∈ I e per ogni q = L T Φ s, q , q̇ , q̇ L q , ∈ S, abbiamo , q̇ cioè, per ogni s ∈ I, e q L(q1 , . . . , ql , q̇1 , . . . , q̇l ) = ) , ...Φl (s, q ) , L Φ1 (s, q .., l k=1 ∂Φ1 q̇k ∂qk . (5.98) l ∂Φ1 q̇k , .. ∂qk k=1 (5.99) Possiamo ora enunciare il teorema di Noether23 Teorema 5.8.1 Sia Φ una simmetria per la funzione Lagrangiana L, allora la funzione I : S → R definita da l ∂L dΦk , q̇ = I q , ∂ q̇k ds s=0 (5.100) k=1 è una costante del moto, ovvero dI = 0. dt Dim. La dimostrazione si basa sulla possibilità di scambiare le derivate rispetto a s e a t. Queste sono due variabili indipendenti tra loro (t è il tempo, mentre s è il parametro di una trasformazione “geometrica” indipendente dal tempo). Quindi, considerando 23 Amalie (t) = (q1 (t) , ...., ql (t)) , q Emmy Noether (Erlangen, 1882 – Bryn Mawr, Pennsylvania 1935), matematica tedesca. LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 195 q (t)) , avremo per ogni componente Φj , j = 1, ..., l, della l-upla Φ (s, l (t)) d dΦj (s, q d dΦj d ∂Φj · = = q . dt ds ds dt ds ∂qk k (5.101) k=1 Deriviamo la funzione I rispetto al tempo l d d ∂L dΦk I(q1 , . . . , ql , q̇1 , . . . , q̇l ) = , dt dt ∂ q̇k ds s=0 (5.102) k=1 e sviluppiamo la derivata del prodotto dentro la somma l l d ∂L ∂L d dΦk dΦk + dt ∂ q̇k ds s=0 ∂ q̇k dt ds s=0 k=1 (5.103) k=1 d ∂L Nel primo addendo possiamo usare le equazioni di Lagrange per sostituire dt ∂ q̇k ∂L con , e nel secondo addendo possiamo scambiare le derivate rispetto a s e t come ∂qk nella (5.101), l l ∂L dΦk ∂L d dΦk + ∂qk ds s=0 ∂ q̇k ds dt s=0 k=1 = k=1 l l l ∂L d ∂Φk ∂L dΦk + q̇ h ∂qk ds s=0 ∂ q̇k ds ∂qh k=1 k=1 h=1 . s=0 Quest’ultima è la derivata di L (T Φ(s, (q1 , . . . , ql ; q̇1 , . . . , q̇l ))) rispetto a s ed è quindi nulla per l’invarianza della Lagrangiana sotto l’azione del gruppo a un parametro. Infatti, sfruttando la (5.99), per ogni s ∈ I, l l d ∂Φ1 ∂Φ1 ) , ..., Φl (s, q ) , 0 = L Φ1 (s, q q̇k , ..., q̇k ds ∂qk ∂qk k=1 = l l ∂L dΦk ∂L d + ∂qk ds ∂ q̇k ds k=1 k=1 l ∂Φk q̇h ∂qh h=1 k=1 . E quindi, calcolando la derivata per s = 0, otteniamo la tesi. 5.9 Equilibrio Nel seguito lavoreremo sotto le seguenti ipotesi: Hp. 1. Il sistema di N punti materiali è sottoposto a m vincoli olonomi lisci, ed è ≡ 0. soggetto soltanto a forze conservative ed alle forze vincolari, cioè S 196 LEZIONI DI SISTEMI DINAMICI Hp. 2. La Lagrangiana non dipende esplicitamente dal tempo. Dalla (4.33), abbiamo dunque L = l l 1 ahk (q1 , . . . , ql )q̇h q̇k + bh (q1 , . . . , ql )q̇h + 2 h,k=1 h=1 T1 T2 +T0 (q1 , . . . , ql ) − V (q1 , . . . , ql ) . (5.104) Notiamo che tale espressione potrebbe sembrare in contrasto con l’ipotesi 2: infatti, se nella funzione L compaiono T1 e T0 , allora abbiamo a che fare con vincoli mobili e quindi con Lagrangiane dipendenti dal tempo. Così non è poiché esistono casi di vincoli mobili per cui la L non dipende esplicitamente dal tempo. Questo è il caso dell’esempio 5.7.1 dove, se la circonferenza ruota con velocità costante ω, abbiamo una Lagrangiana che non dipende esplicitamente dal tempo. ≡ Poiché che la Lagrangiana in (5.104) non dipende esplicitamente dal tempo e S 0, la funzione di Hamilton (5.78) è un integrale primo del moto. Infatti dalla (5.82) deduciamo dH = 0. (5.105) dt La forma di H è data dalla (5.84), cioè H= l 1 ahk (q1 , . . . , ql )q̇h q̇k − T0 (q1 , . . . , ql ) + V (q1 , . . . , ql ) = T2 − Veff . 2 h,k=1 (5.106) Ora, cerchiamo (se esistono) soluzioni costanti delle equazioni di moto (5.36), ovvero funzioni del tipo q1 (t) ≡ q1, e , . . . , ql (t) ≡ ql, e , per ogni t . (5.107) In analogia con la definizione 2.8.1, diamo la seguente: e = (q1, e , . . . , ql, e ) si dice una configurazione Definizione 5.9.1 La configurazione q di equilibrio se una volta posto il sistema in tale configurazione, con (q̇1 , ..., q̇1 ) ≡ e è configurazione (0, ...., 0), il sistema ivi rimane indefinitamente. In altri termini, q (t) ≡ q e , è soluzione delle equazioni di moto (5.36) con le condizioni di equilibrio se q e , e q̇ |t=0 = q =0. iniziali q t=0 Proposizione 5.9.1 Se le ipotesi Hp. 1 e Hp. 2 sono sodisfatte, le configurazioni di equilibrio sono tutte e sole le soluzioni di ∂Veff ∂ (V − T0 ) = = 0, ∂qk ∂qk k = 1, . . . , l . (5.108) LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 197 Dim. Ricordando la forma compatta (4.40) della Lagrangiana, abbiamo L= 1� T � � � q), q̇ Aq̇ + b • q̇ − Veff (� 2 dove né A né � b dipendono esplicitamente dal tempo. Scriviamo (5.36)    1 T ∂A   ∂ � b � � � • q̇ q̇ q̇    2 ∂q1   ∂q1   �    dA d b    . . �+ �+ − .. .. − Aq̈ q̇ +      dt dt    ∂�  1 � T ∂A � b q̇ q̇ � • q̇ 2 ∂ql ∂ql adesso le equazioni ∂Veff ∂q1 .. . ∂Veff ∂ql     = 0.   In particolare,  e quindi  d� b  =  dt  �+ Aq̈ db1 dt .. . dbl dt  �l      =      ∂b1 q̇k k=1 ∂qk  � l  ∂� b .. = q̇k , .  ∂q  k=1 k �l ∂bl q̇k k=1 ∂qk l b dA � � ∂ � q̇k q̇ + dt ∂qk (5.109) k=1  1 T ∂A � � q̇ q̇  2 ∂q1  .. − .   1 T ∂A � � q̇ q̇ 2 ∂ql   ∂� b � • q̇   ∂q 1    .. − .     � ∂b � • q̇ ∂ql � = 0, il sistema (5.109) si riduce a Ora, se q̇  ∂V eff  ∂q1  ..  .   ∂V eff ∂ql   ∂V eff   ∂q 1     .. + .    ∂Veff ∂ql     = 0.       = 0.   �e sono quindi tutte e sole le soluzioni di (5.108). Le configurazioni di equilibrio q Ricordiamo poi che il potenziale efficace si riduce al potenziale delle forze direttamente applicate nel caso dei vincoli fissi. In questo caso le configurazioni di equilibrio corrispondono ai punti critici dell’energia potenziale V . 198 LEZIONI DI SISTEMI DINAMICI 5.9.1 Stabilità � = 0, In quello che segue continuiamo a considerare le ipotesi Hp. 1 e Hp. 2, cioè S e Lagrangiane indipendenti dal tempo. Ricordando la sezione 5.4, sappiamo che il sistema (5.109) può essere scritto nella seguente forma compatta � � � =G � q � , �, q̇ Aq̈ (5.110) � si può ricavare dalla (5.109). Ora, la matrice A è non singolare dove l’espressione di G (v. teorema 4.1.3), e quindi possiamo ridurre il sistema (5.110), ad un sistema del primo ordine in forma normale. Infatti introducendo     η1 q̇1 .   .  �, ⇔  � = q̇ η  ..  =  ..  , ηl abbiamo  �  q̇  � η̇ q̇l �, = η (5.111) � (� � ). = A−1 G q, η Di conseguenza, ricordando il teorema 2.8.1, abbiamo la seguente �e = (q1, e , . . . , ql, e ) Definizione 5.9.2 Una configurazione di equilibrio, o punto di equilibrio, q � e ) = (qe1 , . . . , qel , 0, . . . , 0) è una posizione di equilibrio stabisi dirà stabile se (� qe , η le nel senso della definizione 2.8.2, per il sistema di equazioni del primo ordine (5.111). Un punto di equilibrio non stabile si dirà instabile. Come nella sezione 2.8.3, vale il Teorema 5.9.1 (Principio di Dirichlet) Se le ipotesi Hp. 1 e Hp. 2 sono sodisfatte, �e = (q1, e , . . . , ql, e ) è un minimo isolato dell’energia potenziale efficace Veff = eq �e è una configurazione di equilibrio stabile. −T0 + V , allora q Dim. La dimostrazione di questo principio è relativamente semplice: si riduce a far � e di q �, vedere che la funzione Hamiltoniana data da (5.106), vista come funzione di η meno Veff (� q e ), cioè �) = H (� �) − Veff (� qe ) = Λ (� η, q η, q 1 T � A� η η + Veff (� q ) − Veff (� qe ) , 2 è una funzione di Lyapunov per il sistema (5.111). Si applica dunque il teorema 2.8.1 da � e ) è punto di equilibrio stabile. Mostriamo dunque che Λ (� �) cui discende che (� qe, η η, q è funzione di Lyapunov. �) lungo le soluzioni sia minore o uguale a La condizione che la derivata di Λ (� η, q zero è conseguenza della conservazione dell’energia (5.105). Resta da far vedere che la funzione Λ ha un minimo isolato in (qe,1 , . . . , qe,l , 0, . . . , 0). Anche questo segue facilmente dalla forma della Λ e dall’ipotesi di minimo isolato per Veff . Infatti il primo addendo nella definizione di Λ è una forma quadratica definita positiva nelle ηk (cioè nelle q̇k ) e quindi è nullo soltanto se η1 = ..... = ηl = 0, mentre Veff (� q ) > Veff (� q e ). LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 199 e ), ) in un intorno della configurazione di equilibrio ( Quindi, se prendiamo ( q, η qe , η e ), si ha ma diversi da ( qe , η ) = Λ ( η, q 1 T A η η + Veff ( q ) − Veff ( q e ) > 0, 2 La funzione Λ ha un minimo isolato in (q1, e , . . . , ql, e , 0, . . . , 0). Esempio 5.9.1 Continuando con l’esempio 5.7.1, vogliamo determinare le configurazioni di equilibrio stabile nel caso in cui la circonferenza ruoti uniformemente, cioè dϕ = ω = costante. Abbiamo già osservato che, in questo caso, L non dipende dt esplicitamente dal tempo. Sono quindi verificate le ipotesi Hp.1 e Hp.2, per cui le configurazioni di equilibrio sono i massimi e i minimi di Veff (θ) = V − T0 = − ω2 g sin2 θ − cos θ. 2 R I punti di equilibrio sono dunque le soluzioni di g dVeff (θ) = ω 2 sin θ − cos θ = 0. 2 dθ ω R Si distinguono due casi: • g ≥ 1. I punti di equilibrio sono θ = 0, π (o θ = −π). Dall’analisi del segno ω 2 R′ di Veff , si deduce che θ = 0, è un minimo isolato e quindi è punto di equilibrio stabile. E’ facile poi vedere che θ = π è configurazione di equilibrio instabile. g g ′ • 2 < 1. Gli zeri di Veff . sono θ = 0, π, ±θ̄, dove θ̄ = arccos ω R ω2R Le configurazioni di equilibrio stabile corrispondono a ±θ̄. Applicando poi la definizione 5.9.2, si prova che θ = 0, π, sono punti di equilibrio instabile. 5.10 Piccole Oscillazioni Supponiamo di avere un sistema meccanico con l gradi di libertà, con funzione Lagrangiana della forma24 l =1 , q̇ ). L q aij ( q )q̇i q̇j − V ( q 2 i,j=1 e = (q1, e , . . . , ql, e ) sia tale che si abbia Supponiamo che la configurazione q ∂V ( q ) = 0, ∂qk e k = 1, ..., l, (5.112) (5.113) 24 Se la Lagrangiana ha la forma L = T + T − V , quello che segue vale sostituendo V 2 0 eff = −T0 + V al posto dell’energia potenziale V . 200 LEZIONI DI SISTEMI DINAMICI e che la matrice hessiana B( qe ) = qe ) ∂ 2 V ( , ∂qk ∂qh k, h = 1, ..., l, (5.114) sia definita positiva. Le condizioni (5.113) e (5.114), e il criterio di Dirichlet, ci garane è una configurazione di equilibrio stabile, ovvero tiscono che la configurazione q e (e della che il moto resta confinato in un intorno della configurazione di equilibrio q nulla). In altri termini, durante il moto, le norme � e � velocità lagrangiana q̇ q (t) − q e q̇(t) restano “piccole”. Vediamo dunque come sfruttare questo fatto per sempli- ficare le equazioni di Lagrange in vicinanza della configurazione di equilibrio stabile. Dapprima considereremo sistemi con un solo grado di libertà e poi sistemi con l > 1, gradi di libertà. 5.10.1 Sistemi con un solo grado di libertà In questo caso L è data da 1 a (q) q̇ 2 − V (q) . 2 La configurazione di equilibrio stabile è q = qe , per cui V ′ (qe ) = 0, e V ′′ (qe ) > 0. Consideriamo quindi (q, q̇) “vicini” al punto di equilibrio (qe , 0), cioè (q, q̇) ∈ Bε (qe , 0), essendo Bε (qe , 0) l’intorno di (qe , 0) di raggio ε, come mostrato in figura 5.6. Si introduce quindi la nuova variabile ξ L (q, q̇) = q = qe + εξ, q̇ = εξ˙ . ⇔ ξ= q − qe , ε Evidentemente 0 ≤ |ξ| ≤ 1, mentre ε sarà “piccolo”, cioè ε ≪ 1. Scriveremo dunque ε = O (q − qe ), mentre ξ = O (1), che significano: ε è dell’ordine di (q − qe ), e quindi “molto piccolo”, mentre l’ordine di grandezza di ξ è 1. Adesso sviluppiamo sia V (q) che a (q) in vicinanza di qe , V (q) 1 = V (qe ) + V ′ (qe ) (q − qe ) + V ′′ (qe ) (q − qe )2 + .... 2 =0 >0 1 = V (qe ) + V ′′ (qe ) ε2 ξ 2 + o ε2 . 2 1 2 = a (qe ) + a′ (qe ) (q − qe ) + a′′ (qe ) (q − qe ) + .... 2 1 = a (qe ) + a′ (qe ) εξ + a′′ (qe ) ε2 ξ 2 + o ε2 . 2 Sostituiamo tali sviluppi nella Lagrangiana 2 2 2 1 ′′ 1 ′ 2 2 a (qe ) + a (qe ) εξ + a (qe ) ε ξ + o ε ε ξ˙ L = 2 2 1 +V (qe ) + V ′′ (qe ) ε2 ξ 2 + o ε2 . 2 a (q) LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 201 . q ε qe q Figura 5.6: L’intorno Bε (qe , 0). Se trascuriamo i termini o ε2 , possiamo approssimare la funzione di Lagrange con Lapp = 1 1 a (qe ) ε2 ξ̇ 2 − V ′′ (qe ) ε2 ξ 2 − V (qe ) , 2 2 che definiamo Lagrangiana approssimata, o Lagrangiana delle piccole oscillazioni. Scrivendo, per tale Lagrangiana, l’equazione di moto (5.36) otteniamo a (qe ) ξ¨ + V ′′ (qe ) ξ = 0, ⇒ ξ̈ = − V ′′ (qe ) ξ, a (qe ) che è l’equazione dell’oscillatore armonico mξ¨ − kξ = 0, la cui frequenza è ω2 = V ′′ (qe ) . a (qe ) 5.10.2 Sistemi con l gradi di libertà Si procede come nella sezione precedente introducendo lo sviluppo di Taylor di V in un intorno del punto del punto di equilibrio limitandoci soltanto al secondo ordine V (q) ≈ V ( qe ) + l ∂V ( qe ) 1 e )T B ( e ) , ( q−q (qk − qk,e ) + q ) ( q−q e ∂qk 2 k=1 l b ( q )(q −q )(q −q ) =0 k,h=1 kh e h h,e k k,e 202 LEZIONI DI SISTEMI DINAMICI �e , data dalla (5.114). Per quel che dove B (� q e ) è la matrice Hessiana calcolata in q riguarda l’energia cinetica, seguendo lo stesso approccio illustrato nella sezione 5.10.1, ci limitiamo all’ordine “zero”, cioè T ≈ l l 1 � 1 � d (qk − qk, e ) d (qh − qh, e ) ahk (� q e ) q̇h q̇k = ahk (� qe ) . 2 2 dt dt h,k=1 h,k=1 � �� T q̇ A( q e ) q̇ Approssimiamo dunque la Lagrangiana (5.112) con la seguente � � � �, q̇ Lapp q = l 1 � d (qk − qk, e ) d (qh − qh, e ) ahk (� qe ) 2 dt dt h,k=1 − l 1 � bkh (qh − qh,e ) (qk − qk,e ) . 2 (5.115) k,h=1 In particolare, introducendo   q1 (t) − q1 e �e ) � q−q   .. � = d (� � (t) = q � (t) − q �e =  = q̇ , u  , ⇒ u̇ . dt ql (t) − ql e (5.116) possiamo riscrivere la (5.115) in forma matriciale compatta � � � = 1 u̇ �−1u � T A (� � T B (� � , u̇ �. q e ) u̇ qe ) u Lapp u 2 2 (5.117) Le equazioni di Lagrange (5.36) sono �+Bu � = 0, Aü (5.118) dove A e B sono matrici l × l, simmetriche, definite positive, le cui componenti sono costanti. Chiameremo Lagrangiana delle piccole oscillazioni o Lagrangiana approssimata la funzione definita in (5.117) (o (5.115)), mentre le equazioni (5.118) sono usualmente dette equazioni delle piccole oscillazioni. Soluzione delle equazioni delle piccole oscillazioni Come già visto nella sezione 2.10, dove abbiamo trattato i sistemi lineari bidimensionali di equazioni differenziali a coefficienti costanti, cerchiamo di semplificare il sistema (5.118) applicando un “trucco vecchio quanto la matematica”: il cambiamento di varia� (t), che siano una combinazione bili. Cerchiamo cioè nuove variabili indipendenti w � (t), ovvero che siano legate alle u � (t) da una trasformazione lineare delle variabili u lineare, ovviamente invertibile, del tipo � (t) = Vw � (t) , u ⇔ � (t) = V−1 u � (t) , w (5.119) LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 203 dove V è una matrice l × l, invertibile, le cui componenti, denotate con vij , i, j = 1, ...., l, sono numeri reali. Sostituendo nella (5.118) si ha � + BV w � = 0, AV ẅ che, moltiplicata a sinistra per VT , diventa � T � � � � + VT BV w � = 0. V AV ẅ (5.120) Se adesso riusciamo a selezionare V in modo tale che VT AV = I, e     VT BV = M =    (5.121) µ1 0 0 .. . 0 µ2 0 .. . 0 0 µ3 .. . ··· ··· ··· 0 0 0 .. . 0 0 0 ··· µl     ,   (5.122) con µk positivi, cioè µk > 0, ∀ k = 1, ..., l, il sistema (5.120) diventa � +Mw � = 0, ẅ che, scritto per esteso, assume la forma  ẅ1 + µ1 w1 = 0,     ẅ2 + µ2 w2 = 0, .   ..   ẅl + µl wl = 0. Abbiamo quindi ottenuto un sistema di l oscillatori armonici disaccoppiati, le cui soluzioni sono25 √ (5.123) wk (t) = ak cos ( µk t + φk ) , k = 1, 2, ..., l, dove ak , e φk ,sono costanti arbitrarie (il cui valore può essere determinato quando sono note le condizioni condizioni iniziali). � , che poi, ricordando Quindi tornando alla (5.119), ovvero alle “vecchie variabili” u la (5.116), altro non sono che (� q (t) − � q e ), abbiamo qi (t) − qi e = l � vik wk (t) k=1 = l � √ vik ak cos ( µk t + φk ) , j=1 25 Una scrittura equivalente della (5.123) è √ √ wk (t) = ak cos ( µk t) + bk sin ( µk t) , con ak , bk , costanti. i = 1, ..., l, 204 cioè LEZIONI DI SISTEMI DINAMICI �√ �  µ1 t + φ1   .. � (t) − q �e = V  q . . �√ � al cos µl t + φl  a1 cos � Le variabili w(t) sono detti modi normali, mentre √ ωk = µk , k = 1, ..., l, (5.124) sono dette frequenze26 proprie delle piccole oscillazioni. Mostriamo adesso che esiste ed è unica la matrice V che, realizzando le (5.121) �e ), ai modi normali w(t) � e (5.122), permette di passare dalle variabili (� q (t) − q dati dalla (5.123). Poniamoci dunque in Rl , dove, seguendo la notazione fin qui utilizzata, � intendiamo i vettori (cioè le l-uple) colonna con v   v1   � =  ...  , v vl �T = �T i vettori (l-uple) riga, v e con v seguente teorema per le matrici A e B � v1 ··· vl � . Dimostreremo che è vero il Teorema 5.10.1 (Teorema spettrale) Sia A una matrice simmetrica definita positiva �1 , . . . , e B una matrice simmetrica. Allora esistono l vettori linearmente indipendenti v �l , e l numeri reali µ1 , . . . , µl (non necessariamente diversi tra loro) tali che v µk A� v k = B� vk , e27 k = 1, . . . , l , �h • A� �T v vk = v v k = δhk , h A� ∀ h, k = 1, . . . , l . (5.125) (5.126) Se anche la matrice B è definita positiva, allora i numeri µk sono tutti positivi. �k sono detti rispettivamente gli autovalori e gli autovettori I numeri µk e i vettori v di B relativi ad A. Il teorema è una generalizzazione del teorema spettrale per le matrici simmetriche (e infatti rientra in questa versione se A = I). Ciò che si perde rispetto al caso in cui A = I, è il fatto che la base di autovettori non è più, in generale, �h • v �k = δhk , bensì la (5.126). ortonormale. Infatti non vale v In accordo con il teorema spettrale possiamo facilmente provare che esiste ma matrice V che realizza le (5.121) e (5.122). Abbiamo infatti �1 , . . . , v �l , sono gli autovettori di B relativi ad A, allora, ponendo Teorema 5.10.2 Se v � � �1 v �2 · · · v �l , V= v (5.127) V realizza le (5.121) e (5.122). 26 In realtà, se volessimo esser precisi, si tratta di pulsazioni e non di frequenze. Le frequenze ν sono date k da ωk /2π. 27 Con • si intende l’usuale prodotto scalare, componente per componente, in Rl , cioè •p =z T p =p T z . z Al solito δhk denota la δ di Dirac: δhk = 1 se h = k, δhk = 0, altrimenti. LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 205 �k , Dim. Le colonne della matrice V sono i vettori colonna (cioè le l-uple colonna) v k = 1, ..., l. La matrice VT sarà dunque formata dai vettori riga    VT =   �T v 1 �T v 2 .. . �T v l    .  Eseguendo il prodotto righe per colonne abbiamo    VT AV =   ed anche �T v v1 1 A� �T v v1 2 A� .. . �T v1 v l A� VT BV �T v v2 1 A� �T v v2 2 A� .. . �T v v2 l A�    =      =      =   ··· ··· ··· �T v v1 1 B� T �2 B� v v1 .. . �T v v1 l B� �T v v2 l B� �T µ1 v v1 l A� 0 µ2 .. . 0 0 �T v vl l A� �T v v2 1 B� T �2 B� v v2 .. . �T µ1 v v1 1 A� �T µ1 v A� 2 v1 .. . µ1 0 .. . �T v vl 1 A� �T v vl 2 A� .. .        =   (5.126)  ··· ··· ··· �T µ2 v v2 1 A� �T µ2 v A� 2 v2 .. . �T v vl 1 B� T �2 B� v vl .. . �T v vl l B� ··· ··· �T µ2 v v2 · · · l A�  ··· 0 ··· 0   ..  . .  · · · µl 1 0 0 1 .. .. . . 0 0 ··· ··· 0 0 .. . ··· 1    ,      =  (5.125) �T µl v vl 1 A� �T µl v A� 2 vl .. . �T µl v vl l A�      Da notare che, siccome la matrice B è definita positiva (è la matrice hessiana di un punto di minimo), ogni µk , k = 1, ..., l, è positivo. La matrice V, soddisfacendo sia la (5.121) che la (5.122), è dunque la matrice che cercavamo. Il teorema spettrale ci fornisce anche il “metodo pratico” per determinare µk , k = 1, ...., l, e quindi calcolare le frequenze delle piccole oscillazioni tramite la (5.124), ed i modi normale, ovvero i vettori colonna v k , k = 1, ...., l. Infatti, la (5.125) può esser così riscritta �k = 0, (B − µk A) v �k �= 0, k = 1, ...., l. Di conseguenza i valori µk si ottengono dove sappiamo che v risolvendo l’equazione det (B − µ A) = 0, (5.128) 206 LEZIONI DI SISTEMI DINAMICI anche detta equazione secolare. Una volta determinati i µk (che sappiamo essere tutti reali), i vettori colonna   vk, 1  vk, 2    �k =  .  , k = 1, ...., l, v  ..  vk, l si ottengono risolvendo il sistema lineare   vk, 1   (B−µk A)  ...  = 0, vk, l (5.129) �k • A� v k = 1, k = 1, ...., l. Assemblando poi gli l con la condizione supplementare v �1 , ..., v �1 , si forma la matrice V secondo la (5.127). I modi normali w � vettori colonna v si ottengono poi applicando la (5.119). Dimostrazione del Teorema spettrale Prima di passare alla dimostrazione vera e propria del teorema spettrale è opportuno premettere il seguente Lemma 5.10.1 Se le matrici A e B soddisfano le ipotesi del teorema spettrale, allora l’equazione in µ (5.128) ha soltanto radici reali. Se poi B è definita positiva allora le radici di (5.128) sono tutte positive. Dim. Il teorema fondamentale dell’algebra ci dice che (5.128) ammette l soluzioni. Vediamo che queste non possono essere complesse. Supponiamo infatti che µ sia una soluzione complessa, e quindi Im (µ) �= 0, di (5.128). Siccome l’equazione (5.128) è a � la l-upla complessa, n � = Re n � + i Im n �, coefficienti reali anche28 µ̄ è soluzione. Sia n corrispondente a µ, cioè soluzione di B� n = µ A� n. (5.130) � = Siccome A e B sono reali, considerando i complessi coniugati, abbiamo che n � = µ̄ An. � Consideriamo adesso � − i Im n � , risolve Bn Re n � = � • An n = � + i Im n � ) • A (Re n � − i Im n �) = (Re n � ) • A (Re n � ) + (Im n � ) • A (Im n �) + (Re n � ) • A (Re n � ) − (Re n � ) • A (Im n � )] . i [(Im n � ) • (Re n � ) = A (Im n �) • � ) • A (Re n � ) = AT (Im n Siccome A è simmetrica, (Im n � ), e dunque il termine in parentesi quadra si annulla. Concludiamo pertanto che (Re n � = (Re n � • An � ) • A (Re n � ) + (Im n � ) • A (Im n � ) > 0. n � �� >0 perchè A è definita positiva 28 Con >0 perchè A è definita positiva µ̄ intendiamo il complesso coniugato di µ, cioè µ̄= Re (µ̄) − i Im (µ̄). (5.131) LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 207 �1, Osserviamo adesso che se µ1 , µ2 , con µ1 �= µ2 , sono due soluzioni di (5.128) e n � 2 , sono le due corrispondenti l-uple, n � 1, � 1 = µ1 A n Bn abbiamo B� n2 = µ2 A� n2 , � 1 • A� � 2 • A� n n2 = n n1 = 0 . Infatti, sfruttando la simmetria di A e B, � 2 • A� � 2 • B� � 1 = µ2 A� �1 n1 = n n1 = B� n2 • n n2 • n µ1 n � 2 • A� = µ2 n n1 , B=BT A=AT � 1 • A� n2 = 0. Ma allora, tornando alla che ci darebbe l’assurdo µ1 = µ2 , se non fosse n � relative a µ e µ̄, ovviamente � e n, (5.131), abbiamo ottenuto un assurdo: due soluzioni n � > 0, anziché n � = 0. Concludiamo quindi che � • An � • An fra loro diversi, danno n una qualunque soluzione µ di (5.128) non può essere complessa. Mostriamo infine che, se B è definita positiva e se µ è soluzione di (5.128), abbiamo � è il vettore colonna (ovviamente non nullo) relativo a µ, cioè µ > 0. Sia infatti se n B� n = µ A� n. Otteniamo T � T�� = µ n �� , Bn An �n �� >0 =⇒ µ > 0. >0 Passiamo adesso alla dimostrazione del teorema spettrale. Si parte dalla (5.128) e si considera una radice µ, che, in virtù del lemma precedente, sappiamo essere reale. Sia � �= 0 il corrispondente vettore colonna di Rl soluzione di quindi v (5.132) B� v = µ A� v. �l , vettori linearmente indipendenti che soddi�1 , . . . , v Vogliamo provare che esistono v sfano la (5.132) in corrispondenza delle soluzioni µ (tutte reali) della (5.128). Osserviamo che la matrice A, essendo simmetrica e definita positiva, ammette una � 1 , ...., a � l , di A, cioè base di l autovettori a A� ai = �j �i • a a = � i , con ρi ∈ R e ρi > 0, i = 1, ..., l, ρi a � j = δij , �T a i a ∀ i, j = 1, ..., l. �l , � 1 , ...., a Costruiamo quindi la matrice P le cui colonne sono i vettori a  T  �1 a T   a � �  �2  �1 a �2 · · · a � l , PT =  .  . P= a  ..  �T a l Evidentemente PT P = PPT = I e    PT AP = D, dove D =   ρ1 0 .. . 0 ρ2 .. . ··· ··· 0 0 .. . 0 0 ··· ρl    ,  (5.133) 208 LEZIONI DI SISTEMI DINAMICI dove tutti i ρi sono positivi. Riscrivendo quindi la (5.132) otteniamo T T � = BPP �, =⇒ µ APP �� v ��v I I che, ponendo � = PT BP PT v �, µ �PT��AP� PT v D PT BP = B1 , e riscriveremo come µDV� = B1 V� . Definiamo adesso D1/2 �, V� = PT v  √ ρ1  .. = . 0 ··· ···    0  ..  , D−1/2 =   .   √  ρl 1 √ ρ1 .. . 0 (5.134) (5.135) ··· ··· 0 .. . 1 √ ρl     ,   ed osserviamo che D1/2 D−1/2 = D−1/2 D1/2 = I, e che D−1/2 DD−1/2 = I. Se moltiplichiamo dunque a sinistra la (5.135) per D−1/2 ed inseriamo fra B1 e V� la matrice identità scritta come I = D−1/2 D1/2 , si ottiene −1/2 1/2 � µD−1/2 D V� = D−1/2 B1 D � ��D � V , (5.136) I che potremo scrivere come µD1/2 V� = B2 D1/2 V� , dove B2 = D−1/2 B1 D−1/2 = (5.134) D−1/2 PT BPD−1/2 . (5.137) Quindi, introducendo � = D1/2 V� , W la (5.136) si riscrive così ⇔ �, V� = D−1/2 W � = µW �. B2 W Ora, tenendo presente la definizione (5.137), è facile provare che B2 è simmetrica. Possiamo quindi�invocare il teorema � spettrale per matrici simmetriche e concludere che esi� 1, . . . , W � l di autovettori a due a due ortogonali cui corrispondono l ste una base W autovalori µk , reali. Scriveremo dunque �k • W � h = δkh . � k = µk W � k , k = 1, ..., l, con W B2 W (5.138) � � � l non sono i vettori {� � 1, . . . , W �l } che stiamo cerv1 , . . . , v Chiaramente i vettori W � � � 1, . . . , W � l . Infatti, cando. Facciamo vedere che questi si ottengono a partire da W ripercorrendo all’indietro i passaggi abbiamo � k = µk W � k, ⇒ D−1/2 PT BP D−1/2 W � k = µk P D1/2 W �k , BP D−1/2 W � �� DD−1/2 LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI cioè 209 � k = µk PDD−1/2 W � k = µk PD PT P D−1/2 W �k . BPD−1/2 W �� I T da cui, ricordando la (5.133) che scriviamo come PDP = A, si ottiene � � � � � k = µk A PD−1/2 W �k . B PD−1/2 W � k , k = 1, . . . , l, che soddisfano la (5.125) Quindi gli l vettori linearmente indipendenti v sono dati da � k , k = 1, 2, ..., l . �k = PD−1/2 W v (5.139) Rimane da dimostrare la (5.126) e che µk > 0, per ogni k = 1, ..., l, se B è definita positiva. Per quel che riguarda la (5.126) abbiamo �h • A� v vk = (5.139) � h • APD−1/2 W �k PD−1/2 W �T � T −1/2 � � h • D−1/2 � h • D−1/2 DD−1/2 W �k = W Wk = W � �� P ��AP�D � �� D I = (5.138) δhk . D−1/2 Infine, per dimostrare che µk > 0, per ogni k = 1, ..., l, quando B è definita positiva, è sufficiente applicare il lemma 5.10.1. Esempio 5.10.1 Consideriamo29 un punto materiale di massa m vincolato senza attrito al piano e soggetto all’energia potenziale di tipo elastico della forma V (x, y) = � k� 2 x + y 2 − α̂xy, 2 con k > 0, α̂ > 0, costanti e dove k > α̂. Le posizioni di equilibrio si ottengono imponendo   kx − α̂y = 0, ∇V (x, y) = 0, ⇒ ⇒ Pe ≡ (0, 0) .  ky − α̂x = 0, Se calcoliamo la matrice hessiana B (Pe ) = � k −α −α k � , deduciamo che Pe è un punto di equilibrio stabile poiché entrambi gli autovalori di B (Pe ) sono positivi (se k > α̂). Scrivendo le equazioni di moto otteniamo   ẍ + ωo2 x − αy = 0, (5.140)  ÿ + ωo2 y − αx = 0, 29 Questo esempio è tratto da L.D. Landau, E. M. Lifsits, Fisica Teorica 1 - Meccanica, Editori Riuniti, 1976. 210 LEZIONI DI SISTEMI DINAMICI dove ωo2 = k/m, e α = α̂/m. Ovviamente ωo2 > α. Il sistema (5.140) può riscriversi come la (5.118) se � � � � � 2 � x 1 0 ωo −α �= u , A= , B= . y 0 1 −α ωo2 Le frequenze proprie (5.124) si ottengono essenzialmente risolvendo l’equazione secolare (5.128), cioè  � 2 �  µ1 = ωo2 − α, ωo − µ −α det = 0, ⇒ µ = −α ωo2 − µ  µ2 = ωo2 + α, � � da cui ω1 = ωo2 − α, ω2 = ωo2 + α. Quindi, ricordando la (5.123), i modi normali sono  �  �� a1 cos ωo2 − αt + φ1    � = w  � , �� 2 a2 cos ωo + αt + φ2 con ak , φk , k = 1, 2, le solite costanti di integrazione da calcolarsi tramite le condi� k , k = 1, 2, risolviamo la (5.129), cioè zioni iniziali. Per determinare i vettori v � 2 �� ωo −α v11 1 0 v11 = µ , 1 −α ωo2 0 1 v12 v12 � 2 �� ωo −α v21 1 0 v21 = µ2 , −α ωo2 0 1 v22 v22 con la condizione supplementare � � �� vk1 1 0 vk1 2 2 • = vk1 + vk2 = 1, k = 1, 2, 0 1 vk2 vk2 � �� A ottenendo   1  1  � � √ √ 1 1 1    2  √ �1 =  12  , v �2 =  v . , ⇒ V = 1  1 −1 2 √ −√ 2 2 Le soluzioni nelle variabili dipendenti originarie x e y sono �  ��      ωo2 − αt + φ1 a1 cos x (t) 1 1   .   = √1   �  �  � 2 y (t) 1 −1 2 a2 cos ωo + αt + φ2 E’ interessante trovare l’espressione dei modi normali in funzione delle variabili x e y. Dalla (5.119) otteniamo �� √ � � � 2 1 1 x (t) x (t) w1 (t) −1 , = =V 1 −1 y (t) w2 (t) y (t) 2 e quindi w1 (t) = x (t) + y (t) √ , 2 w2 (t) = x (t) − y (t) √ . 2 LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI 211 5.10.3 Esempio: la catena di oscillatori In questa sezione vogliamo studiare i modi normali e le frequenze proprie di oscillazione per un sistema meccanico caratterizzato da una Lagrangiana quadratica (per cui non ci sarà bisogno di approssimare la Lagrangiana ma solo di riscriverla utilizzando coordinate lagrangiane centrate nell’equilibrio). Consideriamo un sistema di N punti materiali {Pi , mi }, i = 1, . . . , N , che si muovono senza attrito su una retta orizzontale30 e sono collegati l’uno all’altro da molle le cui masse e lunghezza a riposo sono trascurabili. Questa “catena di oscillatori” è fissata ai punti fissi A e B, posti a distanza L l’uno dall’altro, come mostrato in figura 5.7. La forza totale Fi agente sull’i-esimo punto materiale è data da31 Fi = −ki (xi − xi−1 ) + ki+1 (xi+1 − xi ) , i = 1, ..., N . forza su Pi esercitata da Pi−1 (5.141) forza su Pi esercitata da Pi+1 dove: • kj , j = 1, ..., N + 1, è il coefficiente elastico (o rigidezza) della j-esima molla. In particolare, la molla che collega il primo punto materiale della catena, cioè P1 , al punto A ha rigidezza k1 , mentre quella che la collega l’ultimo punto materiale PN a B ha rigidezza kN +1 . • xr , r = 1, ..., N , indica l’ascissa del punto r-esimo punto materiale. Inoltre, xN +1 = xB = L e x0 = xA sono, rispettivamente, le ascisse dei punti fissi B e A a cui la catena è collegata (vedi figura 5.7). Figura 5.7: Catena di N punti materiali mobili P1 , . . . , PN , di ascisse x1 , . . . , xN . La catena è collegata ai punti fissi A e B, di ascisse xA e xB = L, da molle di rigidezza k1 e kN +1 , rispettivamente. Inoltre i punti materiali mobili sono collegati fra loro da molle le cui rigidezze sono k2 , . . . , kN . Tutte le molle hanno lunghezza a riposo e masse trascurabili. La Lagrangiana del sistema è data da N L= 30 Per 31 P 0 N 1 1 mi ẋ2i − ki+1 (xi+1 − xi )2 . 2 i=1 2 i=0 cui la forza peso non ha nessuna influenza. corrisponde al punto fisso A, mentre PN+1 al punto fisso B. 212 LEZIONI DI SISTEMI DINAMICI Cerchiamo adesso gli eventuali punti di equilibrio. Questi corrispondono alle configurazioni del sistema nelle quali la risultante delle forze agenti su ciascun punto è nulla. Imponiamo pertanto     F = 0, 1    −k1 (x1 − x0 ) − k2 (x1 − x2 ) = 0, .. .. ⇒ (5.142) . .   F = 0, −k (x − x N N N N −1 ) − kN +1 (xN − L) = 0, che scritto in forma esplicita diventa  −(k1 + k2 ) k2 .  k2 −(k2 + k3 ) .   . . .   . . .   . . . 0 0 . −(kN � �� M     x1 −k1 x0 0    .  0 0          . . .  .  =       . .    .       . 0 . xN −kN +1 L + kN +1 ) � � � �� x b Tale sistema ammette una e una sola soluzione poiché la matrice M è invertibile32. La soluzione, che corrisponde all’unica configurazione di equilibrio cercata, è dunque xe = M−1 b. (5.143) Eseguiamo ora il cambio di coordinate qi = xi − xei , i = 1, ...., N, (5.144) dove xei , i = 1, ..., N , è la posizione di equilibrio dell’i-esimo punto materiale (ottenuta dalla (5.143)). Dalla (5.144) otteniamo ẋi = q̇i , mentre la configurazione di equilibrio corrisponderà a qi = 0, i = 1, ..., N . L’energia potenziale V nelle nuove variabili diventa V̂ (q1 , ..., qN ) = N �2 �� 1� ki+1 qi+1 + xei+1 − (qi + xei ) 2 i=0 N = N � �2 1� 1� ki+1 (qi+1 − qi )2 + ki+1 xei+1 − xei 2 i=0 2 i=0 + N � i=0 � � ki+1 (qi+1 − qi ) xei+1 − xei , (5.145) dove abbiamo posto q0 = qN +1 = 0, xe0 = x0 e xeN +1 = L. 32 E’ facile provare che M è invertibile essendo essa una matrice a bande e simmetrica. La dimostrazione si fa per induzione. Definiamo con MN la matrice N × N . Per N = 1 è banale mostrare l’invertibilità, perché M1 = (−(k1 + k2 )). Supponiamo ora che MN sia invertibile e dimostriamo che lo è anche MN+1 . Ricordando che una matrice è invertibile se e solo se ha determinante non nullo, abbiamo det(MN+1 ) = −(kN + kN+1 ) det(MN ) �= 0, ed è dunque chiaro che MN+1 è invertibile. LE EQUAZIONI DI MOTO PER SISTEMI VINCOLATI Se adesso calcoliamo 213 ∂ V̂ per ogni i = 1, ..., N , si ottiene ∂qi � � � � ∂ V̂ = ki (qi − qi−1 ) − ki+1 (qi+1 − qi ) + ki xei − xei−1 − ki+1 xei+1 − xei . � �� ∂qi �� termini che derivano dal primo addendo della (5.145) termini che derivano dal terzo addendo della (5.145) � � � � Tuttavia ki xei − xei−1 − ki+1 xei+1 − xei = 0, poiché xei , i = 1, ..., N , sono proprio le soluzioni del sistema (5.142). Di conseguenza il terzo addendo della (5.145) così come il secondo (che è costante) è del tutto ininfluente ai fini delle equazioni di Lagrange. Possiamo dunque riscrivere la Lagrangiana come N L= N 1� 1� mi q̇i2 − ki+1 (qi+1 − qi )2 , 2 i=1 2 i=0 dove, lo ricordiamo ancora, q0 = qN +1 = 0. Questa Lagrangiana ci dà il seguente sistema di equazioni di Lagrange33 mi q̈i = −ki−1 (qi − qi−1 ) + ki (qi+1 − qi ), i = 1, ...., N, che è appunto un sistema di equazioni lineari del secondo ordine lineari reciprocamente accoppiate. L’idea è quindi quella di disaccoppiare le equazioni tramite un opportuno cambio di variabili, giungendo così ad N equazioni del tipo oscillatore armonico. Se ci limitiamo a considerare il caso in cui tutte le masse siano uguali a m, e tutte le molle abbiano la stessa costante elastica k, allora la Lagrangiana si semplifica e (utilizzando la funzione L = L/m invece della Lagrangiana L) otteniamo L= N N 1 � 2 ω2 � q̇i − (qi+1 − qi )2 , 2 i=1 2 i=0 dove, al solito, ω 2 = k/m. Le equazioni di Lagrange prendono la forma q̈i = −ω 2 (qi−1 − 2qi + qi+1 ) , i = 1, ...., N. Le matrici A e B che intervengono nella scrittura di L nella forma matriciale (5.117) sono rispettivamente la matrice identità e la matrice   −2 1 0 . . . . . . 0  1 −2 1 0 . . . . . 0     0 1 −2 1 0 . . . . 0     . . . . . . . . . .     . . . . . . . . .  2 . . B = −ω  . . . . . . . . .    .  . . . . . . . . . .     0 . . . . 0 1 −2 1 0     0 . . . . . 0 1 −2 1  0 . . . . . . 0 1 −2 33 Con le condizioni aggiuntive q0 = qN+1 = 0. 214 LEZIONI DI SISTEMI DINAMICI Quindi la determinazione dei modi normali e delle loro frequenze è ridotta alla ricerca degli autovettori e degli autovalori della matrice B. E’ facile verificare che gli N autovettori sono dati da srπ ( v s )r = sin , r = 1, . . . , N , s = 1, . . . , N, (5.146) N +1 dove ( v s )r è la r-esima componente del s-esimo autovettore. Il corrispondente autovalore è sπ . (5.147) λs = 2ω 2 1 − cos N +1 Lasciamo come esercizio la verifica che i vettori (5.146) sono effettivamente gli autovettori di B con autovalori λs dati dalla (5.147). Suggerimento: usare le formule di addizione del seno e calcolare s(r − 1)π srπ s(r + 1)π − sin + 2 sin − sin . N +1 N +1 N +1 Nota 5.10.1 Se si scorrono le componenti degli autovettori dalla prima alla N -esima, si osserva che nel primo autovettore (s = 1) tutte le componenti hanno lo stesso segno, mentre nel secondo si hanno metà componenti positive e metà negative (se N è pari, se N = 2M + 1 la componente M -esima è nulla) e in generale il numero di cambiamenti di segno delle componenti è uguale a s − 1. Inoltre il primo autovalore è il più piccolo degli autovalori, che sono una successione crescente, λ1 < λ2 < · · · < λN . Questo significa che le frequenze di oscillazione aumentano all’aumentare di k, ovvero all’aumentare del numero di cambi di segno delle componenti.34 Per chiarire la dinamica di questo sistema, vediamo il caso semplice di due soli punti. In questo caso gli autovettori sono semplicemente 1 1 2 1 = 2 = v con autovalore ω , e v con autovalore 3ω 2 . 1 −1 Nel modo normale associato al primo autovettore, le due masse si muovono oscillando nella stessa direzione e con la stessa frequenza ed ampiezza, mantenendo quindi inalterata la distanza reciproca (uguale alla distanza all’equilibrio). Nel secondo modo invece le due masse oscillano ancora con la stessa frequenza ed ampiezza, ma in due direzioni opposte: in questo caso il centro di massa delle molle resta fermo durante il moto. Il moto generico del sistema è dunque una sovrapposizione (combinazione lineare) di questi due moti. 34 Si veda anche la sezione 44 di F. Gantmacher, Lectures in Analytical Mechanics, MIR 1975. Capitolo 6 Cinematica dei Sistemi Rigidi 6.1 Introduzione In questo capitolo descriveremo come si muove un corpo rigido nello spazio. Un corpo, o sistema, rigido è un insieme di punti materiali vincolati a mantenere inalterate le loro mutue distanze. Lo scopo del capitolo è duplice: da un lato vogliamo determinare la relazione fondamentale che lega le velocità di punti differenti che “partecipano di uno stesso moto rigido” (ovvero si muovono mantenendo inalterate le mutue distanze) rispetto a un osservatore fisso; dall’altro vogliamo trovare le relazioni che legano le osservazioni che due osservatori, in moto tra loro, fanno dei moti di altri “corpi” (punti o corpi rigidi). Quest’ultimo problema prende il nome di cinematica relativa. Con l’espressione osservatore ci riferiamo a un sistema cartesiano ortogonale, con orientamento fissato, cioè nel quale sono determinati: un’origine, un’unità di misura per le lunghezze, tre assi ortogonali orientati (ovvero tra i quali si sia fissato un ordine, per esempio gli assi x, y e z disposti come i diti pollice, indice e medio della mano destra1 , come specificato nella sezione 1.5.1) e un orologio per misurare il tempo. 6.2 Moti rigidi Sia fissato un osservatore, ovvero un sistema di riferimento (SdR) cartesiano ortogonale levogiro centrato in Ω, i cui assi coordinati sono ξ, η e ζ. Indichiamo con Σ = (Ω, ξ, η, ζ) tale SdR, oppure con (Ω, e1 , e2 , e3 ), essendo ei , i = 1, 2, 3, i versori degli assi coordinati, ovvero i versori di una terna ortonormale levogira. L’osservatore Σ viene detto osservatore fisso2 , o sistema di riferimento (SdR) fisso, o terna fissa. Viene poi dato un sistema rigido, che per brevità chiameremo B, di cui vogliamo studiare il moto rispetto all’osservatore Σ. 1 Ricordiamo che, in questo caso, il sistema di riferimento viene detto destrorso, o levogiro. Si ricordi inoltre che un riferimento destrorso e uno non destrorso, cioè sinistrorso, non possono essere sovrapposti mantenendo l’ordine degli assi. 2 Non indichiamo mai esplicitamente la scelta dell’orologio per un osservatore. In questo paragrafo la scelta dell’orologio non è molto importante in quanto l’osservatore fisso è il solo che vede i punti in movimento. Dovremo tornare su questo problema nel caso della cinematica relativa. 216 LEZIONI DI SISTEMI DINAMICI Per prima cosa eliminiamo dalla nostra analisi il caso “degenere” in cui tutti i punti del sistema rigido siano allineati (o ci siano solo due punti). SdR mobile S, solidale con il corpo rigido z ζ y O SdR fisso Σ Ω η x ξ Figura 6.1: Sistema di riferimento - SdR - fisso Σ, e SdR solidale S. Consideriamo quindi un sistema rigido che abbia almeno tre punti non allineati. Siano essi P1 , P2 , e P3 . Al corpo B è possibile associare una terna ortonormale levogira S = (O, x, y, z) di versori i, j, k, costruita nel seguente modo: poniamo O = P1 , i = vers(P2 − P1 ), j = vers(i ∧ (P3 − P1 )) e infine k = i ∧ j. Il sistema di riferimento S, viene anche detto sistema di riferimento (SdR) solidale, o terna solidale, o anche osservatore solidale. Ora, la geometria di B è nota e pertanto conosciamo la posizione di ogni suo punto rispetto al sistema solidale. Quindi ogni P ∈ B è individuato dalla terna x ∈ R3 , data da   x x =  y , z i cui elementi rappresentano le coordinate di P rispetto ad S, ovvero le componenti del vettore (P − O) rispetto a S, x = xi + yj + zk. Con xT si denota, come al solito, la terna trasposta, cioè xT = (x, y, z). Notiamo che una volta determinata la terna solidale, il numero di punti di cui è composto B non ha più importanza: ogni punto P viene ora individuato dalle sue coordinate x, rispetto alla terna solidale3 . Quest’ultime inoltre sono costanti nel tempo. Quindi la posizione dei punti di B nello spazio (e non rispetto alla terna solidale) è determinata dalla posizione della terna solidale stessa. In altre parole: il moto di un sistema rigido nello spazio è equivalente al moto di una terna di riferimento. Infatti, siccome i punti che partecipano al moto rigido di B hanno coordinate (x, y, z) costanti 3 Questa semplice osservazione ha una conseguenza importante: la cinematica dei sistemi rigidi discreti e dei sistemi rigidi continui può essere descritta allo stesso modo. CINEMATICA DEI SISTEMI RIGIDI 217 nel SdR solidale, è sufficiente conoscere la posizione di S rispetto a Σ per localizzare ogni punto del sistema rigido. Abbiamo quindi ridotto il problema del moto rigido al moto relativo di due sistemi di riferimento nello spazio euclideo tridimensionale, ovvero a situare ad ogni istante la terna mobile S rispetto alla terna fissa Σ. A sua volta questo problema si scompone naturalmente nella localizzazione dell’origine O della terna mobile S rispetto alla terna fissa, e all’orientazione dei versori di S rispetto ai versori della terna fissa Σ. 6.2.1 Primo caso: Ω ≡ O Consideriamo dapprima il caso in cui le origini dei due SdR O e Ω rimangono coincidenti. Le coordinate del generico punto P ∈ B, saranno espresse dalla terna x nel SdR S, e dalla terna ξ ∈ R3 ,   ξ ξ =  η , ζ nel SdR Σ, ovvero (P − O) −→   ξ = ξe1 + ηe2 + ζe3 ,  x = xi + yj + zk, rispetto al SdR fisso Σ, rispetto al SdR solidale S. ζ z y O =Ω η ξ x Figura 6.2: Primo caso: Ω ≡ O. Indichiamo con ξ = ̥ (x) , (6.1) l’applicazione da R in R che trasforma le coordinate dal sistema S al riferimento fisso4 Σ. Siccome il corpo è rigido, la distanza fra due punti qualsiasi di B deve essere 3 3 4 Le coordinate dei punti nel sistema S, sono note dal momento che B è dato (cioè si conosce la geometria del corpo). Non sono invece note le coordinate ξ dei punti rispetto al SdR Σ. 218 LEZIONI DI SISTEMI DINAMICI la stessa in entrambe i riferimenti, |ξ 1 − ξ 2 | = |x1 − x2 |, cioè |̥ (x1 ) − ̥ (x2 )| = |x1 − x2 | , (6.2) ̥ (0) = 0, (6.3) ed inoltre dal momento che O rimane sempre coincidente con Ω. Definizione 6.2.1 Un’applicazione da R3 in R3 , che verifica le (6.2) e (6.3), si dice isometria ortogonale. Abbiamo quindi questo importante risultato Teorema 6.2.1 Se ̥ è un isometria ortogonale, allora: 1. ̥ è un applicazione lineare, ovvero possiamo far corrispondere ad ̥ una matrice A, tale che ̥ (x) = Ax. 2. La matrice A è ortogonale (si veda la sezione 1.3), cioè AT = A−1 , e di conseguenza det A = ±1. (6.4) Dim5 . E’ facile provare che l’isometria ̥ conserva il prodotto scalare. Infatti, 2 2 |̥ (x1 ) − ̥ (x2 )| = |x1 − x2 | , implica 2 2 2 2 |̥ (x1 )| + |̥ (x2 )| − 2̥ (x1 ) · ̥ (x2 ) = |x1 | + |x2 | − 2x1 · x2 , |x1 |2 |x2 |2 e dunque ̥ (x1 ) · ̥ (x2 ) = x1 · x2 . La linearità si prova mostrando che ∀ x1 e x2 di R3 , e per ogni coppia di numeri reali m, n, sia ha ̥ (mx1 + nx2 ) = m̥ (x1 ) + n̥ (x2 ) , ovvero che |̥ (mx1 + nx2 ) − m̥ (x1 ) − n̥ (x2 )| = 0. La dimostrazione di questo passaggio viene lasciata per esercizio. Quindi se ̥ è lineare e ̥ (0) = 0, allora ̥ (x) = Ax , dove A è un matrice 3 × 3. Notiamo inoltre che la matrice A è sicuramente invertibile. Infatti, siccome |Ax| = |x|, abbiamo Ax = 0 se e solo se x = 0. Il punto 2 si ottiene provando che AT A = I, (6.5) 5 La dimostrazione del presente teorema è ripresa da Giuseppe Benfatto, Note del Corso di Meccanica Analitica, Università di Roma “Tor Vergata”, a.a. 2007-08. CINEMATICA DEI SISTEMI RIGIDI 219 essendo I la matrice identità. Per la dimostrazione6 della (6.5) rimandiamo alla sezione 1.3. Di conseguenza, moltiplicando a destra per A−1 ambo i membri della (6.5), abbiamo AT = A−1 . Infine, sempre dalla (6.5) � � 2 1 = det I = det AT A = �det��AT� det A = (det A) , det A da cui deriva banalmente la (6.4). La condizione ̥ (x1 ) · ̥ (x2 ) = x1 · x2 , comporta la conservazione degli angoli. Infatti, se θ1 è l’angolo fra ̥ (x1 ), ̥ (x2 ), e θ2 è l’angolo fra x1 , x2 , abbiamo  ̥ (x1 ) · ̥ (x2 ) = |̥ (x1 )| |̥ (x2 )| cos θ1   � ��  |x1 ||x2 | x1 · x2 = |x1 | |x2 | cos θ2    ⇒ cos θ1 = cos θ2 , da cui θ1 = ± θ2 . E dunque, considerando gli angoli privi di segno, θ1 = θ2 . Vediamo adesso come determinare la matrice A. Consideriamo le immagini mediante ̥ delle terne rappresentanti i versori i, j e k (ovvero le componenti in Σ dei versori di S)             1 α1 α2 α3 0 0 ̥  0  =  β1  , ̥  1  =  β2  , ̥  0  =  β3  . 0 γ1 γ2 γ3 0 1 � �� i j k Ora, data la linearità di ̥ abbiamo ̥ (xi + yj + zk) Quindi 6 La = x̥ (i) + y̥ (j) + z̥ (k)       α1 α2 α3 = x  β1  + y  β2  + z  β3  γ1 γ2 γ3    x α1 α2 α3 =  β1 β2 β3   y  . z γ1 γ2 γ3  α1 A =  β1 γ1 α2 β2 γ2  α3 β3  . γ3 dimostrazione è immediata se ricordiamo che ̥ (x2 ) · ̥ (x2 ) = x1 · x2 . Abbiamo infatti Ax1 · Ax2 = AT Ax1 · x2 = x1 · x2 , da cui discende (6.5). (6.6) 220 LEZIONI DI SISTEMI DINAMICI Ne segue che la relazione fra terne (6.1) si potrà esplicitamente scrivere come      x ξ α1 α2 α3 ξ = Ax, ⇔  η  =  β1 β2 β3   y  . z γ1 γ2 γ3 ζ Il cambiamento dal SdR solidale S al SdR fisso Σ, è completamente descritto dalla matrice A. In generale le componenti di A dipenderanno dal tempo, dal momento che l’orientazione dei versori i, j e k rispetto a Σ può variare nel tempo. Scriveremo pertanto A = A (t), intendendo   α1 (t) α2 (t) α3 (t) A (t) =  β1 (t) β2 (t) β3 (t)  (6.7) γ1 (t) γ2 (t) γ3 (t) Osserviamo che la condizione (6.5) rappresenta un “vincolo” sulle nove componenti della matrice A (tale concetto verrà approfondito nella sezione 6.2.3). Infatti i versori devono soddisfare la condizione di ortonormalità, ovvero le equazioni i · i = 1, j · j = 1, k · k = 1, i · j = 0, j · k = 0, k · i = 0, (6.8) che si traduce nelle sei7 condizioni date dalla (6.5), ovvero Ai · Aj = 0, A j · Ak = 0, Ak · Ai = 0, Ai · Ai = 1, A j · Aj = 1, Ak · Ak = 1. (6.9) Com’è noto, le matrici 3 × 3 che soddisfano la condizione (6.5), ovvero AT = A−1 , sono dette ortogonali. Ora, siccome stiamo studiando moti continui dello spazio, possiamo escludere le matrici a determinante negativo (che rappresentano un moto rigido più un ribaltamento speculare: quest’ultimo infatti non è riconducibile con continuità, attraverso moti rigidi, all’identità, che, a sua volta, indica lo “stato di partenza”)8 e limitarci alle matrici a determinante uguale a uno, det A = +1. (6.10) Vediamo adesso un’importante teorema, usualmente noto come teorema di Eulero. Teorema 6.2.2 Sia A una matrice ortogonale, A �= I. Allora esiste x ∈ R3 , x �= 0, definita a meno di una costante moltiplicativa (ovvero esiste una direzione individuata dal vettore associato alla terna x) per cui Ax = x. 7 La (6.11) (6.5) dà luogo a sei equazioni indipendenti, e non nove, dal momento che AT A è simmetrica. altre parole, e in modo più formale: prendiamo la posizione a un certo istante come “configurazione di riferimento”. Possiamo sempre orientare gli assi del sistema fisso in modo che questi coincidano con gli assi solidali. Avremo quindi A(0) = I. La (6.4) ci dice che, al variare del tempo A(t) può assumere solo i valori 1 e −1. Ma il determinante è una funzione continua delle componenti della matrice, pensata come un elemento di R3×3 , quindi non può passare con continuità dal valore iniziale 1 al valore −1. 8 In CINEMATICA DEI SISTEMI RIGIDI 221 Dim. Innanzitutto osserviamo che A non ammette autovalori nulli9 . Proviamo adesso che se λ è un autovalore reale di A, ovvero se Az = λz con λ ∈ R, allora |λ| = 1. Dalla (6.5) infatti 2 T 2 |z|2 = z · z = z·A A z = A z· Az = λ |z| . I Abbiamo quindi dimostrato che tutti gli autovalori reali di A hanno modulo unitario. Supponiamo adesso che λi , i = 1, 2, 3, siano i tre autovalori di A. La (6.10) comporta 1 = det A = λ1 λ2 λ3 . (6.12) Si hanno quindi due casi: 1. Due autovalori sono complessi, diciamo λ1 e λ2 , mentre λ3 ∈ R e, per quanto visto, |λ3 | = 1. Siccome gli autovalori sono radici dell’equazione a coefficienti reali det (A − λI) = 0, λ1 e λ2 sono uno il complesso coniugato dell’altro. Ne segue λ1 λ2 = |λ1 |2 . Riscrivendo la (6.12) abbiamo |λ1 |2 λ3 = 1, e dunque, per evitare contraddizioni nei segni, deve essere λ3 = 1. Evidentemente i tre autovettori non possono essere tutti e tre complessi per il fatto che, come già detto, le radici di det (A − λI) = 0 sono coppie di numeri complessi coniugati. 2. Tutti e tre gli autovalori sono reali e inoltre |λi | = 1, i = 1, 2, 3. In tal caso necessariamente almeno uno deve essere uguale a +1. Dunque, in entrambi i casi esiste un autovalore λ = 1, cui corrisponde (a meno di una costante moltiplicativa) un autovettore x che soddisfa la (6.11). In sostanza il teorema di Eulero afferma che esiste una retta r, eventualmente dipendente dal tempo, i cui punti sono invarianti per l’applicazione di A: ovvero un qualunque vettore (P − O) ∈ r è rappresentato in S ed in Σ dalla medesima terna. Non solo, ma valgono anche le seguenti proprietà: (a) Detto Po un qualsiasi punto di r, individuato dalla terna xo in S, il piano π⊥r per Po ortogonale ad r è descritto nel sistema S dalla equazione (x − xo ) · ν = 0, essendo ν il versore di r. Consideriamo adesso Ax, e mostriamo che soddisfa la stessa equazione, cioè (Ax − xo ) · ν = 0. Infatti10 T 0 = A A(x−xo )·ν = A (x − xo )· Aν = (Ax − Axo )·ν = (Ax − xo )·ν . I ν Questo vuol dire che, comunque si scelga una generica terna x di S, Ax è giace sullo stesso piano ortogonale ad r su cui giace x. 9 Se 10 Si A avesse autovalori nulli la (6.10) sarebbe contraddetta. ricordi che Axo = xo , come del resto Aν = ν. 222 LEZIONI DI SISTEMI DINAMICI (b) Consideriamo ancora il generico punto Po della retta r, ed il solito piano π⊥r passante per Po . Sia q una generica retta giacente su tale piano e passante per Po , la cui direzione è individuata, in S, dal versore q. Quindi, nel SdR S, l’equazione parametrica della retta q è x − xo = µq, essendo µ ∈ R, il parametro. Proviamo adesso che q è trasformata, nel SdR Σ, in un’altra retta. Infatti x − xo = µq, ⇒ T A A (x − xo ) = µq. I Quindi moltiplicando a sinistra per A si ha A (x − xo ) = µAq, ⇒ Ax − Axo = µAq , ξ ξo che è l’equazione parametrica, nel SdR Σ, di una retta di direzione Aq. (c) Mostriamo infine che, data una qualsiasi retta q di π⊥r per Po , l’angolo fra q e Aq è indipendente dalla retta selezionata. Infatti, consideriamo un’altra retta p, diversa da q, giacente sempre sul piano π⊥r e passante per Po . Sia β l’angolo che p forma con la retta q. Ora, siccome l’applicazione A conserva gli angoli, l’angolo fra Aq e Ap è sempre β. Di conseguenza, riferendoci alla figura 6.3 se θq è l’angolo fra la retta q e la retta Aq, e θp è quello fra p e Ap, abbiamo θq + β = θp + β, ⇒ θp = θq . Si conclude quindi che, dato un generico x, l’angolo fra (x − xo ) e A (x − xo ), è indipendente da x. Quindi, volendo riformulare alla luce delle proprietà (a), (b) e (c) l’enunciato del teorema di Eulero si potrebbe renderlo come: dati due sistemi di riferimento (nello specifico il SdR S ed il SdR Σ) è sempre possibile sovrapporre il primo al secondo con un’unica rotazione intorno ad un opportuno asse. Infatti: (i) l’applicazione rappresentata dalla matrice A lascia invariate lunghezze ed angoli; (ii) le terne x (ovvero le coordinate dei punti) che giacciono su r non vengono mutate dalla rotazione; (iii) le coordinate dei punti che non stanno sulla retta r sono comunque trasportate in altre terne che giacciono nel medesimo piano ortogonale ad r; (iv) le rette del piano π⊥r , passanti per il punto Po sono “mappate” in altre rette; (v) l’angolo, misurato sul piano π⊥r , fra x e Ax, è indipendente da x. L’asse di rotazione si individua determinando l’autovettore di A relativo all’autovalore λ = 1, mentre l’angolo di rotazione si determina calcolando la traccia della matrice11 A. Infatti, tornando alla notazione del teorema di Eulero, se λ3 = 1, gli altri due autovalori di A, saranno12 λ1 = eiα , e λ2 = e−iα , con α ∈ R. Abbiamo quindi13 trA = 3 λi = 1 + 2 cos α. (6.13) ι=1 11 Riferendoci alla (6.6), trA = α1 + β2 + γ3 . che la formula di Eulero per i numeri complessi di modulo unitario afferma che, per ogni numero reale α, si ha eiα = cos α + i sin α. Osserviamo anche che il caso λ2 = λ1 = −1, corrisponde a α = π. 13 Si ricorda che gli autovalori, la traccia ed il determinante della matrice A, risultano indipendenti dalla base. Se infatti avessimo scelto un diverso SdR fisso Σ′ ed un diverso SdR mobile S ′ , avremmo ottenuto una matrice A′ diversa da A (ma ad essa collegata tramite una trasformazione di similitudine). Tuttavia gli autovalori di A′ sono gli stessi di A, ed inoltre det A = det A′ , trA =trA′ . 12 Ricordiamo CINEMATICA DEI SISTEMI RIGIDI θp 223 θq β β Piano θp + β =θp + β, π ⊥r ⇒ θ p = θq Figura 6.3: L’angolo fra due rette viene conservato. Se adesso si sceglie come SdR fisso quello in cui la direzione della retta invariante r coincide con l’asse ζ, la matrice A è data da  cos θ A =  sin θ 0 − sin θ cos θ 0  0 0 , 1 (6.14) essendo θ, l’angolo di cui la coppia di versori i, j è ruotata rispetto ai versori e1 , e2 . Calcolando la traccia di A data da (6.14), e confrontando con (6.13), otteniamo α = θ, (6.15) e quindi α va identificato con l’angolo di rotazione. Osserviamo però che per definire univocamente l’angolo di rotazione θ è necessario definire una convenzione. Noi adotteremo la seguente: scelto il verso positivo della retta invariante r come quello di k, se la rotazione avviene in senso antiorario rispetto al verso di k, allora θ è positivo, altrimenti è negativo. Va infine osservato che l’uguaglianza (6.15), data l’invarianza della traccia, assume carattere generale e non si riferisce soltanto al caso in cui la retta r è parallela a k. Nota 6.2.1 In definitiva il teorema di Eulero dà anche la regola per passare, mediante semplici operazioni, dal SdR Σ al SdR S. Lavorando nel SdR Σ, si individua la retta r (autodirezione relativa all’autovalore λ = 1) ed un qualsiasi piano π⊥r . Poi, selezionato un qualsiasi punto P ∈ π⊥r , si ruota P attorno ad r dell’angolo α (che essenzialmente si trova calcolando trA). In questo movimento P trascina con sé il sistema rigido e quindi anche gli assi cartesiani. Al termine della rotazione il SdR ottenuto è proprio S. 224 LEZIONI DI SISTEMI DINAMICI 6.2.2 Secondo caso: Ω �= O Consideriamo ora il caso particolare in cui14 O, origine del SdR S, e Ω origine del SdR Σ, non sono coincidenti. Il generico punto P ∈ B, è individuato, rispetto al SdR S dal vettore (P − O), la cui espressione è data dalla terna x. Lo stesso punto P viene individuato, rispetto al SdR Σ dal vettore (P − Ω), la cui espressione, sempre relativa a Σ, è data dalla terna ξ. Consideriamo poi il SdR Σ′ , i cui assi si mantengono sempre paralleli a quelli di Σ, e la cui origine coincide con O (v. figura 6.4). Denotiamo con ξ P la terna che rappresenta il vettore (P − O) rispetto al SdR Σ′ . La relazione che lega ξP e x sarà sempre      x ξp α1 α2 α3 ξP = Ax, ⇔  ηp  =  β1 β2 β3   y  , z ζp γ1 γ2 γ3 dove A è la matrice di rotazione di cui abbiamo parlato nella precedente sezione. Quindi, la relazione vettoriale (P − Ω) = (P − O) + (O − Ω) , (6.16) ξ = ξ O + ξP = ξO + Ax, (6.17) si traduce nella seguente relazione fra terne   ξO dove ξ O =  ηO , è la terna che rappresenta il vettore (O − Ω) nel SdR Σ. OsζO serviamo che nella (6.17) ξ O = ξO (t), come A = A (t), nel senso della (6.7), mentre x non dipende dal tempo (essendo la terna che, nel SdR S solidale col corpo rigido, rappresenta il vettore (P − O)). 6.2.3 Gradi di libertà di un corpo rigido Dato un corpo rigido B, col termine gradi di libertà intendiamo il numero di variabili indipendenti necessarie per determinare univocamente la sua posizione nello spazio (si tratta quindi del numero di gradi libertà anche secondo la definizione data nella sezione 4.1). Quindi, siccome è nota la struttura geometrica di B, ovvero sono note, rispetto ad un SdR solidale, tutte le coordinate x dei punti che lo compongono, dalla (6.17) si deduce che determinare la posizione di un qualsiasi punto di B rispetto ad un SdR fisso Σ è necessario: • conoscere la posizione di almeno un punto O solidale con B; ovvero la terna ξO , e questi sono tre parametri indipendenti; • conoscere la rotazione descritta dalla matrice A. Per quanto riguarda la matrice A, a priori sembrerebbe che fossero necessari 9 parametri per determinarla. Tuttavia, è ben noto che per descrivere una rotazione sono sufficienti solo tre parametri: l’angolo di rotazione (un parametro); e l’asse di rotazione (due parametri). Quest’ultimo è determinato infatti dal versore che ne dà la direzione. Abbiamo infatti il seguente teorema 14 Si ricorda che O è solidale con il corpo rigido B. CINEMATICA DEI SISTEMI RIGIDI 225 Σ‘ P Σ S Ο Ω Figura 6.4: Secondo caso: Ω �= O. Il SdR Σ′ ha l’origine in O, ma mantiene gli assi costantemente paralleli a quelli di Σ. Teorema 6.2.3 La matrice A può essere espressa in termini di soli tre parametri indipendenti. Dim. Le 9 componenti della matrice di rotazione A si trovano esplicitate nella formula (6.6). Di esse però non tutte sono indipendenti: ovvero ben 6 possono essere espresse in termini di soli tre parametri indipendenti. Infatti A deve soddisfare la relazione (6.5), che quindi rappresenta un vincolo per le 9 componenti. In pratica, la (6.9) è un insieme di sei vincoli indipendenti (si veda la sezione 4.1 del capitolo 4) che legano fra loro le componenti αi , βi , γi , i = 1, 2, 3. Tali equazioni consentono di esprimere sei coefficienti in termini di soli tre parametri indipendenti (che, come visto nella sezione 4.1, sono detti parametri lagrangiani). Per semplicità svolgiamo la dimostrazione nel caso in cui A sia una matrice 2 × 2, cioè nel caso in cui si abbia a che fare con un corpo rigido piano che si muove sul piano. In questo semplice caso α1 α2 A= , β1 β2 dove −1 ≤ αi ≤ 1, i = 1, 2, e −1 ≤ βi ≤ 1, i = 1, 2. Ovviamente (6.18) det A = α1 β2 − α2 β1 > 0, mentre la condizione (6.5) si traduce in α1 β1 α1 α2 α21 + β12 = α2 β2 β1 β2 α1 α2 + β1 β2 α1 α2 + β1 β2 α22 + β22 = 1 0 0 1 , 226 LEZIONI DI SISTEMI DINAMICI ovvero nelle seguenti 3 equazioni che i coefficienti α1 , α2 , β1 e β2 devono soddisfare  2  α1 + β12 = 1, α1 α2 + β1 β2 = 0, (6.19)  2 α2 + β22 = 1. Ora, applicando il teorema delle funzioni implicite al sistema (6.19) possiamo stabilire quando è possibile utilizzare una sola variabile per esplicitare le altre 3 (ovvero quando le tre equazioni di (6.19) sono indipendenti). Leggendo (6.19) come   F1 (α1 , α2 , β1 , β2 ) = 0, F2 (α1 , α2 , β1 , β2 ) = 0,  F3 (α1 , α2 , β1 , β2 ) = 0, se        ∂F1 ∂α1 ∂F2 ∂α1 ∂F3 ∂α1 ∂F1 ∂β1 ∂F2 ∂β1 ∂F3 ∂β1 ∂F1 ∂α2 ∂F2 ∂α2 ∂F3 ∂α2 ∂F1 ∂β2 ∂F2 ∂β2 ∂F3 ∂β2    2α1    α2 =  0  2β1 β2 0 0 α1 2α2  0 β1  , 2β2 (6.20) ha rango massimo, cioè 3, allora (almeno localmente) sarà possibile esplicitare tre variabili in funzione della quarta. Se consideriamo15 α2 �= 0, il determinante delle prime tre colonne di (6.20) dà   2α1 2β1 0 β2 α1  = 4α2 det A �= 0. det  α2 (6.18) 0 0 2α2 Infatti, possiamo riscrivere (6.19) come  2  β1 = 1 − α21 , α2 α2 = β12 β22 ,  22 1 β2 = 1 − α22 , ⇒  2  β1 = 1 − α21 , α2 = 1 − α21 ,  22 β2 = α21 , (6.21) e quindi usare α1 come parametro indipendente ed esprimere gli altri 3 in funzione di esso. Di fatto, al posto di α1 è molto più pratico usare l’angolo di rotazione θ, θ ∈ [0, 2π), come variabile (o parametro lagrangiano) tramite cui esprimere αi , βi , i = 1, 2. Utilizzando dunque l’angolo θ, otteniamo α1 = cos θ, β1 = sin θ, α2 = − sin θ, e β2 = cos θ, e quindi � � cos θ − sin θ A= . (6.22) sin θ cos θ Nel caso in cui A sia una matrice 3 × 3, si procede nello stesso modo (adesso i calcoli sono decisamente più complicati). Si individuano tre parametri indipendenti che, come 15 Il caso α2 = 0 implica, in virtù del sistema (6.19), 1 0 A= . 0 1 CINEMATICA DEI SISTEMI RIGIDI 227 visto nel capitolo 4, sono tre parametri lagrangiani e si esprimo tutti i coefficienti αi , βi , γi , i = 1, 2, 3, in funzione di essi. Di fatto, cioè, non si adoperano tre dei nove coefficienti αi , βi , γi , i = 1, 2, 3, in quanto, come nella (6.21), i legami funzionali sono di tipo quadratico e quindi difficilmente utilizzabili. Si preferisce quindi usare altri tre parametri, i cosiddetti angoli di Eulero (che saranno illustrati nella sezione 6.4), ed esprimere tramite essi i coefficienti della matrice A. In sostanza quanto fino ad ora detto ci porta a concludere che un sistema un sistema rigido che si muove nello spazio ha 6 gradi di libertà: le tre coordinate dell’origine O del sistema mobile; ed i tre parametri indipendenti tramite cui si definisce la matrice A. Infatti, come abbiamo visto, le nove componenti della matrice A sono vincolate a “muoversi” sulla sottovarietà determinata dalle equazioni (6.5) (o meglio nella componente connessa che soddisfa anche alla disequazione detA > 0). Questo insieme, che ha la struttura di gruppo rispetto al prodotto tra matrici, si indica con la sigla16 SO(3), � � SO (3) = M ∈ R3×3 | MMT = I, det M = +1 . In definitiva, l’insieme delle possibili “configurazioni” che un sistema di riferimento “mobile” può assumere rispetto a un sistema di riferimento “fisso” è parametrizzato dai punti dell’insieme R3 × SO(3), che risulta essere una varietà differenziabile di dimensione 6. Nota 6.2.2 Il prodotto tra matrici non è commutativo. Infatti, date due matrici A e B, in generale AB �= BA. Questo è vero anche per due matrici generiche di SO(3). Come si interpreta ciò in termini di moti rigidi? 6.3 Formula fondamentale del moto rigido La velocità di un corpo rigido varia, in generale, da punto a punto. Per tal motivo si parla di campo di velocità o atto di moto. L’atto di moto è infatti definito come un’applicazione che ad ogni punto del corpo associa la sua velocità. Rifacendoci a quanto detto nell’introduzione, la velocità delle particelle di B è quella misurata dall’osservatore solidale con il SdR fisso Σ centrato in Ω. Quindi, considerando la (6.17) e derivandola abbiamo        ξ ξ α α2 α3 x d   d  O d  1 η = (6.23) ηO + β1 β2 β3   y  , dt dt dt ζ z ζO γ1 γ2 γ3 dove  α d  1 β1 dt γ 1 α2 β2 γ2  · ·   · α1 (t) α2 (t) α3 (t) α3 · ·  ·  β3  =  β 1 (t) β 2 (t) β 3 (t)  , · · · γ3 γ 1 (t) γ 2 (t) γ 3 (t) 16 Il numero 3 sta a indicare la dimensione della matrice (e quindi dello spazio su cui agisce come matrice di trasformazione), O sta per “ortogonale” e significa che le matrici devono soddisfare la (6.5) e infine S sta per “speciale” indicando che si prendono solo le matrici con determinante positivo. 228 LEZIONI DI SISTEMI DINAMICI dx = 0, dal momento che x rappresenta la terna delle coordinate del punto P e dove dt rispetto al SdR solidale S (che quindi non variano nel tempo). Rimarchiamo ancora che la derivata a primo membro della (6.23) è la velocità del punto P misurata da Σ, e ugualmente la derivata di (ξO , ηO , ζO )T è la velocità del punto O rispetto al SdR Σ.   x y  la Possiamo ora riscrivere la relazione (6.23) inserendo tra dA e il vettore dt z matrice identità scritta nella forma AT A, cosicché abbiamo       � � ξ ξ x d   d  O dA T η = ηO + A A y  . (6.24) dt dt dt ζ z ζO � �� ξP   x Ricordiamo infatti che ξ P = A y  è la terna delle componenti del vettore geomez trico (P − O) espresse rispetto al SdR Σ (ovvero le differenze tra le coordinate di P e quelle di O calcolate da Σ). Osserviamo inoltre che se si sceglie un punto diverso da O come origine del riferimento solidale (mantenendo però gli stessi versori i, j, k) dA T la matrice A che compare nella formula non cambia. Possiamo quindi dire che dt la distribuzione di velocità di tutti i punti di un sistema rigido si ottiene dalla formula dA T (6.24) quando si conosca la velocità di un punto solidale e la matrice A . dt dA . Derivando la Osserviamo infine una caratteristica fondamentale della matrice dt relazione (6.5) si ha � �T dA T dA T dAT dA A +A = A +A = 0. (6.25) dt dt dt dt Ricordando che ABT = (BAT )T , possiamo riscrivere la (6.25) come �T � dA T dA A =− A , dt dt ovvero la matrice dA T A è una matrice antisimmetrica. Indichiamola con dt   0 −ω3 ω2 dA T  ω3 0 −ω1  , A = dt −ω2 ω1 0 e riscriviamo la (6.24) come      0 ξ˙ ξ˙O η̇  = η̇O  +  ω3 −ω2 ζ̇O ζ̇ −ω3 0 ω1   ξP ω2 −ω1  ηP  . 0 ζP (6.26) (6.27) (6.28) CINEMATICA DEI SISTEMI RIGIDI Se adesso estraiamo dalla matrice (6.27) la terna17   ω1 ω =  ω2  , ω3 229 (6.29) e ricordiamo la definizione del prodotto vettoriale fra terne (1.15), è immediato verifidA T care che il risultato del prodotto tra la matrice antisimmetrica A e la terna ξ p nella dt (6.28) è identico al prodotto vettoriale fra le terne ω e ξp , cioè � � dA T A ξp = ω ∧ ξp . (6.30) dt Possiamo quindi riscrivere la (6.28) così: ξ̇ = ξ̇ O + ω ∧ ξ p . (6.31) A questo punto però vengono spontanee le seguenti domande18: i. La terna ω, o meglio le componenti della “colonna” (6.29) rappresentano veramente le componenti di un vettore? In altre parole, esiste un vettore ω, le cui componenti sono date dalla terna ω? E, nel caso in cui il vettore ω esistesse, gli elementi della terna (6.29) sono le componenti del vettore ω rispetto a quale SdR? ii. Ammesso che esista il vettore ω, questo è intrinseco all’atto di moto oppure dipende dai SdR Σ, S, e dalle origini Ω, O? Se ω esiste ed è un vettore che dipende soltanto dal moto del sistema rigido, allora (6.31) può essere scritta nella notazione “vettoriale” (la cui forma cioè è indipendente dal SdR19 ) d (O − Ω) d (P − Ω) = + ω ∧ (P − O), (6.32) dt dt detta formula fondamentale del moto rigido. Il vettore ω è detto velocità angolare del corpo rigido, o anche velocità angolare istantanea del corpo rigido. Teorema 6.3.1 La velocità di un punto P del sistema rigido B rispetto al SdR Σ è data dalla formula (6.32), dove ω è un vettore (o meglio uno “pseudovettore”), le cui componenti nel SdR Σ vengono estratte dalla matrice (6.27) secondo la (6.29). Il vettore ω può dipendere, in generale, dal tempo, ma è univocamente determinato dal moto del corpo B rispetto a Σ. 17 Sottolineiamo ancora che ω denota semplicemente tre numeri messi in colonna. Questo aspetto delicato verrà chiarito nel seguito. 18 Si veda anche: Giuseppe Benfatto, Note del Corso di Meccanica Analitica, Università di Roma “Tor Vergata”, a.a. 2007-08. 19 La (6.32) non è una relazione vettoriale in senso stretto. Essa infatti mantiene la sua forma solo per cambiamenti di coordinate ortogonali (cioè se solo se si passa da un sistema ortonormale a un altro sempre ortonormale); questo perché sia la definizione di ω sia quella di prodotto vettoriale fanno intervenire la struttura metrica dello spazio euclideo, ovvero la definizione di ortogonalità, e l’orientazione, cioè l’ordine in cui si considerano i versori della terna. Spesso, per essere più corretti, si usa l’espressione “pseudovettoriale” per riferirsi a relazioni che si conservano solo per trasformazioni ortogonali con determinante positivo. 230 LEZIONI DI SISTEMI DINAMICI Dim. La dimostrazione di questo teorema fondamentale verrà svolta nei seguenti passi: 1. Dapprima mostriamo che i tre elementi della (6.29) rappresentano le componenti, rispetto al SdR Σ, di un vettore che appunto abbiamo indicato con ω. Facciamo poi vedere che tale vettore non dipende né da Σ né dal centro Ω. 2. Proviamo poi che ω è indipendente sia dal SdR S che da O. Passo 1. Ricordiamo che una terna ordinata di R3 rappresenta effettivamente le componenti di un vettore se, nel cambiamento da un SdR ad un altro, soddisfa una ben precisa regola di trasformazione. In sostanza se u e u′ sono due terne che rappresentano rispettivamente nei SdR Σ e Σ′ lo stesso vettore allora u′ = Qu, (6.33) dove Q è la matrice del cambio di base da Σ a Σ′ . Viceversa se vale la (6.33) allora le terne u e u′ sono, rispettivamente nel SdR Σ e nel SdR Σ′ , le terne delle componenti del medesimo vettore20. Quindi per dimostrare che le componenti della (6.29) sono effettivamente le componenti di un vettore dobbiamo provare che ω soddisfa la condizione di trasformazione (6.33) quando si considera un diverso SdR. In quest’ottica consideriamo, come in figura 6.5, un altro SdR fisso Σ′ centrato in Ω′ �= Ω. Sia Q la matrice del cambiamento di riferimento da Σ a Σ′ . Abbiamo P − Ω′ = (Ω − Ω′ ) + (P − Ω) = (Ω − Ω′ ) + (O − Ω) + (P − O) . (6.34) Se denotiamo con ξ ′ la terna delle componenti del vettore (P − Ω′ ) rispetto al SdR Σ′ , questa può essere espressa in due modi equivalenti  ′ Ax ) = ξ Ω′ + QξO + Qξp ,   ξΩ + Q(ξ O + ��  ξp (6.35) ξ′=    ′ ξΩ + Qξ O + ξ p′ , dove ξ p′ è la terna delle componenti del vettore (P − O) rispetto a Σ′ , mentre, lo stesso vettore (P − O) è rappresentato dalla terna ξp nel SdR Σ. Di conseguenza, le terne ξp′ e ξ p sono collegate dalla relazione ξ p′ = Qξp . (6.36) Osserviamo poi che, se x è la terna delle componenti del vettore (P − O) rispetto al SdR solidale S, le terne ξ p′ e ξ p sono legate ad x tramite ξ p′ = Bx, ξ p = Ax, (6.37) dove B è la matrice di rotazione di S rispetto al SdR fisso Σ′ , mentre, come sappiamo, A è la matrice di rotazione fra S e Σ. Infine, si rimarca che nella (6.35) né Q né ξ Ω′ (terna delle componenti del vettore (Ω − Ω′ ) rispetto al SdR Σ′ ) dipendono dal tempo. 20 In caso contrario, cioè se ω non rappresentasse alcun vettore, ci ritroveremmo con importanti limitazioni all’uso della (6.31). Per esempio, la somma di ω 1 e ω 2 , ricavate in due riferimenti diversi, non risulterebbe definita. CINEMATICA DEI SISTEMI RIGIDI 231 O P S SdR solidale con il corpo rigido Σ SdR fisso Ω Σ‘ SdR fisso Ω’ Figura 6.5: Il primo SdR fisso Σ è centrato in Ω, il secondo SdR fisso Σ′ centrato in Ω′ �= Ω. Calcoliamo adesso la velocità di P rispetto a Σ′ derivando la (6.35). Evidentemente dQ = 0, e = 0, in quanto Σ e Σ′ sono fissi. Abbiamo dunque dt dt dξ Ω′  � � dξp dξ dξ   Q O +Q = Q O + Q ω ∧ ξp ,   dt dt dt      ′ � � dξ dξ p′ dB T dξO dξ dξ O = + = Q + B (Bx) = Q O + ω ′ ∧ Qξp , Q  dt  � �� dt dt (6.37) dt dt dt ��    ξp′ ξp′    � ��  ′ ω ′ ∧ξp dB T B . Confrontando dove ω ′ è la “colonna” associata alla matrice antisimmetrica dt adesso le due espressioni otteniamo � � Q ω ∧ ξp = ω ′ ∧ Qξp . Ora se Q ∈SO (3), cioè se Q è una matrice ortogonale con determinante uguale a +1, 232 LEZIONI DI SISTEMI DINAMICI vale la seguente uguaglianza21 � � Q ω ∧ ξ p = Qω ∧ Qξ p , da cui deduciamo (6.38) ω ′ = Qω, (6.39) ovvero che ω ′ e ω trasformano come specificato nella (6.33). Possiamo quindi affermare che ω ′ e ω sono le terne che rappresentano le componenti del vettore ω nei SdR Σ′ e Σ, , rispettivamente. Di fatto la prova dell’esistenza del vettore ω si basa sulla (6.38), che però non è vera per tutte le trasformazioni invertibili, ma soltanto per quelle di SO (3). Per tal motivo non possiamo propriamente affermare che le terne ω ′ e ω rappresentano le componenti di un vettore ω. Per esser più precisi infatti parliamo di “pseudovettore” ω. Inoltre, il fatto che ω si trasformi secondo la (6.33) implica che il vettore ω non dipende dal particolare SdR fisso (purché ortogonale) né dal punto dove lo stesso è centrato. Infatti considerando un SdR fisso Σ′ , diverso da Σ, abbiamo ottenuto una terna ω′ che è collegata ad ω dalla (6.39). Ciò vuol dire che le due terne sono le componenti dello stesso vettore. Quest’ultimo dunque non varia se si passa dal SdR Σ centrato in Ω, al SdR Σ′ centrato in Ω′ . Resta da provare che ω non dipende dal SdR S, né dal centro O. Questo verrà fatto nel passo successivo. Passo 2. Mostriamo per prima cosa che ω non dipende dal SdR solidale. Faremo tale dimostrazione provando che ω non dipende dal SdR solidale. Consideriamo infatti un altro riferimento solidale S ′ , diverso da S, sempre centrato in O. Indichiamo con x e x′ le terne delle componenti di (P − O) nei SdR S e S ′ . Quindi, ricordando la (6.17), scriveremo  SdR S,  A (t) x, ξ (t) = ξ O (t) + ξ p (t) , dove ξ p (t) = (6.40)  C (t) x′ , SdR S ′ , dove C è la matrice di rotazione tra il SdR fisso Σ e il SdR solidale S ′ . Derivando rispetto al tempo la (6.40) abbiamo dξ p dξ dξ = O + , dt dt dt dove � �  dA dA T   x= A Ax ,  ��  dt dt   ξp  dξ p = � �  dC dt  dC T  ′  x = C Cx′ ,   ��  dt dt SdR S, SdR S ′ . ξp 21 Questo è un punto delicato, infatti la (6.38) vale soltanto per le matrici di SO (3). In generale, se F è un matrice invertibile, abbiamo T Fu ∧ Fw = (det F) F−1 (u ∧ w) . E’ chiaro che tale formula si riduce alla (6.38) nel caso in cui F ∈ SO (3), dal momento che det F = 1 e −1 T F = F. CINEMATICA DEI SISTEMI RIGIDI Dal confronto si ottiene 233 dA T dC T A = C , e quindi rammentando la (6.27), dt dt   0 −ω3 ω2 dC T  ω3 0 −ω1  . C = dt −ω2 ω1 0 Si conclude pertanto che il vettore ω non dipende dal SdR solidale dal momento che due SdR solidali distinti hanno dato origine alla stessa terna ω. Terminiamo la dimostrazione con la verifica che il vettore ω è indipendente dal punto solidale O. Lavoriamo direttamente con la formula vettoriale (6.32), considerando un altro punto solidale O′ , diverso da O, e su di esso centriamo un SdR solidale, come mostrato in figura 6.6. O P O’ Ω Figura 6.6: Si considerano due SdR solidali. Il primo centrato in O, il secondo centrato in O′ �= O. Se indichiamo con ω′ la velocità angolare relativa alla scelta di O′ , vogliamo provare che ω ′ = ω. A tal fine consideriamo dapprima il centro O scrivendo d (P − Ω) d (O − Ω) = + ω ∧ (P − O). dt dt Se invece consideriamo il centro O′ , scriveremo d (O′ − Ω) d (P − Ω) = + ω′ ∧ (P − O′ ). dt dt Ora O′ è solidale con il corpo rigido e dunque d (O′ − Ω) d (O − Ω) = + ω ∧ (O′ − O), dt dt (6.41) 234 LEZIONI DI SISTEMI DINAMICI mentre (P − O) = (O′ − O) + (P − O′ ) . Quindi  d (O − Ω)   + ω ∧ (P − O)   dt      = d (P − Ω) =  d (O′ − Ω) dt    + ω ′ ∧ (P − O′ ) =    dt   Per confronto si ottiene d (O − Ω) + ω ∧ (O′ − O) dt +ω ∧ (P − O′ ) , d (O − Ω) + ω ∧ (O′ − O) dt +ω′ ∧ (P − O′ ). (ω − ω ′ ) ∧ (P − O′ ) = 0, che, dovendo valere per ogni punto P , implica ω − ω ′ = 0, ovvero il vettore ω non dipende neanche dal centro O del SdR solidale. Nota 6.3.1 Osserviamo che la formula (6.50) implica che la distanza fra i punti del sistema rigido rimane invariata. Infatti, se P1 e P2 sono due punti del sistema rigido 2 d (P1 − P2 ) dt = = = d [(P1 − O) − (P2 − O)] = dt 2 (P1 − P2 ) · [ω ∧ (P1 − O) − ω ∧ (P2 − O)] = 2 (P1 − P2 ) · 2 (P1 − P2 ) · [ω ∧ (P1 − P2 )] = 0. Nota 6.3.2 Vale la pena anche illustrare brevemente un approccio, diverso da quello seguito, che porta ad introdurre il vettore ω. Tale approccio ha il pregio di condurre direttamente al vettore ω, evitando il passaggio dalle terne, ma, a nostro avviso, ha il difetto di non mettere subito in evidenza due importanti fatti: il primo è che, in realtà, ω è uno pseudovettore mentre il secondo è la stretta relazione fra ω e la matrice A. Vediamo comunque come si procede secondo questa seconda via. Si lavora nel SdR S e qui si osserva che i · i = 1, j · j = 1, k · k = 1, i · j = 0, i · k = 0, j · k = 0. (6.42) (6.43) Se adesso consideriamo i versori i, j, k, nel SdR Σ, questi variano nel tempo essendo solidali col corpo in movimento. Derivando rispetto al tempo le relazioni di (6.42) otteniamo di di · i = 0, =⇒ = ω 1 ∧ i, (6.44) dt dt dj dj · j = 0, =⇒ = ω2 ∧ j, (6.45) dt dt dk dk (6.46) · k = 0, =⇒ = ω 3 ∧ k, dt dt CINEMATICA DEI SISTEMI RIGIDI 235 dove ωi , i = 1, 2, 3, sono vettori a priori diversi fra loro. Derivando poi la prima relazione di (6.43) otteniamo 0= di dj ·j +i· dt dt = (ω 1 ∧ i) · j+ (ω 2 ∧ j) · i, (6.44) (6.45) ed espressioni analoghe per le altre due relazioni. Scambiando l’ordine del prodotto scalare e del prodotto vettoriale e raccogliendo abbiamo 0 = (ω 1 − ω 2 ) · (i ∧ j) = (ω 1 − ω2 ) · k, ⇒ ω 1 · k = ω2 · k. Eseguendo lo stesso procedimento con le espressioni ottenute derivando i · k = 0, e j · k = 0, abbiamo ω2 · i = ω3 · i, ω 3 · j = ω 1 · j. Come si vede, per ognuno dei vettori ω i resta non soggetta a condizioni solo una componente: ω 1 · i, ω2 · j, ω 3 · k. Ora nulla vieta di giocare sull’arbitrarietà di queste componenti e sceglierle in modo che ω1 · i ω2 · j ω3 · k = = = ω2 · i ω3 · j ω1 · k = = = ω3 · i, ω1 · j, ω2 · k . Ma queste relazioni equivalgono a dire che esiste un unico vettore, appunto il vettore velocità angolare, tale che ω = ω1 = ω 2 = ω3 . In particolare, ricordando (6.44), (6.45) e (6.46) otteniamo una relazione che fornisce ω in funzione delle derivate dei versori del SdR S, i∧ di dj dk +j∧ +k∧ = 2ω . dt dt dt A questo punto, ricordando che (P − O) = xi + yj + zk, abbiamo d (P − O) di dj dk =x +y +z = ω ∧ (xi + yj + zk) dt dt dt dt (P −O) da cui la (6.41) discende facilemente. La comparsa del vettore (o “pseudovettore”) ω ha un che di artificioso. Tuttavia il suo significato cinematico può essere reso più chiaro. Per semplificare la trattazione consideriamo il caso in cui il moto sia una rotazione attorno ad un asse fisso che, per esempio, coincide con l’asse ζ nel sistema fisso Σ e con l’asse delle z nel sistema solidale S. In questo moto tutti i punti che giacciono sull’asse delle z sono fermi mentre gli altri punti descrivono, rispetto al SdR Σ, delle circonferenze che giaccciono su piani perpendicolari all’asse ζ ed hanno centro su di esso. Si indica θ (t) l’angolo 236 LEZIONI DI SISTEMI DINAMICI dA(t) , associate a questo moto rigido di rotazione22 (con segno). La matrici A(t) e dt hanno la forma (si veda anche (6.22))     cos θ (t) − sin θ (t) 0 −θ̇ sin θ (t) −θ̇ cos θ (t) 0 dA(t) A(t) =  sin θ (t) cos θ (t) 0  , =  θ̇ cos θ (t) −θ̇ sin θ (t) 0  . dt 0 0 1 0 0 0 (6.47) È immediato verificare che   0 −θ̇ 0 dA(t) A(t) =  θ̇ 0 0  , dt 0 0 0 e pertanto il vettore velocità angolare è rappresentato,nel SdR23 Σ, dalla seguente terna   0 (6.48) ω =  0  , ⇔ ω = θ̇e3 . θ̇ Concludiamo che ω ha per direzione l’asse di rotazione, per modulo il valore assoluto della velocità angolare (rapporto tra angolo percorso e tempo di percorrenza) e per verso quello di e3 (ovvero ζ crescenti) o −e3 (ζ decrescenti) a seconda che la rotazione avvenga concordemente o non con l’orientazione degli assi (ovvero portando e1 su e2 , o viceversa). La rotazione si dirà uniforme se vengono descritti angoli uguali in tempi uguali cioè se θ (t) = ωt + θo , con ω costante. Se la rotazione avviene attorno ad un asse fisso individuato dal versore n, la generalizzazione della (6.48) è ω = θ̇n. (6.49) Qualche considerazione sulle notazioni. Sovente, e lo faremo anche noi nel seguito, la formula vettoriale (6.32) viene, per brevità, denotata così v(P ) = v(O) + ω ∧ (P − O), (6.50) ˙ Ω) rappresenta la velocità del punto P rispetto all’osservatore dove: v(P ) = (P − · fisso; v(O) = (O − Ω) denota la velocità, sempre rispetto al medesimo osservatore fisso, del punto O solidale con il corpo rigido B; ω rappresenta il vettore (o meglio lo “pseudovettore”) velocità angolare. Riprendendo le frasi iniziali di questo paragrafo, la (6.50) mette bene in luce quanto affermato: la velocità dei punti che costituiscono un sistema rigido varia da punto a punto. In particolare, ricordando la definizione di atto di moto come l’applicazione che ad ogni punto del sistema associa la sua velocità (rispetto ad un determinato SdR fisso), la (6.50) è proprio l’atto di moto del sistema rigido. Per concludere, consideriamo la terna delle componenti di ω rispetto al SdR S. Indichiamo tale terna con ω S , che è così collegata ad ω: ω =Aω S , 22 Cioè ω S = AT ω . (6.51) l’angolo di cui la coppia di versori i, j è ruotata rispetto ai versori e1 , e2 . che in questo caso particolare ω = ωk, ovvero ω è rappresentato dalla stessa terna anche nel 23 Notiamo SdR S. ⇔ CINEMATICA DEI SISTEMI RIGIDI 237 dA T A è la matrice antisimmetrica che dà origine alla terna Ci chiediamo adesso, se dt ω, qual’è la matrice antisimmetrica che dà luogo alla terna ω S ? La risposta a tale domanda sarà utile quando calcoleremo proprio ωS a partire dagli angoli di Eulero nella sezione 6.4. Premettiamo il seguente: Lemma 6.3.1 Se S è una matrice antisimmetrica cui corrisponde il vettore24 w, allora per ogni matrice B ∈ SO (3), al vettore Bw, corrisponde la matrice antisimmetrica BSBT . Dim. Si ricorda che, ∀ terna y ∈ R3 , vale la seguente uguaglianza Sy = w ∧ y. Considerando adesso la matrice antisimmetrica BSBT , avremo T BSBT y = B SBT y = B w ∧ BT y = Bw ∧ BB y = Bw ∧ y. (6.38) I Quindi, ∀ y ∈ R3 , abbiamo dimostrato BSBT y = Bw ∧ y, ovvero che alla matrice antisimmetrica BSBT è associato il vettore (o meglio lo “pseudovettore”) Bw e viceversa. dA T A , e considerando come matrice dt T T di SO (3) la matrice A , abbiamo che al vettore A ω, ovvero ad ω S , è associato alla matrice dA T dA dA T T T T A A A A = AT . = AT A dt dt dt B I BT Applicando il lemma alla matrice antisimmetrica S Il tutto quindi può essere riassunto in questo semplice schema dA T A dt −→ ω dA AT dt −→ ωS dove ω S = AT ω. (6.52) Notiamo che tale risultato ribadisce ancora la coerenza intrinseca dalla (6.23). Infatti esprimiamo tale formula nel SdR S, cioè dA AT ξ̇ = AT ξ̇O + AT x, dt ω S ∧x che appunto fornisce, nel SdR S, le componenti del vettore velocità di P misurata · dall’osservatore Σ. Infatti ad AT A associamo proprio la terna ω S che, coerentemente, è costituita dalle componenti di ω rispetto al SdR S. 24 Inteso come terna di R3 . 238 LEZIONI DI SISTEMI DINAMICI Nota 6.3.3 Il teorema di Eulero, come abbiamo sottolineato, afferma che è sempre possibile sovrapporre il SdR S al SdR Σ (o meglio al SdR Σ′ ) eseguendo un’unica rotazione intorno ad un’opportuna retta. Ci chiediamo adesso: in che relazione stanno l’asse di rotazione ed il vettore ω ? Se ω = ω (t) n, con n costante nel tempo allora ω è parallelo all’asse di rotazione del teorema di Eulero. Infatti, è sufficiente selezionare il SdR Σ ed il SdR solidale S in modo che i versori degli assi ζ e z coincidano con n, per ottenere la matrice A nella forma (6.47), da cui ricavre ω = ω (t) e3 , ed e3 = k, cioè e3 è l’autovettore di A relativo all’autovalore λ = 1 (e quindi è proprio l’asse di rotazione del teorema di Eulero). Se invece ω non ha direzione costante, allora, in generale, ω non è parallelo all’asse di rotazione del teorema di Eulero. Questo discende direttamente dalla (6.52): le terne delle componenti del vettore ω rispetto al SdR Σ e al SdR S sono diverse. Quindi ω non è, in generale, autovettore relativo all’autovalore λ = 1 della matrice A. 6.4 Angoli di Eulero Abbiamo visto che il moto rigido è parametrizzato dai “punti” dello spazio R3 ×SO(3). I primi tre parametri, in R3 , sono le coordinate dell’origine O del sistema solidale rispetto al SdR fisso Σ. Gli altri tre parametri dovranno determinare l’orientamento degli assi di S rispetto agli assi del sistema Σ, o meglio, la posizione dei tre versori di S rispetto a Σ′ , che è il SdR con origine in O ed assi costantemente paralleli a quelli di Σ (v. figura 6.4). Il moto di S rispetto a Σ′ è quindi equivalente a quello di un moto rigido con un punto che resta fisso. Un tale moto prende il nome di precessione. Fissiamo quindi una posizione mutua di S e Σ′ e supponiamo che, in questa configurazione, gli assi dei due sistemi non siano sovrapposti e, in particolare, non coincidano i due assi ζ e z (vedi figura 6.7). Vogliamo far vedere che possiamo riportare il sistema “fisso” Σ′ a coincidere con quello “mobile” S mediante tre opportune rotazioni: gli angoli di queste rotazioni forniranno i parametri cercati. ζ z y θ η ψ ϕ linea dei nodi ξ x Figura 6.7: Angoli di Eulero. CINEMATICA DEI SISTEMI RIGIDI 239 Poiché gli assi ζ e z non coincidono, i piani ζ = 0 e z = 0 si intersecano in una retta detta linea dei nodi. Sia n il versore di questa retta, orientato in modo che la terna k, n e e3 (cioè i versori dell’asse z, della linea dei nodi, e dell’asse delle ζ) sia positivamente orientata. Ovviamente la linea dei nodi sta sia sul piano (ξ, η), che sul piano (x, y) . Pertanto indichiamo con ψ l’angolo che e1 , cioè l’asse ξ, forma con n, e con φ l’angolo i, cioè l’asse x, forma con la linea dei nodi. Sia poi θ l’angolo formato fra gli assi z e ζ. Nota 6.4.1 La dimostrazione della possibilità di rappresentare una generica rotazione fra due SdR tramite la composizione ordinata di 3 rotazioni elementari è dovuta, ancora una volta, ad Eulero. I tre angoli di cui ruotare sono detti angoli di Eulero. Tuttavia oltre a dover specificare i valori dei 3 angoli è necessario specificare quali siano gli assi attorno ai quali devono essere effettuate le rotazioni elementari. La scelta di tali assi è libera, cosicché esistono diverse possibilità. Nella presente sezione abbiamo scelto come assi quelli individuati dai versori k, n ed e3 . Essa viene anche detta ZXZ, dal nome degli assi intorno ai quali, di volta in volta, si effettuano le singole rotazioni. Infatti, come spiegheremo in dettaglio nel seguito, partendo dal SdR Σ, si ruota dapprima attorno ad e3 (l’asse “ z ” di Σ), poi una volta ottenuto il nuovo SdR si ruota attorno a quello che sarebbe l’asse x di tale nuovo SdR. Si ottiene così un altro SdR e, come ultimo passo, si ruota attorno all’asse z di quest’ultimo SdR. Questo è il motivo per cui tale scelta degli assi di rotazione è convenzionalmente chiamata ZXZ. Le altre possibili scelte sono XZX, XYX, YXY, YZY, ZYZ, XZY, XYZ, YXZ, YZX, ZYX e ZXY. Le 12 sequenze sono ottenute tramite tutte le disposizioni possibili in cui assi uguali non sono consecutivi. Vediamo come determinare AT , così che x = AT ξ, che corrisponde, come detto, a passare dalla terna Σ′ alla terna S. Tale passaggio si fa mediante l’applicazione di tre successive rotazioni (cui corrispondono tre distinte matrici di rotazione): 1. Prima rotazione (in senso antiorario, scelto come positivo) di un angolo ψ, attorno all’asse e3 , in modo che e1 vada a coincidere con n. Si passa quindi dal SdR (e1 , e2 , e3 ) al SdR (e′1 ≡ n, e′2 , e′3 ≡ e3 ), la cui matrice è data da25 (e1 , e2 , e3 ) −→ (e′1 , e′2 , e′3 ) matrice Aψ , (e′1 , e′2 , e′3 ) −→ (e1 , e2 , e3 ) matrice AT ψ , con  cos ψ Aψ =  sin ψ 0 − sin ψ cos ψ 0  0 0 , 1  cos ψ  − sin ψ AT = ψ 0 sin ψ cos ψ 0  0 0 . 1 2. Seconda rotazione di un angolo θ, detto angolo di nutazione (sempre in verso antiorario e quindi positivo) attorno all’asse e′1 che coincide con linea dei nodi. 25 Si ricordi che secondo la nostra convenzione (terna in Σ) = A (terna in S) . 240 LEZIONI DI SISTEMI DINAMICI Si passa da (e′1 ≡ n, e′2 , e′3 ) al SdR (e′′1 ≡ e′1 , e′′2 , e′′3 ) ottenendo la seguente matrice matrice Aθ , (e′1 , e′2 , e′3 ) −→ (e′′1 , e′′2 , e′′3 ) con � � ′′ e′′1 , e2 , e′′3 −→ (e′1 , e′2 , e′3 )  1 Aθ =  0 0 0 cos θ sin θ  0 − sin θ  , cos θ matrice AT θ ,  1 0  = 0 cos θ AT θ 0 − sin θ  0 sin θ  . cos θ 3. La terza rotazione, di un angolo φ, detto angolo di rotazione propria (sempre in verso positivo antiorario) attorno al versore e′′3 (che rimane quindi invariato). Si passa da (e′′1 , e′′2 , e′′3 ) al SdR S, ovvero (i, j, k ≡ e′′3 ), � � ′′ e′′1 , e2 , e′′3 −→ (i, j, k) matrice Aφ , (i, j, k) −→ (e′′1 , e′′2 , e′′3 ) con  cos φ − sin φ Aφ =  sin φ cos φ 0 0  0 0  1 matrice AT φ ,  cos φ sin φ  − sin φ cos φ AT = φ 0 0  0 0 . 1 La matrice AT (che consente di trasformare le terne di Σ′ in terne di S) è dunque T T A T = AT φ Aθ Aψ , mentre la matrice che permette di passare dalle terne di S a quelle espresse in Σ′ (cioè la matrice A) è data da � �T � � T T T A = AT = AT = Aψ Aθ Aφ , φ Aθ Aψ cioè26  cos φ cos ψ − cos θ sin φ sin ψ A =  cos φ sin ψ + cos θ cos ψ sin φ sin θ sin φ − cos ψ sin φ − cos θ cos φ sin ψ cos θ cos φ cos ψ − sin φ sin ψ cos φ sin θ  sin θ sin ψ − cos ψ sin θ  . cos θ Da essa poi si ricava l’espressione del vettore ω nel SdR solidale S: la terna27 ω S . Ricordando poi lo schema (6.52), alla terna ωS è associata alla matrice antisimmetrica 26 Tra gli angoli di Eulero e le orientazioni del corpo rigido esiste una corrispondenza solo localmente biunivoca. Infatti, si osservi che quando l’asse ζ coincide con z (θ = 0 e θ = π) non si può più definire la linea dei nodi perché il piano solidale x, y e il piano fisso ξ, η sono sovrapposti; in tale caso (che escludiamo dalle nostre considerazioni) è sufficiente l’unico parametro ψ per descrivere l’orientazione reciproca delle due terne. Questo “difetto” è inevitabile, qualsiasi sia il sistema di parametri si scelga per determinare la posizione di S, in quanto l’insieme SO(3), i cui punti sono in corrispondenza 1-1 con le posizioni di S, non ammette sistemi coordinate globali (come accade ad esempio per la superficie di una sfera). 27 L’espressione di ω in S, cioè la terna ω , risulta particolarmente utile nell’ambito della dinamica dove è S vien fatto uso delle componenti del momento angolare rispetto ad una base solidale e dove l’energia cinetica viene calcolata lavorando nel sistema S. CINEMATICA DEI SISTEMI RIGIDI AT 241 dA . Cominciamo quindi col calcolare dt dA dAθ dAφ dAψ = A θ A φ + Aψ A φ + Aψ A θ . dt dt dt dt (6.53) E’ facile provare, svolgendo esplicitamente i calcoli, che   0 −ψ̇ 0 dAψ = Aψ Jψ̇ , dove Jψ̇ =  ψ̇ 0 0 , dt 0 0 0   0 0 0 dAθ = Aθ Jθ̇ , dove Jθ̇ =  0 0 −θ̇  , dt 0 θ̇ 0   0 −φ̇ 0 dAφ = Aφ Jφ̇ , dove Jφ̇ =  φ̇ 0 0  . dt 0 0 0 In particolare, le tre matrici Jψ̇ , Jθ̇ e Jφ̇ sono matrici antisimmetriche cui possiamo associare, in base alla regola (6.27), le seguenti terne       0 0 θ̇ Jψ̇ → ψ̇ =  0  , Jθ̇ → θ̇ =  0  , Jφ̇ → φ̇ =  0  . (6.54) ψ̇ 0 φ̇ Quindi, sfruttando la notazione appena introdotta e la (6.53), abbiamo � � dA T = (Aψ Aθ Aφ ) Aψ Jψ̇ Aθ Aφ + Aψ Aθ Jθ̇ Aφ + Aψ Aθ Aφ Jφ̇ AT dt = T T AT φ Aθ J Aθ Aφ + Aφ Jθ̇ Aφ + Jφ̇ . � �� ψ̇ (Aθ Aφ )T Ora, rammentando il lemma 6.3.1 dimostrato nella precedente sezione, otteniamo le seguenti associazioni tra matrici antisimmetriche e terne   0 � �T T T T T 0  (Aθ Aφ ) Jψ̇ (Aθ Aφ ) −→ (Aθ Aφ ) ψ̇ = AT , φ Aθ ψ̇   θ̇ � � T T T −→ AT AT 0 , φ Jθ̇ Aφ φ θ̇ = Aφ 0 mentre alla matrice Jφ̇ associamo direttamente la terna φ̇ come specificato nella (6.54). Abbiamo quindi         0 0 θ̇ cos φ + ψ̇ sin θ sin φ θ̇ T  0  +  0  =  ψ̇ cos φ sin θ − θ̇ sin φ  . 0  + AT ω S = AT φ Aθ φ ψ̇ 0 φ̇ φ̇ + ψ̇ cos θ (6.55) 242 LEZIONI DI SISTEMI DINAMICI Procedendo in modo simile si trovano le componenti di ω nel SdR Σ, ovvero la terna ω. Infatti dA T A dt = ( dAψ dAθ dAφ T T A θ A φ + Aψ A φ + Aψ A θ )AT φ Aθ Aψ dt dt dt � �� Aψ J · Aθ J · ψ = θ Aφ J · φ T T T T T Aψ Jψ̇ AT ψ + Aψ Aθ Jθ̇ Aθ Aψ + Aψ Aθ Aφ Jφ̇ Aφ Aθ Aψ , a cui si associa la terna         0 0 θ̇ cos ψ + φ̇ sin θ sin ψ θ̇ ω = Aψ  0 +Aψ Aθ  0 +Aψ Aθ Aφ  0  =  θ̇ sin ψ − φ̇ cos ψ sin θ  . ψ̇ 0 φ̇ ψ̇ + φ̇ cos θ (6.56) Notiamo che avremmo ottenuto la stessa espressione se avessimo usato la relazione ω = AωS . Nota 6.4.2 Riprendendo quanto illustrato nella nota 6.3.3, rimarchiamo ancora come, nel caso generale, ω non sia parallelo all’asse di rotazione del teorema di Eulero. Confrontando le terne (6.55) e (6.56) risulta evidente che le componenti del vettore ω sono diverse nei due SdR. Quindi ω non è, in generale, un autovettore della matrice A relativo all’autovalore λ = 1. Lo diventa quando ω = ω S , cioè quando, per esempio, θ ≡ 0, φ ≡ 0 e la rotazione, di un angolo ψ, avviene attorno all’asse e3 , che così rimane coincidente con l’asse z del SdR S. 6.5 Asse istantaneo di moto, rigate del moto Vogliamo ora determinare come è fatto il campo di velocità, o meglio l’atto di moto, determinato dalla formula (6.50). Fissiamo un istante t e indichiamo con v(P ) la velocità di un punto solidale P a questo istante. Moltiplicando scalarmente la (6.50) per il vettore ω/ |ω| otteniamo v(P ) · ω ω = v(O) · , |ω| |ω| (6.57) che ci dice che la componente della velocità nella direzione di ω è la stessa per tutti i punti solidali, ovvero per ogni P ∈ B, � � ω ω v � = v(P ) · . |ω| |ω| Quindi, per ogni punto P vale la seguente scomposizione nella direzione parallela ad ω ω (individuata dal versore |ω| ) ed in quella ortogonale v (P ) = v� �� uguale ∀ P + v (P )⊥ , dove v (P )⊥ = v (P ) − v � , (6.58) CINEMATICA DEI SISTEMI RIGIDI 243 o meglio, ricordando ancora la (6.50), v (P )⊥ = v (O)⊥ + ω ∧ (P − O) , � �� (6.59) v (Q) = v � , ∀ Q ∈ asse istantaneo del moto. (6.60) vettore ⊥ ω � � ω ω , componente di v (O) con v (O)⊥ = v (O) − v (O)� = v (O) − v(O) · |ω| |ω| ortogonale ad ω. Al variare di P solo la componente di v(P ) ortogonale alla direzione di ω, ovvero il vettore v (P )⊥ , può cambiare. Mostriamo che esiste una intera retta, detta asse istantaneo del moto, di punti solidali28 Q tali che v (Q)⊥ = 0, e quindi v(Q) si riduce a Nota 6.5.1 Si osserva che la definizione di asse istantaneo di moto coincide con la definizione di asse centrale data nella sezione 1.5.2. Scrivendo le (6.58) (6.59) per tali punti abbiamo v (Q) = = v � + v (Q)⊥ v� �� componente � ω e, imponendo v (Q)⊥ = 0, otteniamo + v (O)⊥ + ω ∧ (Q − O) , �� componente ⊥ ω v (O)⊥ + ω ∧ (Q − O) = 0. (6.61) Possiamo riscrivere l’equazione (6.61) considerando la rappresentazione matriciale della velocità angolare      ξQ 0 −ω3 ω2 v1 (O)⊥  ω3 0 −ω1  ηQ  = −  v2 (O)⊥  , (6.62) −ω2 ω1 0 ζQ v3 (O)⊥     v1 (O)⊥ ξQ dove  ηQ  sono le componenti del vettore (Q − O) rispetto al SdR Σ e  v2 (O)⊥  ζQ v3 (O)⊥ quelle del vettore v (O)⊥ , nel medesimo SdR. Ora, il sistema (6.62) può essere visto come un sistema lineare non omogeneo di tre equazioni (6.62) nelle incognite ξQ , ηQ , ζQ . La matrice del sistema ha rango 2 (salvo quando ω = 0) e la condizione ω · v (O)⊥ = 0, garantisce che anche la matrice completa   0 −ω3 ω2 −v1 (O)⊥  ω3 0 −ω1 −v2 (O)⊥  −ω2 ω1 0 −v3 (O)⊥ 28 In generale non è detto che i punti Q facciano parte del corpo rigido B. Può accadere che Q ∈ / B, pur restando solidali con B. 244 LEZIONI DI SISTEMI DINAMICI abbia ancora rango 2. Infatti, comunque si selezioni una matrice 3 × 3 che contenga l’ultima colonna, quando se ne calcola il determinante si ottiene ωi (ω · v (O)⊥ ), i = 1, 2, 3, e quindi si annulla. Ne segue che (6.62) ammette ∞1 soluzioni: ovvero una retta. In particolare, se consideriamo due soluzioni (Q1 − O) e (Q2 − O), il vettore (Q1 − Q2 ) giace sulla retta. Ma siccome   v (O)⊥ + ω ∧ (Q1 − O) = 0, ω ∧ (Q1 − Q2 ) = 0, =⇒  sottraendo v (O)⊥ + ω ∧ (Q2 − O) = 0, otteniamo che l’asse istantaneo di moto è parallelo a ω. asse istantaneo del moto v( P2 ) v( P1 ) v v Q v v (P1 ) P1 v (P2 ) P2 Figura 6.8: Il punto Q sta sull’asse istantaneo del moto. Per ogni punto P vale la scomposizione v (P ) = v � + v ⊥ (P ). La componente v � è uguale per tutti i punti ed è pari alla velocità dei punti giacenti sull’asse istantaneo del moto. Sull’asse istantaneo di moto la velocità rispetto a Σ assume il minimo modulo e coincide con v � , ovvero ha la stessa direzione dell’asse istantaneo di moto, come mostrato in fig. 6.8. Quindi l’asse del moto “scivola” lungo la sua giacitura, o meglio la velocità dei punti materiali che ivi giacciono è parallela all’asse. Infatti, dalla (6.58) si ha � �2 |v (P )|2 = �v � � + |v (P )⊥ |2 , � � poiché v � · v (P )⊥ = 0. Dunque, per ogni P ∈ B, |v (P )| ≥ �v � �, ed il valor minimo verrà assunto da quei punti P per cui v (P )⊥ = 0, che sono proprio i punti che giacciono sull’asse istantaneo di moto. Bisogna però ricordare che i vettori ω e v(O) sono variabili nel tempo, e quindi anche la posizione dell’asse di moto varia nel tempo CINEMATICA DEI SISTEMI RIGIDI 245 e i punti (solidali) che si trovano sull’asse ad un istante t2 sono diversi da quelli che ci si trovavano all’istante t1 . Ciò giustifica l’aggettivo “istantaneo”. Fissato t, la retta che descrive l’asse istantaneo di moto nel SdR Σ, può essere data in forma parametrica   ξ = ξ (µ, t) , η = η (µ, t) , (6.63)  ζ = ζ (µ, t) , dove µ ∈ R è il parametro che descrive la retta a t fissato, e t è il tempo. Al variare di t si ottengono, come dicevamo, rette diverse. Se poi consideriamo il sistema (6.63) con t e µ entrambe variabili in R, si ottiene l’equazione parametrica di una superficie (si rimanda alla sezione 4.1.3 per le superfici date in forma parametrica). Tale superficie è una rigata, in quanto costituita da rette, e viene detta rigata fissa. L’equazione della stessa superficie (6.63) nel SdR solidale S si ottiene riscrivendo l’equazione (6.62) nel SdR S. Quindi, se   ξQ ξ Q =  ηQ  ζQ   xQ denota la terna delle componenti di (Q − O) nel SdR Σ, la terna xQ =  yQ , zQ delle componenti del medesimo vettore nel SdR solidale S è data da x Q = AT ξ Q . Applicando la matrice AT alla (6.62) otteniamo � � 0 = AT v (O)⊥ + AT ω ∧ ξ Q = AT v (O)⊥ + ω s ∧ xQ , �� (6.38) �� AT ω (6.64) AT ξ Q che è appunto l’equazione dell’asse istantaneo di moto nel SdR S. Evidentemente tale retta varia nel tempo e descrive una superficie che viene detta rigata mobile. Esempio 6.5.1 Riprendiamo l’esempio 4.1.2 considerando un disco di raggio R che rotola senza strisicare lungo l’asse ξ, come mostrato in figura 6.9. La velocità angolare è ω = ωe3 , con ω = ϕ̇. Di conseguenza, siccome il moto avviene nel piano (ξ, η), v � = 0, e v = v ⊥ . L’asse istantaneo del moto è dunque la retta dove v ⊥ = 0. Se Q è un generico punto del disco, le componenti del vettore (Q − Ω) rispetto al SdR Σ sono (Q − Ω) = ξe1 + ηe2 . Ricordando il vincolo di rotolamento puro (4.14), abbiamo (O − Ω) = −Rϕe1 + Re2 , e pertanto, siccome (Q − O) = (Q − Ω) − (O − Ω), si ha     ξQ ξ − Rϕ  ηQ  =  η − R  . ζQ 0 (6.65) 246 LEZIONI DI SISTEMI DINAMICI η y O ϕ ϕ R ξ Ω C x Figura 6.9: Disco che rotola di rotolamento puro. (O, x, y) è il SdR solidale S. Le coordinate nel SdR S, del punto di contatto C sono (−R sin ϕ, −R cos ϕ). Si osservi che in questo caso l’angolo di rotolamento ϕ è negativo. Sempre la (6.65) ci consente di determinare le componenti del vettore v ⊥ (O) nel SdR Σ. Infatti29 d (O − Ω) = −Rωe1 . v (O) = dt Scrivendo la (6.62) otteniamo 0 = = −Rωe1 + ωe3 ∧ [(ξ − Rϕ) e1 + (η − R) e2 ] (−ωη) e1 + [ω (ξ + Rϕ)] e2 . L’equazione parametrica, nel SdR Σ, dell’asse istantaneo di moto è dunque   η = 0, ξ = −Rϕ, con µ ∈ R .  ζ = µ, L’asse di moto è pertanto la retta ortogonale al piano ξ, η, che passa per il punto di contatto. Questo risultato è coerente con la “fisica” del problema, dal momento che il punto di contatto è quel punto che, istante per istante, ha velocità nulla (e quindi la minore in modulo). La rigata fissa è quindi il piano ξ, ζ. 29 Si ricordi che, in questo caso particolare, v (O)⊥ = v (O). CINEMATICA DEI SISTEMI RIGIDI 247 Se vogliamo determinare l’equazione dell’asse di moto nel SdR S, dobbiamo lavorare con la (6.64). Abbiamo      −Rω −Rω cos ϕ cos ϕ sin ϕ 0 AT v (O) =  − sin ϕ cos ϕ 0   0  =  Rω sin ϕ  , 0 0 0 0 1 mentre ω S ∧ x = ωk ∧ (xi + yj + zk) = −ωyi + ωxj . Scrivendo quindi la (6.64) otteniemo la seguente equazione parametrica dell’asse di moto nel SdR S   x = −R sin ϕ, y = −R cos ϕ con µ ∈ R ,  z = µ, ovvero una retta perpendicolare al piano x,y. Tale ratta tocca la circonferenza esterna del disco nel punto di coordinate (R sin (−ϕ) , −R cos ϕ), che sono proprio le coordinate, rispetto al SdR S, del punto di contatto (v. figura 6.9). In questo caso le rigata mobile è il cilindro di raggio R il cui asse è l’asse z. Di particolare interesse il caso in cui l’invariante v � è nullo (come nel precedente esempio 6.5.1). In questo caso i punti dell’asse di moto sono “istantaneamente fermi”, cioè hanno velocità nulla. Ne segue che la rigata mobile rotola senza strisciare sulla rigata fissa e possiamo pensare quindi al moto rigido come “generato” dal rotolamento di queste due superfici, una sull’altra. Questa osservazione è alla base della teoria su cui si basa la costruzione degli ingranaggi. In questo caso l’asse viene anche detto asse di istantanea rotazione, in quanto la distribuzione (istantanea) delle velocità è la stessa di quella che ci sarebbe in un moto di rotazione (in cui l’asse del moto resta fisso). Nel caso generale, al variare di P , si “sommano” il moto di rotazione dato dalla v (P )⊥ , con il moto di “traslazione” dato da v � (uguale per tutti i punti di B). Se ω e v(O), restano costanti allora le velocità hanno sempre questa distribuzione e, in particolare, l’asse di moto è sempre lo stesso. Il moto che ne risulta è quindi quello in cui i punti dell’asse si muovono lungo l’asse, mentre gli altri punti li “seguono girando attorno all’asse”. Questo moto è detto “elicoidale”, ed è il moto che ha un bullone mentre viene avvitato, o un cavatappi mentre entra nel tappo. Nel caso generale questa è la forma della distribuzione di velocità ad ogni istante, ma da un istante all’altro la posizione dell’asse muta. Per questa si parla, per un moto rigido generico, di atto di moto elicoidale o roto-traslatorio. 6.6 Cinematica relativa: composizione delle velocità Vogliamo adesso determinare come due SdR Σ e S, in moto tra loro, giudichino la velocità di un punto P in moto rispetto ad entrambi gli osservatori (e quindi non più fermo rispetto al SdR S). Anche se i termini “fisso” e “mobile” sono arbitrari continueremo a riferirci a Σ come al SdR fisso e a S come al sistema mobile. Supporremo inoltre di conoscere le caratteristiche del moto di S rispetto a Σ, ovvero i vettori v(O) e ω (funzioni del tempo) e chiameremo velocità assoluta, v A , e 248 LEZIONI DI SISTEMI DINAMICI velocità relativa, v R , la velocità del punto P rispetto a Σ e a S. Riferendoci quindi alla figura 6.4 vA = d (P − Ω) , dt mentre vR = d (P − O) . dt Per ricavare il legame tra v A e v R partiamo dalla formula (6.16) che lega fra loro i vettori (P − Ω) e (P − O). Passando alle terne, consideriamo la (6.17) che deriviamo rispetto al tempo. Questa volta però teniamo conto del fatto che anche x, le coordinate del vettore (P − O) in S, variano nel tempo         � x � ξ ξ x d   d  O d d η = A(t) y  + A(t) y  . (6.66) ηO + dt dt dt dt ζ z z ζO Il termine a primo membro nella (6.66) è la terna delle componenti della velocità assoluta del punto P nel sistema Σ. Il terzo addendo a secondo membro rappresenta le componenti, in S, del vettore velocità relativa moltiplicate per la matrice di cambiamento di riferimento: queste sono quindi le componenti in Σ del vettore v R , cioè  nel SdR S,  ẋ, vR →  Aẋ, nel SdR Σ. I primi due addendi del secondo membro sono gli stessi che comparivano nella formula fondamentale del moto rigido, quindi possiamo riscrivere la (6.66) nella forma “vettoriale” v A (P ) = v A (O) + ω ∧ (P − O) + v R (P ) . (6.67) La somma v A (O)+ω∧(P −O), rappresenta la velocità che il punto P avrebbe se fosse solidale, ovvero se fosse fermo (anche solo “istantaneamente”) rispetto all’osservatore S. Per questa ragione si dà a questo termine il nome di velocità di trascinamento, v T , e si riscrive la (6.67) nella forma v A (P ) = v T (P ) + v R (P ) , (6.68) che si legge dicendo che la velocità assoluta è uguale alla velocità di trascinamento più la velocità relativa. Nota 6.6.1 Con il “senno di poi” ci possiamo rendere conto che nella derivazione della formula (6.67) si utilizza un’ipotesi non esplicitata: ad ogni istante i due sistemi di riferimento devono essere in grado di confrontare le variazioni rispetto al tempo di una quantità scalare (le componenti del vettore che si sta derivando) nei due sistemi. Questo è possibile solo se i due sistemi possono “sincronizzare” in ogni momento e istantaneamente i loro orologi. Ma ciò è fisicamente impossibile, come messo in luce da Einstein nel suo lavoro (del 1905) sulla Relatività Ristretta. Il motivo per cui questa ipotesi è rimasta nascosta per secoli dipende dal fatto che la massima velocità con cui due osservatori possono scambiarsi delle informazioni è la velocità della luce, che è molto maggiore di qualsiasi velocità in gioco nei fenomeni meccanici macroscopici. L’errore che quindi si compie tenendo per buona l’ipotesi di sincronizzazione istantanea degli orologi non è quindi rilevabile nell’ambito delle applicazioni meccaniche ordinarie. CINEMATICA DEI SISTEMI RIGIDI 249 6.7 Formula di Poisson Notiamo ora che le considerazioni fatte per la velocità valgono per qualsiasi quantità vettoriale, in quanto il termine di differenza tra v A (P ) e v R (P ) dipende dalla varia� d� zione dell’orientazione degli assi S al variare del tempo. Useremo i simboli dt e A � d� per indicare la derivata rispetto al tempo di una qualsiasi quantità vettoriale come dt R giudicata rispettivamente dagli osservatori Σ e S, e le chiameremo ancora derivata assoluta e derivata relativa. Consideriamo un vettore libero U definito nel sistema di riferimento solidale col corpo rigido B. Nel generico SdR S solidale il vettore U sarà espresso dalla terna us , mentre sarà espresso dalla terna uΣ , nel SdR Σ, ovvero U →   uS ,  uΣ = AuS , nel SdR S, nel SdR Σ. Quindi rispetto all’osservatore Σ, U varia sia a causa del moto di S, sia a causa della “variazione propria” di U (ovvero quella “misurata” dall’osservatore solidale S ), che dunque sarà  � nel SdR S,  u̇S , d U �� →  dt �R nel SdR Σ. u̇Σ |R = Au̇S , In accordo con le notazioni introdotte, avremo quindi per un qualsiasi vettore U , � � d U �� d U �� = + ω ∧ U, dt �A dt �R (6.69) che è nota con il nome di formula di Poisson30 . Nota 6.7.1 Confrontando la (6.69) con la (6.67) ci si potrebbe chiedere perché nella (6.69) non compare v A (O). Osserviamo che la (6.67) è la derivata assoluta del vettore (P − Ω) che si scompone come nella (6.16). Calcolando la derivata assoluta del vettore (O − Ω) otteniamo v A (O), mentre per calcolare la derivata assoluta del vettore (P − O) si applica la (6.69) dove U = (P − O). Si otteniamo così la (6.67) dal � d U �� momento che è proprio la velocità relativa v R del punto P . dt � R Per dimostrare la (6.69) consideriamo la derivata di uΣ rispetto al SdR Σ, che denoteremo con d (AuS ) . u̇Σ |A = dt 30 Siméon-Denis Poisson (Pithiviers, 1781 – Parigi, 1840), matematico, fisico, astronomo e statistico francese. 250 LEZIONI DI SISTEMI DINAMICI Questa ci darà appunto le componenti della derivata di U rispetto al SdR fisso Σ. Abbiamo dA dA T u̇Σ |A = uS + Au̇S = A AuS + Au̇S dt dt = ω ∧ AuS + Au̇S uΣ = u̇Σ |R (6.70) ω ∧ uΣ + u̇Σ |R , dove ω è la terna delle componenti della velocità angolare nel SdR Σ. Ora, come ampiamente illustrato nella sezione 6.3, si può far vedere che (6.70) è indipendente dagli specifici sistemi di riferimento considerati, e quindi concludere che la (6.70) è proprio l’espressione nel SdR Σ dell’identità vettoriale (6.69). In particolare, l’espressione del vettore ddtU A rispetto al SdR S è data da AT u̇Σ |A = AT dA T A A uS + AT A u̇S dt I I dA uS + u̇S dt = ω S ∧ uS + u̇S , = AT (6.71) dove, ricordando la (6.51), ω S è la terna delle componenti della velocità angolare nel SdR S. Nota 6.7.2 Mostriamo come ottenere la (6.71) partendo da uS = AT uΣ e derivandola rispetto al tempo. Abbiamo infatti T T dA dA T u̇S = uΣ + AΣ u̇Σ = AAT uΣ + AT Σ u̇Σ , dt dt dove u̇Σ va ovviamente intesa come u̇Σ |A , essendo la derivata della terna uΣ costituita dalle componenti del vettore U nel SdR Σ. Adesso si sfrutta la (6.5) che, come sappiamo, derivata rispetto al tempo fornisce T dA dA T A+A = 0, dt dt e quindi u̇S = −AT dA T T A uΣ + AT Σ u̇Σ = −ω S ∧ uS + A u̇Σ |A , dt (6.52) uS da cui la (6.71) discende banalmente. Nota 6.7.3 Calcoliamo la derivata rispetto a Σ della velocità angolare. Se ω è la terna delle componenti della velocità angolare rispetto a Σ, abbiamo ω̇|A = ω̇. Se CINEMATICA DEI SISTEMI RIGIDI 251 invece consideriamo le componenti rispetto al SdR S, cioè la terna ω S , sfruttando la (6.51), abbiamo T d T dA T ω̇ S |A = A ω = A ω + AT ω̇ A dt dt I T dA T dA T T = A A ω+ AT ω̇|A = −AT A ω + A ω̇|A dt dt (6.25) (6.52) ωS ωS T − dA A dt ω S ∧ω S = AT ω̇|A , e quindi ω̇|A = A ω̇ S |A . 6.8 Composizione di moti rigidi Siano dati adesso tre osservatori Σ, S e S ′ , con S ′ in moto sia rispetto a Σ che a S, e siano note le caratteristiche del moto di S rispetto a Σ, v(O) e ω, e di S ′ rispetto31 a S, v R (O′ ) e ω′ . Vogliamo determinare il moto di S ′ rispetto a Σ. Se P è un punto solidale con S ′ , la velocità di P rispetto a S è v R (P ) = v R (O′ ) + ω′ ∧ (P − O′ ). Indichiamo con v A (P ) la velocità di P rispetto all’osservatore Σ. Dalla (6.67) otteniamo v A (P ) = = v A (O) + ω ∧ (P − O) + v R (P ) v A (O) + ω ∧ (P − O) + v R (O′ ) + ω ′ ∧ (P − O′ ), che riscriviamo v A (P ) = = v A (O) + ω ∧ (P − O′ + O′ − O) + v R (O′ ) + ω ′ ∧ (P − O′ ) v A (O) + ω ∧ (O − O′ ) + v R (O′ ) + v A (O′ ) ω ∧ (P − O′ ) + ω ′ ∧ (P − O′ ). (6.72) Il trinomio v A (O) + ω ∧ (O − O′ ) + v R (O′ ) rappresenta la velocità del punto O′ rispetto al SdR Σ, che, secondo la nostra convenzione, abbiamo denotato con v A (O′ ), velocità di O′ (centro del SdR S ′ ) rispetto all’osservatore fisso Σ. Possiamo pertanto riscrivere la (6.72) v A (P ) = v A (O′ ) + (ω ′ + ω) ∧ (P − O′ ) , 31 Con O ′ si è ovviamente indicato l’origine di S ′ , e si è usata la notazione v R (O ′ ) per evidenziare che · questa è la velocità di O ′ valutata dall’osservatore S, cioè v R (O ′ ) = (O − O ′ ). 252 LEZIONI DI SISTEMI DINAMICI che ci dice che il sistema S ′ compie rispetto a Σ un moto rigido di velocità angolare (ω ′ + ω). Quindi nella composizione di due moti rigidi, le velocità angolari si sommano. Lo stesso vale se si compongono tre o più moti rigidi. Un’applicazione immediata della formula di addizione delle velocità angolari si ha in un metodo per la determinazione di ω a partire dagli angoli di Eulero (metodo diverso da quello illustrato nella parte conclusiva del paragrafo 6.4). Da come abbiamo definito gli angoli di Eulero (v. sezione 6.4) risulta chiaro che la generica trasformazione che porta Σ′ a coincidere con S è ottenuta tramite le tre rotazioni consecutive: (i) rotazione di ψ attorno all’asse e3 (cioè l’asse ζ del SdR Σ′ ); (ii) rotazione di θ attorno alla linea dei nodi il cui versore è n; (iii) rotazione di φ attorno all’asse z (asse k del SdR S). Ricordando la forma della velocità angolare in una rotazione, ovvero la (6.49), e utilizzando l’addizione delle velocità angolari, si ha la semplice espressione ω = ψ̇ e3 + θ̇ n + φ̇ k . (6.73) La (6.73) è però un’espressione “ibrida” perché non ci dà le componenti di ω né nel sistema Σ, né nel sistema S. La (6.73) ha un altro difetto: mentre n è perpendicolare32 sia a e3 che a k, questi ultimi due versori non sono in genere perpendicolari tra loro, quindi il modulo di ω non può essere ottenuto da (6.73) semplicemente sommando i quadrati di ψ̇, θ̇, e φ̇. E’ tuttavia facile ottenere l’espressione di ω in entrambi i riferimenti Σ e S, osservando che n = cos ψ e1 + sin ψ e2 , n = cos φi − sin φ j, k e3 = sin θ (sin ψ e1 − cos ψ e2 ) + cos θ e3 , = sin θ (sin φ i + cos φ j) + cos θ k. Si ottengono così le formule (6.55) e (6.56). Esempio 6.8.1 La formula della composizione delle velocità angolare è estremamente utile quando si deve calcolare la velocità angolare di moti rigidi tridimensionali. Riprendendo l’esempio 4.1.3, dimostriamo la formula (4.19) facendo uso del metodo della composizione della velocità angolare. Riferendoci alla figura 6.10, denotiamo con Σ : {Ω, x, y, z} il sistema di riferimento fisso. Consideriamo il SdR S : {O, X, Y, Z} solidale con il vettore (Q − O). Tale SdR ruota attorno all’asse z ≡ Z, e quindi la velocità angolare di S rispetto a Σ è ω 1 = θ̇ez . Consideriamo poi il SdR solidale con il disco che rotola, cioè S ′ : {Q, X ′ , Y ′ , Z ′ }. Quest’ultimo ruota attorno all’asse X ≡ X ′ e quindi la sua velocità angolare rispetto ad S è ω2 = ϕ̇eX ′ . La velocità angolare del SdR solidale S ′ rispetto al SdR fisso Σ (e dunque la velocità angolare del disco rigido rispetto a Σ) è quindi ω = ω 1 +ω 2 = ϕ̇eX ′ + θ̇ez , che possiamo esprimere sia nel SdR Σ che nel SdR solidale S ′ o, eventualmente, nel SdR “semisolidale” S. Se decidiamo di esprimere ω in Σ, allora otteniamo la (4.19) siccome eX ′ ≡ eX = cos θex + sin θey . 32 Ricordiamo che la linea dei nodi è l’intersezione dei piani (ξ, η) e (x, y), e quindi è ortogonale sia all’asse z, che all’asse ζ. CINEMATICA DEI SISTEMI RIGIDI 253 _ z_ Z Y y O ϕ Z’ _ X _ X’ Q Ω θ Y’ x Figura 6.10: {Ω, x, y, z} è il SdR fisso Σ. Il sistema di riferimento solidale con il disco che rotola è {Q, X ′ , Y ′ , Z ′ }. Viceversa se decidiamo di esprimere ω nel SdR solidale S ′ , allora dobbiamo esprimere ez nel SdR solidale S ′ . Guardando la figura 6.10 è facile rendersi conto che ez = cos ϕeZ ′ − sin ϕeY ′ , per cui ω = ϕ̇eX ′ − θ̇ sin ϕeY ′ + θ̇ cos ϕeZ ′ . (6.74) 6.9 Cinematica relativa: l’accelerazione Vediamo infine come viene giudicata da due osservatori diversi l’accelerazione di un punto in movimento rispetto a entrambi. Per trovare la relazione che lega le due accelerazioni, basta derivare la formula (6.67) che lega la velocità relativa alla velocità assoluta tenendo presente che l’accelerazione giudicata da Σ (che chiameremo assoluta) è la derivata in Σ della velocità giudicata da Σ, mentre l’accelerazione giudicata da S (che chiameremo relativa) è la derivata in S della velocità giudicata da S Avremo quindi che l’accelerazione del punto P “misurata” dall’osservatore Σ è d d aA (P ) = v A (P ) [v A (O) + ω ∧ (P − O) + v R (P )] . = (6.75) dt A (6.67) dt A Calcoliamo la derivata a secondo membro d d d v A (O) + ω ∧ (P − O) + v R (P ) , aA (P ) = dt dt dt A A A 254 LEZIONI DI SISTEMI DINAMICI utilizzando la formula di Poisson (6.69) per il secondo e terzo addendo. Il primo addenso è chiaramente l’accelerazione del punto O giudicata dall’osservatore Σ. Otteniamo dunque: d • v A (O) = aA (O), accelerazione del punto O rispetto al SdR Σ; dt A d d v R (P ) = ω ∧v R (P )+ v R (P ) = ω ∧v R (P )+ aR (P ), dove aR (P ) • dt dt A R è l’accelerazione di P valutata dall’osservatore S; d d d ω ∧ (P − O) = ω ∧ (P − O) + ω ∧ (P − O) . La derivata di ω, • dt dt A dt A A d valutata dall’osservatore Σ, viene denotata con ω̇, cioè ω̇ = ω . Abbiamo dt A quindi d d ω ∧ (P − O) = ω̇ ∧ (P − O) + ω ∧ (P − O) dt dt A A = ω̇ ∧ (P − O) + ω ∧ [ω ∧ (P − O) + v R (P )] . Possiamo riunire tutti i “pezzi” e otteniamo il legame cercato tra le due accelerazioni aA (P ) = aR (P )+aA (O)+ ω̇ ∧(P −O)+ω∧(ω ∧ (P − O))+2 ω∧v R (P ). (6.76) La (6.76) va letta osservando che il secondo, terzo e quarto termine della somma sono presenti anche quando il punto P è fermo rispetto ad S; per questa ragione la loro somma prende il nome di accelerazione di trascinamento, aT (P ). Infine il termine 2 ω ∧ v R (P ), indicato generalmente con il simbolo aC (P ), è dovuto alla correzione necessaria per il diverso modo che hanno i due osservatori di giudicare sia la variazione della velocità relativa sia la variazione della velocità di trascinamento. Questo termine prende il nome di accelerazione complementare o accelerazione di Coriolis33 . La (6.76) si può quindi scrive nella forma compatta aA = aR + aT + aC . (6.77) L’importanza di questa relazione è dovuta al fatto che molto spesso i fenomeni meccanici sono osservati da sistemi di riferimento non inerziali. Esempi noti sono la deviazione dalla verticale nella caduta di un grave34 , la deviazione dalla direzione dei meridiani dei venti alisei e il moto del pendolo di Foucault. 33 Gaspard-Gustave de Coriolis (Parigi, 1792 – Parigi, 1843) matematico, fisico e ingegnere francese. noti che nella direzione della verticale, che è quella del filo a piombo, è compresa oltre alla forza di gravità, un termine centrifugo dovuto all’accelerazione di trascinamento della terra. Quando un grave cade, il termine di accelerazione complementare fa deviare la sua traiettoria dalla verticale. Se si guarda al fenomeno dal punto di vista di un osservatore posto al di fuori della terra, questa deviazione è l’ovvia conseguenza del fatto che nel tempo impiegato nella caduta, l’osservatore (la terra) ha ruotato spostando il piede della verticale del punto di partenza verso oriente. L’osservatore solidale con la terra vedrà quindi deviare il grave verso occidente. Tuttavia questo effetto è molto piccolo, e praticamente inosservabile, nella caduta di un grave da altezza ordinarie. 34 Si Capitolo 7 Dinamica dei Sistemi Rigidi Abbiamo già visto nel capitolo 6 che un sistema di punti (Pk , mk ), è detto rigido se è tenuto a rispettare (oltre a eventuali altri vincoli) il vincoli di rigidità, cioè 2 |Pi − Pj | = d2ij , ∀ i �= j, con dij costante nel tempo. (7.1) Sempre nel capitolo dedicato alla cinematica abbiamo osservato che, se il sistema possiede almeno tre punti non allineati, allora le sue configurazioni sono in corrispondenza uno a uno con le posizioni che un sistema di riferimento ortonormale (solidale) può assumere rispetto a un altro sistema di riferimento ortogonale (fisso). Un’importante conseguenza è che, almeno dal punto di vista cinematico, non ci sono differenze nella descrizioni del moto di un sistema rigido “discreto”, cioè formato da un numero finito di punti materiali, e un corpo rigido continuo1 . In quello che segue tratteremo il problema della dinamica di un sistema rigido discreto. Le equazioni di moto che ricaveremo saranno però facilmente “adattabili” al caso continuo. Esse saranno quindi adottate come modello per la dinamica dei corpi rigidi continui. Il vincolo di rigidità, che, come visto nell’esempio 5.2.1, è liscio, è mantenuto da opportune forze (o reazioni) vincolari che risultano incognite. In questo capitolo ricaveremo una coppia equazioni vettoriali, dette prima equazione cardinale e seconda equazione cardinale, che non contengono le forze vincolari interne relative al vincolo di rigidità. Per la precisione le equazioni cardinali sono valide anche per sistemi non rigidi. La loro caratteristica è proprio quella che in esse non compaiono le forze interne al sistema ma soltanto le forze esterne (daremo più avanti la definizione di forze interne ed esterne). Vedremo poi che, nel caso di sistemi rigidi, la seconda equazione cardinale acquista una struttura particolare a causa della particolare forma della velocità dei punti di un corpo rigido (si veda il paragrafo 6.3 del capitolo 6). Concludiamo sottolineando una proprietà fondamentale delle equazioni cardinali che verrà dimostrata in questo capitolo: proveremo che, nel caso di un sistema rigido, 1 Anche se è abbastanza chiaro cosa si debba, intuitivamente, intendere per corpo rigido continuo, è bene dare una definizione più formale. Diremo che B un corpo continuo se esso occupa una regione C(t), ed esiste una funzione continua, non negativa ρ(x, y, z, t) di cui C(t) è il supporto al tempo t, ovvero se ρ(x, y, z, t) > 0 per (x, y, z) ∈ C(t) e nulla altrimenti: la funzione ρ è detta densità di massa, e rappresenta la massa per unità di volume. Il corpo si dice rigido se esiste un sistema di riferimento in cui la funzione densità ρ non dipende dal tempo. 256 LEZIONI DI SISTEMI DINAMICI le due equazioni cardinali formano un sistema di 6 equazioni scalari indipendenti cioè tante quanti sono i gradi di libertà de sistema (sezione 6.2.3 del capitolo 6). Le due equazioni cardinali sono quindi sufficienti a determinare la dinamica del corpo rigido (se, ovviamente, sono note tutte le forze esterne agenti su di esso). 7.1 Il centro di massa Sia dato in uno spazio affine euclideo A un sistema B di N punti materiali (Pk , mk ), k = 1, ..., N , (anche non rigido). Si fissa poi un punto O nello spazio A. Definizione 7.1.1 Si dice centro di massa, o baricentro, del sistema B il punto Po dato da N mk (Pk − O) k=1 , (7.2) (Po − O) = M N dove M = mk , è la massa totale del sistema. k=1 Il centro di massa è un’entità puramente concettuale: in generale Po non coincide con un punto materiale Pk di B. Tuttavia Po , pur non coincidendo in generale con alcun punto materiale, è una quantità intrinseca di B: dipende cioè soltanto dalla struttura geometrico-materiale del sistema. Vale infatti la seguente Proposizione 7.1.1 Il centro di massa Po non dipende dalla scelta del punto O. Dim. Per dimostrare la proposizione dobbiamo fare vedere in pratica che, scegliendo un punto O′ �= O, il vettore che si ottiene applicando la definizione (7.2), cioè (Po′ − O′ ) = N k=1 mk (Pk − O′ ) M , identifica lo stesso punto Po . Riferendoci alla figura 7.1, per provare che Po′ ≡ Po , dobbiamo mostrare che (Po′ − O′ ) + (O′ − O) = (Po − O) . (7.3) Partendo dalla (7.2) abbiamo (Po − O) = N N 1 1 mk (Pk − O) = mk [(Pk − O′ ) + (O′ − O)] M M k=1 = 1 M N k=1 k=1 mk (Pk − O′ ) + (Po′ −O′ ) = (Po′ − O′ ) + (O′ − O) , cioè la (7.3). N 1 mk (O′ − O) M k=1 N 1 ′ k=1 mk )(O −O) M( DINAMICA SISTEMI RIGIDI 257 B O Po O’ Figura 7.1: Il sistema materiale B, ed il centro di massa Po , che, in questo caso, non coincide con alcun punto di B. Una diretta conseguenza di tale proposizione è che, ai fini del calcolo di Po , conviene porsi nel sistema di riferimento dove i calcoli sono i più semplici possibili. Quindi, se B è un corpo rigido conviene sempre considerare un sistema di riferimento solidale con il corpo. Un’altra proprietà utile ai fini del calcolo è l’additività rispetto alle masse, ovvero la proprietà distributiva. Supponiamo di dividere B in due parti B1 , B2 disgiunte, cioè B = B1 ∪ B2 , con B1 ∩ B2 = ∅. Quindi se B1 = {(Pk , mk ) : k = 1, ... N1 }, tale N 1 che M1 = mk è la massa parziale di B1 , e B2 = {(Pk , mk ) : k = N1 + 1, ..., k=1 N N }, con M2 = mk , abbiamo, con evidente significato dei simboli k=N1 +1 (Po − O) = = N 1 mk (Pk − O) M k=1 N 1 1 mk (Pk − O) + M k=1 N k=N1 +1 mk (Pk − O) 1 [M1 (Po, B1 − O) + M2 (Po, B2 − O)] . M Il centro di massa dell’intero sistema B coincide quindi col centro di massa dei due punti materiali Po, B1 e Po, B2 , aventi masse M1 e M2 , che, a loro volta, sono i centri = 258 LEZIONI DI SISTEMI DINAMICI di massa “parziali” dei sottosistemi B1 e B2 . Evidentemente tale procedura si può generalizzare, supponendo di suddividere B in L sottosistemi Bi , i = 1, ..., L, disgiunti di masse Mi . Avremo quindi (Po − O) = L 1 Mi (Po, Bi − O) . M i=1 Nota 7.1.1 Se B è un corpo rigido continuo e C(t) è la regione da esso occupata, il centro di massa di B è così definito 1 1 xPo = x dm = x ρ (x) dV , M C(t) M C(t) dove: • x è il vettore posizione del generico punto di C(t); • dm è la misura di massa che viene espressa come ρ dV , con ρ massa per unità di volume (densità di massa) e dV misura di volume. La massa totale del corpo è M= Introduciamo la seguente dm = C(t) ρ (x) dV. C(t) Definizione 7.1.2 Siano v k , k = 1, ..., N , le velocità dei punti materiali di B rispetto ad un dato SdR S. Si dice velocità del centro di massa rispetto ad S, il vettore v (Po ) = N 1 mk v k . M (7.4) k=1 · Talvolta v (Po ), viene anche denotato con (Po − O). Inoltre il vettore K = M v (Po ) = N mk v k , (7.5) k=1 viene detto quantità di moto, o momento lineare, o anche semplicemente momento, del sistema di B rispetto al SdR S. Concludiamo osservando che, nel caso in cui le masse degli N punti materiali del sistema siano costanti nel tempo, abbiamo N N k=1 k=1 dK dv k = = mk mk ak , dt dt (7.6) dove ak denota l’accelerazione del k-esimo punto di B rispetto al SdR S. In particolare, se definiamo l’accelerazione del centro di massa rispetto al SdR S, come ·· 1 N a (Po ) = (Po − O) = mk ak , la (7.6) si può scrive come k=1 M dK = M a (Po ) . dt DINAMICA SISTEMI RIGIDI 259 7.2 Il momento angolare Consideriamo un sistema B di N punti materiali (non necessariamente rigido) ed un generico punto Q (non necessariamente coincidente con un punto materiale del sistema). Adesso, seguendo la procedura della sezione 1.5.2, consideriamo il sistema di vettori applicati S = {(Pk , v k ) ∈ A × V : k = 1, ...., N } , dove v k , k = 1, ..., N , è la velocità del punto Pk , si introduce il momento del sistema rispetto al polo, o centro di riduzione, Q, che, in questo specifico caso viene detto momento angolare. Abbiamo cioè la seguente Definizione 7.2.1 Si dice momento angolare, o momento della quantità di moto, del sistema B rispetto al centro di riduzione Q, il vettore L (Q) = N k=1 (7.7) mk (Pk − Q) ∧ v k . Il punto Q viene talvolta anche detto polo. A differenza del centro di massa, il momento angolare L (Q) dipende dalla struttura geometrico-materiale del sistema B, ma anche dal centro di riduzione. Se infatti consideriamo D �= Q, abbiamo L (D) = N k=1 mk (Pk − D) ∧ v k , che, in generale, è diverso da L (Q). Infatti L (D) = N k=1 = N k=1 mk (Pk − D) ∧ v k = mk (Pk − Q) ∧ v k + L(Q) Quindi, ricordando la (7.5), abbiamo N k=1 N k=1 mk [(Pk − Q) + (Q − D)] ∧ v k mk (Q − D) ∧ v k . (Q−D)∧ N k=1 mk v k L (D) = L (Q) + (Q − D) ∧ K , che altro non è che la (1.20), già incontrata nella sezione 1.5.2. Quindi L (D) = L (Q), soltanto se (Q − D) e K sono paralleli oppure la velocità del centro di massa è nulla, sì che K = 0. 7.3 Geometria delle masse In questa sezione verrà introdotto il momento d’inerzia ed altri concetti ad esso collegati. Verranno poi presentati alcuni esempi riguardanti il calcolo di momenti d’inerzia, 260 LEZIONI DI SISTEMI DINAMICI la determinazione della terna principale d’inerzia e proprietà della matrice d’inerzia. L’applicazione di queste grandezze alla dinamica dei sistemi rigidi verrà presentata nelle sezione 7.6 ed in quelle successive. 7.3.1 Momenti d’inerzia Sia B un sistema di N punti materiali (Pi , mi ) , i = 1, 2, ..., N . Definizione 7.3.1 Data una retta r, il cui versore è er , passante per il punto Q, la grandezza N Ir (Q) = mi [(Pi − Q) ∧ er ]2 , i=1 si dice momento d’inerzia del sistema B rispetto ad r. Riferendosi alla figura 7.2, [(Pi − Q) ∧ er ]2 , rappresenta la distanza al quadrato di Pi 2 dalla retta r passante per Q (il segmento Pi Ri ). Pertanto, la definizione è indipendente dalla scelta del punto Q ∈ r. E’ facile vedere che Ir (Q) > 0, e Ir (Q) = 0 soltanto nel caso particolare in cui tutti i punti Pi giacciono sulla retta r. Nel caso di un sistema continuo che occupa un dominio D, la somma si sostituisce con l’integrale, ovvero 2 2 Ir (Q) = [(P − Q) ∧ er ] dm = [(P − Q) ∧ er ] ρdV, D D dove, come nell’osservazione 7.1.1, dm è la misura di massa che viene espressa come ρdV , con ρ densità di massa e dV misura di volume. Definizione 7.3.2 Siano dati due piani π1 e π2 non paralleli, i cui versori normali sono eπ1 e eπ2 . Sia r la retta tale che r = π1 ∩ π2 , e sia Q un punto di r. Si definisce il momento d’inerzia di B rispetto ai piani π1 e π2 come Iπ1 π2 (Q) = − N i=1 mi [(Pi − Q) · eπ1 ] [(Pi − Q) · eπ2 ] . Analogamente alla definizione di Ir (Q), è facile dimostrare che Iπ1 π2 (Q) non dipende dalla scelta del punto Q su r. Infatti, [(Pi − Q) · eπ1 ] (e allo steso modo anche [(Pi − Q) · eπ2 ]) rappresenta la “quota” (che può essere quindi positiva, negativa o nulla) del punto Pi rispetto a π1 . Come nel caso precedente, se il sistema è continuo la somma andrà sostituita con un integrale (definito sul dominio D occupato da B) che, al solito, farà intervenire ρdV . Teorema 7.3.1 (Teorema di Huygens) Sia dato un sistema di punti N materiali B di cui Po è il centro di massa. Si ha 2 Ir (Q) = IrPo (Po ) + M [(Po − Q) ∧ er ] , (7.8) DINAMICA SISTEMI RIGIDI [(P − Q ) ∧ er ] 261 = P Q sin θ = P R Figura 7.2: Retta r e distanza di Pi da r. e Iπ1 π2 (Q) = Iπ1,Po π2,Po (Po ) − M [(Po − Q) · eπ1 ] [(Po − Q) · eπ2 ] , (7.9) dove con rPo si intende una retta parallela ad r, passante per Po , e con π1,Po , π2,Po i due piani, paralleli rispettivamente a π1 e π2 , la cui retta d’intersezione passa per Po . Dim. Si nota che (7.8) si può anche scrivere come Ir (Q) = IrPo (Po ) + M d2 , essendo d la distanza fra le retta r e la retta rPo , ovvero d = |(Po − Q)) ∧ er | . 262 LEZIONI DI SISTEMI DINAMICI Ricordando la definizione di centro di massa (7.2), abbiamo N Ir (Q) = 2 mi [(Pi − Q) ∧ er ] = i=1 N = 2 mi [(Pi − Po ) ∧ er ] + i=1 IrP (Po ) o +2 N i=1 N i=1 mi [((Pi − Po ) + (Po − Q)) ∧ er ] N 2 2 mi [(Po − Q)) ∧ er ] + i=1 d2 M mi [(Pi − Po ) ∧ er ] · [(Po − Q)) ∧ er ] . L’ultimo termine si annulla per definizione di centro di massa, N N mi [(Pi − Po ) ∧ er ] = mi [(Pi − O) − (Po − O)] ∧ er i=1 = i=1 N i=1 mi (Pi − O) ∧ er − M(Po −O)∧er N mi i=1 M (Po − O) ∧ er = 0. La prima parte del teorema è così dimostrata. La (7.9) si dimostra con la stessa tecnica, tenendo cioè conto del fatto che N i=1 mi (Pi − Po ) = 0. Abbiamo infatti Iπ1 π2 (Q) = − =− N i=1 N i=1 mi [(Pi − Q) · eπ1 ] [(Pi − Q) · eπ2 ] mi [((Pi − Po ) + (Po − Q)) · eπ1 ] [(Pi − Po ) + (Po − Q)) · eπ2 ] = Iπ1,Po π2,Po (Po ) − M [(Po − Q) · eπ1 ] [(Po − Q) · eπ2 ] . Vediamo adesso alcune proprietà dei momenti d’inerzia. Proposizione 7.3.1 Sia B un sistema materiale di N punti e sia {e1 , e2 , e3 } una terna cartesiana ortogonale centrata in Q. Se Ii (Q), i = 1, 2, 3, denota il momento d’inerzia rispetto all’asse ei (passante per Q), allora I1 (Q) + I2 (Q) + I3 (Q) = 2 N i=1 2 mi |Pi − Q| . DINAMICA SISTEMI RIGIDI 263 Dim. Il generico punto Pi è individuato dal vettore (Pi − Q), che nella terna { e1 , e3 , e3 } è rappresentato da Pi − Q = xi e1 + yi e2 + zi e3 . Applicando la definizione 7.3.1, abbiamo N i=1 N N N mi yi2 + zi2 + mi x2i + zi2 + mi x2i + yi2 = 2 mi x2i + yi2 + zi2 . I1 (Q) i=1 i=1 I2 (Q) I3 (Q) i=1 N 2 i=1 mi |Pi −Q| (7.10) Nota 7.3.1 Osserviamo che, anche considerando un’altra terna { e′1 , e′2 , e′3 }, sempre centrata in Q ma diversa da { e1 , e2 , e3 } (sì che il vettore (Pi − Q) non è più rappresentato da (xi , yi , zi ) ma, per esempio, da (x′i , yi′ , zi′ )), la relazione (7.10) continuerà a 2 valere. Infatti, il secondo membro della (7.10) sarà sempre dato da N i=1 mi |Pi − Q| . Corollario 7.3.1 Se B giace su un piano π, e Q sta nel medesimo piano, allora, data una generica terna ortonormale con, e3 ortogonale a π, si ha I3 (Q) = I1 (Q) + I2 (Q) Dim. Si procede come nel caso precedente, supponendo, senza perdere di generalità, che zi = 0, per ogni i = 1, 2, ..., N . Nota 7.3.2 Vogliamo rimarcare una proprietà importante dei momenti d’inerzia: la proprietà distributiva. Come già visto per il centro di massa, se il sistema B è composto da due sottosistemi B1 e B2 , tali che B1 ∩ B2 = ∅, e B1 ∪ B2 = B, allora, definendo con IrBi (Q), IπB1i,π2 (Q) , i = 1, 2, i momenti d’inerzia dei sottosistemi Bi , abbiamo Ir (Q) = Iπ1 ,π2 (Q) = IrS1 (Q) + IrS2 (Q) , (7.11) IπS11,π2 (Q) + IπS11,π2 (Q) . (7.12) Evidentemente la (7.11) e la (7.12) si generalizzano banalmente al caso in cui B sia composto non solo da 2 ma n > 2 sottosistemi disgiunti e tali che la loro unione dia B. 7.3.2 Omografia d’inerzia, matrice d’inerzia e terna principale d’inerzia In questa sezione vogliamo analizzare come varia il momento d’inerzia al variare del versore er di una retta uscente dal punto Q. Mostreremo che esiste un’applicazione lineare che consente di calcolare Ir (Q) come forma bilineare. 264 LEZIONI DI SISTEMI DINAMICI Definizione 7.3.3 Sia dato un sistema di N punti materiali e sia dato un punto Q. Sia poi V lo spazio vettoriale definito sullo spazio affine. Su V si definisce il seguente operatore lineare, detto omografia d’inerzia, σ (Q) : V → V che opera così, σ(Q) v ∈ V −→ σ (Q) v = N i=1 mi (Pi − Q) ∧ [v ∧ (Pi − Q)] . (7.13) Si osserva che in base alla nota formula del calcolo vettoriale a ∧ (b ∧ c) = b (a · c) − c (a · b) , σ (Q) può anche essere così definito σ (Q) v = N i=1 2 mi |Pi − Q| v − (v · (Pi − Q)) (Pi − Q) . (7.14) Proposizione 7.3.2 L’operatore σ (Q) gode delle seguenti proprietà: 2 1. v · σ (Q) v = Iv (Q) | v| , dove Iv (Q) è il momento d’inerzia rispetto alla retta passante per Q parallela a v. 2. Se u e v sono due vettori non paralleli u · σ (Q) v = Iπv πu (Q) | v | | u | + i mi |Pi − Q|2 u · v, dove Iπv πu (Q) è il momento d’inerzia rispetto ai due piani πv , e πu , rispettivamente ortogonali a u e v, la cui retta d’intersezione passa per Q. Dim. La dimostrazione dei punti 1 e 2 si effettua facilmente sfruttando la formula (7.14). Infatti, per quanto riguarda il punto 1, ricordando che v · (Pi − Q) = |v| |Pi − Q| cos θi , essendo θi l’angolo fra (Pi − Q) e v, si ha v · σ (Q) v = N i=1 = 2 mi |Pi − Q| | v | N i=1 2 1 − cos2 θi mi [(Pi − Q) ∧ ev ] Iev (Q) sin2 θi 2 2 | v| , dove ev vettore unitario parallelo a v. Analogamente, partendo dalla (7.14) e ricordando la definizione 2, il punto 2 è facilmente dimostrabile. DINAMICA SISTEMI RIGIDI 265 La conseguenza della proposizione 7.3.2 è la seguente: σ (Q) definisce una forma bilineare simmetrica definita positiva. La simmetria è banale da dimostrare come il fatto che v · σ (Q) v > 0, se v �= 0, e che v · σ (Q) v = 0, solo se v = 0 (si esclude qui il particolarissimo caso in cui i punti di B giacciono sulla retta passante per Q e parallela al vettore v). Inoltre, il significato della forma è chiaro: se er è il vettore della retta passante per Q, la quantità er · σ (Q) er è il momento d’inerzia del sistema B rispetto a tale retta. Data adesso una terna ortonormale S : {e1 , e3 , e3 }, centrata in Q, possiamo rappresentare σ (Q) tramite la matrice simmetrica IQ  I11 IQ =  I12 I13 I12 I33 I23  I13 I23  I33 i cui elementi si determinano così Ijk = ej · σ (Q) ek , j, k = 1, 2, 3. Evidentemente, gli elementi Iij della matrice, detta matrice d’inerzia, o tensore d’inerzia, dipendono dalla particolare terna scelta. Pertanto, se il generico vettore (Pi − Q) si rappresenta nel SdR S come Pi − Q = xi e1 + yi e2 + zi e3 , (7.15) la matrice IQ assumerà (rispetto ad S) questa forma � 2 �  � � 2 m + z m x y − m x z y − i i i i i i i i i i i � � � � � 2 2 . − �i mi xi yi im �i xi + zi �− i�m2i zi yi2 � − i mi xi zi − i mi z i y i m + y x i i i i  � IQ =  i (7.16) Gli elementi diagonali Iii sono i momenti di inerzia rispetto agli assi x, y e z rispettivamente, e gli elementi extra-diagonali sono detti momenti deviatori rispetto alle coppie di piani {x = 0 , y = 0}, {x = 0 , z = 0} e {y = 0 , z = 0}. Notiamo che se invece di S avessimo considerato un’altra terna ortonormale S ′ : {e1′ , e3′ , e3′ }, sempre centrata in Q, avremmo ottenuto un’altra matrice I′Q , che rappresenta l’operatore σ (Q) rispetto S ′ . In particolare, le matrici I′Q e IQ sono legate da IQ = BI′Q BT , (7.17) dove B è la matrice ortogonale (cioè BT = B−1 ) del cambio di base da S ′ in S, definita nella sezione 1.3. Infatti, ricordando la (1.10) abbiamo ei = 3 � j=1 bij e′j , i = 1, 2, 3 , 266 LEZIONI DI SISTEMI DINAMICI dove2 bij , è l’elemento i, j della matrice B la cui forma generale è data dalla (1.12). Otteniamo dunque � � � 3 � 3 � � ′ ′ ei · σ (Q) ej = bjs es bik ek · σ (Q) � �� s=1 k=1 (IQ )ij = = 3 3 � � bik (e′k · σ (Q) e′s ) bjs � �� k=1 s=1 (I′Q )ks 3 � 3 � k=1 s=1 � � bik I′Q ks bT sj , ovvero la (7.17). Data la proprietà di simmetria di IQ (che ovviamente discende dalla simmetria di σ (Q)), è possibile determinare una particolare terna ortonormale, detta terna principale d’inerzia, rispetto alla quale la matrice d’inerzia è diagonale, ovvero   I1 0 0 IQ =  0 I2 0  . 0 0 I3 I versori che costituiscono la terna principale d’inerzia (centrata in Q) sono detti assi principali d’inerzia, ed i momenti I1 , I2 , I3 , momenti principali d’inerzia. I vettori unitari ei , i = 1, 2, 3, della terna principale d’inerzia, sono gli autovettori dell’operatore σ (Q). Infatti, se un generico vettore v è parallelo ad una autovettore di σ, allora viene “trasportato” da σ (Q) in un altro vettore, σ (Q) v, parallelo a v stesso, ovvero σ (Q) v = Ii v, con l’evidente significato del momento Ii : l’autovalore corrispondente all’autovettore ei . La determinazione della terna principale d’inerzia si fa diagonalizzando IQ , ovvero ricercando gli autovettori di IQ stessa. Tale procedimento può essere talvolta lungo. Si preferisce allora seguire (quando possibile) alcune “scorciatoie” che permettono di individuare subito una terna principale d’inerzia a partire dalle proprietà geometricomateriali del sistema di punti materiali B. Nota 7.3.3 E’ interessante osservare che si può giungere alla matrice (7.16) partendo direttamente dalla definizione (7.13). Selezioniamo infatti un SdR dove il vettore (Pi − Q) è dato dalla (7.15) e dove dove v = v1 e1 + v2 e2 + v3 e3 . Utilizziamo poi l’espressione matriciale del prodotto vettoriale vista nella sezione 6.3, cioè    v1 0 zi −yi 0 xi   v2  . v ∧ (Pi − Q) = − (Pi − Q) ∧ v = −  −zi yi −xi 0 v3 2 Dalla (1.11) si ha bij = ei · e′j , i, j = 1, 2, 3. DINAMICA SISTEMI RIGIDI 267 Scrivendo quindi esplicitamente la (7.16) si ottiene   N 0 zi 0 zi −yi � 0 xi   −zi 0 mi  −zi σ (Q) v = − ι=1 yi −xi 0 yi −xi  2    N −xi zi yi + zi2 −xi yi v1 � mi  −xi yi x2i + zi2 −yi zi   v2  . = ι=1 −xi zi −yi zi x2i + yi2 v3 ��   v1 −yi xi   v2  0 v3 IQ Nota 7.3.4 Sia data la terna ortonormale S : { e1 , e3 , e3 }, tale che e3 , per esempio, è asse principale d’inerzia, allora I13 = I23 = 0. Viceversa, se IQ è la matrice d’inerzia rispetto a S, ed è tale che I13 = I23 = 0, allora l’asse e3 è asse principale d’inerzia. La dimostrazione di tali affermazioni è molto semplice. Infatti se e3 è asse principale d’inerzia, allora IQ e3 = I3 e3 ovvero     0 0 IQ  0  =  0  . 1 I3  I11 Del resto, in generale, IQ =  I12 I13  I11  I12 I13 I12 I33 I23 I12 I33 I23  I13 I23 . Avremo quindi I33     I13 0 I13 I23   0  =  I23  , 1 I33 I33 da cui, per banale confronto, discende I13 = I23  I11 I12 IQ =  I12 I33 0 0 = 0. Se invece IQ ha questa forma  0 0 , I33 applicando IQ ad ogni vettore del tipo βe3 (parallelo all’asse e3 )      I11 I12 0 0 0  I12 I33 0   0  =  0  = I33 βe3 , β I33 β 0 0 I33 si ottiene un vettore ancora parallelo ad e3 . L’asse e3 è dunque asse principale d’inerzia. Evidentemente, tale ragionamento resta valido anche se, invece dell’asse e3 , avessimo scelto l’asse e1 , oppure l’asse e2 . Definizione 7.3.4 Dato un sistema B di N punti materiali, un piano π si dice piano di simmetria materiale se per ogni punto materiale Pi , ne esiste un altro, avente la stessa massa, disposto in posizione simmetrica rispetto a π. 268 LEZIONI DI SISTEMI DINAMICI Proposizione 7.3.3 Sia B un sistema di punti materiali e sia π un piano di simmetria materiale. Sia inoltre Q un qualsiasi punto di π. Allora una retta passante per Q e perpendicolare a π, è asse principale d’inerzia Dim. Consideriamo una generica terna ortonormale S : {e1 , e3 , e3 }, centrata in Q, con e3 , perpendicolare al piano che, senza perdere in generalità, sarà dato da z = 0. Rifacendosi alla nota 7.3.4, per provare che e3 è asse principale d’inerzia, è sufficiente mostrare che I23 = I13 = 0. Se Pi − Q = xi e1 + yi e2 + zi e3 , possiamo raggruppare i primi N/2 punti come quelli caratterizzati da zi ≤ 0, e i rimanenti N/2 come i loro simmetrici (la cui coordinata rispetto ad e3 è −zi ). Quindi, ricordando la (7.16), abbiamo N/2 I13 = � i=1 N/2 mi xi (zi − zi ) = 0, e I23 = � i=1 mi yi (zi − zi ) = 0. Corollario 7.3.2 Se B è un sistema piano (tutti i punti giacciono su un piano) allora una retta perpendicolare al piano è asse principale d’inerzia. Dim. Possiamo considerare, senza perdere di generalità, che zi = 0, ∀ i = 1, 2, ...N (il sistema giace sul piano z = 0). Procedendo come nella dimostrazione della proposizione 7.3.3, si ottiene I13 = I23 = 0. La retta e3 (retta perpendicolare al piano su cui giace il sistema) è asse principale d’inerzia. Proposizione 7.3.4 Sia SPo : {e1 , e3 , e3 } una terna principale d’inerzia centrata in Po , centro di massa di B. Dato un qualsiasi punto A appartenente ad uno degli assi di S (ovvero (A − Po ) parallelo a e1 , oppure ad e2 , oppure ad e3 ), allora la terna {e1 , e3 , e3 } centrata in A, che si denota con SA , è terna principale d’inerzia. Dim. Incominciamo col considerare un punto A qualsiasi (A − Po ) = xA e1 + yA e2 + zA e3 . Il sistema SPo è terna principale d’inerzia, per cui   I1 0 0 IPo =  0 I2 0  . 0 0 I3 Consideriamo adesso la terna SA centrata in A, e applichiamo il teorema di Huygens � 2 �   2 −M xA zA + zA −M�xA yA � I1 + M yA 2 −M xA yA I2 + M x2A + zA −M�yA zA �  (7.18) IA =  2 −M xA zA −M yA zA I3 + M x2A + yA Quindi, se, per esempio, A giace sull’asse e1 (sì che yA = zA = 0), avremo IA diagonale, come del resto se A giace sull’asse e2 o sull’asse e3 . DINAMICA SISTEMI RIGIDI 269 7.3.3 Ellissoide d’inerzia Sia dato il sistema di punti materiali B. Fissata una generica direzione individuata dal versore w, | w | = 1, il momento d’inerzia di S rispetto alla retta avente direzione w, passante per Q, è dato da (proposizione 7.3.2, punto 1) (7.19) Iw (Q) = w · σ w. 1 Consideriamo adesso il vettore W parallelo a w, dato da W = � w. EvidenIw (Q) 1 temente | W | = � . Dalla (7.19) abbiamo Iw (Q) W · σ W = 1. Fissiamo una generica terna ortonormale SQ : { e1 , e3 , e3 }, centrata in Q. Rispetto a SQ , il vettore W avrà componenti (7.20) W = ξ e1 + η e2 + ζ e3 , � 1 ξ 2 + η2 + ζ 2 = � . Inoltre, sempre rispetto a SQ , l’omografia Iw (Q) d’inerzia σ, sarà rappresentata dalla matrice   I11 I12 I13 IQ =  I12 I33 I23  . I13 I23 I33 tali che Di conseguenza   ξ I11 1 = W · σ W =  η  ·  I12 I13 ζ  ovvero I12 I33 I23   I13 ξ I23   η  , ζ I33 I11 ξ 2 + I22 η 2 + I3 ζ 2 + 2I12 ξη + 2I13 ξζ + 2I23 ηζ = 1. (7.21) L’equazione (7.21) è l’equazione di una superficie (ellissoide), detto ellissoide d’inerzia, centrata in Q. Quindi, data comunque una direzione w, il vettore W = w � , le cui generiche componenti sono specificate dalla (7.20), individua un Iw (Q) ben preciso punto geometrico che giace sulla superficie (7.21). E’ ovviamente vero anche il viceversa. Ad ogni punto A che giace sulla superficie (7.21), e che è individuato da una generica terna (ξ, η, ζ), possiamo associare il vettore W = (A − Q) = ξ e1 + η e2 + ζ e3 . La norma di tale vettore ha un ben preciso significato fisico |A − Q| = |W | = � 1 ξ 2 + η2 + ζ 2 = � . Iw (Q) (7.22) Ora, i punti che stanno la superficie (7.21), si trovano a varie distanze3 dal centro Q. In particolare, i due punti che si trovano in corrispondenza dell’asse maggiore 3I punti si troverebbero tutti alla stessa distanza da Q nel caso in cui l’ellissoide fosse una sfera. 270 LEZIONI DI SISTEMI DINAMICI sono quelli che si trovano a maggior distanza da Q, ossia quelli per cui |A − Q| = ξ 2 + η 2 + ζ 2 è la più grande possibile. Allo stesso modo i due punti che stanno sull’asse minore sono quelli che si trovano a minor distanza da Q, ossia quelli per cui |A − Q| = ξ 2 + η 2 + ζ 2 è la più piccola possibile. Detti dunque Amax e Amin i punti dell’ellissoide che si trovano in corrispondenza dell’asse maggiore e dell’asse minore, per ogni punto A che giace sull’ellissoide, varrà |Amin − Q| ≤ |A − Q| ≤ |Amax − Q| . Ma allora, dalla (7.22), data una generica direzione individuata da w, abbiamo che ossia 1 ≤ |Amax − Q| , |Amin − Q| ≤ Iw (Q) 1 |Amax − Q| ≤ Iw (Q) ≤ 1 |Amin − Q| . Questo vuol dire che il momento d’inerzia di un sistema B rispetto alla retta per Q avente direzione w, è limitato dall’alto e dal basso. Non solo, ma, fissato Q, al variare della direzione w, il momento d’inerzia ha un massimo ed un minimo. Il massimo è ottenuto quando la direzione w corrisponde alla direzione dell’asse minore dell’ellissoide mentre il minimo quando la direzione w è parallela all’asse maggiore dell’ellissoide. 7.3.4 Determinazione della terna principale d’inerzia nel caso di sistemi piani Supponiamo che tutti i punti materiali di B giacciano su un piano che, senza perdere in generalità, può essere il piano z = 0. Fissiamo poi un punto Q (giacente su z = 0) ed una terna SQ : {e1 , e2 , e3 }, tale che il versore e3 sia perpendicolare al piano z = 0 (e pertanto, corollario 7.3.2, è asse principale d’inerzia). I punti Pi di B avranno coordinate (Pi − Q) = xi e1 + yi e2 , i = 1, 2, ..., N . Riferendoci sempre a SQ e limitandoci solo alle due componenti “piane”, la matrice d’inerzia sarà I11 I12 IQ = . I12 I22 ′ Il problema che ci poniamo è il seguente: determinare un nuovo sistema SQ : ′ ′ ′ con e1 e e2 ruotati di un angolo α rispetto a e1 ed e2 , in modo che SQ π π sia terna principale d’inerzia. Evidentemente, − ≤ α ≤ . Nel seguito presentiamo 2 2 ′ alcuni metodi per individuare l’angolo α, in modo tale che SQ risulti terna principale d’inerzia. {e1′ , e2′ , e3 }, METODO DEL CERCHIO DI MOHR ′ il sistema {X, Y }. Riferendoci alla figura 7.3, SQ indica il sistema {x, y}, mentre SQ ′ Nel sistema SQ la matrice d’inerzia è data da JQ = J11 J12 J12 J22 . DINAMICA SISTEMI RIGIDI 271 y Y X α x Figura 7.3: Sistema (X; Y ) ruotato di α rispetto a (x, y). Ora, è facile vedere che � x y � � �� cos α − sin α X = , sin α cos α Y � �� B per cui, ricordando la (7.17), la relazione che lega IQ a JQ è la seguente IQ = B JQ BT Q , ⇔ JQ = BT IQ BQ . (7.23) Se supponiamo nota IQ , gli elementi della matrice JQ si ottengono dalla seconda della (7.23), cioè  I22 − I11 I11 + I22   J11 = − cos 2α + I12 sin 2α,   2 2      I22 − I11 I11 + I22 + cos 2α − I12 sin 2α, J22 =  2 2         J12 = I22 − I11 sin 2α + I12 cos 2α, 2 dove abbiamo sfruttato le formule di duplicazione: sin2 α = 1 + cos 2α . 2 (7.24) 1 − cos 2α , cos2 α = 2 272 LEZIONI DI SISTEMI DINAMICI Se selezioniamo la (7.24)1 e la (7.24)3, abbiamo, nel piano (J11 , J12 ) , una curva definita tramite il parametro 2α, −π ≤ 2α ≤ π,  I22 − I11 I11 + I22  − cos 2α + I12 sin α,   J11 = 2 2    J = I22 − I11 sin 2α + I cos α. 12 12 2 Tale curva rappresenta una circonferenza, detta cerchio di Mohr (v. figura 7.4), di raggio �� 2 I22 − I11 2 , + I12 R= 2 � � I22 + I11 ,0 . ed il cui centro nel piano (J11 , J12 ) ha coordinate 2 J12 R= I   −I 2   + (I  ) R J J I   +I 2  ,0   J11 Figura 7.4: Cerchio di Mohr. ′ è principale d’inerzia, è quello per cui J12 = 0, Quindi, l’angolo α per cui SQ ovvero I22 − I11 2I12 sin 2α + I12 cos 2α = 0, ⇔ tan 2α = − . (7.25) 2 I22 − I11 In corrispondenza di tali angoli4 J11 assume valore massimo �� 2 I22 − I11 I11 + I22 2 , + + I12 JM = 2 2 4 Gli angoli α che soddisfano la (7.25) sono due e sono separati da π/2. (7.26) DINAMICA SISTEMI RIGIDI 273 o minimo Jm I11 + I22 − = 2 I22 − I11 2 2 (7.27) 2 . + I12 Notiamo che gli autovalori di IQ sono ottenuti dall’equazione 2 = 0, (I11 − λ) (I22 − λ) − I12 det (IQ − λI) = 0, ⇒ le cui soluzioni sono proprio le (7.26), (7.27). METODO DEL PRODOTTO VETTORIALE Se il versore u è parallelo ad un autovettore di σ (Q), allora σ (Q) u è parallelo ad u stesso, per cui (7.28) u ∧ σ (Q) u = 0. Quindi, fissata una generica terna SQ , rispetto alla quale u ha la seguente espressione (7.29) u = cos αe1 + sin αe2 , avremo σ (Q) u = I11 I12 I12 I22 cos α sin α = (I11 cos α + I12 sin α) e1 + (I12 cos α + I22 sin α) e2 . Pertanto u ∧ σ (Q) u = I22 − I11 sin 2α + I12 cos 2α e3 , 2 da cui, imponendo la (7.28), si ottiene nuovamente la (7.25). METODO DELLA DERIVAZIONE Il metodo consiste nello sfruttare il fatto (messo in luce nella sezione 7.3.3) che, fissato Q, una direzione u è asse principale d’inerzia se il momento d’inerzia rispetto ad essa è massimo o minimo, o comunque stazionario. Quindi, se u è una generica direzione data da (7.29), avremo Iu (Q) = = u · σ (Q) u = cos α sin α I11 · I12 I12 I22 cos α sin α (I22 − I11 ) I11 + I22 − cos 2α + I12 sin 2α. 2 2 Quindi, Iu (Q) risulta una essere una funzione di α. Ricercando gli angoli α che dIu (Q) = 0, da cui si ottiene, ancora rendono stazionaria tale funzione, imponiamo dα una volta, la (7.25). 274 LEZIONI DI SISTEMI DINAMICI 7.3.5 Esempi e complementi In questa sezione daremo alcuni esempi sul calcolo dei momenti d’inerzia e illustreremo alcune proprietà della matrice d’inerzia dovute alla simmetria della stessa (proprietà note dal corso di algebra lineare). Proposizione 7.3.5 Gli autovalori della matrice d’inerzia sono tutti reali. Dim. La dimostrazione di questa proposizione è un caso particolare della dimostrazione del lemma 5.10.1 al quale rimandiamo. Mostriamo adesso che gli autovalori sono invarianti, cioè non dipendono dal particolare SdR ortonormale scelto. Proposizione 7.3.6 Gli autovalori della matrice d’inerzia sono invarianti per cambiamenti di base. Dim. Sia SQ : { e1 , e3 , e3 }, una base ortonormale centrata in Q. In tale base ′ σ (Q) è rappresentata dalla matrice simmetrica IQ . Se SQ : { e1′ , e3′ , e3′ }, è un’altra base ortonormale centrata in Q. La matrice che rappresenta l’operatore σ (Q) rispetto ′ SQ è I′Q . Sappiamo però che le matrici I′Q e IQ sono legate dalla (7.17), con B matrice ortogonale. � � E’ facile provare che det I′Q − λI = det (IQ − λI). Infatti det (IQ − λI) = = � � � � � � det BI′Q B−1 − λBIB−1 = det B I′Q − λI B−1 � � � � det B det I′Q − λI det B−1 = det I′Q − λI . � � Vediamo però anche un’altra dimostrazione. Sviluppando det I′Q − λI = 0, otteniamo il seguente polinomio in λ (detto polinomio caratteristico) λ3 − I1 λ2 + I2 λ − I3 = 0, con  I1 = tr IQ ,       � �� 1� 2 (tr IQ ) − tr IQ2 , I2 =  2      I3 = det IQ , �3 dove tr IQ = i=1 Iii , è la somma degli elementi diagonali. Le tre quantità I1 , I2 e I3 sono detti invarianti della matrice IQ , proprio perché non dipendono dalla particolare base. Infatti, ricordando che trAB =trBA, si ha � � � � � � tr IQ = tr BI′Q B−1 = tr B−1 BI′Q = tr I′Q , � � � � � � tr IQ2 = tr( BI′Q B−1 BI′Q B−1 ) = tr B−1 BI′Q2 = tr I′Q2 . � �� IQ IQ DINAMICA SISTEMI RIGIDI 275 Quindi, det (IQ − λI) = 0 darà luogo sempre allo stesso polinomio indipendentemente dalla base su cui è stata rappresentata σ (Q). Di conseguenza gli autovalori dui σ (Q) non dipendono dalla particolare base. Come ultima proprietà degli assi principali d’inerzia (che, come sappiamo, rappresentano gli autovettori della matrice d’inerzia) dimostriamo la seguente Proposizione 7.3.7 Esiste una base ortonormale di R3 formata da autovettori di σ (Q). Dim. Siano u1 , e u2 due autovettori relativi agli autovalori distinti I1 e I2 , ovvero σ (Q) ui = Ii ui , i = 1, 2. Siccome σ (Q) è simmetrica avremo u1 · σ (Q) u2 = σ (Q) u1 · u2 , e quindi 0 = u1 · σ (Q) u2 − σ (Q) u1 · u2 = u1 · I2 u2 − I1 u1 · u2 = (I2 − I1 ) u1 · u2 , che comporta u1 · u2 = 0, dal momento che I1 �= I2 . Evidentemente tale procedura non si applica nel caso in cui I1 = I2 , ovvero se l’autovalore I2 ha molteplicità algebrica doppia. Consideriamo quindi il caso in cui i tre autovalori di σ (Q) sono i seguenti I1 = I2 �= I3 . Consideriamo gli autovettori relativi a I3 ed a I2 , ovvero σ (Q) ui = Ii ui , i = 2, 3. Sia poi v un vettore ortogonale sia a u2 che a u3 . Mostriamo che v è autovettore di σ (Q). Infatti le componenti di σ (Q) v lungo u2 e u3 sono nulle u2 · σ (Q) v = σ (Q) u2 · v = I2 u2 · v = 0, u3 · σ (Q) v = σ (Q) u3 · v = I3 u3 · v = 0. Dunque σ (Q) v è parallelo a v, ovvero σ (Q) v = λv. Se adesso supponiamo che v, u2 e u3 , siano vettori unitari, si deduce che essi costituiscono una base ortonormale. Calcolando la traccia di σ (Q) su tale base abbiamo trσ (Q) = λ + I2 + I3 . Ma la traccia è un invariante, per cui abbiamo anche trσ (Q) = I2 + I2 + I3 . Di conseguenza λ = I2 . Si conclude che, anche nel caso in cui un autovalore abbia molteplicità doppia, si trovano comunque tre autovettori ortogonali. Non solo, ma si dimostra che un qualsiasi vettore ortogonale a u3 è autovettore relativo all’autovalore doppio I2 . Infatti, consideriamo un generico vettore w = αv + βu2 , ortogonale a u3 . Abbiamo σ (Q) w = σ (Q) (αv + βu2 ) = I2 αv + I2 βu2 = I2 w. In termini di assi principali d’inerzia, questo fatto vuol dire che ogni retta passante per Q, e che giace sul piano ortogonale a u3 , è asse principale d’inerzia. Vediamo infine l’ultimo caso: i tre autovalori sono coincidenti I1 = I2 = I3 = I. Sia u un autovettore, σ (Q) u = Iu, che supporremo unitario. Consideriamo adesso altri due vettori unitari v e w, tra loro ortogonali e ortogonali rispetto a u. Il sistema 276 LEZIONI DI SISTEMI DINAMICI u, v e w, costituisce una base ortonormale, su cui possiamo rappresentare σ (Q). In particolare, siccome u · σ (Q) v = σ (Q) u · v = Iu · v = 0, e analogamente u · σ (Q) w = 0, si deduce che σ (Q) v e σ (Q) w giacciono nel piano π, piano generato da v e w (e che è ortogonale a u). Rappresentando dunque σ (Q) nella base {u, v, w} otterremo la seguente matrice     σ (Q) v · v σ (Q) v · w σ (Q) v · u α β 0 IQ =  σ (Q) w · v σ (Q) w · w σ (Q) w · u  =  β δ 0  σ (Q) u · v σ (Q) u · w σ (Q) u · u 0 0 I � � α β Se adesso consideriamo la matrice simmetrica 2 × 2, , ovvero la rappresenβ δ tazione di σ (Q) sul piano π (piano ortogonale a u), si deduce che la stessa ammette ′ una coppia di autovettori ortogonali (entrambi giacenti � su π),� che denoteremo con v γ 0 e w′ , rispetto ai quali assume la forma diagonale . Ma allora, nella base 0 θ ortonormale {u, v ′ , w′ }, σ (Q) viene rappresentata dalla seguente matrice   γ 0 0 �IQ =  0 θ 0  0 0 I Calcolando adesso gli invarianti di �IQ , otteniamo il seguente sistema    γ + θ + I = 3I,  γ = I, ⇒   Iγθ = I 3 , θ = I. Abbiamo quindi determinato tre vettori ortogonali, u, v ′ e w ′ , che sono autovettori di σ (Q). Non solo, ma nella base {u, v ′ , w′ }, la matrice �IQ è multipla della matrice identità. Quindi ogni matrice d’inerzia sarà un multiplo della matrice identità. Di conseguenza ogni vettore è autovettore di σ (Q), ovvero ogni direzione è asse principale d’inerzia. Concludiamo la sezione con alcuni esempi. Esempio 7.3.1 Determinare il momento d’inerzia di un anello omogeneo di massa M , raggio R e spessore trascurabile, rispetto ad una retta passante per il centro e ortogonale al piano dell’anello. Applicando semplicemente la definizione 7.3.1 si ha I = M R2 . Esempio 7.3.2 Determinare la matrice d’inerzia di un disco omogeneo di massa M e raggio R, rispetto ad una terna centrata nel centro del disco, il cui asse z è perpendicolare al piano del disco (v. figura 7.5). L’asse z è asse principale d’inerzia così DINAMICA SISTEMI RIGIDI 277 z y R Q x Figura 7.5: Disco omogeneo di massa M e raggio R. come lo sono l’asse x e l’asse y (v. proposizione 7.3.3). Per determinare I3 (momento rispetto a z) si ricorre all’osservazione 7.3.2, immaginando di suddividere il disco in un’infinità di “anellini” di raggio r, 0 < r < R, e spessore infinitesimo dr. La massa infinitesima di ciascun “anellino” sarà dm = κ2πrdr essendo κ la massa per unità di superficie (densità superficiale di massa) κ = Avremo5 I3 = R 0 2 r dm = 2πκ 0 R r3 dr = M . πR2 M R2 . 2 Inoltre, dal momento che Ix = Iy , per ovvie ragioni di simmetria, sfruttando il corollario 1, avremo 2Ix = M R2 M R2 , ⇒ Ix = Iy = . 2 4 5 Osserviamo D 2 che questa procedura è equivalente a calcolare, in coordinate polari, l’integrale x + y 2 κ dxdy, dove κ = M/πR2 e D = (x, y) ∈ R2 : x2 + y 2 < R2 . 278 LEZIONI DI SISTEMI DINAMICI La matrice d’inerzia sarà dunque     IQ =    M R2 4 0 0 0 MR 4 0  0 2 0 MR 2 2    .   (7.30) Esempio 7.3.3 Determinare il momento d’inerzia di un segmento di massa M e lunghezza L, rispetto ad una retta ortogonale al segmento stesso passante per il suo centro. Anche in questo caso si ricorre alla nota 7.3.2, considerando il segmento come l’unione di “massettine infinitesime” dm, la cui posizione sulla retta individuata dal segmento, è identificata con la coordinata x, −L/2 < x < L/2, essendo x = 0 il centro del segmento. Introducendo la massa per unità di lunghezza λ = M/L, possiamo scrivere dm = λdx, e quindi, il momento d’inerzia rispetto ad una qualunque retta passante per il centro del segmento e ad esso ortogonale sarà I= � L/2 x2 λdx = −L/2 M L2 . 12 Esempio 7.3.4 Determinare la matrice d’inerzia di una lamina rettangolare omogenea di massa M e lati a e b, rispetto ad una terna {x, y, z}, centrata in Q, come in figura 7.6. L’asse z è asse principale d’inerzia, mentre gli assi x e y lo sono perché ortogonali a piani di simmetria materiale (proposizione 7.3.3). Iniziamo col calcolare il momento d’inerzia rispetto all’asse y, Iy . Seguendo ancora l’osservazione 7.3.2 si suddivide il rettangolo in un’infinità di sbarrette di lunghezza b e spessore infinitesimo dy. La massa di ciascuna sbarretta infinitesima sarà dm = κbdy, M , densità superficiale di massa. Il momento d’inerzia infinitesimo del ab b2 b3 segmento che si trova a coordinata y, −a/2 < y < a/2, sarà dm = κ dy = 12 12 M b2 dy , (v. esempio 7.3.3) per cui, sfruttando l’additività del momento d’inerzia (si 12 a veda la nota 7.3.2), � M b2 M b2 a/2 dy Iy = = . 12 −a/2 a 12 con κ = DINAMICA SISTEMI RIGIDI 279 z y Q b a x Figura 7.6: Lamina rettangolare omogenea di massa M . M a2 , per cui, applicando il corollario Con lo stesso procedimento si prova che Ix = 12 7.3.1, si ha   M a2 0 0  12    2 M b . IQ =  0  0  12   � M� 2 a + b2 0 0 12 Esempio 7.3.5 Determinare la matrice d’inerzia di una semidisco omogeneo di massa M e raggio R, rispetto ad una terna {x, y, z}, centrata in Q, come in figura 7.7. L’asse z è asse principale d’inerzia, così come l’asse x (perchè ortogonale ad un piano di simmetria materiale. Il terzo asse sarà di conseguenza asse principale d’inerzia. Per calcolare Iz , si ricorre ancora all’osservazione 7.3.2, notando che il momento d’inerzia rispetto all’asse z di un disco di massa 2M è il doppia di Iz . Avremo così 2Iz = 2M R2 , ⇒ 2 Iz = M R2 . 2 Allo stesso modo, 2Ix è il momento d’inerzia di un disco di massa 2M rispetto all’asse x, 2M R2 M R2 2Ix = , ⇒ Ix = . 4 4 La matrice IQ è quindi identica alla (7.30). 280 LEZIONI DI SISTEMI DINAMICI z y R Q x Figura 7.7: Semidisco di massa M . Esempio 7.3.6 Data una lamina piana omogenea, a forma di triangolo isoscele, avente massa M , base a ed altezza h, determinare il momento d’inerzia rispetto ad una retta ortogonale alla base e passante per il vertice del triangolo (retta r in figura 7.8 (I)). Si indica con I il momento d’inerzia che vogliamo determinare. La figura 7.8 (II) rappresenta la metà del triangolo isoscele, ovvero un triangolo rettangolo di base a/2 ed altezza h, la cui massa è M/2, ed è indicato con A. Il momento della lamina A, rispetto (1) alla retta (1) (v. ancora figura 7.8 (II)) si indica con IA . Ricordando l’osservazione 7.3.2, avremo (1) I = 2IA . (7.31) Ora consideriamo il rettangolo (che denotiamo con A ∪ B) di figura 7.8 (II), dato dal triangolo A, e dal triangolo “virtuale” B. Il momento d’inerzia del rettangolo A ∪ B (avente massa M e lati h e a/2) rispetto alla retta (1) sarà (1) (1) (1) IA∪B = IA + IB , (7.32) (1) dove IB rappresenta il momento d’inerzia del triangolo “virtuale” B rispetto alla retta (1). Quest’ultimo sarà uguale al momento d’inerzia di A rispetto alla retta (2), (2) (1) (2) IA , ovvero IB = IA . Quindi tornando alla (7.32) si ha (1) (1) (2) IA∪B = IA + IA , (1) (7.33) dove sappiamo quanto vale IA∪B (è sufficiente ricordare l’esempio 7.3.4 ed il teorema di Huygens) 2 M 1 a/2 (1) 2 2 IA∪B = M (a/2) + M (a/2) . = (7.34) 12 2 3 DINAMICA SISTEMI RIGIDI 281 r B A (I) ( II ) Figura 7.8: Lamina piana omogenea a forma di triangolo isoscele. (1) (2) Dobbiamo quindi valutare sia IA , che IA . Anche qui si ricorre al teorema di Huygens sfruttando il fatto che, riferendoci al sistema di riferimento {x, in y} indicato a/2 h . Perfigura 7.8 (II), il centro di massa del triangolo A ha le coordinate , 3 3 CM tanto, indicando con IA il momento d’inerzia di A rispetto alla retta passante per il centro di massa e parallela alla retta (1), abbiamo (1) IA = IACM M + 2 a/2 3 2 . e (2) IA = = 2 2 2 a/2 a/2 M a/2 M M (1) 2 2 = IA − + = 2 3 2 3 2 3 1 4 M M (1) (1) 2 2 (a/2) − + = IA + (a/2) . IA + 2 9 9 6 IACM + Inserendo queste ultime due formule nella (7.33) si ha (1) (1) IA∪B = 2IA + M 2 (a/2) . 6 da cui, ricordando anche la (7.34), (1) (1) 2IA = IA∪B − M M 2 2 (a/2) = (a/2) . 6 6 282 LEZIONI DI SISTEMI DINAMICI E infine, dalla (7.31), M a2 . 24 Ovviamente il procedimento qui illustrato non è l’unico per determinare I, ma ha il pregio di far spesso ricorso al teorema di Huygens e all’osservazione 7.3.2. I= Esempio 7.3.7 Data una lamina omogenea quadrata di massa M e lato a, dimostrare, facendo uso del metodo del cerchio di Mohr che, dato un qualunque punto A sulle diagonali del quadrato, una base {e1 , e2 } è principale d’inerzia se {e1 , e2 } sono paralleli alle diagonali del quadrato. e e α A E Q E Figura 7.9: Quadrato omogeneo. Riferendoci alla figura 7.9, si indica con SQ il sistema {E 1 , E 2 } centrato in Q, mentre con SA sistema {E 1 , E 2 } centrato in A. SQ è principale d’inerzia e, rispetto ad esso, la matrice (2 × 2) d’inerzia è   M a2 0   IQ =  12 . M a2  0 12 In generale il SdR SA non sarà principale d’inerzia. Infatti la matrice d’inerzia è data da (v. formula (7.18))   M a2 2 + M yA −M xA yA   IA =  12 . M a2 −M xA yA + M x2A 12 DINAMICA SISTEMI RIGIDI 283 Dobbiamo adesso individuare l’angolo α di cui ruotare SA al fine di ottenere un nuovo ′ sistema SA : { e1 , e2 }, che sia principale d’inerzia. Ricordando la (7.18) abbiamo M 2 x2A − yA sin 2α − M xA yA cos 2α = 0. 2 Ora se A giace su una diagonale del quadrato vale xA = ±yA , per cui la formula precedente diventa 2 ±M yA cos 2α = 0, π π π ′ le cui due soluzioni sono: α = , e α = + . Quindi SA è principale d’inerzia se 4 4 2 { e1 , e2 } sono paralleli alle diagonali del quadrato. 7.4 Le equazioni cardinali Iniziamo con delle considerazioni generali sulle equazioni di moto di un sistema di punti vere per sistemi qualsiasi, anche non rigidi. Sia (Pk , mk ), k = 1, ..., N , un sistema di N punti materiali. Se adesso per ogni punto scriviamo la seconda legge di Newton otteniamo N equazioni del tipo int mk ak = F ext k + Fk , k = 1, ...., N, (7.35) dove abbiamo indicato con ak è l’accelerazione del k-esimo punto, con F int k e con F ext k le forze risultanti di tutte le forze applicate a Pk e distinte a secondo che la loro reazione (in accordo al principio di azione e reazione) risulti applicata ad un altro punto del sistema o a un punto esterno al sistema. Nel primo caso parleremo di forze interne, ext F int k , mentre nel secondo caso di forze esterne, F k . Sommando le N equazioni (7.35) otteniamo N mk a k = k=1 N F ext k + k=1 N F int k . (7.36) k=1 Ricordando la (7.6), il primo termine della (7.36) è proprio la derivata rispetto a t della quantità di moto6 K. N Osserviamo ora che la somma k=1 F int k è nulla in virtù del principio di azionereazione; infatti possiamo scrivere F int k = N F int j, k , (7.37) j=1 dove F int j, k è la forza che si esercita sul punto Pk e la cui reazione è applicata al punto int Pj . Si ha quindi F int j, k = −F k, j , e i due termini si cancellano nella somma in (7.36). N Quindi, ponendo F ext = k=1 F ext k , la (7.36) diventa N mk ak = F ext , (7.38) k=1 6 Ovviamente stiamo assumendo che le masse degli N punti materiali rimangano costanti nel tempo. 284 LEZIONI DI SISTEMI DINAMICI cioè d2 (Po − O) dK =M = F ext , dt dt2 (7.39) dove abbiamo sfruttato la (7.6). Il vettore F ext prende il nome di risultante delle forze esterne. Possiamo infine “leggere” l’equazione (7.39) come: la variazione della quantità di moto totale del sistema è uguale alla risultante delle forze esterne applicate al sistema. Inoltre, in virtù dell’uguaglianza tra K e M a(Po ), abbiamo che: il centro di massa del sistema si muove come un punto materiale, avente come massa la massa totale del sistema, sotto l’azione della risultante delle forze esterne. L’equazione (7.39) è detta prima equazione cardinale. Rimarchiamo che la (7.39) è stata ottenuta supponendo che le masse mk , k = 1, ..., N , siano costanti nel tempo e che nel SdR S valga la seconda legge di Newton, ovvero che S sia un SdR inerziale. Osserviamo poi che, come anticipato nell’introduzione del capitolo, l’equazione (7.39) è particolarmente adatta a descrivere la dinamica dei sistemi rigidi in quanto in essa non compaiono le forze vincolari interne che mantengono il vincolo di rigidità. Riprendiamo ora le equazioni (7.35) e, fissato un centro di riduzione Q, moltiplichiamo ognuna vettorialmente per (Pk − Q) e sommiamo, N k=1 mk (Pk − Q) ∧ ak = N k=1 (Pk − Q) ∧ F ext k + N (Pk − Q) ∧ F int k . (7.40) k=1 Sempre in virtù del principio di azione-reazione abbiamo che N k=1 (Pk − Q) ∧ F int k = 0. (7.41) Ricordando la (7.37) abbiamo N k=1 (Pk − Q) ∧ F int k = N k=1 (Pk − Q) ∧ N F int j, k , j=1 dove F int j, k è la forza che si esercita sul punto Pk con reazione applicata nel punto Pj . Riscriviamo la somma come N k=1 = (Pk − Q) ∧ j=1 F int j, k = N N k=1 j=1 (Pk − Q) ∧ F int j, k N N [(Pk − Pj ) + (Pj − Q)] ∧ F int j, k N N (Pk − Pj ) ∧ F int j, k + k=1 j=1 = N k=1 j=1 N N k=1 j=1 (Pj − Q) ∧ F int j, k . DINAMICA SISTEMI RIGIDI 285 Pk Fj,k Fk,j = - Fj,k Pj Q Figura 7.10: La forza F int j, k , è la forza interna agente sul punto materiale Pk . La int reazione ad F j, k è la forza F int k, j , che agisce sul punto materiale Pj . Dal principio int int di azione e reazione abbiamo: (i) F int j, k = −F k, j ; (ii) F j, k è parallela al vettore Pk − Pj . Riferendoci ora alla figura 7.10, (Pk − Pj ) ∧ F int j, k = 0, in quanto l’azione e la reazione hanno la stessa retta di azione, determinata dalla congiungente dei due punti di applicazione. Quindi N N k=1 j=1 (Pk − Q) ∧ F int j, k = N N k=1 j=1 (Pj − Q) ∧ F int j, k = − N N k=1 j=1 (Pj − Q) ∧ F int k, j . Le due somme nel primo e l’ultimo termine dell’uguaglianza sono lastessa somma: si N sono soltanto scambiati gli indici di somma. Ne segue che N k=1 j=1 (Pk − O) ∧ int F j, k , è uguale al suo opposto e quindi è nullo e questo prova la (7.41). Definizione 7.4.1 Il vettore7 τ ext (Q) = N k=1 (Pk − Q) ∧ F ext k , è detto momento risultante delle forze esterne rispetto al punto Q. 7 Rimandiamo alla sezione 1.5.2 per le proprità del momento. (7.42) 286 LEZIONI DI SISTEMI DINAMICI Deriviamo ora rispetto al tempo il momento angolare L (Q) dato dalla (7.7) N d d mk (Pk − Q) ∧ v k L (Q) = dt dt k=1 d = dt = N k=1 N d d (Pk − O) − (Q − O) ∧ v k + mk (Pk − Q) ∧ ak dt dt N mk N (v k − v Q ) ∧ mk v k + k=1 = mk [(Pk − O) − (Q − O)] ∧ v k k=1 = −vQ ∧ k=1 N k=1 mk v k + K (7.5) N (Pk − Q) ∧ k=1 mk a k int F ext k +F k (Pk − Q) ∧ F ext k + k=1 N τ ext (Q) (7.42) N k=1 (Pk − Q) ∧ F int k , =0 (7.41) da cui abbiamo d L (Q) = τ ext (Q) − v Q ∧ K . dt (7.43) La (7.43) è detta seconda equazione cardinale. Il termine v Q ∧ K può essere reso nullo con una opportuna scelta del centro di riduzione Q. Infatti se il punto Q ha velocità parallela alla velocità del centro di massa questo termine si annulla (si ricordi la (7.5)). Le scelte più utilizzate sono Q fisso oppure Q ≡ Po ; con queste scelte d abbiamo L (Q) = τ ext (Q), ovvero la variazione del momento della quantità di dt moto uguaglia il momento risultante delle forze esterne. 7.5 Le equazioni cardinali sono sufficienti per determinare il moto dei rigidi Le equazioni cardinali formano un sistema di sei equazioni scalari, valide per qualsiasi sistema materiale (sia discreto che continuo). In generale esse risultano insufficienti per determinare il moto del sistema, non solo nel caso in cui i gradi di libertà siano più di sei, ma anche in casi semplici come quello di due punti isolati tra loro interagenti con una forza qualsiasi (problema a due corpi): in questo caso il sistema ha 6 gradi di libertà ma il moto è solo in parte determinato dalle equazioni cardinali (che in questo caso ci dicono che il centro di massa del sistema si muove di moto rettilineo uniforme e che si conserva il momento della quantità di moto rispetto al centro di massa); non possiamo tuttavia ricavare dalle equazioni cardinali la distanza, variabile nel tempo, tra i due punti in quanto la sua variazione dipende dalla forza di interazione tra i due punti, che è una forza interna. DINAMICA SISTEMI RIGIDI 287 Nel caso dei sistemi rigidi liberi le equazioni cardinali sono anche sufficienti per determinare il moto del sistema. Questo è dovuto al fatto che esse sono equivalenti all’equazione simbolica della dinamica (5.22), che, evitando la scomposizione (5.20), si scrive come8 N k=1 (F k − mk ak ) · δξ k = 0 , (7.44) ∀ (δξ 1 , ...., δξN ) , dove, riprendendo la notazione del capitolo 6, sezione 6.2, δξk , k = 1, ..., N , è lo spostamento virtuale del k-esimo punto materiale del sistema rigido compatibile con il vincolo di rigidità. Supponendo il sistema rigido libero (cioè non soggetto a vincoli se non a quello di rigidità), possiamo scrivere la (6.17) come ξ k = ξ Q (q1 , q2 , q3 ) + A (ϕ1 , ϕ2 , ϕ3 ) xk , k = 1, ..., N, dove Q è un punto solidale con il corpo rigido e: • (q1 , q2 , q3 ) sono i tre gradi di libertà che identificano la posizione del punto Q (per esempio le tre coordinate cartesiane di Q rispetto al SdR fisso); • (ϕ1 , ϕ2 , ϕ3 ) sono gli altri tre parametri lagrangiani che individuano la rotazione (per esempio i tre angoli di Eulero); • xk , rappresenta il vettore (Pk − Q), vettore posizione del k-esimo punto materiale nel SdR solidale9 . Nel seguito di questo paragrafo, dopo aver trovato la forma degli spostamenti “virtuali rigidi”, mostreremo, sfruttando l’arbitrarietà degli spostamenti virtuali, che dalle (7.44) si ottengono proprio le equazioni cardinali. Cominciamo col determinare lo spostamento virtuale δξ k . Applicando la (4.26) abbiamo δξ k = 3 ∂ξ Q δqi + 3 ∂ξ Q δqi + i=1 = i=1 ∂qi ∂qi 3 3 3 ∂ξQ ∂A ∂A T xk δϕi = δqi + A A xk δϕi ∂ϕi ∂qi ∂ϕi i=1 i=1 i=1 I 3 ∂A T A δϕi ∂ϕi i=1 Axk . (7.45) Ricordando adesso la procedura della sezione 6.3, abbiamo 3 ∂A AT δϕi Axk = δω ∧ Axk , ∂ϕ i i=1 8 Si ricorda che nel vettore F k non devono essere considerate le eventuali reazioni vincolari esterne dovute a vincoli lisci, né le forze vincolari interne dovute al vincolo di rigidità. Quest’ultimo è infatti un vincolo liscio, come mostrato nell’esempio 5.2.1. 9 Ovviamente si conoscono i vettori posizione, rispetto al SdR solidale, di tutti i punti che costituiscono il sistema rigido, dal momento che le struttura geometrico-materiale del corpo è data. 288 LEZIONI DI SISTEMI DINAMICI 3 ∂A T A δϕi , è lo spostamento virtuale associato alla rotazione. ∂ϕi 3 ∂ξ Q Ponendo10 (Pk − Q) = Axk , e δξ Q = δqi , la (7.45) diventa i=1 ∂qi dove δω = i=1 δξk = δξ Q + δω ∧ (Pk − Q) , che, utilizzando una notazione vettoriale, scriveremo anche come (7.46) δ (Pk − O) = δ (Q − O) + δω ∧ (Pk − Q) , dove O è il centro del SdR fisso mentre Q è quello del SdR solidale (avevamo già detto che Q è un punto solidale col corpo rigido). L’equazione simbolica della dinamica (7.44) diventa quindi N (F k − mk ak ) · δξ Q + δω ∧ (Pk − Q) = 0, k=1 (7.47) ∀ δξ O , δω . int Operando la scomposizione F k = F ext k + F k , e ricordando la formula (1.16), la (7.47) può essere così riscritta N k=1 = N k=1 = (F ext k + F int k k=1 N (F k − mk ak ) · δξQ + δω ∧ (Pk − Q) − mk ak ) · δξ Q + int [δω ∧ (Pk − Q)] · (F ext k + F k − mk ak ) N k=1 N k=1 (F ext k − mk ak ) · δξQ + (Pk − Q) ∧ (F ext k N F int k k=1 =0 − mk ak ) · δω + · δξ Q + N k=1 (Pk − Q) ∧ =0 F int k · δω . A questo punto sfruttiamo l’arbitrarietà degli spostamenti virtuali, δξ Q e δω, considerando dapprima δω = 0, e poi δξ Q = 0. Nel primo caso, δω = 0, la (7.44) si riduce a N (F ext k − mk ak ) · δξ Q = 0, k=1 10 Volendo utilizzare la stessa notazione della sezione 6.2, avremmo dovuto indicare Axk con ξp k . DINAMICA SISTEMI RIGIDI 289 che, dovendo valere per ogni δξQ , equivale alla (7.38), ovvero alla (7.39). Se adesso consideriamo δξ Q = 0, otteniamo N k=1 (Pk − Q) ∧ (F ext k − mk ak ) · δω = 0, che, per l’arbitrarietà di δω, equivale a N k=1 (Pk − Q) ∧ (F ext k − mk ak ) = 0. (7.48) Ora, riprendendo la (7.7) e derivandola rispetto al tempo abbiamo N d L (Q) = dt mk k=1 + N k=1 N = k=1 + d [(Pk − O) − (Q − O)] ∧ v k + dt mk (Pk − Q) ∧ ak mk v k ∧ v k − v Q ∧ N k=1 =0 N k=1 mk (Pk − Q) ∧ ak , mk v k + K ovvero N k=1 mk (Pk − Q) ∧ ak = d L (Q) + v Q ∧ K, dt che, sostituita nella (7.48), dà luogo a N k=1 cioè alla (7.43). (Pk − Q) ∧ F ext k − τ ext (Q) d L (Q) − v Q ∧ K = 0, dt 7.6 Momento angolare, energia cinetica e seconda equazione cardinale per i sistemi rigidi Affrontiamo adesso tre argomenti fondamentali di questo capitolo: la scrittura del momento angolare per un corpo rigido (rispetto ad un centro di riduzione solidale col corpo stesso), la scrittura della seconda equazione cardinale e la scrittura dell’energia 290 LEZIONI DI SISTEMI DINAMICI cinetica di un corpo rigido (il cosiddetto Teorema di König11 ). Illustreremo poi un argomento strettamente collegato alla seconda equazione cardinale: il momento delle reazioni vincolari nel caso di rotazioni uniformi. 7.6.1 Momento angolare per un sistema rigido Torniamo all’espressione del momento angolare, o momento della quantità di moto, (7.7). Nel caso di un sistema rigido possiamo sostituire l’espressione di v k con la formula fondamentale dei moti rigidi (6.32), se il polo Q è un punto solidale con il sistema rigido. Nel caso in cui il centro di riduzione non sia solidale la formula è leggermente più complicata e si invita il lettore a ricavarla per esercizio. Otteniamo così L(Q) = N k=1 mk (Pk − Q) ∧ [v(Q) + ω ∧ (Pk − Q)] = M (Po − Q) ∧ v(Q) + N k=1 mk (Pk − Q) ∧ [ω ∧ (Pk − Q)] . (7.49) Anche questa espressione può essere semplificata scegliendo opportunamente il polo Q. Se Q è fisso sì che v(Q) = 0 (cioè abbiamo un moto rigido con un punto fisso, detto moto di precessione), oppure se Q ≡ Po , la (7.49) si semplifica in L(Q) = N k=1 mk (Pk − Q) ∧ [ω ∧ (Pk − Q)] (7.50) che, lo ricordiamo ancora, è valida soltanto se Q è solidale con il sistema rigido. Concentrandoci sulla parte di destra della (7.50) e ricordando la definizione 7.3.3, abbiamo L(Q) = σ(Q)ω . (7.51) Ora, come illustrato nella sezione 7.3.2, l’operatore σ(Q) è rappresentato da una matrice IQ una volta che viene fissato sistema di riferimento12 centrato in Q. Se il SdR in cui si calcolano le componenti della matrice IQ ha gli assi fissi mentre il corpo si muove, allora gli elementi della matrice (7.16) dipendono dal tempo. E’ quindi evidente che conviene selezionare un SdR cartesiano ortogonale i cui assi siano solidali col corpo rigido, ovvero un sistema di riferimento solidale S centrato in Q. Non solo, ma tra tutti i sistemi di riferimento solidali conviene scegliere quelli in cui IQ è diagonale, ovvero SdR che sono terne principali d’inerzia. La selezione di un riferimento solidale (possibilmente una terna principale d’inerzia) porta, come detto, alla ovvia conseguenza che gli elementi della matrice IQ sono costanti, ma porta anche ad un’altra conseguenza: il vettore L(Q) viene ad essere espresso in S, SdR solidale (v. figura 7.11). Bisogna quindi di aver cura di esprimere anche ω in S, e soprattutto, bisogna porre particolare attenzione quando si calcola la derivata rispetto al tempo di L(Q), come vedremo nella prossima sezione. 11 Johann Samuel König (Büdingen, 1712 – Zuilenstein, 1757), matematico tedesco. comunque che i sistemi di riferimento devono essere ortonormali. 12 Ricordiamoci DINAMICA SISTEMI RIGIDI 291 7.6.2 Seconda equazione cardinale per i sistemi rigidi La grande differenza fra la dinamica del punto e la dinamica dei sistemi rigidi risiede nella seconda equazione cardinale, che è deputata a descrivere la parte rotatoria del moto. Riferendoci alla figura 7.11, consideriamo un SdR cartesiano ortogonale fisso Σ ed uno, denotato da S, solidale col corpo rigido. Supponiamo inoltre che il centro di riduzione Q sia fisso o coincidente con centro di massa del corpo, sì che L (Q) assume la forma (7.51). Q Sistema di Riferimento fisso Sistema di Riferimento S solidale con il corpo rigido Σ Figura 7.11: Sistema di riferimento fisso Σ e SdR S solidale con il corpo rigido. Vogliamo calcolare la variazione rispetto al tempo (la derivata temporale) di L (Q) rispetto all’osservatore Σ. Per mantenere la notazione più chiara possibile indicheremo, ma soltanto in questa e nelle prossime sezioni, con: • ISQ , la matrice d’inerzia rispetto al SdR solidale S. Come già detto, le componenti di ISQ , sono constanti. • IΣ Q , la matrice d’inerzia rispetto al SdR fisso Σ, o meglio, la matrice d’inerzia rispetto ad un SdR i cui assi sono paralleli a quelli di Σ ed è centrato in Q. Ovviamente le le componenti di IΣ Q , non sono constanti nel tempo. Infatti, ricordando la (7.17), abbiamo S T IΣ (7.52) Q = AIQ A , dove A = A (t), è la matrice di rotazione (6.7), introdotta nella sezione 6.2. Riprendendo la notazione della sezione 6.3, se ω è il vettore velocità angolare, denotiamo con ω Σ la terna delle componenti ω rispetto al SdR fisso Σ e con ω S la terna 292 LEZIONI DI SISTEMI DINAMICI delle componenti ω rispetto al SdR solidale S. Quindi ω −→   ωΣ ,  ωS , terna delle componenti rispetto a Σ, terna delle componenti rispetto a S. In particolare, ricordando la (6.52), ωΣ = Aωs . L’espressione di L (Q) nel SdR fisso Σ oppure nel SdR solidale S è dunque(7.51)  Σ  IQ ωΣ , L (Q) = σ(Q)ω −→  (7.51) ISQ ωS , nel SdR Σ, nel SdR S. Sfruttando la (7.52), è facile ricavare la relazione che lega le due espressioni S T ω = AISQ ωs . IΣ Q ω Σ = AIQ A � �� Σ� (7.53) ωs Per calcolare la variazione nel tempo di L (Q) rispetto all’osservatore Σ, deriviamo rispetto al tempo IΣ Q ω Σ . Tenendo presenti la (7.53) e la (6.26), otteniamo d �Σ � I ωΣ = dt Q = = d � S T � AIQ A ωΣ dt dω Σ dAT dA S T IQ A ω Σ + AISQ ωΣ + AISQ AT dt dt dt T dωΣ dA T S T S T dA A ωΣ + AISQ AT A I A ω + AI A A Σ Q Q � �� dt dt dt I = � dA T A dt I �� dAT dω Σ AISQ AT ω Σ + AISQ AT A ωΣ + AISQ AT . dt dt � �� Ora, rammentando la formula (6.30), cioè d �Σ � I ωΣ = dt Q = ωΣ ∧ T − dA dt A dA T A v = ω ∧ v, abbiamo dt � � dω � Σ AISQ AT ωΣ − AISQ AT ω Σ ∧ ω Σ + AISQ AT dt � �� =0 IΣ Q Σ ω Σ ∧ IΣ Q ω Σ + IQ IΣ Q dωΣ . dt Notiamo che la stessa equazione si ottiene facendo uso della formula di Poisson S (6.69). Infatti, sfruttando la seconda uguaglianza della (7.53), cioè IΣ Q ω Σ = AIQ ω S , DINAMICA SISTEMI RIGIDI 293 otteniamo � d � Σ �� I ωΣ � dt Q A = � dA dωS dω S dA T S d � S AIQ ωS = ISQ ωS + AISQ = A A�IQ ω S + AISQ �� dt dt dt dt dt I = ωΣ ∧ AISQ ω S � �� + dω S AISQ ��dt� Σ d(I ω Σ ) Q � IΣ Q ωΣ dt = ωΣ ∧ IΣ QωΣ R � � �� d IΣ Q ωΣ � + � � dt R Osserviamo che talvolta conviene esprimere la derivata rispetto al tempo di13 L (Q) nel SdR solidale S. In accordo con la (6.52) e la (6.71), abbiamo � � � dA � �Σ � dω S S T d T d T A I ωΣ AIQ ω S = AT A�ISQ ISQ ω S + �A�� = A dt Q dt dt dt � �� I ωS ∧ dω S . = ω S ∧ ISQ ω S + ISQ dt Quindi, prescindendo dal SdR, la seconda equazione cardinale per un corpo rigido, nell’ipotesi che il polo Q sia fisso o coincidente col centro di massa14 , si scrive come ω ∧ σ(Q)ω + σ(Q)ω̇ = τ ext (Q) , (7.54) intendendo che le quantità vettoriali ω, τ ext (Q) e l’omografia d’inerzia σ(Q) che ivi compaiono possono essere espresse sia nel SdR fisso Σ, sia nel SdR solidale S. La scelta di quale SdR utilizzare dipende essenzialmente dalla convenienza nel fare i calcoli. Alcune osservazioni sono doverose: 1. Notiamo per prima cosa che ω̇ = 0, rotazione uniforme, non comporta necessariamente τ ext (Q) = 0. Infatti, se ω̇ = 0, avremo che τ ext (Q) = 0 soltanto se ω è parallelo ad un asse principale d’inerzia, cioè se σ(Q)ω è parallelo ad ω (ovvero ω è un autovettore di σ(Q). 2. La (7.54) assume una forma particolarmente semplice nel caso di moti piani. Se infatti e3 è il versore ortogonale al piano dove si svolge il moto, abbiamo ω Σ = ω S = ϕ̇e3 , e  I11  I12 IQ = 0 I12 I22 0  0 0  I33 ⇒ IQ ω = I33 ϕ̇e3 , 13 Attenzione a non fare confusione: la derivata rispetto al tempo di L (Q) viene calcolata dall’osservatore Σ. Tale derivata però, che è un vettore, può essere espressa sia nel SdR fisso Σ, ma anche nel SdR solidale S. 14 In ogni caso Q deve essere solidale con il corpo rigido. 294 LEZIONI DI SISTEMI DINAMICI per cui ω ∧ IQ ω = ϕ̇e3 ∧ I33 ϕ̇e3 = 0, e la (7.54) si riduce a I33 ϕ̈ = τ ext (Q) · e3 . (7.55) La configurazione del sistema è determinata completamente dall’angolo ϕ, ed il suo stato cinematico da ϕ e ϕ̇. Inoltre, se la componente τ ext (Q) · e3 del momento è funzione anch’essa solo di ϕ (oppure di ϕ e ϕ̇ nel caso sia presente una qualche forma di attrito o resistenza al moto), ne segue che la (7.55) determina completamente il moto rotatorio del sistema. Da un punto di vista “matematico” l’equazione (7.55) è del tutto analoga all’equazione di moto di un punto materiale, dove ora il ruolo della forza è tenuto dal momento delle forze esterne e il ruolo della massa dal momento di inerzia. Possiamo quindi identificare il momento di inerzia di un corpo, relativo ad un dato asse, come la sua tendenza a permanere in uno stato di moto di rotazione uniforme attorno a quell’asse, così come la massa inerziale di un punto materiale misura la tendenza a permanere nel suo stato di moto rettilineo uniforme: far variare la velocità di rotazione sarà tanto più difficile quanto maggiore è il momento d’inerzia. Esempio 7.6.1 Una lamina rettangolare è vincolata a ruotare uniformemente attorno alla propria diagonale maggiore, come mostrato nella figura 7.12. Si vuole determinare il momento τ ext che i cuscinetti che sostengono l’asse di rotazione esercitano sull’asse stesso. SdR fisso Σ y x cuscinetti che sostengono l’asse di rotazione α cuscinetti che sostengono l’asse di rotazione Q asse di rotazione Figura 7.12: Lamina rettangolare in rotazione uniforme attorno alla diagonale principale. Si denota con α è l’angolo fra la diagonale della lamina e l’asse x. DINAMICA SISTEMI RIGIDI 295 Applichiamo la (7.54), scrivendola nel SdR solidale. Il vettore ω, nel SdR fisso è dato dalla terna   ω ωΣ =  0  , (7.56) 0 mentre nel SdR solidale è ωS = AT ωΣ , dove, al solito, A è la matrice di rotazione. Evidentemente, la terna delle componenti della velocità angolare nel SdR solidale è   ω cos α ω S =  −ω sin α  , (7.57) 0 dal momento che la velocità angolare giace sempre nel piano (x, y) del SdR solidale. Tuttavia, mostriamo come si giunge ad ω S passando tramite l’usuale relazione ω S = AT ω Σ , con ωΣ data dalla (7.56). Per passare dal SdR fisso a quello solidale, dobbiamo prima ruotare attorno all’asse (diagonale maggiore della lamina) di un angolo φ = ωt, la cui matrice è   1 0 0  0 cos φ sin φ  , AT φ = 0 − sin φ cos φ e poi ruotare attorno all’asse ortogonale al piano della lamina passante per Q, di un angolo α, la cui matrice è   cos α sin α 0  − sin α cos α 0  . AT α = 0 0 1 Quindi AT = = Si ottiene così ωS = =  1 0 cos α sin α 0 T    0 cos φ AT A = − sin α cos α 0 α φ 0 − sin φ 0 0 1   cos α cos φ sin α sin α sin φ  − sin α cos α cos φ cos α sin φ  . 0 − sin φ cos φ   cos α AT ω Σ =  − sin α 0   ω cos α  −ω sin α  , 0  0 sin φ  cos φ    ω 1 0 0 sin α 0 cos α 0   0 cos φ sin φ   0  0 0 − sin φ cos φ 0 1 cioè la (7.57). Osserviamo adesso che il SdR solidale è una terna principale d’inerzia per cui   I1 0 0 ISQ =  0 I2 0  , 0 0 I3 296 LEZIONI DI SISTEMI DINAMICI e quindi  I1 ISQ ω S =  0 0 0 I2 0     0 ω cos α ωI1 cos α 0   −ω sin α  =  −ωI2 sin α  , 0 I3 0 da cui ricaviamo l’espressione del momento applicato dai cuscinetti all’asse nel SdR solidale     ω cos α ωI1 cos α τ ext = ωS ∧ ISQ ω S =  −ω sin α  ∧  −ωI2 sin α  0 0   0 sin 2α (I1 − I2 )  0  . = ω2 (7.58) 2 1 Si deduce che τ ext = 0, se I1 = I2 , cioè la lamina è un quadrato, oppure se sin 2α = π 0, ⇒ α = 0, ± , ovvero se l’asse di rotazione coincide con l’asse x o con l’asse y (che 2 sono principali d’inerzia). Osserviamo che l’espressione (7.58) fornisce le componenti di τ ext nel SdR solidale (nello specifico τ ext è ortogonale al piano della lamina). L’espressione di τ ext nel SdR fisso è data da   0 sin 2α (I1 − I2 )  − sin φ  , Aτ ext = Aφ Aα τ ext = ω 2 (7.59) 2 cos φ dove φ varia nel tempo. E’ interessante notare che si giunge esattamente allo stesso risultato se fin da principio si lavora nel SdR fisso. In quest’ottica dobbiamo esprimere la matrice d’inerzia nel SdR fisso, cioè = S T S T T IΣ Q = AIQ A = Aφ Aα IQ Aα Aφ  sin 2α cos φ (I1 − I�2 ) I1 cos2 α + I2 sin2 α 2 �  sin 2α cos φ (I1 − I2 ) cos2 φ I2 cos2 α + I1 sin2 α + I3 sin2 φ 2 � � sin 2α sin φ (I1 − I2 ) cos φ sin φ I2 cos2 α + I1 sin2 α − I3 2  sin 2α � �2 sin2φ (I1 − I2 )2 . cos φ �sin φ I2 cos α + I1 sin � α − I32 2 2 2 sin φ I2 cos α + I1 sin α + I3 cos φ Ora, ricordando che φ = ωt, la precedente espressione di IΣ Q mette in luce un fatto importante (già sottolineato alla fine della sezione 7.6.1): in generale gli elementi della matrice d’inerzia espressa nel SdR fisso dipendono dal tempo. Tornando alla seconda cardinale, �    �  ω I1 cos2 α + I2 sin2 α ω Σ IΣ 0  =  ω (I1 − I2 ) sin22α cos φ  , Q ω Σ = IQ 0 ω (I1 − I2 ) sin22α sin φ DINAMICA SISTEMI RIGIDI per cui le componenti di τ ext    ω   0  ∧ IΣ Q 0 297 nel SdR fisso sono    ω 0 sin 2α 0  = ω2 (I1 − I2 )  − sin φ  , 2 0 cos φ che coincide con (7.59). Per concludere osserviamo che τ ext è il momento imposto all’asse di rotazione dai cuscinetti i quali subiscono, per il principio di azione e reazione, una sollecitazione uguale ed opposta. Infatti, ponendoci nel SdR solidale scriveremo � � d 2 sin 2α ω (I1 − I2 ) = 2 Fcuscinetti , 2 2 dove d/2 è la semidiagonale e Fcuscinetti è la forza applicata dai cuscinetti all’asse. La forza che i cuscinetti subiscono è dunque Fcuscinetti = ω 2 sin 2α (I1 − I2 ) . 2d 7.6.3 Reazioni vincolari applicate all’asse di rotazione Alla luce dell’esempio 7.6.1, vogliamo sottolineare ancora il ruolo delle reazioni vincolari nel caso di rotazioni. Supponiamo che il sistema rigido sia vincolato a muoversi di moto rotatorio attorno ad un asse fisso, che, senza perdere in generalità, assumeremo coincidere con l’asse e3 . Nello specifico vogliamo: 1. determinare le condizioni che devono valere affinché i vincoli che impongono la rotazione attorno ad un asse si possano dire lisci; 2. determinare le reazioni vincolari, o meglio il momento delle reazioni, nel caso di rotazioni uniformi. Per prima cosa vediamo cosa si deve intendere per vincolo di rotazione liscio. Applicando la definizione 5.2.1, i vincoli che impongono al corpo di ruotare attorno all’asse e3 sono lisci se le reazioni vincolari Rext k soddisfano la condizione � Rext (7.60) k · δ (Pk − O) = 0 , k per ogni sistema di spostamenti virtuali δ (Pk − O) compatibile con i vincoli. La maniera più naturale per vincolare un rigido a ruotare attorno ad un asse fisso è quello di collocare una o più cerniere in altrettanti punti della retta il cui versore è e3 , come mostrato nella figura 7.13 Poiché l’asse di rotazione è fisso, supponiamo che il centro di riduzione Q ed O coincidano e che Q giaccia sull’asse di rotazione (quindi Q ≡ O, ancorché solidale col sistema rigido, è fisso). La (7.46) comporta δ (Pk − O) = δϕe3 ∧ (Pk − Q) , dove, come detto, e3 è il versore dell’asse di rotazione. Usando l’arbitrarietà di δϕ nella (7.60) abbiamo � �� (7.61) Rext (Pk − Q) ∧ Rext · e3 = 0 . k k · [e3 ∧ (Pk − Q)] = k (1.16) k 298 LEZIONI DI SISTEMI DINAMICI e3 Figura 7.13: Corpo rigido in rotazione attorno ad un asse fisso. Diremo quindi che il corpo rigido ruota senza attrito attorno all’asse, ovvero che il vincolo di rotazione attorno all’asse è liscio, se le forze di reazione dovute al vincolo di rotazione hanno momento con componente nulla lungo l’asse di rotazione15. Si osservi tuttavia che la (7.61) non comporta assolutamente che le reazioni vincolari 16 Rext k siano nulle . Nota 7.6.1 Se consideriamo un moto piano e supponiamo che il vincolo di rotazione sia liscio, nel termine di destra della (7.55), cioè in τ ext (Q) · e3 , le reazioni vincolari non compaiono. In altri termini, τ ext (Q) · e3 è dovuto alle sole forze esterne direttamente applicate. Se poi τ ext (Q) · e3 = 0, cioè se il momento risultante delle forze esterne applicate è nullo, la rotazione risulterà uniforme, cioè ϕ̇ = costante. 15 Allo stesso modo si dimostra che se si impone al sistema il vincolo di mantenere un punto fisso Q durante il moto, la condizione di vincolo liscio equivale a dire che il momento delle reazioni vincolari rispetto ad Q deve essere nullo. 16 Ricordiamo, a titolo di esempio, che nel caso di un punto materiale vincolato su una superficie, il vincolo (la superficie) si dice liscio non se la reazione vincolare è nulla, ma se questa è ortogonale al vincolo. DINAMICA SISTEMI RIGIDI 299 Concentriamoci adesso sul secondo punto, supponendo che la rotazione sia uniforme, cioè ω = ϕ̇e3 , con ϕ̇ = costante, e che non vi siano forze esterne direttamente applicate al corpo. La (7.54) diventa ω ∧ IQ ω = τ ext (Q) , dove τ ext (Q) è il momento delle sole reazioni vincolari. Mostriamo innanzitutto che il vincolo è liscio. Infatti τ ext (Q) · e3 = (ϕ̇e3 ∧ IQ ϕ̇e3 ) · e3 = ϕ̇2 (e3 ∧ e3 ) · IQ e3 . � �� (1.16) =0 Calcoliamo adesso τ ext (Q). Consideriamo un SdR solidale S in cui l’asse z coincida con l’asse e3 . Lavorando in S, avremo   0 ω =  0 , ϕ̇ e  I11 IQ ω =  I12 I13 I12 I22 I23     I13 0 I13 I23   0  = ϕ̇  I23  , ϕ̇ I33 I33 siccome, in generale, S non sarà una terna principale d’inerzia. Otteniamo così   −I23 (7.62) τ ext (Q) = ω ∧ IQ ω = ϕ̇2  I13  0 Quindi, se l’asse di rotazione non è principale di inerzia, il termine ω ∧ IQ ω non si annulla. Le forze vincolari devono fornire un momento per garantire il moto di rotazione attorno all’asse stesso. Si può calcolare il modulo del momento che le reazioni devono fornire (e quindi “quantificare” la sollecitazione che questa rotazione impone ai vincoli) � � ext � �τ (Q)� = ϕ̇2 I 2 + I 2 �= 0 . (7.63) 13 23 Si osservi che il momento τ ext (Q), che è costante nel sistema di riferimento solidale S, ruota nel sistema di riferimento fisso, ovvero quello in cui si trovano i dispositivi che realizzano fisicamente i vincoli (cuscinetti, bronzine, etc.). Quindi la presenza di un momento deviatore non nullo tende a “destabilizzare” il moto di rotazione, cercando di far “deviare” l’asse di rotazione dalla sua direzione “scardinando” (alla lunga) i vincoli. Non solo, ma il modulo del momento dipende dal quadrato della velocità angolare. Ciò significa che nei sistemi rigidi che ruotano ad altissime velocità, come per esempio le turbine, è di cruciale importanza posizionare l’asse di rotazione in corrispondenza di un asse principale d’inerzia. 300 LEZIONI DI SISTEMI DINAMICI Nota 7.6.2 Nonostante l’apparenza “esoterica”, questo fenomeno dovrebbe essere abbastanza noto a chiunque guidi un’automobile: sono le vibrazioni che si avvertono sullo sterzo quando si guida un’auto che abbia subito una (lieve) deformazione di una delle ruote a seguito, per esempio, di un urto con un marciapiede o una buca. Il “rimedio” è la cosiddetta “equilibratura” della ruota: si aggiunge un peso in un punto opportuno sulla parte esterna del cerchio della ruota. L’effetto è di far tornare l’asse di rotazione della ruota un asse principale di inerzia, togliendo quindi le sollecitazioni sul semiasse a cui è attaccata la ruota. Esempio 7.6.2 Prendendo spunto dalla nota precedente, calcoliamo il momento imposto dalle forze vincolari all’asse di rotazione di un disco che sta uniformemente ruotando attorno alla retta z, come mostrato in figura 7.14. X y=Y Z α asse di rotazione z x Figura 7.14: Disco in rotazione uniforme alla retta z, che forma un angolo α con l’asse del disco Z. Si individuano due SdR solidali: S ′ : {X, Y, Z}, che è una terna principale d’inerzia e S : {x, y, z}, che è non una terna principale d’inerzia, il cui asse y coincide con Y . Il SdR S è ottenuto da S ′ ruotando quest’ultimo di un angolo α attorno all’asse Y. Nel SdR solidale S ′ : {X, Y, Z}, la cui origine è nel punto Q, centro del disco, la matrice d’inerzia ha la forma (7.30), cioè  1 2 M R  0 I′Q = 4 0 0 1 0  0 0 . 2 DINAMICA SISTEMI RIGIDI 301 Il SdR solidale S : {x, y, z} si ottiene ruotando S ′ attorno all’asse Y di un angolo α (come evidenziato dalla figura 7.14). La matrice di rotazione da S ′ ad S è data da   cos α 0 − sin α . 1 0 B= 0 sin α 0 cos α L’espressione della matrice d’inerzia nel SdR S si ottiene sfruttando la (7.17), cioè   − cos α sin α cos2 α + 2 sin2 α 0 2 M R .  0 1 0 IQ = BI′Q BT = 4 2 2 − cos α sin α 0 2 cos α + sin α Nel SdR S la velocità angolare è ω S = ϕ̇e3 , per cui   − cos α sin α M R2  , 0 IQ ωS = ϕ̇ 4 2 cos2 α + sin2 α ed il momento applicato dalle forze vincolari all’asse di rotazione è   0 2 MR  sin 2α  . τ ext (Q) = ω S ∧ IQ ω S = −ϕ̇2 8 0 π Notiamo che il momento si annulla se α = 0, ± , ovvero il disco ruota attorno all’asse 2 Z, oppure attorno all’asse X, che sono assi principali d’inerzia. 7.6.4 L’energia cinetica Il tensore d’inerzia ci fornisce anche una forma compatta per esprimere l’energia cinetica in di un sistema rigido. Selezioniamo un punto Q solidale con il corpo rigido, e sfruttiamo la formula fondamentale dei moti rigidi (6.32) N N k=1 k=1 1� 1� 2 T = mk v 2k = mk [v(Q) + ω ∧ (Pk − Q)] . 2 2 (7.64) Sviluppando il quadrato otteniamo � � N N � 1 1� 2 2 T = M v (Q) + v(Q) · ω ∧ mk (Pk − Q) + mk [ω ∧ (Pk − Q)] . 2 2 k=1 k=1 (7.65) dove M la massa totale del corpo. Anche in questo caso il doppio prodotto può essere reso nullo con una opportuna scelta del punto Q. Infatti: • se Q è fisso sia il primo che il secondo termine nella somma in (7.65) sono nulli e abbiamo N 1� T = mk [ω ∧ (Pk − Q)]2 ; 2 k=1 302 LEZIONI DI SISTEMI DINAMICI • oppure se Q ≡ Po , cioè Q coincide con il centro di massa, la somma tra parentesi nel secondo addendo si annulla e si può scrivere N 1 1� 2 T = M v 2 (P0 ) + mk [ω ∧ (Pk − P0 )] . 2 2 (7.66) k=1 La formula (7.66) è nota come Teorema di König, e dice che l’energia di un corpo rigido è data dalla somma dell’energia che avrebbe un punto materiale di massa uguale alla massa del corpo, indicata con TP0 , e l’energia cinetica che il corpo ha rispetto a un sistema di riferimento che trasla con velocità uguale a quella del centro di massa17 , che indicheremo con TR . Procedendo nel calcolo in modo analogo a quanto fatto nel calcolo di L(Q), applichiamo la proposizione 7.3.2 TR = 1 ω · σ(P0 )ω . 2 (7.67) In particolare, una volta selezionato un SdR cartesiano ortogonale centrato nel centro di massa, avremo 1 TR = ω · IPo ω, (7.68) 2 essendo IPo l’espressione dell’operatore σ(P0 ) rispetto al SdR selezionato. Anche in tal caso converrà in generale selezionare un SdR solidale che sia principale d’inerzia in modo che sia IPo diagonale. Evidentemente dovremo aver cura di esprimere anche ω nel medesimo SdR. Riepilogando T =  1 1 2    2 M v (P0 ) + 2 ω · σ(P0 )ω ,    1 ω · σ(Q)ω , 2 se Q coincide con Po , (7.69) se Q è fisso. Esempio 7.6.3 Consideriamo un sistema rigido come in figura 7.15. Il corpo può ruotare attorno alla retta verticale (con cui l’asta forma un angolo α) e su se stesso. Si seleziona un SdR solidale centro in O, in cui l’asse x coincide con l’asta, l’asse z giace sul piano formato dalla retta verticale e dall’asse x, e l’asse y è ortogonale a tale piano. Tale SdR è una terna principale d’inerzia. Indichiamo con θ l’angolo di rotazione attorno alla retta verticale e con φ quello attorno all’asse x. Quindi, l’espressione di ω nel SdR solidale è   φ̇ − θ̇ cos α , 0 ω= θ̇ sin α 17 Questo teorema è spesso enunciato dicendo che l’energia cinetica di un sistema rigido è uguale alla somma dell’energia cinetica del centro di massa e dell’energia cinetica relativa al centro di massa. E’ bene notare che il senso dei termini usati è quello specificato sopra nel testo: presi “alla lettera” energia cinetica del centro di massa e energia cinetica relativa al centro di massa non hanno significato. DINAMICA SISTEMI RIGIDI 303 z y O α x Figura 7.15: Il sistema rigido è composto da un disco di massa M e raggio R, e un’asta, di massa m e lunghezza d, saldata ortogonalmente al disco nel suo centro. L’asta è incernierata nel punto O della retta verticale e mantiene un angolo α con la retta stessa. dove θ̇ è la velocità di rotazione attorno alla retta verticale mentre φ̇ è la velocità di rotazione del corpo su se stesso. Applicando il teorema 7.3.1 e l’osservazione 7.3.2, la matrice d’inerzia è data da IO = = Iasta + Idisco O O   0 0 0 2 2     0 md + m d 0   12 4  2 2  md d 0 0 +m 12 4  M R2 0 0  2  2  MR + 0 + M d2 0  4  M R2 + M d2 0 0 4 che, per brevità di notazione, indicheremo come   I1 0 0 IO =  0 I2 0  . 0 0 I2     ,   304 LEZIONI DI SISTEMI DINAMICI Applicando la (7.69)2, abbiamo      φ̇ − θ̇ cos α φ̇ − θ̇ cos α I1 0 0 1  ·  0 I2 0    0 0 T = 2 0 0 I2 θ̇ sin α θ̇ sin α � � � �2 1 I1 φ̇ − θ̇ cos α + I2 θ̇2 sin2 α . = 2 Esempio 7.6.4 Consideriamo il sistema rigido dell’esempio 7.6.1. Le componenti del vettore ω nel SdR solidale di figura 7.12, sono   ω cos α ω =  −ω sin α  , 0 per cui, applicando sempre la formula (7.69)2    ω cos α I1 0 1 −ω sin α  ·  0 I2 T = 2 0 0 0 = � ω2 � I1 cos2 α + I2 sin2 α . 2   0 ω cos α 0   −ω sin α  0 I3 Esempio 7.6.5 Calcoliamo l’energia cinetica del disco dell’esempio 4.1.3, applicando la (7.69)1, dove Po è il centro Q della figura 4.3. Ricordando la (4.18), M 2 2 1 M v 2 (Q) = R θ̇ . 2 2 Per quel che riguarda l’energia cinetica dovuta alla rotazione, riferendoci alla figura 6.10, selezioniamo il SdR solidale S ′ . Come mostrato nell’esempio 6.8.1, la velocità angolare del disco è data da ω = ϕ̇eX ′ + θ̇ez , che, come già detto, esprimeremo nel SdR S ′ . Quindi ricordando la (6.74) abbiamo   ϕ̇ ω =  −θ̇ sin ϕ  , θ̇ cos ϕ dove, lo ricordiamo, θ e l’angolo di rotolamento ϕ sono legati dalla (4.20). Si applica adesso la (7.68), con IQ data da   M R2 0 0   2     M R2 IQ =  . 0 0   4  M R2  0 0 4 ottenendo così 1 M R2 2 M R2 2 ω· IQ ω = ϕ̇ + θ̇ . 2 4 8 DINAMICA SISTEMI RIGIDI 305 La (7.69)1 diventa quindi M R2 M R2 2 5 ϕ̇ = T = M R2 θ̇2 + 8 4 4 (4.20) � 5 R2 + 2 2 r � θ̇2 . Esempio 7.6.6 Il sistema di figura 7.16 è costituito da un asta AB, di lunghezza l e massa m, i cui estremi sono vincolati a scorrere su una circonferenza di raggio l/2 e massa m. La circonferenza può ruotare attorno all’asse x. I gradi di libertà del sistema rigido sono due: l’angolo ϕ di rotazione della circonferenza e l’angolo θ di rotazione dell’asta. Rispetto al SdR {O, x, y, z} solidale con il disco (ma non con ez O A B ey ex θ ϕ x Figura 7.16: Asta vincolata ad una circonferenza ruotante. l’asta), abbiamo ω = ϕ̇ex + θ̇ez . In tale SdR dobbiamo esprimere la matrice d’inerzia, che sarà + Iasta . IO = Ianello O O Come già osservato, il SdR {O, x, y, z} non è solidale con l’asta. Consideriamo quindi un SdR S, sempre centrato in O, solidale con l’asta, in cui l’asse X coincide con l’asta AB, l’asse Y giace sul piano dell’anello ed è ortogonale ad X, e Z ≡ z. In tale SdR abbiamo   0 0 0 2 ml  0 1 0 . Iasta O, S = 12 0 0 1 306 LEZIONI DI SISTEMI DINAMICI Per passare ad Iasta O , bisogna applicare la formula (7.17), dove B è la matrice di rotazione di un angolo θ attorno all’asse z, cioè     cos θ sin θ 0 0 0 0 cos θ − sin θ 0 2 ml  sin θ cos θ 0   0 1 0   − sin θ cos θ 0  Iasta = O 12 0 0 1 0 0 1 0 0 1   − cos θ sin θ 0 sin2 θ ml2  = − cos θ sin θ cos2 θ 0 . 12 0 0 1 Come più volte osservato, gli elementi della matrice d’inerzia in un SdR non solidale dipendono, in generale, dal tempo (si ricordi infatti che θ = θ (t) ). Dunque, la matrice d’inerzia della circonferenza e dell’asta è     1 0 0 sin2 θ − cos θ sin θ 0 2 ml ml2   − cos θ sin θ 0 1 0 + IO = cos2 θ 0  8 12 0 0 2 0 0 1  3  + sin2 θ − cos θ sin θ 0 2  ml2   . 3 = 2   + cos − cos θ sin θ θ 0 12 2 0 0 4 Applicando quindi la (7.69)2 otteniamo  3  + sin2 θ − cos θ sin θ ϕ̇  2 ml  3 0 ·  − cos θ sin θ + cos2 θ 24 2 θ̇ 0 0 � �� ml2 3 4θ̇2 + ϕ̇2 sin2 θ + . 24 2 2 T = =     ϕ̇   0  0  θ̇ 4 0 7.7 Le precessioni per inerzia Un caso importante di moto rigido è quello che va sotto il nome di precessione per inerzia. Ad esso si riducono diversi moti, apparentemente diversi. Il primo caso è quello di un corpo che si muove mantenendo un punto fisso O ed è soggetto a vincoli lisci e a forze esterne che hanno momento risultate τ ext (O) nullo rispetto al punto O. In questo caso si vede immediatamente che la seconda equazione cardinale è sufficiente per determinare il moto (essa è infatti equivalente all’equazione simbolica della dinamica), mentre la prima equazione cardinale serve solo per determinare la risultante delle forze vincolari. Il secondo caso è il moto di un corpo rigido “libero” (cioè non soggetto a vincoli oltre a quelli di rigidità) e a cui non siano applicate forze esterne. In questo caso il centro di massa si muove di moto rettilineo uniforme, e il moto “essenziale” è quello del corpo rispetto al riferimento inerziale con origine nel centro di massa. DINAMICA SISTEMI RIGIDI 307 Infine a questo tipo di moto si può ridurre il moto di un corpo rigido quando sia soggetto solo alla forza di gravità (e quando si possa assumere che questa sia uniforme, ovvero uguale a −mk g). Infatti in questo caso la prima equazione cardinale determina il moto del centro di massa, mentre il moto del corpo relativo al sistema di riferimento che trasla con la velocità del centro di massa è determinato dalla seconda equazione cardinale, dove ora le forze esterne hanno momento nullo rispetto al centro di massa. E’ interessante notare che ora, al contrario del caso precedente, questo il riferimento non è più inerziale. 7.7.1 Le equazioni di Eulero Le equazioni fondamentali per la descrizione delle precessioni per inerzia sono le Equazioni di Eulero. In realtà non si tratta di nuove equazioni; le equazioni di Eulero sono le equazioni scalari ottenute dalla seconda equazione cardinale, scritta nella forma (7.54), scomposta nel sistema di riferimento principale di inerzia (quindi un sistema solidale) centrato nel polo della precessione (il punto fisso). Se O è il punto fisso, la matrice d’inerzia ha la forma   I1 0 0 IO =  0 I2 0  , 0 0 I3 le equazioni di Eulero per precessioni qualsiasi, non solo per quelle per inerzia, hanno la forma I1 ω̇1 I2 ω̇2 I3 ω̇3 = (I2 − I3 )ω2 ω3 + τ1ext , = (I3 − I1 )ω3 ω1 + τ2ext , = (I1 − I2 )ω1 ω2 + τ3ext (7.70) , dove abbiamo indicato con ωi le componenti di ω in questo sistema di riferimento. Le componenti τiext del momento delle forze estere τ ext (O), rispetto ai tre assi solidali del riferimento principale, dipendono in genere dall’orientazione del corpo rispetto al sistema di riferimento che giudica il moto, e quindi sono funzioni degli angoli di Eulero. Quindi nel caso generale le (7.70) formano un sistema di equazioni differenziali del secondo ordine negli angolo di Eulero (per “esplicitare” questo sistema si dovrebbero sostituire le componenti di ω tramite gli angoli di Eulero e le loro derivate). Nel caso di una precessione per inerzia, tuttavia, abbiamo τiext = 0, i = 1, 2, 3, e le equazioni di Eulero diventano un sistema di equazioni del primo ordine per le componenti di ω. E’ bene notare subito che la risoluzione di queste equazioni non fornisce direttamente il moto del sistema ma l’evoluzione del vettore velocità angolare nel sistema di riferimento solidale; ovvero come si muove il vettore ω nel sistema di riferimento di cui stavamo cercando il moto! In effetti la soluzione delle equazioni di Eulero è solo un passo intermedio nella determinazione del moto. Una volta determinato ω dobbiamo ricostruire la matrice A di passaggio tra il sistema di riferimento fisso e quello mobile di cui ω, come espresso dalla formula (6.27) della sezione 6.3, è “la derivata”, cioè   0 −ω3 ω2 dA T  ω3 0 −ω1  . A = dt −ω2 ω1 0 308 LEZIONI DI SISTEMI DINAMICI 7.7.2 Risoluzione dell’equazione di Eulero nel caso di precessioni per inerzia Le equazioni di Eulero per le precessioni per inerzia sono risolubili “per quadrature”, cioè se ne può trovare la soluzione con un numero finito di integrazioni (e inversioni di funzioni) come avveniva per l’equazione scalare ẍ = f (x), analizzata nella sezione 2.6 capitolo 2. Questo è dovuto all’esistenza di due integrali primi, che permettono di ridurre il sistema a una sola equazione scalare del primo ordine. Riscriviamo il sistema (7.70) ponendo τ ext (O) = 0, I1 ω̇1 = I2 ω̇2 = I3 ω̇3 = (I2 − I3 )ω2 ω3 , (I3 − I2 )ω3 ω1 , (7.71) (I1 − I2 )ω1 ω2 . Il primo integrale è la conservazione dell’energia: poiché non ci sono forze che compiono lavoro, l’energia si riduce alla sola energia cinetica T = 1 I1 ω12 + I2 ω22 + I3 ω32 . 2 (7.72) La costanza di T si può ricavare direttamente delle (7.71) moltiplicando la prime per · · · ω 1 , la seconda per ω 2 e la terza per ω3 e sommando membro a membro: il risultato è la derivata di T eguagliata a zero. L’altro integrale è la conservazione del momento della quantità di moto che segue dalla seconda equazione cardinale, dal momento che τ ext (O) = 0. In particolare resta costante il modulo quadro del momento L2 = I12 ω12 + I22 ω22 + I32 ω32 . (7.73) Si noti che questi due integrali si riducono, essenzialmente, alla stessa equazione nel caso in cui i tre momenti di inerzia siano uguali: in questo caso ogni asse è principale di inerzia e il moto è una rotazione uniforme attorno all’asse individuato dalla condizione iniziale per ω. I due integrali primi ci dicono che ad ogni istante il vettore ω si trova sulla curva determinata dall’intersezione dei due ellissoidi determinati da (7.72) e (7.73): questa curva prende il nome di poloide (v. figura 7.17). Dividendo la (7.72) per 2T I1 2 I2 2 I3 2 ω + ω + ω =1 2T 1 2T 2 2T 3 (7.74) I12 2 I22 2 I32 2 ω + ω + ω = 1, L2 1 L2 2 L2 3 (7.75) e la (7.73) per L2 e sottraendo membro a membro, otteniamo L2 L2 L2 2 2 I1 I1 − ω1 + I2 I2 − ω2 + I3 I3 − ω32 = 0 . 2T 2T 2T (7.76) DINAMICA SISTEMI RIGIDI 309 La (7.76) è l’equazione di un cono (detto cono di Poinsot18 ) passante passante per O (v. figura 7.18), che è la superficie spazzata dall’asse di moto al variare del tempo, ovvero la rigata mobile di questo particolare moto rigido19. Figura 7.17: Integrali primi del moto per inerzia. Poloide. Casi degeneri: rotazioni Vediamo prima cosa succede in alcuni casi particolari. Supponiamo di aver scelto gli L2 = I1 , il cono rappresentato dalla (7.76) assi in modo che sia I1 < I2 < I3 . Se 2T degenera nella retta ω2 = ω3 = 0 (il coefficiente di ω1 è nullo e gli altri due sono negativi) che è l’asse maggiore dell’ellissoide 2T = I1 ω12 + I2 ω22 + I3 ω32 . Questo implica che la velocità angolare ω ha sempre la direzione dell’asse ω1 . Per valori di L2 2T leggermente maggiori di I1 , la poloide è una piccola curva chiusa attorno all’asse maggiore: ne segue che le rotazioni attorno all’asse maggiore sono stabili. L2 Analogamente se 2T = I3 , ω ha sempre la direzione dell’asse ω3 (l’asse minore dell’ellissoide). Il moto risultante è una rotazione del sistema attorno a questo asse. L2 Anche in questo caso le poloidi corrispondenti a valori leggermente inferiori di 2T , sono curve chiuse attorno all’asse minore, e la rotazione è ancora stabile. 18 Louis Poinsot (Clermont, 1777 – Parigi, 1859) è stato un matematico e fisico francese noto per i suoi contributi alla meccanica dei sistemi rigidi. 19 Ovviamente (7.76) è l’equazione di un cono se e solo se min{I , I , I } < L2 < max{I , I , I }. 1 2 3 1 2 3 2T Questa condizione è garantita (con i segni non stretti nei casi degeneri) dall’esistenza stessa del moto, ovvero 2 L soddisfi le due diseguaglianze. la condizione iniziale per ω fa sì che 2T 310 LEZIONI DI SISTEMI DINAMICI Figura 7.18: Integrali primi: l’ellissoide scuro (si vede solo una calotta) è la superficie dell’energia cinetica: l’ellissoide chiaro è la superficie del modulo quadro del momento; la superficie aperta è il cono di Poinsot solidale. Nel caso in cui si abbia L2 2T = I2 , il cono degenere nella coppia di piani20 L2 L2 ω12 + I2 I2 − ω32 = 0 . I1 I1 − 2T 2T Ovviamente vi è anche la soluzione ω1 = ω3 = 0, e ω2 �= 0, che corrisponde alla condizione iniziale ω diretto lungo l’asse intermedio: moto di rotazione attorno all’asse intermedio. Questa volta però il moto di rotazione è instabile. Il giroscopio Un altro caso in cui è facile determinare il moto per inerzia è quello che corrisponde ad un corpo a struttura giroscopica, ovvero quando due dei momenti di inerzia risultano uguali (ma non tutti e tre). Volendo caratterizzare un corpo a struttura giroscopica in termini di ellissoide d’inerzia, abbiamo che questo è un ellissoide di rotazione. L’asse di simmetria dell’ellissoide è detto asse giroscopico, e su di esso giace il centro di massa. In questo caso i due ellissoidi (7.74) e (7.75) sono “rotondi” (cioè a sezione circolare). Le poloidi sono quindi delle circonferenze e il cono di Poinsot è un cono circolare retto. 20 Si noti che i due coefficienti hanno segni opposti. DINAMICA SISTEMI RIGIDI 311 Senza perdere in generalità, possiamo supporre I1 = I2 = I, mentre l’asse z ha momento d’inerzia I3 . Le equazioni di Eulero si riducono a I ω̇1 I ω̇2 I3 ω̇3 = (I − I3 )ω2 ω3 , = (I3 − I)ω3 ω1 , = 0. Abbiamo quindi immediatamente ω3 (t) = ω3 0 = costante, e    ω̈1 = −Ω2 ω1 ,  ω̇1 = Ωω2 , ⇒   ω̇2 = −Ωω1 , ω̈2 = −Ω2 ω2 , (7.77) dove I − I3 ω3 0 . (7.78) I Le (7.77) sono immediatamente risolubili: sono le equazioni del moto armonico e ci dicono che ω ruota con velocità di modulo costante attorno all’asse z. In particolare, se supponiamo che all’istante iniziale ω1 |t=0 = A, e ω2 |t=0 = 0, la soluzione è   ω1 (t) = A cos (Ωt) , ω2 (t) = A sin (Ωt) ,  ω3 (t) = ω3 0 . Ω= Le componenti del momento angolare (ovviamente nel SdR solidale) sono      A cos (Ωt) I 0 0 AI cos (Ωt) L (O) = IO ω =  0 I 0   A sin (Ωt)  =  AI sin (Ωt)  . ω3 0 0 0 I3 I3 ω3 0 Quindi, rispetto al SdR solidale, le prime due componenti di L (O), cioè L1 e L2 variano nel tempo, mentre la terza componente L3 = I3 ω3 0 , rimane costante. Ma allora, se osservato dal SdR solidale il vettore L (O) ruota attorno all’asse z, con velocità angolare Ω. Tale moto viene appunto detto precessione. Quindi, se ξ è l’angolo fra l’asse z e il vettore L (O), esso rimane invariato e, siccome L3 = |L (O)| cos ξ, si ha cos ξ = I3 ω3 0 . |L (O)| Ora poniamoci nel SdR fisso {X, Y, Z} in cui l’asse Z coincide con il vettore L (O), che, ovviamente, è costante. Da questa prospettiva è l’asse z del SdR solidale che forma un angolo (costante) ξ con l’asse Z. In tal caso è l’asse z che precede attorno all’asse Z (come mostrato dalla figura 7.19) con velocità angolare Ω, data da (7.78), detta anche velocità di precessione. In particolare, Ω può anche essere espresso in funzione dell’angolo ξ, infatti Ω= I − I3 I − I3 |L (O)| ω3 0 = cos ξ . I I I3 312 LEZIONI DI SISTEMI DINAMICI z L(O) Z ξ Y O Ωt X Figura 7.19: SdR fisso {X, Y, Z}, in cui l’asse Z è allineato con L (O). L’asse z del SdR solidale precede attorno a L (O), ovvero attorno all’asse Z. Caso generico L2 è diversa Torniamo al caso generico in cui sia I1 < I2 < I3 , e la costante del moto 2T dai momenti di inerzia. Possiamo utilizzare le due relazioni (7.72) e (7.73) per scrivere un’equazione che coinvolge solo una delle ωi , per esempio la seconda componente ω2 . Infatti si ha ω12 = a21 (ν12 − ω22 ) , ω32 = a23 (ν32 − ω22 ) , (7.79) con a21 = e  I2 I1 − I2 I2 I3 − I2 , a23 = , I1 I3 − I1 I3 I1 − I3    L2 L2 − I 1 2T  2T  2 2T  2T  ν12 =   , ν3 =  . I2 I3 − I2 I2 I1 − I2 I3 − Sostituendo nella seconda equazione di Eulero il prodotto ω1 ω3 tramite la (7.79), otteniamo un’equazione a variabili separabili per la sola ω2 (l’equazione sarà affetta da una doppia determinazione di segno a causa delle radici quadrate; questo è inevitabile poiché corrisponde al fatto che ad ogni valore di ω2 corrispondono due punti sulla poloide). DINAMICA SISTEMI RIGIDI 313 7.7.3 Il moto à la Poinsot Accanto alla descrizione analitica del moto fornita dalle equazioni di Eulero, i due integrali primi T e L (O) ci permettono di dare una elegante descrizione geometrica del moto di precessione per inerzia, anche detto moto à la Poinsot. Denotiamo con E = costante, l’energia cinetica del corpo e consideriamo l’ellissoide dato da φ (ω) = ω · IO ω − 2E = 0. (7.80) Nel SdR solidale {ex , ey , ez } l’espressione di φ (ω) è particolarmente semplice se supponiamo che questo sia una terna principale d’inerzia, φ (ω1 , ω2 , ω3 ) = I1 ω12 + I2 ω22 + I3 ω32 − 2E = 0 . (7.81) Fissato adesso un qualsiasi ω che soddisfa la (7.81), calcoliamo il gradiente della superficie φ = 0, in corrispondenza di tale ω ∇φ = 2 [I1 ω1 ex + I2 ω2 ey + I3 ω3 ez ] = 2IO ω . Si osserva facilmente che ∇φ è parallelo al momento angolare L (O) L (O) = IO ω = I1 ω1 ex + I2 ω2 ey + I3 ω3 ez . Adesso consideriamo il piano Π ortogonale a ∇φ, passante per ω. Esso sarà ovviamente tangente all’ellissoide nel punto ω. Abbiamo quindi provato che, fissato comunque ω che soddisfa la (7.81), il piano tangente all’ellissoide in ω è ortogonale ad L (O). O d ω L (O) Figura 7.20: Moto à la Poinsot. Adesso facciamo gli stessi ragionamenti nel SdR fisso. Ovviamente l’equazione dell’ellissoide (7.80) avrà una forma molto più complicata e varierà nel tempo dal momento che, in generale, i coefficienti di IO dipendono dal tempo. Tuttavia L(O) è costante e allora anche la giacitura del piano Π è costante (essendo perpendicolare ad un vettore costante). Calcoliamo ora la distanza d di questo piano dal punto fisso O. Riferendoci alla figura 7.20 abbiamo d = ω · n, 314 dove n = IO ω, LEZIONI DI SISTEMI DINAMICI L (O) ∇φ = , è la normale al piano n. Ricordando adesso che L (O) = |∇φ| |L (O)| d=ω· ω · IO ω 2E L (O) = = . |L (O)| |L (O)| |L (O)| (7.82) La (7.82) ci dice dunque che la distanza d del piano Π dall’origine è costante nel tempo. Quindi il piano tangente all’ellissoide nel punto di intersezione con ω, che è l’asse istantaneo di moto, è un piano fisso (rispetto all’osservatore fisso). A sua volta il punto solidale che istantaneamente si trova a essere il punto di tangenza, ha velocità nulla in quanto è un punto dell’asse istantaneo di moto. Ne segue che l’ellissoide rotola senza strisciare sul piano. La curva descritta dal punto sul piano Π dal punto di tangenza prende il nome di erpoloide. Essa è l’intersezione del piano con la rigata fissa del moto. 7.8 Lagrangiana del corpo rigido Le equazioni di Lagrange sono utilizzabili per qualunque sistema meccanico, quali che siano i vincoli, purché olonomi. In particolare, abbiamo visto che il vincolo di rigidità è un vincolo liscio (esempio 5.2.1) per cui le forze vincolari che lo mantengono non compaiono nelle equazioni di Lagrange. In questa sezione illustreremo come si scrivono la funzione di Lagrange e le equazioni di Lagrange per un corpo rigido che: • sia soggetto alla forza peso; • sia soggetto a K forze F r , r = 1, ..., K, applicate nei punti Pr , r = 1, ..., K, del corpo; Come nel paragrafo 7.5 si denotano con qi , le coordinate, rispetto al SdR fisso, del centro del SdR solidale, e con ϕj , gli angoli che descrivono la rotazione. Ovviamente se il corpo è libero i = 1, 2, 3 e j = 1, 2, 3, ed il numero di gradi di libertà è 6, mentre se il corpo è soggetto a vincoli allora il numero di gradi di libertà sarà imax + jmax , dove 0 ≤ imax ≤ 3, e 0 ≤ jmax ≤ 3. Per quanto riguarda la forza peso, questo è un sistema di vettori applicati negli N punti Pi del corpo, cioè S = {(Pi , −mi gez ) , i = 1, ...., N } , dove −gez è l’accelerazione di gravità. Come visto nella sezione 1.5.4 il sistema S, è equivalente alla forza peso risultante −M gez = − i mi gez , applicata in un punto qualunque della retta passante per il centro di massa Po e parallela a g. Possiamo quindi supporre che la forza peso risultante sia applicata in Po , sì che l’energia potenziale ad essa associata è Vpeso = M gzPo , dove zPo è la quota del centro di massa. Esprimendo quest’ultima in termini dei parametri lagrangiani qi e ϕj , cioè zPo = zPo (qi , ϕj ), poniamo, come nella sezione 5.3, Vpeso (qi , ϕj ) = M g zPo (qi , ϕj ), e la funzione di Lagrange è L = T − Vpeso = T − M g zPo , DINAMICA SISTEMI RIGIDI 315 con T energia cinetica del corpo data dalla (7.69). Quindi il sistema di equazioni di Lagrange (5.33) diventa � � d ∂L ∂L − = Ξi , i ≤ imax , dt ∂ q̇i ∂qi � � ∂L d ∂L − = Ξj , j ≤ jmax , dt ∂ ϕ̇j ∂ϕj dove Ξi e Ξj sono le forze generalizzate che, ricordando la (5.32), sono date da Ξi = K � r=1 Fr · ∂xr , ∂qi e Ξj = K � h=1 Fr · ∂xr , ∂ϕj dove, per brevità, xr = (Pr − O) denota il vettore posizione del punto Pr , dove è applicata la forza F r . Se poi le forze applicate nei K punti del corpo sono conservative (per esempio sono forze generate da molle) allora sono derivabili da un’energia potenziale V (x1 , ..., xK ), per cui Ξi = − ∂ V� , ∂qi Ξj = − ∂ V� , ∂ϕj con V� (qi , ϕj ) = V (x1 (qi , ϕj ) , ..., xK (qi , ϕj )). La funzione di Lagrange diventa L = T − V�peso − V� . Esempio 7.8.1 In figura 7.21 è data un’asta AB, di lunghezza l e massa m, vincolata senza attrito nell’estremo A. L’estremo B è soggetto all’azione di una molla di lunghezza a riposo e massa trascurabili fissata nel punto C ≡ (0, 0, l). Il peso è� come in � figura. Prendiamo come parametri lagrangiani gli angoli ϕ ∈ [0, 2π) e θ ∈ − π2 , π2 , mostrati in figura. Consideriamo poi il SdR fisso S : {A, x, y, z} e quello solidale S ′ : {A, X, Y, Z}. La velocità angolare nel SdR S è ω = ϕ̇ez + θ̇eY = ϕ̇ez + θ̇ (− sin ϕex + cos ϕ ey ) = −θ̇ sin ϕex + θ̇ cos ϕey + ϕ̇ez , mentre nel SdR S ′ diventa ω = ϕ̇ez + θ̇eY = ϕ̇ (sin θeX + cos θeZ ) + θ̇eY = ϕ̇ sin θeX + θ̇eY + ϕ̇ cos θeZ . Poniamoci nel SdR solidale S ′ per calcolare l’energia cinetica. Applichiamo il teorema ′ 7.3.1 per determinare ISA , ′ ISA  0   0 =   0 0 � �2 ml2 l +m 12 2 0 0    0  ml2 =  0 � �2  3  0 ml2 l +m 12 2 0  0 0 1 0 . 0 1 316 LEZIONI DI SISTEMI DINAMICI z C X peso B Z Y A θ ϕ x y Figura 7.21: Asta vincolata nell’estremo A con l’estremo B soggetto alla forza di una molla. Sfruttando poi la (7.69)   ϕ̇ sin θ ml  · θ̇ 6 ϕ̇ cos θ � ml2 � 2 θ̇ + ϕ̇2 cos2 θ 6 2 T = =  0 0 0 1 0 0   ϕ̇ sin θ 0  0  θ̇ 1 ϕ̇ cos θ . Notiamo che se θ = 0, corrispondente all’asta orizzontale, l’energia cinetica è massima (a parità di ϕ̇ e θ̇) mentre è minima quando l’asta è verticale,cioè θ = ±π/2. Nel punto B è applicata una forza elastica, che possiamo derivare dall’energia k 2 potenziale V = (B − C) , 2 � k� 2 2 (l cos θ) + (l − l sin θ) = kl2 (1 − sin θ) . V� = 2 L’energia potenziale della forza peso è V̂ = mg 2l sin θ, e dunque la Lagrangiana è L= � ml2 � 2 l θ̇ + ϕ̇2 cos2 θ − kl2 (1 − sin θ) − mg sin θ. 6 2 La variabile ϕ è ciclica e ciò consente di determinare l’energia potenziale efficace (si suggerisce di farlo come esercizio). DINAMICA SISTEMI RIGIDI 317 Esempio 7.8.2 Riprendiamo l’esempio 4.1.2 e: (i) calcoliamo la funzione di Lagrange; (ii) mostriamo che il vincolo di rotolamento puro è liscio. Cominciamo proprio da questo punto, considerando l’angolo di rotolamento ϕ come parametro lagrangiano. Se C è il punto che, istante per istante, è a contatto con la guida rettilinea (v. figura 4.2), e F rot è la forza che impone il vincolo, dobbiamo calcolare F rot · ∂ (C − Ω) , ∂ϕ dove (C − Ω) deve essere espresso nel SdR fisso {Ω, x, y, z}. Selezioniamo un generico punto P del disco e prendiamo il centro del disco O come punto solidale. Volendo esprimere il vettore (P − Ω) nel SdR fisso scriveremo (P − Ω) = (O − Ω) + (P − O) , � �� −Rϕex +Rey AX dove A è la matrice di rotazione   cos ϕ − sin ϕ 0 A =  sin ϕ cos ϕ 0  , 0 0 1 e X è la terna delle coordinate, rispetto al SdR solidale, del punto P . Dunque ∂ (P − Ω) ∂A = −Rex + X. ∂ϕ ∂ϕ (7.83) Adesso consideriamo come punto P quello che, ad un determinato istante, coincide con C, cioè con il punto di contatto fra la guida ed il disco. Siccome nel SdR fisso il punto di contatto è individuato dal vettore −Rey , la terna X è data da  0 X = AT  −R  . 0  Se quindi consideriamo il punto di contatto, la (7.83) diventa   0 ∂ (C − Ω) ∂A T  −R  . = −Rex + A ∂ϕ ∂ϕ 0 Siccome ∂A T A ∂ϕ = =  cos ϕ − sin ϕ − cos ϕ 0  cos ϕ − sin ϕ 0   − sin ϕ 0 0 0 0   0 −1 0  1 0 0 , 0 0 0   sin ϕ 0 cos ϕ 0  0 1 318 LEZIONI DI SISTEMI DINAMICI abbiamo     0 0 −1 0 0 0   −R  =  0  . 0 0 0 0    −R 0 ∂ (C − Ω)  0 + 1 = ∂ϕ 0 0 Di conseguenza, qualunque sia la forza F rot , F rot · ∂ (C − Ω) = 0: il vincolo di ∂ϕ rotolamento è liscio. Per quel che riguarda l’energia cinetica, sfruttando la (7.69)1, otteniamo � �2 mR2 2 3 m d (O − Ω) ϕ̇ = mR2 ϕ̇2 , + T = 2 dt 4 4 da cui L = 3 mR2 ϕ̇2 . 4 7.9 Il giroscopio pesante Un altro caso interessante di moto rigido, che può essere risolto analiticamente, è quello della “trottola”, ovvero di un corpo a struttura giroscopica21 soggetto alla sola forza peso e vincolato senza attrito a precedere attorno a un punto dell’asse giroscopico, come mostrato in figura 7.22. Ovviamente assumeremo che il punto in cui il corpo è vincolato sia diverso dal centro di massa (altrimenti il moto sarebbe una precessione per inerzia). ζ θ z x η φ ψ ξ y linea dei nodi Figura 7.22: Giroscopio pesante In questo caso l’integrazione delle equazioni di moto è fatta a partire dalle equazioni di Lagrange, utilizzando come parametri lagrangiani gli angoli di Eulero. 21 La caratteristica di un corpo rigido a struttura giroscopica è stata descritta all’inizio del paragrafo 7.7.2. DINAMICA SISTEMI RIGIDI 319 Scegliamo il SdR solidale, S : {i, j, k}, con origine O nel polo della precessione (il punto fisso) con l’asse delle z coincidente con l’asse giroscopico. Ogni coppia di assi x e y (ortogonali) sul piano z = 0 definisce un sistema principale di inerzia per la simmetria di rotazione dell’ellissoide rispetto all’asse giroscopico. Prendiamo poi un riferimento fisso, Σ : {e1 , e2 , e3 }, con asse delle ζ coincidente con la direzione della verticale (ascendente): i parametri lagrangiani sono gli angoli di Eulero definiti da questi due riferimenti. I due SdR sono rappresentati nella figura 7.22. L’energia potenziale della forza peso è dato da V� (θ, ψ, ϕ) = M gl cos θ dove M è la massa totale del corpo rigido e l la distanza tra P0 e il polo O. Per determinare l’energia cinetica esprimiamo la velocità angolare ω in funzione degli angoli di Eulero ω = θ̇ n + ψ̇ e3 − ϕ̇ k . Per determinare ω · σ(O)ω, osserviamo che il calcolo può essere eseguito nel riferimento che ha come assi l’asse giroscopico, la linea dei nodi e l’asse perpendicolare a questi due: questo è una terna principale d’inerzia ad ogni istante (anche se mobile sia rispetto a S che a Σ) per la simmetria dell’ellissoide, e la matrice d’inerzia è del tipo   A 0 0 IO =  0 A 0  , 0 0 C con A > 0 e C > 0. Indichiamo con t il terzo versore di questo sistema. Basta quindi esprimere ω nelle componenti lungo k, n e t. Siccome e3 è ortogonale alla linea dei nodi otteniamo ω = θ̇ n + (ψ̇ cos θ − ϕ̇)k + ψ̇ sin θ t , da cui 2T = C(ψ̇ cos θ − ϕ̇)2 + A(θ̇2 + ψ̇ 2 sin2 θ) . Le due variabili ψ e ϕ sono cicliche, come dovevamo aspettarci visto che il sistema è invariante per rotazioni attorno al suo asse giroscopico (variazioni di ϕ) e rotazioni del sistema fisso attorno alla verticale (variazioni di ψ). Ne segue che le quantità pϕ = e ∂L = −C(ψ̇ cos θ − ϕ̇) = Cw3 = −Aa , ∂ ϕ̇ (7.84) ∂L (7.85) = C(ψ̇ cos θ − ϕ̇) cos θ + A ψ̇ sin2 θ = Ab , ∂ ψ̇ sono costanti del moto. I loro valori sono stati indicati con −A a e A b. Si noti che il primo integrale (7.84) dice che la componente della velocità angolare lungo l’asse giroscopico è costante. Avendo supposto che il corpo sia vincolato senza attrito, abbiamo anche la conservazione dell’energia pψ = E= 1 1 C(ψ̇ cos θ − ϕ̇)2 + A(θ̇2 + ψ̇ 2 sin2 θ) + M gl cos θ . �� 2 2� p2 ϕ C (7.86) 320 LEZIONI DI SISTEMI DINAMICI Possiamo ora utilizzare (7.84) per esprimere ϕ̇ in funzione di ψ̇ e θ C ϕ̇ = −Aa + C ψ̇ cos θ , (7.87) che sostituita nella (7.85) dà b − a cos θ . sin2 θ Sostituendo infine (7.88) nella (7.87) si ottiene ϕ̇ = ψ̇ = (7.88) b − a cos θ A a + cos θ . C sin2 θ (7.89) Le due relazioni (7.88) e (7.89) ci forniscono l’espressione delle derivate dei due angoli di Eulero in funzione dell’angolo θ. Quindi una volta ricavato θ in funzione del tempo, possiamo integrarle e ottenere ψ e ϕ in funzione del tempo. Possiamo ricavare un’equazione per la sola θ partendo dalla conservazione dell’energia che riscriveremo in forma ridotta, sfruttando la conservazione di pϕ . Infatti, partendo dalla (7.86) e considerando E′ = E − 1 1 p2ϕ = A(θ̇2 + ψ̇ 2 sin2 θ) + M gl cos θ , 2C 2 (7.90) abbiamo che E ′ è ancora un integrale primo del moto. Sostituendo le (7.88) e (7.89) nella (7.90) abbiamo l’equazione cercata sin2 θ θ̇2 = sin2 θ (α − β cos θ) − (b − a cos θ)2 , (7.91) dove 2M gl 2E ′ , β= . A A L’equazione (7.91) può essere scritta in termini della variabile u(t) = cos θ(t) α= u̇2 = (1 − u2 )(α − β u) − (b − a u)2 = f (u) , (7.92) che può essere risolta per separazioni di variabili esprimendo il tempo t in funzione della soluzione u u(t) du t − t0 = ± . (7.93) 2 (1 − u )(α − β u) − (b − a u)2 u(t0 ) L’integrale in (7.93) è un integrale ellittico, quindi non esprimibile, con un numero finito di operazioni, in termini di “funzioni elementari”. Inoltre la “soluzione” di (7.93) non consente di chiarire la fisica del problema più di quanto non si possa fare con l’analisi qualitativa della soluzione basata direttamente sull’equazione (7.92). Dalla (7.92) abbiamo che il moto è possibile solo per quei valori di u per cui f (u) > 0. Inoltre, essendo u = cos θ, solo i valori di u compresi nell’intervallo [−1, 1] hanno significato fisico. Notiamo che f (u) è un polinomio di terzo grado con coefficiente del termine di ordine massimo positivo. Inoltre abbiamo f (±1) ≤ 0, e il segno di uguaglianza vale solo nei casi a = b e a = −b che corrispondono a dati iniziali con l’asse giroscopico DINAMICA SISTEMI RIGIDI 321 asse giroscopico θ2 asse giroscopico θ2 arccos (a/b) θ1 θ1 Figura 7.23: a b �∈ [u1 , u2 ] , e a b ∈ [u1 , u2 ]. verticale. Nel caso generico abbiamo che, denotando con u3 il massimo delle soluzioni di f (u) = 0, u3 è sicuramente maggiore di 1 e tale che f (u)(u − u3 ) > 0 per u in un intorno di u3 e per tutti gli u > u3 . Poiché i coefficienti della funzione f (u) sono determinati dalle condizioni iniziali, essi saranno tali che f (u) è positiva (o meglio non negativa) in un sottoinsieme (eventualmente ridotto a un punto) contenuto in [−1, 1]. Quindi nella situazione generica avremo f (u) > 0 per u ∈ (u1 , u2 ) ⊂ (−1, 1), dove u1 e u2 sono le altre due radici del polinomio. Ne segue che il moto dell’asse, per quanto riguarda il suo angolo di nutazione θ, è un moto periodico compreso tra i due valori θ2 = arccos u2 e θ1 = arccos u1 (si noti che θ2 < θ1 dal momento che la funzione coseno decrescente in (0, π)). L’angolo di precessione ψ è determinato dall’equazione (7.88). Ciò implica che ψ sarà, o non sarà, una funzione monotona del tempo, a seconda che il valore ab non appartenga, oppure appartenga, all’intervallo delle radici, si vedano le figure 7.23. Un caso limite interessante è quello in cui u2 = ab , schematicamente rappresentato in figura 7.24. Tale caso corrisponde all’asse giroscopico “lasciato con velocità nulla” (ovviamente il giroscopio è inizialmente in rotazione attorno al proprio asse giroscopico). Questo caso può essere trattato in modo sufficientemente esauriente nell’approssimazione di “rotazione veloce” del giroscopio, ovvero nel caso, detto trottola veloce, in cui il numero adimensionale p2ϕ 2C >> 1 , 2M gl (7.94) ovvero quando l’energia cinetica di rotazione attorno all’asse giroscopico è molto maggiore della massima variazione possibile dell’energia potenziale. Gli effetti dovuti al momento generato dalla forza peso sono ora solo delle piccole perturbazioni del moto della trottola attorno al suo asse giroscopico. Possiamo quindi valutare l’estensione della nutazione e la velocità media della precessione dell’asse giroscopico, e le loro frequenze. 322 LEZIONI DI SISTEMI DINAMICI asse giroscopico θ2 θ1 Figura 7.24: Caso: a b = u2 L’angolo iniziale θ0 corrisponde alla circonferenza superiore nella figura 7.24, ovvero u0 = u2 . Quindi l’estensione della nutazione dipenderà dalla posizione della seconda radice di f (u) = 0. Poiché abbiamo assunto anche ψ̇ = 0, le costanti a e b sono legate (vedi la formula (7.88)), da b = au0 . Inoltre f (u0 ) = 0, quindi avremo anche α = βu0 , che significa semplicemente che il valore dell’energia ridotta E ′ è dato da M gl cos θ0 , ovvero l’energia potenziale iniziale. Usando queste relazioni possiamo riscrivere la funzione f (u) fattorizzando la radice u0 f (u) = (u0 − u) β(1 − u2 ) − a2 (u0 − u) . (7.95) La seconda radice u1 è quindi data dalla radice minore di 1 del polinomio di secondo grado tra parentesi quadre, che riscriveremo nella forma x2 + px − q = 0, con x = u0 − u, e p= a2 − 2 cos θ0 , β q = sin2 θ0 . Il termine 2 cos θ0 in p può essere trascurato, poiché il rapporto p2ϕ C C a = , β A 2M gl 2 a2 β è dato da DINAMICA SISTEMI RIGIDI 323 che, nell’ipotesi di “trottola veloce”, è molto più grande di 2 a meno che il giroscopio non sia di forma molto allungata lungo l’asse giroscopico (un sorta di trottola a forma di cilindretto). Allo stesso modo p2 sarà molto più grande di 4q quindi la radice che ci interessa è data, approssimativamente, da u0 − u1 = β sin2 θ0 A 2M gl = sin2 θ0 . a2 C Cw32 (7.96) La (7.96) ci dice che l’ampiezza della nutazione (ovvero di quanto “scende” l’asse giroscopico) decresce in modo inversamente al quadrato della velocità di rotazione attorno all’asse. Possiamo anche determinare in modo approssimato la frequenza di nutazione. In- fatti, poiché l’ampiezza della nutazione è piccola, possiamo sostituire il termine 1 − u2 nella (7.95) con il suo valore iniziale sin2 θ0 , ottenendo l’equazione differenziale in termini del rapporto x = u0 /u ẋ2 = x(β sin2 θ0 − a2 x) , che è l’integrale primo di una equazione di moto armonico e ha soluzione x = x21 (1 − p cos at). Ne segue che la frequenza di nutazione è data da a = Aϕ , ovvero aumenta con l’aumentare della velocità di rotazione attorno all’asse giroscopico. Infine, sostituendo questa soluzione nell’equazione per ψ, (7.88) otteniamo ψ̇ = β 2a (1 − cos at), che ci dice che velocità di precessione non è uniforme e non cambia segno (lo sapevamo!). La quantità importante in questo caso è la velocità media β della precessione sul suo periodo, che è data da ψ̇ = 2a = Mgl pϕ , che ci dice che la precessione è tanto più lenta quanto la trottola è veloce. Nota 7.9.1 Il moto della trottola è un ottimo esempio per capire i cosiddetti effetti giroscopici: la tenacia dell’asse e la tendenza al parallelismo. Il primo effetto consiste nel fatto che spostare l’asse giroscopico dalla sua direzione è tanto più “difficile” (ovvero richiede tanto maggiore momento della forza) quanto più la rotazione attorno all’asse è veloce. Il secondo effetto consiste nell’osservazione di un spostamento dell’asse non nella direzione della forza applicata, ma in quella del suo momento, ovvero in direzione perpendicolare alla forza applicata (questo comportamento paradossale è solo “macroscopicamente vero” nel senso che il moto iniziale dell’asse è nella della direzione della forza ma è piccolo e viene “immediatamente” mascherato dal moto di precessione, che avviene nella direzione del momento). 324 LEZIONI DI SISTEMI DINAMICI Capitolo 8 Principi variazionali Il est démontré, disait-il, que le choses ne peuvent être autrement: car tout étant fait pour une fin, tout est nécessairement pour la meilleure fin. Candide, Voltaire I principi variazionali della meccanica hanno origine da un “principio”, piuttosto oscuro e impregnato di misticismo, enunciato nel 1744 da Pierre Louis Moreau de Maupertuis1 con il nome di principe de la moindre quantité d’action2. Esso sosteneva che il moto avviene in modo da rendere minima l’azione che la Natura deve compiere in esso: “Lorsqu’il arrive quelque changement dans la Nature, la quantité d’action nécessaire pour ce changement est la plus petite qu’il soit possible3 . ” Questo modo “finalistico” di interpretare le leggi della fisica ha però un antecedente nel principio di Fermat4 per la propagazione della luce a cui Maupertuis fa esplicito riferimento. Fermat cerca “. . . l’explication des réfractions dans cet unique principe que la Nature agit toujours par les voies les plus courtes5 . . . ”: enuncia un principio secondo cui la luce segue il percorso lungo il quale in cammino ottico è il più breve, ovvero quello in cui la luce impiega il minor tempo possibile per andare dalla sorgente all’osservatore. Grazie a questo riesce a ricavare la legge della rifrazione di Snell6 della costanza del rapporto tra i seni dell’angolo di incidenza e quello di rifrazione (si veda la figura 8.1). Questo tipo di principi, detti variazionali, ha però trovato sempre dei feroci oppositori. Il principio di Fermat fu subito osteggiato dai seguaci di Cartesio, con argomenti abbastanza convincenti: se si sceglie il principio di Fermat come legge fondamentale per la propagazione della luce ci si trova a dover ammettere che il raggio di luce che va 1 Maupertuis (Saint-Malo, 1698 – Basilea, 1759) è stato un matematico, fisico, filosofo, naturalista e astronomo francese. 2 Principio della minima quantità d’azione 3 Quando in Natura avviene un qualche cambiamento, la quantità di azione necessaria a tale cambiamento è la più piccola possibile. 4 Pierre de Fermat (Beaumont-de-Lomagne, 1601 – Castres, 1665) fu tra i principali matematici della prima metà del XVII secolo e dette importanti contributi allo sviluppo della matematica moderna. 5 La spiegazione delle rifrazioni in quell’unico principio per cui la Natura agisce sempre per le vie più brevi. 6 Willebrord Snell van Royen (Leida,1580 – Leida, 1626), matematico, astronomo e fisico olandese. 326 LEZIONI DI SISTEMI DINAMICI da A a B, quando giunge alla superficie di separazione dei due mezzi deve, per andare proprio in B e non in un altro qualsiasi punto equidistante dal punto O di incidenza, ricordarsi di essere partito da A per andare in B, contrariamente al principio di “localizzazione” che vuole che solo ciò che accade al momento del passaggio da un mezzo all’altro deve influenzare la variazione di direzione del moto. In effetti il principio di Fermat si può poi ricavare attraverso il principio di Huygens della teoria ondulatoria, principio questo in accordo con la “localizzazione”. A i n1sin i = n 2sin r mezzo 1 O mezzo 2 r B Figura 8.1: La legge si Snell o della rifrazione. n1 è l’indice di rifrazione del mezzo 1, n2 è l’indice di rifrazione del mezzo 2. 8.1 La brachistocrona Esiste un classico problema della meccanica che si presenta direttamente in forma variazionale: la ricerca della brachistocrona, ovvero della curva di “minimo tempo”. Il problema è quello di trovare la curva che unisce due punti A e B su cui un punto materiale, liberamente cadendo, ovvero muovendosi senza attrito e sotto l’influenza del suo solo peso, passi dal punto A al punto B nel minor tempo possibile. Si assume che il punto parta da A con velocità nulla e quindi B si trovi a una quota inferiore a quella di A. Il problema aveva già attratto l’attenzione di Galileo, che aveva proposto come soluzione un arco di circonferenza al posto del segmento di retta che unisce A con B. Malgrado questa non sia la soluzione corretta, essa mette in evidenza una caratteristica della possibile soluzione: avere una prima parte molto ripida in modo che il punto acquisti al più presto un’elevata velocità; poi potrà percorrere anche un cammino “più lungo” purché lo faccia con maggiore velocità. Il problema tornò all’attenzione dei matematici e fisici della fine del XVII secolo con la sfida a trovarne la soluzione lanciata da Johann Bernoulli7 nel 1696. 7 Johann Bernoulli (Basilea 1667 – Basilea 1748) matematico svizzero, è stato uno dei più importanti scienziati della famiglia Bernoulli. Johann è fratello minore di Jacob. PRINCIPI VARIAZIONALI 327 La soluzione di Johann venne pubblicata, assieme a quella del fratello Jacob ed a una nota di Leibniz nel maggio del 1697. Una soluzione anonima apparve nel gennaio 1697 in Inghilterra (opera di Newton). La soluzione originale di Johann Bernoulli è interessante perché stabilisce una profonda analogia tra il problema della brachistocrona e il problema ottico della rifrazione: il modo di procedere è lo stesso che si utilizza per dare conto dei miraggi e altri fenomeni ottici dovuti alla progressiva variazione di densità dell’atmosfera. A x C ds dz H dx D B z Figura 8.2: La cicloide. In analogia col principio di Fermat, pensiamo alla curva come al percorso di un raggio luminoso che parte da A. Fissiamo un punto C sulla curva. L’angolo di deviazione della curva (ovvero della sua tangente) dalla verticale sarà l’angolo di rifrazione alla quota del punto C. Il suo seno è dato da dx ds dove ds è la lunghezza della curva tra C e il punto “vicino” D e dx la sua proiezione orizzontale. In accordo con la legge di Snell quindi dx v = , ds a (8.1) dove v è la velocità del raggio e a la costante di proporzionalità (ricordiamo che nella legge di Snell, come vista da Fermat, la velocità è inversamente proporzionale all’indice di rifrazione8). 8 Una delle alternative poste dall’“eterna” dualità tra struttura corpuscolare e ondulatoria della luce era che la velocità della luce fosse maggiore nei mezzi più densi (Cartesio e Newton, corpuscolaristi) oppure in quelli più rarefatti (Fermat, in accordo con l’“intuizione” e soprattutto Huygens per la teoria ondulatoria). Fu proprio la misurazione sperimentale della velocità della luce in laboratorio, effettuata solo alla metà del XIX secolo, a far trionfare, provvisoriamente, la teoria ondulatoria nella fisica pre-quantistica. Al tempo di cui stiamo parlando, Newton era ancora vivo, quindi l’assunzione di Bernuolli, della proporzionalità inversa tra velocità e indice di rifrazione non era una cosa ovvia. Tant’è che nella già citata memoria, Maupertuis introduceva l’azione, ovvero una nuova quantità, in modo che la minimizzazione di questa quantità, al posto del tempo di percorrenza, permettesse di ricavare la legge della rifrazione da un principio di minimo à la Fermat anche nell’ipotesi newtoniana che la luce fosse più veloce nei mezzi densi. 328 LEZIONI DI SISTEMI DINAMICI Ma ds2 = dx2 + dz 2 quindi possiamo riscrivere la (8.1) come √ dz a2 − v 2 = . dx v (8.2) Fino a questo punto la “meccanica” non è ancora intervenuta. √ Essa interviene nell’esprimere la velocità in funzione della caduta del grave: v = 2g z. Inserendo questa velocità nella (8.2), otteniamo l’equazione differenziale cercata √ dz b−z = √ , (8.3) dx z 2 con b = a2g , che Bernoulli dimostra essere l’equazione soddisfatta dalla cicloide, rappresentata in figura 8.2. 8.1.1 La trattazione moderna La soluzione di Johann Bernoulli però non si presta a una generalizzazione a problemi variazionali più generali. Il metodo che ora seguiamo per dedurre le equazioni differenziali da problemi variazionali è dovuto a Lagrange (e ad Eulero) e permette di trovare le equazioni per tutta una vasta classe di problemi. Riscriviamo il problema della brachistocrona introducendo il funzionale “tempo” in dipendenza della curva scelta. Consideriamo un sistema di coordinate cartesiane in cui l’asse z è la verticale discendente uscente da A (coincidente con l’origine degli assi) e l’asse delle x è l’asse orizzontale. In tale piano le coordinate dei punti A e B, sono rispettivamente (0, 0) e (L, H) (ovviamente escludiamo il caso in cui B non stia sulla verticale condotta da A, ma in questo caso la soluzione è banale!). Assumiamo inoltre che: • la curva soluzione del problema giaccia nel piano (z, x); • la curva sia esprimibile come il grafico di una funzione z = z(x). In particolare z (0) = 0 e z (L) = H. Queste assunzioni, benché ragionevoli, non sono essenziali. Potremmo infatti pensare a una curva espressa parametricamente come x = x(τ ) e z = z(τ ), o addirittura rinunciare all’ipotesi, ovvia, che la curva sia piana e aggiungere anche y = y(τ ), ed ottenere dalla soluzione stessa del problema che in effetti le assunzioni sono, a posteriori, soddisfatte. Il vettore posizione del punto materiale, espresso in funzione del tempo, è dato da x (t) = x (t) ex + z (x (t)) ez , per cui la velocità del punto materiale è ẋ (t) = ẋ (t) [ex + z ′ ez ], dove z ′ = dz/dx. Assumendo che ẋ (t) > 0, e denotando con v il modulo di ẋ, abbiamo 2 v = ẋ (t) 1 + (z ′ ) . (8.4) PRINCIPI VARIAZIONALI 329 Il tempo T che il punto impiega per andare da A a B è ovviamente dato da T dt . T = (8.5) 0 · Ora, se x (t) > 0, possiamo esprimere t in funzione dell’ascissa x, cioè t = t (x). In particolare, t (0) = 0, mentre t (L) = T . Effettuando quindi tale cambio di variabile nell’integrale (8.5) si ottiene L L 1 T = dx, t′ (x) dx = 0 0 ẋ dove, evidentemente, dobbiamo aver cura di esprimere ẋ in termini di x. A tale scopo, ricordando la (8.4) e la conservazione dell’energia9 m 2 v − mgz = 0, ⇒ v = 2 g z , 2 abbiamo v = ẋ 1 + (z ′ )2 , =⇒ √ 2gz 2 g z (x) . ẋ (x) = 2 ′ 1 + (z (x)) Quindi il tempo impiegato dal punto materiale per andare da A a B sotto l’azione della sola forza peso è dato da L (z ′ )2 + 1 √ T [z] = dx , (8.6) 2gz 0 dove abbiamo messo in evidenza la dipendenza dell’integrale dalla scelta della curva. Il problema della brachistocrona si può ora enunciare facendo riferimento alla (8.6): Tra tutte le funzioni z(x) tali che z(0) = 0 (partenza da A) e z(L) = H (arrivo in B), determinare quella che rende minimo il valore di T [z] in (8.6) 8.2 L’equazione di Eulero-Lagrange Generalizziamo ora il problema della brachistocrona a una funzione integranda f “qualsiasi”: Problema: Data una funzione f : R3 → R determinare una funzione y : [a, b] → R tale che: 1. y(a) = ya e y(b) = yb ; 2. il valore dell’integrale I [y] = b f (y ′ (x) , y (x) , x) dx , a sia minimo. 9 Si ricordi che il punto materiale parte da fermo e che l’energia potenziale iniziale è nulla. (8.7) 330 LEZIONI DI SISTEMI DINAMICI Con y ′ si intende ancora la derivata della funzione y rispetto alla variabile x. Le ipotesi di regolarità da assumere sulla funzione f e sulla y saranno determinate dal calcolo che faremo, per ora le lasciamo nel vago! La struttura del problema è: fissato un certo insieme di funzioni (le y(x) che soddisfano alle condizioni agli estremi y(a) = ya e y(b) = yb ) e, data una “funzione” a valori in R su questo insieme, determinarne il minimo. Anziché usare il termine “funzione” per I[y] si usa il termine funzionale, per sottolineare il fatto che I è “funzione di una funzione”. Il problema sopra enunciato è quindi simile al problema di determinare i minimi di una funzione in più variabili. Inoltre, anche se ancora non ben specificato, l’insieme dove cercare la soluzione ha una naturale struttura affine: ogni y(x) può essere ottenuta da una funzione y(x) di questo insieme più una funzione h(x) (con la stessa regolarità) che soddisfa alla condizioni omogenee al bordo h(a) = h(b) = 0. Inoltre, l’insieme delle funzioni h è uno spazio vettoriale. Quindi ci sono molti degli ingredienti che nel calcolo differenziale permettono di “risolvere” il problema della ricerca dei minimi. La difficoltà è che l’insieme, qualsiasi sia la richiesta di regolarità che si fa sulle y, è “molto grande” (ha dimensione infinita!). Quindi diventa assai difficile definire, per esempio, la derivata di I[y] come limite del rapporto incrementale (I[y+h]−I[y])/�h� (dobbiamo decidere come definire �h�). In verità questo programma può essere portato a termine, ma con grande dispiegamento di mezzi matematici! C’è però un modo per dare una condizione necessaria per il minimo, simile a quella dell’annullarsi della derivata. Supponiamo che il nostro problema di minimo (assoluto) abbia una o più soluzioni e che y ∗ (x) sia una di queste soluzioni. Fissiamo ora una qualsiasi della funzioni h(x) nulle agli estremi e consideriamo solo le funzioni del tipo y ∗ (x)+εh(x) con ε ∈ R. Possiamo quindi pensare all’applicazione che manda ε nel valore di I[y ∗ + εh] come ad una funzione reale di una sola variabile reale ε. Ora, se y ∗ (x) rende minimo il valore di I[y], ovvero se I[y ∗ ] ≤ I[y] per ogni y, allora la funzione ε → I[y ∗ + εh], avrà un minimo per ε = 0 (un po’ più complesso il caso di “minimi locali” cioè quando I[y ∗ ] ≤ I[y] è verificata solo per funzioni y “vicine” a y ∗ (x), perché non abbiamo definito cosa intendiamo per funzioni vicine; comunque si ha che qualsiasi sia questa definizione, y ∗ + εh sarà “vicina” a y ∗ (x) purché ε sia sufficientemente piccolo). Ne risulta che condizione necessaria affinché y ∗ (x) sia un minimo per il funzionale I[y] è che sia nulla la derivata rispetto a ε della funzione I[y ∗ +εh], calcolata per ε = 0, e questo per ogni funzione h nulla agli estremi10 . d I[y ∗ + εh]|ε=0 è detta variazione prima del funzionale dε I[y] in y = y ∗ , e si indica con δI[y ∗ ], per cui la condizione necessaria affinché y ∗ (x) sia un minimo per il funzionale I[y] si esprime dicendo che in y ∗ si annulla la variazione prima di I[y]. La funzione minimizzante y ∗ (x) va quindi cercata tra le soluzioni dell’equazione variazionale δI[y] = 0, ovvero Nota 8.2.1 La derivata δI = δ b f (y ′ (x), y(x), x) dx = 0. a 10 Si confronti questa condizione con la condizione di annullamento di tutte le derivate direzionali in un punto di minimo di una funzione da Rn in R PRINCIPI VARIAZIONALI 331 La funzione arbitraria (purché nulla agli estremi) h è detta variazione della y, ed è spesso indicata con δy. Vogliamo adesso calcolare esplicitamente la variazione prima d dε a b f ((y ) (x) + εh (x), y (x) + εh(x), x) dx ∗ ′ ′ ∗ . ε=0 Derivando sotto il segno di integrale, e calcolando il risultato per ε = 0, otteniamo b ∂f ∂f ∗ ′ ∗ ′ ∗ ′ ∗ ((y ) (x), y (x), x) h (x) + 0= ((y ) (x), y (x), x) h(x) dx , ∂y ′ ∂y a ∂f ∂f dove ∂y ′ e ∂y denotano rispettivamente la derivata rispetto al primo e al secondo argomento della funzione f . Infine integriamo per parti il primo temine b d ∂f ∂f ∗ ′ ∗ ∗ ′ ∗ ((y − ((y ) (x), y (x), x) + ) (x), y (x), x) h(x) dx 0 = dx ∂y ′ ∂y a x=b ∂f ∗ ′ ∗ ((y ) (x), y (x), x) h(x) , + ∂y ′ x=a e, tenendo conto che h(a) = h(b) = 0, si ha b ∂f d ∂f ∗ ′ ∗ ∗ ′ ∗ ((y ) (x), y (x), x) h(x) dx . − ((y ) (x), y (x), x) + 0= dx ∂y ′ ∂y a (8.8) La (8.8) deve valere per ogni funzione h(x), quindi deve annullarsi il temine tra parentesi nell’integrale, ovvero la funzione y ∗ deve soddisfare l’equazione differenziale d ∂f ∂f = 0, (8.9) − dx ∂y ′ ∂y che è nota come equazione di Eulero-Lagrange. Nota 8.2.2 La (8.9) segue da (8.8) supponendo che d ∂f ∂f ∗ ′ ∗ ((y ∗ )′ (x), y ∗ (x), x) φ(x) = − ((y ) (x), y (x), x) + dx ∂y ′ ∂y sia una funzione continua. Se infatti esistesse un qualche xo ∈ (a, b), per cui φ(xo ) �= 0 (per esempio φ(xo ) > 0), allora per la continuità avremo che φ(x) > 0 in un intervallo (x1 , x2 ) ⊂ (a, b), che contiene al suo interno xo . A questo punto, se si sceglie la funzione h (x) in modo che: sia continua, valga 0 in [a, x1 ] ∪ [x2 , b], e sia b positiva per x ∈ (x1 , x2 ). Ne segue che a φ(x) h(x) dx > 0 contro l’ipotesi che sia nullo per ogni h. E’ chiaro a questo punto quali siano le ipotesi di regolarità: (nel seguito dicendo “derivabile” si sottintende “con derivate continue”) dobbiamo avere f derivabile due volte sia a rispetto y ′ che a y e una volta rispetto a x, inoltre le soluzione della (8.9) devono 332 LEZIONI DI SISTEMI DINAMICI essere funzioni di classe C 2 , il che obbliga anche le variazioni h ad avere la stessa regolarità. Si confronti la (8.9) con le equazioni di Lagrange per il moto di un sistema meccanico. Nota 8.2.3 Utilizzando la “notazione del δ” introdotta nell’osservazione 8.2.1, la procedura pratica per calcolare δI, ovvero la variazione del funzionale, consiste nel calcolo della differenza δI = I [y + δy] − I [y] , dove I [y + δy] viene approssimato sviluppando in serie di Taylor l’integrando. Quindi, in pratica, δI = b a f (y ′ (x) + δy ′ (x) , y(x) + δy (x) , x) dx − b f (y ′ (x), y(x), x) dx a b ∂f ∂f δy dx − f (y ′ (x), y(x), x) + ′ δy ′ + f (y ′ (x), y(x), x) dx ∂y ∂y a a b ∂f ′ ∂f δy dx, δy + = ∂y ′ ∂y a = b dδy . Se poi la funzione δy (x) è tale che δy (a) = δy (b) = 0, integrando dove δy ′ = dx per parti otteniamo δI = b a d ∂f − ∂y dx ∂f ∂y ′ δy (x) dx. Esempio 8.2.1 Come esempio di calcolo delle variazioni, consideriamo il problema di minimizzare il consumo di un’automobile che deve compiere un percorso di lunghezza L > 0 in un tempo fissato T > 0. Consideriamo quindi la distanza s(t) coperta al tempo t, per cui si dovrà avere (se il viaggio inizia a t = 0) s(0) = 0. (8.10) s(T ) = L. Supponiamo, in prima approssimazione, che il consumo sia proporzionale al lavoro fatto dal motore per opporsi alla forza di attrito viscoso dell’aria. Essendo tale forza proporzionale alla velocità ṡ (si veda l’esempio 2.5.1 del capitolo 2) e diretta nella direzione opposta al moto, ne risulta che il lavoro effettuato dal motore è dato da 0 L αṡ ds = T αṡ2 (t) dt, 0 dove α > 0 è un opportuno fattore di proporzionalità. Più in generale, potremo supporre che α dipenda da s (ad esempio, poiché l’efficienza del motore diminuisce nei tratti in salita, si avrà che α(s) è a sua volta proporzionale alla pendenza della strada, ovvero alla derivata della quota raggiunta alla distanza s). Il funzionale consumo PRINCIPI VARIAZIONALI 333 dell’automobile sarà pertanto11 C[s] = T α(s(t))ṡ2 (t) dt, 0 dove la funzione incognita s : [0, T ] → R, è soggetta alle condizioni (8.10). Si tratta quindi di un funzionale del tipo (8.7) con f (ṡ, s, t) = α(s)ṡ2 . Condizione necessaria affinché s(t) sia un minimo del funzionale C[s] è che s(t) soddisfi l’equazione di Eulero-Lagrange (8.9), che in questo caso è 2α(s)s̈ + α′ (s)ṡ2 = 0, (8.11) dove, ovviamente, α′ (s) indica la derivata di α (s) rispetto a s. Supponiamo ora per semplicità che la strada abbia una pendenza proporzionale a sq (corrispondente a una quota proporzionale a s(q+1) ) per una certa potenza q ∈ R. L’efficenza del motore, α(s), è dunque proporzionale a sq e l’equazione (8.11) diventa 2sq s̈ + qs(q−1) ṡ2 = 0 (8.12) (indipendentemente dalla costante di proporzionalità tra α e sq ). Per risolvere questa equazione differenziale consideriamo come funzione incognita la derivata di s rispetto al tempo e dunque poniamo ṡ = u(s). Poiché s̈ = u′ (s)ṡ = u′ (s)u (al solito, l’apice indica la derivazione rispetto a s e il punto la derivazione rispetto a t), la (8.12) diventa 2sq u(s)u′ (s) + qs(q−1) u2 (s) = 0. Osserviamo che possiamo supporre u(s) �= 0, in quanto u(s) = 0 corrisponde alla soluzione in cui l’auto è ferma, e le condizioni (8.10) non possono essere soddisfatte. Dividendo per u(s) si ottiene quindi 2sq u′ (s)s̈ + qs(q−1) u(s) = 0, (8.13) che è un’equazione a variabili separabili la cui soluzione generale è u(s) = cs−q/2 , (8.14) dove c è una costante arbitraria. Ricordando che u(s) = ṡ, la (8.14) è un’equazione differenziale per s(t), che può essere facilmente risolta a sua volta per separazione di variabili. In questo modo si ottiene la seguente soluzione generale dell’equazione (8.12): s(t) = (c1 t + c0 )2/(q+2) , (8.15) 11 Il lavoro fatto contro la forza peso sarà semplicemente dato dalla differenza fra la quota finale e quella iniziale ed è quindi una costante ininfluente. 334 LEZIONI DI SISTEMI DINAMICI dove c0 e c1 sono costanti arbitrarie. Imponendo infine le condizioni (8.10) si ottiene s(t) = L � t �2/(q+2) T . (8.16) Il caso q = 0 corrisponde a una strada con pendenza costante (compreso naturalmente il caso della strada pianeggiante). In questo caso la (8.16) ci dice che, indipendentemente dal valore della pendenza, per minimizzare il consumo si dovrà viaggiare a velocità costante ṡ = L/T . Se, invece, q > 0, dalla (8.16) si vede che l’automobile dovrà progressivamente rallentare mano a mano che la pendenza aumenta. Esempio 8.2.2 Si considerino due punti A ≡ (a, ya ), B ≡ (b, yb ) sul piano. Tra tutte le curve del tipo y (x) che connettono A con B, cioè tali che ya = y (a), yb = y (b), si vuole determinare quella di lunghezza minima. Il funzionale che, data la funzione y (x), esprime la lunghezza della curva è I [y] = � a b � 2 1 + (y ′ (x)) dx . L’equazione di Eulero-Lagrange è  �  ′ 2 d  ∂ 1 + (y )  y ′ y ′′ � = 0, = 0, ⇒ dx ∂y ′ 2 1 + (y ′ (x)) che, escludendo y ′ = 0, ha come soluzione y ′′ = 0. La curva di minima lunghezza è dunque la retta yb − ya (x − a) . y (x) = ya + b−a 8.2.1 Un integrale primo e ritorno alla brachistocrona Possiamo ora ricavare l’equazione differenziale per la brachistocrona direttamente dall’equazione di Eulero-Lagrange e dalla forma della funzione integranda � 2 (z ′ ) + 1 ′ . (8.17) f (z , z, x) = √ 2gz Si ottiene � �   ′ )2 + 1 (z (z ′ )2 + 1 d  ∂  ∂  √  −  = 0. √ dx ∂z ′ ∂x 2gz 2gz  (8.18) Così facendo però si giunge ad un’equazione differenziale del secondo ordine per z(x), mentre l’equazione (8.3) è un’equazione del primo ordine con una costante “b” da determinare in funzione delle condizioni iniziali e finali. Questo ci dice che, se abbiamo operato correttamente e le (8.18) e (8.3) sono “equivalenti”, la (8.3) deve essere un integrale primo dell’equazione di Eulero-Lagrange della brachistocrona, cioè PRINCIPI VARIAZIONALI 335 della (8.18). Vediamo che è effettivamente così poiché la funzione integranda (8.17) non dipende esplicitamente da x. Considerando un contesto generale, assumiamo che la funzione che definisce il funzionale, cioè la f che compare nella (8.7), non dipenda esplicitamente da x, ovvero ∂f = 0. ∂x Definiamo la funzione12 u = y′ ∂f −f, ∂y ′ (8.19) e calcoliamone la derivata rispetto a x. Poiché ∂f ∂x = 0 si ottiene du ∂f d ∂f ∂f ∂f ′ = y ′′ ′ + y ′ y . − ′ y ′′ − dx ∂y dx ∂y ′ ∂y ∂y Chiaramente il primo e il terzo termine si cancellano tra loro. Ciò che resta è l’equazione di Eulero-Lagrange, moltiplicata per y ′ , e quindi è nullo anch’esso. Abbiamo quindi il seguente Teorema 8.2.1 Se la funzione integranda in (8.7) non dipende esplicitamente dalla x, la quantità ∂f y′ ′ − f ∂y è un integrale primo dell’equazione di Eulero-Lagrange. Torniamo ora alla brachistocrona, e scriviamo l’equazione differenziale corrispondente ′ all’integrale √ primo (8.19) con f = f (z , z) data dalla (8.17). Abbiamo (tralasciando il fattore 2g che non ha effetto sulla ricerca del minimo) 1 + (z ′ )2 z′ z′ √ , − C= √ z 1 + (z ′ )2 z dove C è una costante, da cui si ottiene √ C 1 + (z ′ )2 z = −1 , e quindi, ponendo √ 1 b=− , C z′ = √ b−z √ , z (8.20) (8.21) che è di nuovo la (8.3). Si noti che per passare da (8.20) a (8.21) si deve estrarre una radice quadrata di (z ′ )2 e quindi abbiamo una ambiguità di segno. Ovviamente questa ambiguità non c’è all’inizio della curva: il punto, per mettersi in moto, deve scendere e quindi z ′ > 0 con la nostra scelta degli assi. Vedremo nella nota 8.2.4, e la cosa 12 Si confronti la (8.19) con la funzione di Hamilton (3.29), scritta nel caso di un solo parametro lagrangiano q. 336 LEZIONI DI SISTEMI DINAMICI è abbastanza sorprendente, che se il rapporto L/H è sufficientemente grande (quindi il punto B è distante da A ma “non troppo sotto” A) la soluzione passerà per punti del piano verticale più bassi di B, ovvero il punto dovrà scendere sotto il suo punto di arrivo, e poi risalire, per arrivare nel minor tempo possibile. Per trovare la soluzione della (8.20) introduciamo un parametro ϕ e poniamo x = x(ϕ) e z = z(ϕ). Possiamo quindi riscrivere la (8.20) nella forma (x′ )2 + (z ′ )2 = c (x′ )2 , z (8.22) 1 dove c = 2 e l’apice indica adesso la derivata rispetto al parametro ϕ. C Si può verificare, a questo punto, che le funzioni x (ϕ) = c (ϕ − sin ϕ) , 2 z (ϕ) = c (1 − cos ϕ) , 2 (8.23) sono soluzioni di (8.22). Inoltre, le (8.23) soddisfano x(0) = y(0) = 0, quindi il valore ϕ = 0 del parametro corrisponde al punto di partenza A. Tuttavia, per affermare che (8.23) sono le soluzioni del problema dobbiamo mostrare che esiste un unico valore della costante c ed un unico valore ϕB ∈ (0, 2π) tale che c x(ϕB ) = L , 2 c z(ϕB ) = H . 2 (8.24) H e, teniamo presenti le (8.23), possiamo riscriver la (8.24) in Ora, se poniamo h = L questo modo c H z(ϕB ) = L , ⇒ z(ϕB ) = h x(ϕB ). (8.25) 2 L c2 x(ϕB ) h Quindi, se introduciamo a(ϕ) = (1 − cos ϕ), e b (ϕ) = (ϕ − sin ϕ), la (8.25) ammetterà soluzione se l’equazione (8.26) a(ϕ) = h b(ϕ), ha soluzione. Il valore di c sarà poi determinato da c = 2L x(ϕB ) . Lemma 8.2.1 Per ogni L > 0 e H > 0, ovvero per ogni h > 0, l’equazione (8.26) ammette almeno una soluzione. Dim. Si osserva che b(0) = 0, b(ϕ) > 0 in (0, 2π], mentre a(2π) = a (0) = 0, e a (ϕ) > 0, per ϕ ∈ (0, 2π). Per provare che (8.26) ha almeno una soluzione bisogna far vedere che, qualunque sia h, esiste un εh tale che b(ϕ) < a(ϕ) per ϕ ∈ (0, εh ). Ciò segue facilmente dal confronto degli sviluppi di Taylor in ϕ = 0 delle funzioni a(ϕ) e b(ϕ). Infatti a è infinitesima del secondo ordine, mentre b è infinitesima del terzo ordine, qualunque sia h. PRINCIPI VARIAZIONALI 337 Lemma 8.2.2 L’equazione (8.26) ammette una sola soluzione in (0, 2π). Dim. Poniamo r(ϕ) = 1 1 − cos ϕ a(ϕ) = . hb(ϕ) h ϕ − sin ϕ In ogni soluzione ϕ̃ di (8.26) si ha r(ϕ̃) = 1. Per dimostrare l’unicità basta far vedere che r(ϕ) è una funzione strettamente decrescente in (0, 2π), dal momento che r(ϕ) > 0, per ϕ ∈ (0, 2π), r (2π) = 0, e limϕ→0+ r (ϕ) = +∞. Se calcoliamo la derivata si ha 1 ϕ sin ϕ − 2 (1 − cos ϕ) r′ (ϕ) = . (8.27) h (ϕ − sin ϕ)2 In (π, 2π) si ha r′ (ϕ) < 0 in quanto somma di due funzioni negative. Inoltre r′ (ϕ) < 0 “vicino” a ϕ = 0. Infatti 1 4 1 ϕ + 180 ϕ6 + O ϕ8 1 − 12 ′ r (ϕ) = , 1 6 8 h 36 ϕ + O (ϕ ) per cui limϕ→0+ r′ (ϕ) = −∞. Inoltre il numeratore di r′ , n(ϕ) = ϕ sin ϕ − 2 (1 − cos ϕ), è una funzione decrescente e sempre negativa nell’intervallo (0, π), come mostrato dalla figura 8.3. Quindi il rapporto r(ϕ) è strettamente decrescente. 0.0 0.2 0.4 0 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 3.0 ϕ -1 -2 -3 -4 n(ϕ) Figura 8.3: Grafico della funzione n(ϕ) = ϕ sin ϕ − 2 (1 − cos ϕ), per ϕ ∈ [0, π]. Ne risulta il seguente 338 LEZIONI DI SISTEMI DINAMICI Teorema 8.2.2 Comunque dati due punti A e B, con B posto a quota inferiore ad A, esiste unica una curva congiungente A con B sulla quale un punto, liberamente cadendo sotto l’azione della forza peso, passa da A a B nel minor tempo possibile. Questa curva è l’unico ramo di cicloide (8.23) sul piano verticale contenente A e B con un vertice in A e passante per B. Nota 8.2.4 Se L > π2 H, ovvero se la distanza tra le verticali passanti per A e B è “abbastanza grande” rispetto alla caduta H, il valore di ϕ supera π. Ma in π la funzione z(ϕ) assume il suo massimo: questo significa che la brachistocrona discende al di sotto del livello del punto di arrivo. Ci resta solo da “giustificare” il nome di cicloide dato alla curva (8.23). Riferendoci alla figura 4.2 dell’esempio 4.1.2, col nome di cicloide si indica una famiglia di curve, ognuna delle quali è descritta “cinematicamente” come la traiettoria sul piano di un punto S solidale con un cerchio che rotola senza strisciare su una guida rettilinea. Dovrebbe essere abbastanza evidente da questa descrizione che si hanno due parametri positivi per descrivere la curva. Il primo è il raggio R della circonferenza, il secondo il rapporto r tra la distanza del generico punto dal centro della circonferenza e il raggio della stessa. Il primo è sostanzialmente un fattore di scala, a parità del secondo parametro le curve si ottengono l’una dall’altra per omotetia. Nel caso della brachistocrona si ha r = 1, ovvero il punto si trova sulla circonferenza (come mostrato in figura 4.2), mentre il valore 2c in (8.23) è il raggio R della circonferenza. Per r = 1 la cicloide ha un punto singolare (cuspide) di arresto del moto nella direzione parallela alla giuda e di inversione del moto nella direzione ortogonale. Nella rappresentazione (8.23) questo punto corrisponde a ϕ = 0 e ϕ = 2 π (la curva è ovviamente periodica e, in questa rappresentazione, il periodo è proprio 2 π), ovvero al punto A di partenza del grave. E’ opportuno notare che la rappresentazione (8.23) non coincide con quella data dalle (4.15) e (4.16). La differenza risiede nel fatto che le (4.15) e (4.16) sono state ottenute considerando ϕ > 0 per rotazioni antiorarie, mentre nelle (8.23) ϕ > 0 in caso di rotazioni orarie, come mostrato nella figura 8.4. A z’ x P x’ = xo φ=π x’ xo P z’ = zo B zo z Figura 8.4: La generazione della cicloide PRINCIPI VARIAZIONALI 339 La cicloide, oltre a una notevole quantità di proprietà geometriche13, gode di un altra interessante proprietà meccanica: è l’unica curva per cui cui le oscillazioni di un punto materiale che si muove su di essa, senza attrito e sotto l’azione della gravità, sono isocrone, ovvero il periodo delle oscillazioni è lo stesso per ogni valore (ammissibile) dell’energia14. A tal riguardo si rimanda all’esempio 5.7.4. 8.3 Funzionali dipendenti da l funzioni Supponiamo che sia data f : R2l+1 → R. Vogliamo determinare l funzioni yi (x) : [a, b] → R, i = 1, ...., l, tali da rendere stazionario il funzionale b f (y1′ (x), ...yl′ (x), y1 (x), ..., yl (x), x)dx, I[y1 , , yl ] = (8.28) a (x) = (y1 (x) , . . . , yl (x)) e y ′ (x) = (y1′ (x) , . . . , yl′ (x)), che, denotando con y scriveremo nella seguente forma compatta b (x), x)dx. I[ y] = f ( y ′ (x) , y a Il problema che stiamo analizzando è più generale di quello trattato nella precedente sezione 8.2, dove il funzionale dipendeva da una sola funzione e dalla sua derivata: adesso il funzionale I dipende da l funzioni e dalle loro derivate. (x), ovvero il Definiamo adesso l’insieme dove ricercare le l-uple di funzioni y dominio del funzionale I. Sia (x) : [a, b] → R : yk (x) ∈ C 2 ([a, b]) ∀ k = 1, 2, ..., l . V= y Se indichiamo con (b) = (y1b , ..., ylb ) (a) = (y1a , ..., yla ) e y y (8.29) (x) ∈ V : y (a) = y a , y (b) = y b } . D={y (8.30) le l-uple costituite dai valori assunti dalle funzioni yk (x), k = 1, ..., l, agli estremi a e b, il dominio del funzionale I è l’insieme Consideriamo adesso l’insieme (x) ∈ V : g (a) = g (b) = 0} . V0 = { g E’ facile mostrare che V e V0 hanno struttura di spazio vettoriale (in particolare V0 è sottospazio di V ) mentre D, anche se è un sottoinsieme di V, non è spazio vettoriale 13 Si consiglia di consultare la pagina dedicata alle curve su: www-groups.dcs.st-and.ac.uk/~history/ 14 Ovviamente si assume che la cicloide giaccia su un piano verticale e che i suoi vertici siano alla stessa quota. 340 LEZIONI DI SISTEMI DINAMICI (la somma di due elementi di D non dà un elemento di D). Si osservà però che D è uno spazio affine il cui spazio vettoriale è V0 (si veda la definizione 1.4.1). In particolare, su V, e quindi anche su V0 , è possibile definire un prodotto scalare � , � : V →R, ponendo , z = f b l fk (x) zk (x) dx, a k=1 e z ∈V. se f (8.31) Seguendo la notazione dell’osservazione 8.2.1, indichiamo con δ y (x) ∈ V0 , δ y (x) = (δy1 (x) , . . . , δyl (x)) , una l-upla di funzioni tramite la quale calcolare la variazione del funzionale, cioè δ [I]. Tuttavia prima di calcolare esplicitamente la variazione del funzionale (8.28), dimostriamo il seguente lemma che generalizza l’osservazione 8.2.2. (x) = (F1 (x) , ...., Fl (x)) ∈ V. Se F , z = 0, ∀ z ∈ V0 , Lemma 8.3.1 Sia F ≡ 0. allora F Dim. Applicando la definizione (8.31) si ha b l a k=1 Fk (x) zk (x) dx = 0, ∀ (z1 (x) , ...., zl (x)) ∈ V0 . (8.32) Siccome zk (x), k = 1, ..., l, sono fra loro indipendenti, possiamo scegliere = (0, ..., 0, b (x) , 0, 0, .., 0, ) z i−esimo posto cioè zk (x) = z (x) δki , k = 1, ..., l. Con tale scelta la (8.32) si riduce a b Fi (x) z (x) dx = 0, a dove, lo ricordiamo, z (x) è una funzione arbitraria. Quindi, ricordando la nota 8.2.2, si ha Fi (x) ≡ 0. Ma, data l’arbitrarietà con cui è stato scelto l’indice i, abbiamo ≡ 0. Fi (x) ≡ 0 per ogni i = 1, 2, ..., l, e quindi F Fissiamo adesso δ y ∈ V0 e calcoliamo la corrispondente variazione del funzionale. Otteniamo b (x) + δy (x) , x)dx, δI[ y] = f ( y ′ (x) + δy ′ (x) , y (8.33) a Dato che le variazioni δyk (x), k = 1, ..., l, sono fra loro indipendenti, è legittimo considerare questa l-upla: δ y (x) = (δy1 (x) , . . . , δyl (x)) = (εh1 (x) , ...., εhl (x)) , PRINCIPI VARIAZIONALI 341 dove tutte le funzioni hk (x), k = 1, ..., l, ancorché arbitrarie, sono fissate. In corrispondenza di tale δ y otteniamo la seguente funzione della variabile reale ε, F (ε) = b a f (y1′ + εh′1 , ...yl′ + +εh′k , y1 + εh1 , ..., yl + εhl , x)dx. Se il funzionale è stazionario allora che hk (a) = hk (b) = 0, si ha 0 = ovvero d dove con dx dF (ε) = 0, e dunque, tenendo conto del fatto dε ε=0 l ∂f ′ d ′ ′ − (y , .., yk , ..yl , y1 , .., yk , .., yl , x) dx ∂yk′ 1 a k=1 ∂f ′ ′ ′ + (y , .., yk , ..yl , y1 , .., yk , .., yl , x) hk (x)dx, ∂yk 1 b d dx ∂f ∂ y′ ∂f , δ y − ∂ y = 0, (8.34) ∂f ∂f , intendiamo la l-upla − ′ ∂ y ∂ y d ∂f ∂f ∂f ∂f d − . − , ...., dx ∂y1′ ∂y1 dx ∂yl′ ∂yl Ora la (8.34) vale per qualunque l-upla δ y (x) ∈ V0 . Possiamo applicare il lemma 8.3.1 e concludere ∂f d ∂f − = 0, ∀ k = 1, 2, ..., l. (8.35) ′ dx ∂yk ∂yk Il sistema di l equazioni (8.35) è dunque la generalizzazione dell’equazione di EuleroLagrange al caso di funzionali dipendenti da l funzioni e dalle loro derivate prime. Con ∗ (x) rende stazionario il funzionale (8.28) allora è soluzione cludiamo dunque: se y del sistema (8.35). 8.3.1 Massimizzazione vincolata Supponiamo adesso che si richieda di determinare i punti di estremo del funzionale (8.28) assumendo che le funzioni yi (x), i = 1, ..., l, soddisfino la relazione Φ (y1 (x) , ..., yl (x) , x) = 0, ∀ x ∈ [a, b], (8.36) che, scritta in forma compatta, diventa Φ ( y (x) , x) = 0. Di conseguenza il dominio del funzionale I diventa ={y (x) ∈ D : Φ (y1 (x) , ..., yl (x)) = 0, ∀ x ∈ [a, b]} . D dove D è definito dalla (8.30). 342 LEZIONI DI SISTEMI DINAMICI Nota 8.3.1 Osserviamo che devono essere soddisfatte le seguenti condizioni di compatibilità Φ (y1a , ..., yla , a) = Φ (y1b , ..., ylb , b) = 0. Φ( y(a),a) Φ( y(b),b) Il vincolo (8.36) potrebbe essere utilizzato per esprimere una delle funzioni yi (x) in termini delle rimanenti (l − 1). Tuttavia, siccome questa procedura può essere estremamente complicata, si preferisce percorrere una via alternativa e, per certi versi, più semplice. Definiamo innanzitutto qual è l’insieme dove cercare le l-uple δ y (x). Fissata una o (x) ∈ D, una generica l-upla y (x) ∈ D può scriversi come l-upla y (x) = y o (x) + δ y y (x) , a patto che: 1. δ y (a) = δ y (b) = 0. y (x)) = 0. 2. Φ ( y (x)) = 0, ovvero Φ ( y o (x) + δ Le l-uple δ y ammissibili sono dunque quegli elementi di V0 per cui y (x)) = 0, Φ ( y o (x) + δ e ∀ x ∈ [a, b] . o (x) ∈ D, ∀ y (8.37) La condizione (8.37) è tuttavia “scomoda” dal punto di vista pratico. Una condizione equivalente si ottiene considerandone lo sviluppo di Taylor15 0 = Φ ( y o (x) + δ y (x)) = Φ ( y o (x)) + =0 l ∂Φ 2 δyk + O ||δ y || . ∂yk k=1 Quindi, trascurando i termini del secondo ordine (che però sono influenti ai fini del calcolo delle variazioni), la (8.37) è equivalente a • δ Λ y = Λ1 (x) δy1 (x) + .. + Λl (x) δy2 (x) = 0, ∀ x ∈ [a, b] , dove16 (x) = (Λ1 (x) , ...., Λl (x)) = Λ (8.38) ∂Φ ∂Φ , , ...., ∂y1 y(x) ∂yl y (x) e dove • denota, come al solito, il prodotto scalare in Rl . Quindi, l’insieme delle l-uple δ y (x) di funzioni con cui calcolare la variazione del funzionale (8.28) non è più V0 ma 0 = δ • δ V y (x) ∈ V0 : Λ y (x) = 0, ∀ x ∈ [a, b] . Quest’ultimo è un sottoinsieme di V0 e questo fa sì che anche il lemma 8.3.1 debba essere modificato. Infatti le l funzioni δyk (x), k = 1, ..., l, non sono più fra loro indipendenti (come lo erano nel caso del lemma 8.3.1) ma vincolate dalla (8.38).Vale dunque il seguente 15 Ovviamente 16 Si si assumeche Φ sia sufficientemente regolare. assume che Λ (x) �= 0, ∀ x ∈ [a, b]. PRINCIPI VARIAZIONALI 343 (x) ∈ V. Se Lemma 8.3.2 Sia F con λ (x) ∈ R. , δ F y 0 , allora F = λ (x) Λ, = 0, ∀ δ y ∈V Dim. Osserviamo innanzi tutto che la condizione (8.38) implica b a • δ Λ y (x) dx = 0, ⇐⇒ , δ Λ y = 0, (8.39) 0 e Λ sono ortogonali, nel senso del prodotto scalare � , � definito dalla cioè δ y ∈V (8.31) . Non solo, ma la (8.38) implica anche , δ 0 = γ (x) Λ y = b l (8.40) γ (x) Λk (x) δyk (x) dx, a k=1 per ogni funzione γ (x) sufficientemente regolare. , δ Scriviamo adesso la condizione F y = 0, tenendo conto della (8.40) dove γ (x) è una generica funzione non identicamente nulla, ovvero 0 = = b l Fk (x) δyk (x) dx a k=1 b l Fk (x) δyk (x) dx + a k=1 = b l b l γ (x) Λk (x) δyk (x) dx a k=1 =0 [Fk (x) + γ (x) Λk (x)] δyk (x) dx. (8.41) a k=1 Come già osservato, la (8.38) implica che (l − 1) componenti di δ y sono indipendenti mentre una può esser espressa in termini delle altre17 . Quindi, senza perdere di generalità, possiamo supporre che le funzioni δy2 (x), ..., δyl (x), siano indipendenti e, tornando alla (8.41), scrivere 0 = b [F1 (x) + γ (x) Λ1 (x)] δy1 (x) dx a + b l [Fk (x) + γ (x) Λk (x)] δyk (x) dx . (8.42) a k=2 17 Infatti, se per esempio Λ1 �= 0, la (8.38) dà luogo a δy1 = − l 1 Λi δyi . Λ1 i=2 Quindi le funzioni δy2 (x), ..., δyl (x), sono indipendenti mentre la prima, δy1 (x), viene espressa in termini delle altre. 344 LEZIONI DI SISTEMI DINAMICI A questo punto si sceglie la funzione γ (x) in modo da far annullare il primo integrale F1 (x) ). La (8.42) si riduce quindi a (se, per esempio, Λ1 �= 0 si pone γ (x) = − Λ1 (x) b l [Fk (x) + γ (x) Λk (x)] δyk (x) dx = 0, a k=2 dove adesso le funzioni δyk (x), k = 2, ..., l, sono tutte indipendenti. Possiamo quindi applicare il lemma 8.3.1 e concludere che Fk (x) + γ (x) Λk (x) ≡ 0, k = 2, ..., l. In , δ 0 , abbiamo provato che definitiva, se F y = 0, per qualunque funzione δ y ∈V = λ (x) Λ, dove λ (x) = −γ (x) per un’opportuna funzione γ (x). F Nota 8.3.2 Il lemma appena dimostrato può essere letto anche in chiave geometrica: = λ (x) Λ è una condizione di parallelismo fra F e Λ. la condizione F Passiamo adesso a calcolare esplicitamente la variazione (8.33) per una generica δ y∈ 0 . Abbiamo V b l ∂f ∂f d − δyk dx, δI[ y] = dx ∂yk′ ∂yk a k=1 che, ponendo (x) = F d dx ∂f ∂y1′ ∂f d − , ...., ∂y1 dx ∂f ∂yl′ ∂f − ∂yl , (x) , δ riscriveremo anche come δI[ y] = F y . Ora se il funzionale è stazionario in avremo che δI[ 0 e quindi ∗ (x) ∈ D, corrispondenza di y y ∗ ] = 0, per ogni δy (x) ∈ V = λΛ, =⇒ F d dx ∂f ∂yk′ − ∂f ∂Φ = λ (x) , ∀ k = 1, ..., l. ∂yk ∂yk (8.43) Osserviamo infine che il sistema di equazioni (8.43) può anche riscriversi come ∂F ∂F d − = 0, ∀ k = 1, ..., l, dx ∂yk′ ∂yk dove F(y1′ , ...yl′ , y1 , ..., yl , x) = f (y1′ , ...yl′ , y1 , ..., yl , x) + λ (x) Φ (y1 , ..., yl , x) . Abbiamo quindi un sistema di l equazioni differenziali nelle l funzioni incognite y1 (x), ..., yl (x), con le condizioni agli estremi date dalla (8.29), cioè yk (a) = ya, k e yk (b) = yb, k , k = 1, ..., l. Per quanto riguarda la funzione λ (x), questa sarà determinata imponendo il vincolo (8.36). PRINCIPI VARIAZIONALI 345 Esempio 8.3.1 Come esempio di massimizzazione/minimizzazione vincolata consideriamo il problema della ricerca della curva di minima lunghezza che connette due punti A e B su una sfera di raggio R. Sia x (τ ) = x (τ ) ex + y (τ ) ey + z (τ ) ez , τ ∈ [0, 1] , la parametrizzazione della generica curva che collega A e B (curva tratteggiata in figura 8.5). B A Figura 8.5: Cammino più breve stra i punti A e B con il vincolo di rimanere sulla superficie della sfera. Il funzionale che ne esprime la lunghezza è � 1� I [x] = x′ 2 + y ′ 2 + z ′ 2 dτ , 0 mentre il vincolo cui le funzioni x (τ ), y (τ ) e z (τ ) sono sottoposte è x2 (τ ) + y 2 (τ ) + z 2 (τ ) − R2 = 0, ⇒ �x (τ )� = R ∀ τ ∈ [0, 1] . Scrivendo le (8.43) otteniamo  d x′  � = 2λ (τ ) x,    dτ x′ 2 + y ′ 2 + z ′ 2        d y′ � = 2λ (τ ) y, dτ x′ 2 + y ′ 2 + z ′ 2         d z′   �  = 2λ (τ ) z, dτ x′ 2 + y ′ 2 + z ′ 2 (8.44) ovvero, se indichiamo con 1 x′ (τ ) t (τ ) = � , (x′ ex + y′ey + z ′ ez ) = �x′ (τ )� x′ 2 + y ′ 2 + z ′ 2 (8.45) 346 LEZIONI DI SISTEMI DINAMICI il versore tangente alla curva, il sistema (8.44) può riscriversi nella seguente forma compatta dt = 2λ x . dτ Se moltiplichiamo vettorialmente per x (τ ) tale equazione si ottiene x∧ dt = 2λ x ∧ x = 0, dτ e quindi dt d dx (x (τ ) ∧ t (τ )) = x ∧ ∧t = + x′ 2 + y ′ 2 + z ′ 2 t ∧ t = 0, dt dτ dτ (8.45) =0 ovvero x (τ ) ∧ t (τ ) = c , (8.46) dove c è un vettore costante. La (8.46) implica che, per ogni τ , x (τ ) e x′ (τ ) giacciono su un piano passante per l’origine, il cui versore normale è parallelo a c. Ma allora anche i punti A e B posti agli estremi della curva x (τ ) giacciono su tale piano, che è appunto un piano equatoriale e la cui intersezione con la sfera è la circonferenza di raggio massimo, ovvero di raggio R. Quindi la curva che connette A e B avente minima lunghezza è l’arco di cerchio massimo che contiene A e B (curva continua in figura 8.5). 8.4 Il principio di Hamilton Sia dato un sistema meccanico con funzione lagrangiana L(q1 , . . . , ql , q̇1 , . . . , q̇l , t) = t , dove, come nella sezione 4.1, abbiamo posto q , q̇, (t) = (q1 (t) , . . . , ql (t)) . L q Ipotizziamo inoltre che il moto sia governato dal sistema (5.36), ovvero che il sistema sia soggetto a vincoli lisci e che le uniche forze attive siano conservative. Definizione 8.4.1 Siano dati due tempi t1 e t2 , con t1 < t2 , e due configurazioni di coordinate lagrangiane a = (q1a , . . . , qla ) e q b = (q1b , . . . , qlb ). q (8.47) Diremo classe dei moti variati sincroni l’insieme Q costituito dalle l-uple di fun (t) = (q1 (t), . . . , ql (t)) tali che: (1) qk (t) : [t1 , t2 ] → R, e qk (t) ∈ zioni q (t1 ) = q a , q (t2 ) = q b . C 2 ([t1 , t2 ]) ∀ k = 1, ..., l; (2) q (t) soluzioni delle Definizione 8.4.2 Diremo moti naturali per il sistema le funzioni q equazioni di Lagrange18 (5.36). 18 Ovvero distinguiamo tra un “moto” compatibile con la struttura cinematica del sistema meccanico, ivi (t), e un moto che sia compatibile con la compresi i vincoli imposti, che è dato da una qualsiasi funzione q dinamica risultante dalle forze applicate. PRINCIPI VARIAZIONALI 347 Definizione 8.4.3 Si dice azione hamiltoniana il funzionale A : Q −→ R, che opera così t2 ]= (t) , A[ q L q q̇ (t) , t dt. (8.48) t1 Vale il seguente teorema, anche noto come Principio di Hamilton, ∗ (t) rende stazio∗ (t) ∈ Q è moto naturale del sistema allora q Teorema 8.4.1 Se q 19 ], nario il funzionale (8.48), ovvero la variazione del funzionale (8.48), cioè δA [ q ∗ . è nulla in corrispondenza di q ∗ (t) ∈ Q rende stazionaria l’azione (8.48), cioè anche il viceversa: se q Vale ∗ ∗ = 0, allora q (t) è moto naturale secondo la definizione 8.4.2. δA q Dim. La dimostrazione del teorema è una ripetizione del calcolo che abbiamo effettuato nella sezione 8.3 per ricavare il sistema (8.35) (equazioni di Eulero-Lagrange) nel caso in cui il funzionale dipenda da l funzioni e dalle loro derivate prime. Infatti, utilizzando la notazione dell’osservazione 8.2.3, abbiamo δA = t2 t1 l ∂L d ∂L − δqk dt, dt ∂ q̇k ∂qk k=1 dove δ q (t) = (δq1 (t), . . . , δql (t)) ∈ Q0 , con δ q (x) : [t1 , t2 ] → R : δqk (x) ∈ C 2 ([t1 , t2 ]) ∀ k = 1, ..., l e Q0 = q (t2 ) = 0} . δ q (t1 ) = δ ∗ (t) è moto naturale, cioè se le q1∗ (t), ..., ql∗ (t) , soddisfano E’ quindi evidente che se q d ∂L ∂L − = 0, k = 1, ..., l, dt ∂ q̇k ∂qk ∗ = 0. Viceversa, se l’azione è stazionaria in corrispondenza di q ∗ (t), allora δA q ∗ = 0, allora cioè δA q t2 t1 l d ∂L ∂L d ∂L ∂L , δ q = 0, − δqk dt = 0, ⇔ − dt ∂ q̇k ∂qk dt ∂ q̇ ∂ q k=1 per ogni l-upla δ q (t) ∈ Q0 . Ora le funzioni δqk (t), k = 1, ..., l, sono indipendenti e quindi, applicando il lemma 8.3.1, concludiamo che le funzioni q1∗ (t), ..., ql∗ (t), ∗ (t), risolvono le equazioni di Lagrange (5.36). Dunque, in virtù costituenti la l-upla q ∗ (t) è moto naturale. della definizione 8.4.2, q 19 Questo enunciato è una forma più generale del classico enunciato Il moto naturale di un sistema meccanico rende minima l’azione stazionaria nella classe dei moti che rispettano le condizioni iniziali e finali; così enunciato il principio è molto più “significativo” in quanto fa appello alla proprietà di minimo, come nel principio di Fermat. Questo però non è generalmente vero, l’azione è minima solo se le condizioni iniziale e finale sono “sufficientemente vicine”. Nella enunciazione del teorema (8.4.1) si ottiene l’equivalenza tra il principio e le equazioni di Lagrange. Il principio è così matematicamente corretto, ma meno significativo! 348 LEZIONI DI SISTEMI DINAMICI Esempio 8.4.1 Consideriamo l’oscillatore armonico la cui Lagrangiana è 3 L= m 2 q̇i − ω 2 qi2 , 2 i=1 e, sull’intervallo [0, T ], consideriamo il seguente moto naturale q2∗ (t) = q3∗ (t) = 0. q1∗ (t) = a sin ωt, Mostriamo che tale moto naturale rende minima l’azione se T è sufficientemente piccolo. Calcoliamo esplicitamente ∗ ∗ + δ , δA = A q q −A q e mostriamo che δA > 0, per ogni δ q ∈ Q0 . Abbiamo 2 3 d ∗ 2 2 ∗ (q + δqi ) − ω (qi + δqi ) dt = dt i 0 i=1 2 3 dqi∗ m T 2 ∗2 dt − − ω qi 2 0 i=1 dt δA = m 2 m 2 T 3 T 0 +m i=1 T 3 m 2 i=1 − ω 2 q1∗ δq1 ]dt q̇ ∗ δ q̇1 1 [ 0 = δ q̇i2 − ω 2 δqi2 dt si integra per parti con δq1 (0)=δq2 (T )=0 T δ q̇i2 0 −ω 2 δqi2 dt − m ovvero 3 δA = Si sfrutta adesso δqi (t) = cui δqi (t) ≤ i · 20 δq L2 (0,T ) = t 0 m 2 i=1 0 T 0 T q̈1∗ + ω 2 q1∗ dt , =0 δ q̇i2 − ω 2 δqi2 dt . δ q̇i dτ , e la stima 20 t 0 √ δ q̇i dτ ≤ t �δ q̇i �L2 (0,T ) , per √ 2 t �δ q̇i �L2 (0,T ) , ⇒ δqi2 (t) ≤ t �δ q̇i �L2 (0,T ) . T 0 · δqi (t) 2 dt . (8.49) PRINCIPI VARIAZIONALI 349 Tornando a δA, otteniamo 3 3 T m T 2 2 2 δA = δqi dt δ q̇i dt − ω 2 i=1 0 i=1 0 ≥ (8.49) T 3 3 m 2 2 �δ q̇i �L2 (0,T ) − ω 2 �δ q̇i �L2 (0,T ) t dt 2 i=1 i=1 0 T2 2 = 3 ω2T 2 m 2 , �δ q̇i �L2 (0,T ) 1 − 2 i=1 2 ω2T 2 > 0, si ha δA > 0. per cui, se T è sufficientemente piccolo sì che 1 − 2 8.4.1 Sistemi vincolati ed equazioni di Lagrange di prima specie Riprendiamo quanto visto nell’osservazione 4.1.3 della sezione 4.1 supponendo che il sistema meccanico, con l gradi di libertà sia soggetto ad un ulteriore vincolo olonomo e liscio del tipo (4.11), che per brevità indicheremo con Φ ( q ) = 0. Evidentemente si può sfruttare l’equazione vincolare e ridurre così i gradi di libertà passando da l ad (l − 1). Tuttavia si può anche procedere come nella sezione 8.3.1, considerando il funzionale (8.48) con in più il vincolo Φ ( q ) = 0. Quindi, ricordando la (8.43) e supponendo che tutti gli altri vincoli siano lisci e che le uniche forze attive siano conservative, le equazioni di Eulero-Lagrange per il sistema diventano d ∂L ∂L ∂Φ − =λ , k = 1, ..., l, (8.50) dt ∂ q̇k ∂qk ∂qk che coincidono proprio con le equazioni di Lagrange di prima specie (5.56) nel caso in cui le forze non vincolari siano conservative. Come già specificato nella sezione 5.3.2, ∂Φ il termine λ , k = 1, ..., l, si interpreta come la componente Lagrangiana della forza ∂qk dovuta all’ulteriore vincolo (4.11). Esempio 8.4.2 Riprendiamo l’esempio 4.1.2, solo che adesso consideriamo il disco che rotola senza strisciare lungo un piano inclinato come mostrato nella figura 8.6. Il sistema ha due gradi di libertà: l’ascissa s del centro e l’angolo di rotolamento ϕ. La relazione tra s e ϕ è data dalla (4.14), ovvero da Φ (s, ϕ) = Rϕ + s = 0. (8.51) Adesso però, anziché sfruttare la (8.51) per esprimere ϕ in funzione di s, o viceversa, manteniamo i due gradi di libertà ϕ ed s e consideriamo il vincolo (8.51). La funzione di Lagrange del sistema è la differenza fra l’energia cinetica del disco rigido M 2 1 M R2 T = ṡ + ϕ̇2 , 2 2 2 350 LEZIONI DI SISTEMI DINAMICI y x s α Figura 8.6: L’inclinazione del piano rispetto all’orizzontale è α. Il disco è omogeneo ed M è la sua massa. Il raggio del disco è R. Il peso è diretto nel verso opposto dell’asse y. e l’energia potenziale dovuta alla forza peso, V = −M gs sin α, cioè � � M R2 2 L= ṡ2 + ϕ̇ + M gs sin α . 2 2 Il sistema (8.50), (8.51) diventa  � � d ∂L ∂L ∂Φ   − =λ ,    dt ∂ ṡ ∂s ∂s     � � d ∂L ∂L ∂Φ − =λ ,    dt ∂ ϕ̇ ∂ϕ ∂ϕ       Φ (s, ϕ) = 0 , da cui otteniamo  λ   s̈ − g sin α = ,    M    R λ ⇒ ϕ̈ = ,   2 M       s = −Rϕ ,  2   s̈ = g sin α,   3      2 g sin α, , ϕ̈ = −  3R         λ = − M g sin α . 3 PRINCIPI VARIAZIONALI 351 8.5 Il principio di Jacobi 8.5.1 Coordinate cicliche nell’ambito del principio di Hamilton Ricordiamo che se una delle coordinate lagrangiane, diciamo qk , non compare esplicitamente nella funzione di Lagrange L (ma la q̇k ovviamente compare nella L) la coordinata si dice ciclica (si veda la definizione definizione 3.3.1). Come conseguenza delle equazioni di Lagrange (si ricordi la proposizione 3.3.2) si ha che il momento ∂L coniugato pk = è costante. ∂ q̇k Abbiamo già visto nella sezioni 3.3.1 e 5.6 l’importanza delle coordinate cicliche nel processo di soluzione delle equazioni di moto, in quanto esse permettono di ridurre la “dimensione” del problema, ovvero il numero di equazioni che restano da risolvere. Si ricordi, per esempio, come nella sezione 3.4 è stata sfruttata la ciclicità della variabile angolare nel problema di Keplero al fine di ridursi a risolvere un problema unidimensionale per la distanza dal centro della forza. In particolare, nelle sezioni 3.3.1 e 5.6 abbiamo introdotto la funzione di Routh, come quella funzione da utilizzare “al posto” della funzione di Lagrange quando si vogliono sfruttare le semplificazioni indotte dalle variabili cicliche. In questa sezione vogliamo mostrare come la funzione di Routh emerga naturalmente nell’ambito del principio variazionale di Hamilton. Supponiamo di avere un sistema caratterizzato da l variabili lagrangiane e assumiamo, per semplicità, che una sola variabile, la ql , sia ciclica21 . Abbiamo quindi ∂L = pl , con pl = costante, ∂ q̇l (8.52) da cui, invocando la proposizione 5.6.1, possiamo ricavare q̇l in funzione della costante pl e delle altre variabili. Pertanto, utilizzando la notazione della sezione 5.6, scriveremo q˙l = q̇ l (q1 , ..., ql−1 , q̇1 , ..., q̇l−1 , pl , t) . (8.53) Dobbiamo poi tener conto del fatto che la relazione (8.53) rende la ql funzione delle altre variabili: una volta assegnate le (q1 , ..., ql−1 ), la ql si ottiene integrando la (8.53) rispetto al tempo. In altri termini, le funzioni q1 (t), ..., ql (t), sono vincolate. Il vincolo che le lega però non è del tipo analizzato nella sezione 8.3.1 (per intendersi un vincolo del tipo (8.36)) ma è un vincolo che coinvolge un integrale. La teoria sviluppata nella sezione 8.3.1 non è quindi applicabile al presente caso. Si procede pertanto seguendo una strada diversa da quella illustrata nel paragrafo 8.3.1. L’idea è quella di utilizzare l’equazione (8.53) per eliminare fin dall’inizio la dipendenza dalla variabile q̇l nell’integrale (8.48). Nota 8.5.1 Si osservi che, comunque si varino le funzioni q1 (t), ..., ql−1 (t), se la q̇l è definita dalla (8.53), la relazione (8.52) viene automaticamente soddisfatta: cioè, per ogni t, vale 21 Il ∂L (q1 , .., ql−1 , q̇1 , .., q̇l−1 , q̇ l (q1 , .., ql−1 , q̇1 , .., q̇l−1 , pl , t), t) = pl , ∂ q̇l caso di m < l variabili cicliche è stato analizzato nella sezione 5.6. 352 LEZIONI DI SISTEMI DINAMICI dove pl assume il valore costante scelto. In altri termini, le l funzioni q1 (t), ..., ql (t), con ql (t) ottenuta integrando rispetto al tempo (8.53), giacciono sulla “ipersuperficie” definita dalla (8.52). Partendo dalla (8.48), si sostituisce nell’integrando la funzione � q̇ l al posto di q̇l , ottenendo così un nuovo funzionale che dipende soltanto dalle funzioni q1 (t), ..., ql−1 (t), e dalle loro derivate. In altri termini, rifacendosi sempre alla notazione della sezione 5.6, introduciamo il funzionale � t2 � 1 , ..., ql−1 , q̇1 , ..., q̇l−1 , t) dt A� [q1 , ..., ql−1 ] = (8.54) L(q t1 = � t2 t1 � � L q1 , ..., ql−1 , q̇1 , ..., q̇l−1 , � q̇ l (q1 , ..., ql−1 , q̇1 , ..., q̇l−1 , pl , t) , t dt. Osserviamo che il funzionale definito dalla (8.54) è diverso da quello di partenza, cioè da quello definito dalla (8.48). Quest’ultimo infatti dipende da22 (q1 , ..., ql−1 ), e da (q̇1 , ..., q̇l ) mentre A� dipende da (q1 , ..., ql−1 ), e da (q̇1 , ..., q̇l−1 ). La differenza fra A ed A� è ancora più profonda: mentre A soddisfa il principio di Hamilton, A� non lo soddisfa. Vale infatti il seguente Teorema 8.5.1 Siano dati t1 e t2 , con t1 < t2 , e le configurazioni   (q1 (t1 ) , ..., ql−1 (t1 )) = (q1a , ..., ql−1 a ) ,  (8.55) (q1 (t2 ) , ..., ql−1 (t2 )) = (q1b , ..., ql−1 b ) , e sia (q1 (t1 ) , ..., ql−1 (t1 )) il moto naturale del sistema che soddisfa le condizioni � cioè δ A, � calcolata in corrispondenza di tale (8.55). La variazione del funzionale A, moto non è nulla in generale, ma vale � � � t2 � l−1 q̇ l ∂� q̇ l d ∂� � δqi dt, δA = (8.56) − pl ∂qi dt ∂ q· t1 i=1 i dove pl è la costante data dalla (8.52) e la funzione � q̇ l è data dalla (8.53). Tale teorema ricalca lo stesso risultato illustrato nella sezione 3.3.1: la funzione di � 1 , ..., ql−1 , q̇1 , ..., q̇l−1 , t) non soddisfa le equazioni di Lagrange. Il teoLagrange L(q � pur dipendendo da l − 1 funzioni rema 8.5.1 afferma un fatto analogo: il funzionale A, anziché da l come l’originaria azione A, non soddisfa il teorema 8.4.1. Dim. del teorema 8.5.1. Consideriamo una (l − 1)-upla di funzioni (δq1 (t) , ...., δql−1 (t)) , tali che δqi (t1 ) = δqi (t2 ) = 0, per ogni i = 1, ..., l − 1. Calcoliamo esplicitamente la variazione di A� facendo uso della procedura illustrata nella nota 8.2.3, nell’ipotesi 22 Si ricordi che la qn è ciclica e quindi non compare nella funzione di Lagrange L. PRINCIPI VARIAZIONALI 353 che q1 (t), ...., ql−1 (t), soddisfino le equazioni di Lagrange (5.36). Otteniamo δ A = t2 t1 − 1 + δq1 ) , ..., (ql−1 + δql−1 ) , (q̇1 + δ q̇1 ) , ..., (q̇l−1 + δ q̇l−1 ) , t) dt L((q t2 t1 1 , ..., ql−1 , q̇1 , ..., q̇l−1 , t) dt, L(q dove L deve essere espressa in termini di L come mostrato esplicitamente nella (8.54). Abbiamo dunque t2 l−1 ∂L ∂L δqi + δ q̇i δA = ∂qi ∂ q̇i t1 i=1 n−1 ∂L + ∂q l i=1 pl ∂ q̇ l ∂ q̇ l δqi + δ q̇i ∂qi ∂ q̇i dt , d (δqi ). Integrando per parti e sfruttando la condizione dt δqi (t1 ) = δqi (t2 ) = 0, i = 1, ..., l − 1, ed il fatto che (q1 (t1 ) , ..., ql−1 (t1 )) sono il moto naturale, cioè soddisfano le equazioni di Lagrange (5.36), otteniamo dove, lo ricordiamo, δ q̇i = δ A = ∂L d ∂L − δqi dt ∂qi dt ∂ q̇i i=1 l−1 t2 + t1 t2 pl t1 l−1 i=1 =0 q̇ l ∂ q̇ l d ∂ δqi dt, − ∂qi dt ∂ q· i ovvero la (8.56). Il principio di Hamilton 8.4.1 non è quindi soddisfatto a meno di non modificare l’azione Hamiltoniana considerando t2 1 , ..., ql−1 , q̇1 , ..., q̇l−1 , t) AR [q1 , ..., ql−1 ] = L(q t1 ovvero · − pl q l (q1 , ..., ql−1 , q̇1 , ..., q̇l−1 , pl , t) dt, AR [q1 , ..., ql−1 ] = t2 t1 R(q1 , ..., ql−1 , q̇1 , ..., q̇l−1 , t)dt, (8.57) (8.58) essendo R la funzione di Routh definita dalla (5.72). Possiamo enunciare il principio variazionale di Hamilton come segue 354 LEZIONI DI SISTEMI DINAMICI Proposizione 8.5.1 Se la variabile ql è ciclica, allora la δAR = 0 se e sole se q1 (t), ..., ql−1 (t), sono moto naturale cioè risolvono le (5.75), ovvero d ∂R ∂R − = 0, i = 1, ...., l − 1 . dt ∂ q̇i ∂qi Dim. Calcolando la variazione di AR si ottiene δAR = l−1 t2 t1 k=1 d dt ∂R ∂ q̇k ∂R − δqk dt. ∂qk Quindi se δAR = 0, allora siccome le funzioni δqk , k = 1, ..., l − 1, sono indipendenti possiamo applicare il lemma 8.3.1 e così ottenere il sistema (5.75). Viceversa se q1 (t), ..., ql−1 (t), soddisfano le (5.75) allora δAR = 0. ∂L = costante, ∂ q̇l la minimizzazione del funzionale A si riduce alla minimizzazione del funzionale (8.58). La soluzione di tale problema variazionale permette di determinare l’evoluzione temporale delle prime l − 1 variabili indipendentemente dalla l-esima. Quest’ultima potrà essere ricavata a posteriori dalla (8.53), il cui secondo membro è diventato una funzione nota del tempo e della costante pl . Abbiamo quindi provato che, se vogliamo tener conto del vincolo pl = 8.5.2 Il tempo come variabile Consideriamo ora per semplicità il caso di una Lagrangiana L che non dipende esplicitamente dal tempo. Invece di studiare il problema del moto negli usuali termini in cui le coordinate lagrangiane qk sono funzioni del tempo e il tempo è la variabile indipendente, introduciamo un cambiamento di variabili, sotto forma parametrizzazione delle qk e del tempo stesso tramite una nuova variabile indipendente23 τ . Avremo quindi24 t = t̃(τ ), ⇔ τ = τ (t) , cioè t̃(τ ) è invertibile, q̃k (τ ) = qk ( t̃(τ )), ⇔ qk (t) = q̃k (τ (t)), q̃k′ (τ ) = dqk ( t̃(τ )) = q̇k ( t̃(τ )) t̃′ (τ ) , ⇒ q̇k (t (τ )) = dτ (8.59) (8.60) q̃k′ (τ ) , t̃′ (τ ) (8.61) dove l’apice ′ indica la derivata rispetto a τ . Con questo cambiamento di variabili l’azione Hamiltoniana (8.48) diventa τ2 L (q̃1 (τ ), ..., q̃l (τ ), q̃1′ (τ ), ..., q̃l′ (τ )) t̃′ (τ ) dτ, (8.62) A= τ1 23 Per esempio si può pensare a τ come al parametro d’arco s lungo la traiettoria. Ovviamente possiamo ragionare in questo modo anche se la Lagrangiana dipende esplicitamente dal tempo. 24 Assumendo t̃(τ ) invertibile t̃′ (τ ) ha segno definito. Noi considereremo sempre t̃′ (τ ) > 0. PRINCIPI VARIAZIONALI 355 dove t̃′ (τ ) dτ sostituisce dt e dove � 1 (τ ), ..., q̃l (τ ), q̃ ′ 1 (τ ), ..., q̃ ′ l (τ )) L(q̃ = L(q1 (t̃(τ )), ..., ql (t̃(τ )), q̇1 (t̃(τ )), ..., q̇l (t̃(τ ))) � � q̃ ′ (τ ) q̃ ′ (τ ) , ..., ′l . = L q̃1 (τ ), ..., q̃l (τ ), 1′ (8.61) t̃ (τ ) t̃ (τ ) (8.63) Possiamo calcolare la variazione prima di questo funzionale, facendo variare oltre alle q̃k anche la funzione t̃ con le condizioni δ q̃k = 0 e δ t̃ = 0 per25 τ = τ1 e τ = τ2 . Se ora scriviamo le equazioni di Eulero-Lagrange per l’annullarsi della variazione di (8.62) abbiamo un sistema di l + 1 equazioni. Le prime l sono equivalenti alle ordinarie equazioni di Lagrange (a parte il fattore moltiplicativo t̃′ ). La (l + 1)-esima equazione è invece �  � ′ ∂ L̃ t̃ d   = 0, (8.64) dτ ∂ t̃′ dal momento che t̃(τ ) è ciclica, cioè non compare esplicitamente nella L̃. Quindi, se poniamo � � ∂ L̃ t̃′ pt = , =⇒ pt = costante. (8.65) (8.64) ∂ t̃′ Calcoliamo adesso esplicitamente pt , detto anche momento coniugato a t̃, pt = = = � � ∂ L̃ + L̃ t̃′ ∂ t̃′ �� q̃ ′ q̃ ′ q̃ ′ q̃ ′ ∂ + L q̃1 , ..., q̃l , 1′ , ..., ′l t̃′ ′ L q̃1 , ..., q̃l , 1′ , ..., ′l ∂ t̃ t̃ t̃ t̃ t̃ � � l q̃ ′ q̃ ′ 1 � ∂L ′ q̃i + L q̃1 , ..., q̃l , 1′ , ..., ′l . (8.66) − ′ t̃ i=1 ∂ q̇i t̃ t̃ � �� 1 ,...,q̃l ,q̃′ 1 ,...,q̃′ l ) L(q̃ Se introduciamo la funzione Hamiltoniana26 25 Si � 1 (τ ), ..., q̃l (τ ), q̃1′ (τ ), ..., q̃n′ (τ )) H(q̃ � � � � � � � � = H(q1 t̃(τ ) , . . . , ql t̃(τ ) , q̇1 t̃(τ ) , . . . , q̇l t̃(τ ) ), assume t̃ (τ1 ) = t1 e t̃ (τ2 ) = t2 . che la (8.67) può anche essere derivata se, in accordo con la (5.78), definiamo 26 Osserviamo e poi sfruttiamo la (8.61) e la (8.63). = H l ∂L q̃ ′ − L, ′ i ∂q i i=1 (8.67) 356 LEZIONI DI SISTEMI DINAMICI per cui, dalla definizione (5.78), H = = abbiamo l ∂L q̇i t̃(τ ) − L(q1 t̃(τ ) , . . . , ql t̃(τ ) , q̇1 t̃(τ ) , . . . , q̇l t̃(τ ) ) ∂ q̇i i=1 l 1 ∂L ′ q̃1′ q̃l′ q̃ − L q̃1 , ..., q̃l , ′ , ..., ′ , t̃′ i=1 ∂ q̇i i t̃ t̃ (8.68) 1 (τ ), ..., q̃l (τ ), q̃ ′ (τ ), ..., q̃ ′ (τ )) = −pt = costante. H(q̃ 1 n (8.69) In particolare, tornando alla variabili originarie, cioè considerando t come variabile indipendente e ricordando le (8.60), (8.61), abbiamo pt = L(q1 , . . . , ql , q̇1 , . . . , q̇l ) − ovvero l ∂L q̇i , ∂ q̇i i=1 H(q1 , . . . , ql , q̇1 , . . . , q̇l ) = −pt = costante . (8.70) (8.71) Abbiamo quindi ottenuto, ma con un formalismo completamente diverso, lo stesso risultato dimostrato nella sezione 5.7: se la funzione Lagrangiana non dipende esplicitamente dal tempo, se le uniche forze attive sono conservative e se i vincoli sono lisci allora vale la (5.81). La (8.71) ci dà anche un’informazione in più: si può guardare all’Hamiltoniana (cambiata di segno) come alla variabile coniugata della variabile “tempo” t. La (8.65) ricalca infatti la definizione 9.0.1 del capitolo 9 se consideriamo t̃′ al posto di q̇k e L̃ t̃′ al posto di L. 8.5.3 Formulazione del principio di Jacobi La condizione (8.71) rappresenta un vincolo per le qi (t), q̇i (t), i = 1, ..., l. Tale vincolo tuttavia è diverso da quello analizzato nel paragrafo 8.5.1 dal momento che la (8.71), coinvolgendo tutte le qi e tutte le q̇i , non consente, in generale, di esprimere una variabile lagrangiana in funzione delle rimanenti (l − 1). Se quindi vogliamo tener conto di tale vincolo sorge il problema di come incorporarlo nel principio di Hamilton. In pratica, come mostrato nella sezione 8.5.1, dobbiamo modificare l’azione Hamiltoniana. In definitiva, tener conto del vincolo (8.71) significa individuare, come già accennato nella nota 3.3.1, una particolare funzione di Routh. La strada da seguire è stata essenzialmente tracciata nella sezioni 8.5.1 e 8.5.2: introduciamo una nuova variabile indipendente τ e consideriamo il tempo come variabile dipendente. Osservando poi che la funzione riportata nella parentesi quadra di (8.62), ovvero L t̃′ , non dipende esplicitamente dalla variabile t̃ ma solo dalla sua derivata t̃′ , si può attuare la strategia di riduzione delle variabili del paragrafo 8.5.1, tornando così a “sole” l variabili q̃1 (τ1 ), ..., q̃l (τ1 ), non più vincolate. Seguendo i passaggi illustrati nel caso generale, dobbiamo considerare solo l variabili q̃1 (τ ), ...., q̃l (τ ), e sfruttare la (8.65), ovvero la (8.66), per ricavare ′ t̃′ = t̃′ (q̃1 (τ ), ..., q̃l (τ ), q̃1 (τ ), ..., q̃l′ (τ )) , q(τ ) q ′ (τ ) (8.72) PRINCIPI VARIAZIONALI 357 e da essa t in funzione di τ , cioè t̃ (τ ). In tal modo, come osservato nella nota 8.5.1, il vincolo (8.69) sarà automaticamente soddisfatto. detto classe dei moti variati asincroni isoenergeDefiniamo adesso l’insieme Q, è formato da tutte le tici, che costituisce il dominio della nuova azione. l’insieme Q (τ ), tali che: l-uple di funzioni q (1) . q̃i (τ ) ∈ C 2 ([τ1 , τ2 ]), i = 1, ..., l. (τ1 ) = q a , e q (τ2 ) = q b , con q a , q b definite dalla (8.47). (2) . q e Q (quest’ultimo Nota 8.5.2 E’ importante sottolineare la differenza fra gli insiemi Q non compare il tempo e quindi introdotto con la definizione 8.4.1). Nelle l-uple di Q è l’insieme di tutte le curve di Rl che connettono q a e q b , non sottoposte ad alcun Q (τ ) ∈ Q, si determinano, per mezzo della (8.66), vincolo. Infattidata una qualunque q (τ ) , q ′ (τ ) e, successivamente t in funzione di τ , sì che il vincolo la funzione t̃′ q (8.69) risulta automaticamente soddisfatto. a e La classe Q è invece l’insieme di tutti i moti che partono al tempo t1 da q b . Gli elementi di Q sono dunque le l-uple q (t) che rappreterminano al tempo t2 in q sentano i possibili moti (quindi elementi “fisici”) non soggetti ad alcun vincolo. Gli sono invece enti geometrici che non danno informazioni sullo sviluppo elementi di Q temporale del moto, ovvero sulla legge oraria con cui la traiettoria è percorsa. t (q˜1 (τ), ˜ q2 (τ), ˜t(τ)) q2 a (q1 (τ), q˜2 (τ)) ˜ ˜ q2 b ˜ q2 q1b q1a q1 (q1 (τ), q2 (τ), ˜t(τ)) (q˜1 (τ), q˜2 (τ)) Figura 8.7: Le due curve continue corrispondono a due generiche traiettorie (q̃1 (τ1 ), q̃2 (τ1 ). I relativi moti (q̃1 (τ1 ), q̃2 (τ1 ), t̃ (τ )) sono rappresentati dalle curve tratteggiate. In particolare, una volta fissate le traiettorie, la legge oraria con cui si esprime il tempo t in funzione di τ , viene determinata dalla (8.65), ovvero dalla (8.66). Nella figura 8.7 sono riportate sul piano (q1 , q2 ) due possibili traiettorie (q̃1 (τ1 ), q̃2 (τ1 )), cui corrispondono, nello spazio (q1 , q2 , t), i relativi moti (q̃1 (τ1 ), q̃2 (τ1 ), t̃ (τ )) (curve tratteggiate). Quest’ultimi danno informazioni sulla traiettoria e anche sulla legge oraria con cui la stessa è percorsa. Si nota che gli istanti di partenza e di arrivo non sono gli stessi per entrambe i moti. Infatti, una volta selezionati: punto di 358 LEZIONI DI SISTEMI DINAMICI partenza, punto di arrivo, e la particolare traiettoria (q̃1 (τ1 ), q̃2 (τ1 )) che li connette, il corrispondente moto (q̃1 (τ1 ), q̃2 (τ1 ), t̃ (τ )) si determina calcolando la legge oraria t̃(τ ). Questo si fa tramite la (8.66) che permette di determinare t̃′ (τ ) e poi, integrando la (8.72), di esprimere t come funzione di τ . Il moto così determinato è tale da soddisfare automaticamente il vincolo (8.69). Seguendo le (8.57) e (8.58), la nuova Lagrangiana, o, se vogliamo, la funzione di Routh, è data da l ∂L ′ LR = L̃t̃′ − pt t̃′ = q̃ , (8.66) ∂ q̇i i i=1 −→ R, ed opera così e pertanto la nuova azione è così definita: AR : Q τ2 τ 2 l ∂L ′ q (τ )] = q̃ dτ , LR dτ = AR [ ∂ q̇i i τ1 τ1 i=1 che, ricordando la (8.61), si può anche scrivere come AR = τ2 τ1 l ∂L ′ q̇i t̃ dτ . ∂ q̇i i=1 Se adesso ipotizziamo che l’energia cinetica del sistema sia27 T = T2 , sfruttando la (5.83) abbiamo n ∂L q̇i = 2T, ∂ q̇i i=1 e l’azione diventa quindi AR = τ2 2T t̃′ dτ . (8.73) τ1 In questa forma però compare ancora t̃′ data dalla (8.72) che è stata determinata sfruttando la conservazione del momento pt . Ora supponiamo che in Rl sia dato un sistema di coordinate curvilinee (q1 , ..., ql ) la cui corrispondente matrice metrica (si veda la sezione 1.4) è la matrice28 A dell’e questa (τ ) ∈ Q, nergia cinetica definita nella sezione 4.1.2. Se fissiamo una generica q definisce una curva, o meglio una traiettoria, γ : [τ1 , τ2 ] −→ Rl , γ τ −→ x (τ ) = l xi (q̃1 (τ ), ..., q̃l (τ )) ei . (8.74) i=1 Il vettore tangente, x′ (τ ), può essere espresso utilizzando la base locale {ui } legata alle coordinate curvilinee l ′ x′ (τ ) = q̃i (τ )ui . i=1 27 Si 28 Si ricordi la (4.33). ricordi che la matrice A, di componenti aij , è una matrice simmetrica definita positiva. PRINCIPI VARIAZIONALI 359 Di conseguenza �x′ (τ )� 2 l � = ′ ′ aij (� q (τ )) q̃i (τ ) q̃j (τ ) i,j=1 = (8.61)   � l � i,j=1  aij (� q (τ )) q̇i (τ ) q̇j (τ ) t̃′ 2 , �� 2T (4.38) per cui la lunghezza della curva γ è � ds = γ � τ2 ′ �x (τ )� dτ = τ1 � τ2 √ 2T t̃′ dτ , τ1 dove con ds si denota la lunghezza dell’elemento d’arco, cioè √ ds = �x′ (τ )� dτ = 2T t̃′ dτ. (8.75) Possiamo allora riscrivere il funzionale (8.73) da minimizzare come29 AR = � τ2 2T t̃′ dτ = τ1 = � γ √ √ 2T� � �� 2(E−V ) � τ2 τ1 √ √ 2T � 2T��t̃′ dτ� ds � � ds = 2(E − V ) ds . γ dove γ è la traiettoria data da (8.74). Nell’ultimo integrale è “scomparso” definitivamente il tempo, quindi la soluzione delle equazioni che si ottengono annullandone la variazione prima conterrà solo delle informazioni geometriche: saranno le equazioni della traiettoria del punto rappresentativo nello spazio delle configurazioni. Una volta determinata la traiettoria del moto, la legge oraria potrà essere ricavata dalla (8.75), cioè �x′ (τ )� �x′ (τ )� t̃′ = √ = � , (8.76) 2T 2 (E − V ) poiché a questo punto il secondo membro della (8.76) sarà una funzione nota del parametro τ e la funzione t̃ (τ ), appunto la legge oraria, potrà essere ricavata per integrazione rispetto a τ . Abbiamo quindi determinato un principio variazionale la cui soluzione determina completamente la traiettoria del moto nello spazio delle configurazioni. Questo principio prende il nome di Principio di Jacobi30 ed è la riscrittura “formalmente corretta” di un più antico principio variazionale, noto anche come Principio di Minima 29 Si ricordi che T + V = E, con E = costante. Gustav Jacob Jacobi (Potsdam, 1804 – Berlino, 1851) è stato un matematico tedesco. 30 Carl 360 LEZIONI DI SISTEMI DINAMICI Azione, il moto annullasse la variazione dell’integrale di azione31 t2 nche prevedevache t2 i=1 pi q̇i ) dt = t1 2T dt, nella classe dei moti variati isoenergetici. t1 ( Si può dare anche un’altra formulazione dell’azione se consideriamo come matrice metrica G = 2T A = 2 (E − V ) A, (8.77) dove A è definita dalla (4.38). In questo caso l ′ ds = �x (τ )� dτ = 2 (E − V ) aij ( q (τ )) q̇i (τ ) q̇j (τ ) t̃′ dτ, i,j=1 e quindi AR = ds, γ rappresenta proprio la lunghezza della traiettoria γ. La matrice metrica (8.77) viene detta metrica di Jacobi. Possiamo quindi riformulare come segue il principio variazionale: il moto di un sistema meccanico soggetto a forze conservative e vincoli lisci avviene, nello spazio delle configurazioni munito della metrica di Jacobi, lungo le geodetiche (linee di più breve cammino). E’ interessante analizzare il caso in cui un singolo punto materiale si muova per inerzia (ovvero senza forze direttamente applicate, e quindi V ≡ 0) su una superficie liscia (come descritto nella sezione 4.1.3). In questo 2T = 2E, e quindi ds definito dall’energia cinetica coincide√proprio con la lunghezza dell’elemento di arco superficie (moltiplicato per la massa e 2E, che sono fattori costanti). Ne segue l’importante risultato: il moto per inerzia di un punto materiale su una superficie avviene lungo le linee (geodetiche). 31 Il principio di minima azione, nella forma presente, è dovuto a Lagrange, ma è in genere noto sotto il nome di Principio di Maupertuis che lo anticipò nella sua memoria del 1744. L’“errore” messo in evidenza da Jacobi consiste nel fatto che non è corretto assumere il tempo come variabile indipendente. Questa “sottigliezza” era però chiara a Lagrange Capitolo 9 Il Sistema Canonico Abbiamo osservato nel paragrafo 5.4 che la risolubilità delle equazioni di Lagrange è legata alla possibilità di mettere il sistema delle equazioni in forma normale, cioè di “risolverle” (algebricamente) rispetto alle variabili di ordine massimo, le q̈k . Poi si trasforma il sistema originario di l equazioni differenziali del secondo ordine in un sistema di 2l equazioni del primo ordine, definendo delle nuove variabili ηk = q̇k . Esiste un’altra riduzione al primo ordine che porta a un sistema noto come sistema canonico o sistema di Hamilton. Il punto di partenza è sempre lo stesso: la non-singolarità della matrice delle derivate seconde rispetto alle q̇k . Ricordando la definizione della matrice A tramite (4.34) ed il teorema 4.1.3, abbiamo det A �=0. Ora, partendo dalle (5.34) e (4.33), cioè L= otteniamo l l 1 1 q , t) − V ( q , t) , aij ( q , t) q̇i q̇j + bi ( q , t) q̇i + c ( 2 i,j=1 2 i=1 det ∂2L ∂ q̇i ∂ q̇j = det A �= 0 . (9.1) Estendiamo adesso la definizione 3.3.2 al caso generale di l variabili lagrangiane. Definizione 9.0.1 Si dicono momenti coniugati delle variabili qk le funzioni pk = ∂L (q1 , . . . , ql , q̇1 , . . . , q̇l , t) , ∂ q̇k k = 1, ..., l . (9.2) Le pk sono l funzioni delle variabili (q1 , . . . , ql , q̇1 , . . . , q̇l ) ed eventualmente del tempo se la Lagrangiana ne dipende esplicitamente. Infatti, esplicitando la (9.2) abbiamo pk = l akj ( q , t) q̇j + bk ( q , t) , k = 1, ..., l, j=1 ovvero, con ovvio significato di simboli + = A ( p q , t) q̇ b ( q , t) , 362 LEZIONI DI SISTEMI DINAMICI La condizione (9.1) ci dice che, per ogni fissato (q1 , . . . , ql ), la mappa tra le coordinate (q̇1 , . . . , q̇l ) e le (p1 , ..., pl ) definite da 9.2 è invertibile, cioè = A−1 p − b , q̇ (9.3) in funzione delle p e delle q (e ovviamente del tempo che ci consente di esprimere le q̇ t se, al solito, la Lagrangiana ne presenta una esplicita diependenza). Possiamo quindi definire un “nuovo sistema di coordinate” per lo stato cinematico del sistema (e non solo per le configuarazioni) usando al posto delle (q1 , . . . , ql , q̇1 , . . . , q̇l ) le variabili (q1 , . . . , ql , p1 , . . . , pl ). Per determinare a quali equazioni debbano soddisfare le nuove variabili, quando le originarie soddisfano alle equazioni di Lagrange, richiamiamo la definizione della funzione di Hamilton 5.78, che scriviamo ora nella forma H(q1 , ..., ql , p1 , ..., pl , t) = l i=1 pi q̇i − L , (9.4) dove le q̇i nella sommatoria e nella Lagrangiana L sono ora pensate come funzioni delle variabili1 (q1 , . . . , ql , p1 , . . . , pl ). Quindi, pensando la H come funzione delle qi e delle pi , calcoliamo la derivata di H rispetto alla qi ∂H ∂qi = = ∂ ∂qi l l k=1 pk k=1 pk q̇k − L ∂ q̇k − ∂qi l ∂L ∂ q̇h ∂L − ∂qi ∂ q̇h ∂qi h=1 ph ∂L d dt ∂ q̇i pi = − dpi . dt E’ doveroso rimarcare che nel calcolo di ∂H ∂qi abbiamo sfruttato le equazioni di Lagrange nella forma (5.36). Ciò significa che stiamo implicitamento assumendo che il sistema sia soggetto soltanto a vincoli olonomi e lisci e che le forze attive siano tutte conservative. 1 Le q̇i , i = 1, ..., l, sono espresse tramite la (9.3). IL SISTEMA CANONICO 363 Calcoliamo adesso da derivata di H rispetto alla variabile pi � l � � ∂H ∂ = pk q̇k − L ∂pi ∂pi k=1 = q̇i + l � l pk k=1 Otteniamo quindi ph dqi . dt =  ∂H   q̇ =   i ∂pi assieme con la relazione ∂ q̇k � ∂L ∂ q̇h − ∂pi ∂ q̇h ∂pi h=1 �� , i = 1, ..., l   ∂H   ṗi = − ∂qi (9.5) l ∂H ∂H ∂H dH � ∂H = = . ṗk + q̇k + dt ∂pk ∂qk ∂t ∂t k=1 �� q̇k −ṗk La funzione H è dunque una costante del moto se la Lagrangiana, e la Hamiltoniana di conseguenza, non dipendono esplicitamente dal tempo. Il dominio delle variabili (q1 , ..., ql , p1 , ..., pl ) è detto spazio delle fasi , mentre il sistema di equazioni differenziali (9.5) è detto sistema canonico. 9.1 Il Teorema di Liouville La struttura del sistema di Hamilton, oltre alla sua “gradevolezza estetica” dovuta alla simmetria assunta dal sistema rispetto alla “coppia di variabili” p e q, è ricca di conseguenze, che richiedono però, per essere messe in evidenza, una trattazione molto tecnica che supera gli scopi di questo corso. Una conseguenza è però semplice da ottenere come corollario di un teorema generale sui sistemi di equazioni differenziali, che ci limitiamo a enunciare senza dimostrazione. Sia dato un sistema di equazioni differenziali in Rn  ẋ1 = F1 (x1 , ...., xn ) ,     ẋ2 = F2 (x1 , ...., xn ) , (9.6) ẋ = F (x) , ⇔ ..  .    ẋn = Fn (x1 , ...., xn ) . Sia Ω0 ⊂ Rn , aperto. Indichiamo con Φt (ξ) l’applicazione ξ Φt (ξ) −→ x = Φt (ξ) , 364 LEZIONI DI SISTEMI DINAMICI che opera così: ad ogni ξ ∈ Ω0 , associa x = Φt (ξ), soluzione del problem di Cauchy   ẋ = F (x) ,  x (0) = ξ . In particolare, Φ0 (ξ) = ξ, mentre, se indichiamo con Ωt l’immagine al tempo t dell’aperto Ω0 , abbiamo Ωt = Φt (Ωo ) (si veda la figura 9.1). Φt ( ξ) x(ξ,t) Ωt ξ Ω0 Figura 9.1: Rappresentazione schematica dell’applicazione Φt (ξ). Se F (x) è tale che possiamo applicare le ipotesi del teorema 2.3.1, allora l’applicazione Φt è definita (almeno in un intervallo di tempo finito) ed invertibile (ad ogni dato iniziale ξ corrisponde uno ed un solo x). Inoltre, si può provare (ma non lo faremo) che Φt è continua (cioè Φt porta punti “vicini” in “punti vicini”), sì che Ωt è un dominio aperto se lo è Ω0 . Vale poi questo importante: Teorema 9.1.1 Le seguenti affermazioni sono equivalenti: 1. divF (x) = �n i=1 ∂Fi = 0, cioè il campo vettoriale F ha divergenza nulla; ∂xi 2. l’applicazione ξ → Φt (x) preserva il volume per ogni t, ovvero il volume dell’insieme Ωt è uguale al volume di Ω0 , per ogni dominio Ω0 ⊂ Rn e per ogni tempo t. IL SISTEMA CANONICO 365 Dim. Per semplicità proviamo il teorema in R2 . Indichiamo con |Ω0 | la misura, cioè la superficie, del dominio Ω0 , e con |Ωt | la misura di Ωt . Abbiamo � � |Ω0 | = dξ1 dξ2 , |Ωt | = dx1 dx2 . Ω0 Ωt � d dx1 dx2 . Ovviamente tale dt Ωt calcolo non è assolutamente agevole dal momento che il dominio di integrazione varia nel tempo. Tuttavia, ricordando l’applicazione Φt fra Ω0 e Ωt , possiamo effettuare il cambio di variabile   x1 = x1 (ξ1 , ξ2 , t) , Calcoliamo la derivata rispetto al tempo di |Ωt |, cioè  e scrivere x2 = x2 (ξ1 , ξ2 , t) , |Ωt | = � det J dξ1 dξ2 , Ω0 dove J è la matrice jacobiana ∂x1  ∂ξ2  ∂x1 ∂x2 ∂x1 ∂x2  − .  , ⇒ det J = ∂ξ1 ∂ξ2 ∂ξ2 ∂ξ1 ∂x2  ∂ξ2  ∂x 1  ∂ξ1  J =  ∂x 2 ∂ξ1 (9.7) Tornando adesso alla derivata rispetto al tempo di |Ωt |, possiamo scrivere d |Ωt | = dt � d (det J) dξ1 dξ2 , dt (9.8) Ω0 e quindi dobbiamo calcolare la derivata temporale del det J. Questo la facciamo sfruttando la formula esplicita (9.7) � � � � d d ∂x1 ∂x2 d ∂x1 ∂x2 (det J) = − dt dt ∂ξ1 ∂ξ2 dt ∂ξ2 ∂ξ1 � � � � ∂x1 d ∂x2 ∂x1 d ∂x2 − . (9.9) + ∂ξ1 dt ∂ξ2 ∂ξ2 dt ∂ξ1 � � d ∂xi Considerando le derivate , i = 1, 2, k = 1, 2, abbiamo dt ∂ξk � � ∂Fi (x1 (ξ1 , ξ2 , t) , x2 (ξ1 , ξ2 , t)) d ∂xi ∂ ẋi = = dt ∂ξk ∂ξk (9.6) ∂ξk = ∂Fi ∂x1 ∂Fi ∂x2 + . ∂x1 ∂ξk ∂x2 ∂ξk 366 LEZIONI DI SISTEMI DINAMICI Sostituendo nella (9.9) otteniamo ∂F1 d ∂F2 (det J) = (det J) + (det J) = (det J) divF . dt ∂x1 ∂x2 d |Ωt | = 0: il volume viene preservato. Viceversa dt d |Ωt | se, per ogni dominio e per ogni tempo, = 0, cioè se il volume rimane costante, dt allora nella (9.8) deve annularsi l’integrando e di conseguenza divF = 0. Quindi, se divF = 0, abbiamo E’ immediato verificare che il secondo membro del sistema di Hamilton ha divergenza nulla, quindi Teorema 9.1.2 (Teorema di Liouville) Il moto preserva il volume nello spazio delle fasi. Questo teorema ha una straordinaria importanza in molti campi, in special modo nella meccanica statistica. Esso ha però anche una consequenza immediata sulla struttura delle posizioni di equilibrio di un sistema meccanico conservativo. Corollario 9.1.1 Un sistema meccanico conservativo non ammette posizioni di equilibrio asintoticamente stabili. Dim. Se (q e , pe ) = (q1e , ..., qle , pe1 , ..., pel ) fosse un punto di equilibrio asintoticamente stabile, dopo un tempo finito T tutti i punti contenuti in una “sfera” di centro (q e , pe ) e raggio R qualsiasi, si troverebbero all’interno di una sfera di raggio R/2, contraddicendo la conservazione del volume. 9.2 Le parentesi di Poisson Sia f (q, p) una funzione definita sulla spazio delle fasi, e sia H(q, p) la funzione di Hamilton (che per semplicità assumiamo indipendente dal tempo). Possiamo calcolare la derivata della funzione f lungo le soluzioni del sistema hamiltoniano (9.5). Abbiamo l l l l k=1 k=1 k=1 k=1 ∂f ∂f ∂f ∂H ∂f ∂H df q̇k + ṗk = − . = dt ∂qk ∂pk ∂qk ∂pk ∂pk ∂qk Questa ultima formula suggerisce di introdurre per ogni coppia di funzioni definite sullo spazio delle fasi un prodotto tramite {f, g} = l l ∂f ∂g ∂f ∂g − . ∂qk ∂pk ∂pk ∂qk k=1 k=1 (9.10) IL SISTEMA CANONICO 367 Il “prodotto” così definito {f, g} prende il nome di parentesi di Poisson tra le funzioni f e g. La derivata totale di una funzione f lungo le soluzioni del sistema con Halmiltoniana H può essere espressa come df = {f, H} . dt Quindi possiamo affermare che df = 0, se Corollario 9.2.1 Una funzione f (q, p) è un integrale primo del moto, cioè dt e solo se la sua parentesi di Poisson con la funzione Hamiltoniana è nulla. E’ immediato verificare alcune proprietà delle parentesi di Poisson: • antisimmetria: {f, g} = −{g, f } • linearietà: {αf1 + βf2 , g} = α{f1 , g} + β{f2 , g} per ogni tripla di funzioni f1 , f2 e g e ogni coppia di numeri reali α e β. Analoga formula vale per le combinazioni lineari fatte sul secondo elemento della parentesi. Un po’ meno ovvia ma sempre di verifica elementare (grazie al teorema di Schwarz) è la cosidetta identità di Jacobi {f, {g, h}} + {g, {h, f }} + {h, {f, g}} = 0 . (9.11) Nota 9.2.1 Le stesse tre proprietà algebriche elencate per la parentesi di Poisson sono soddisfatte dal prodotto vettoriale di vettori di R3 introdotto nella sezione 1.5.1. In particolare, l’identità di Jacobi (1.17) segue dalla bilinerità e dal fatto che i∧(j ∧k) = 0. Possiamo poi utilizzare le Parentesi di Poisson per riscrivere il sistema canonico (9.5) nella forma   q̇i = {qi , H}, i = 1, ..., l . (9.12)  ṗi = {pi , H}, Dal corollario 9.2.1 e dalle proprietà della parentesi di Poisson seguono alcune semplici conseguenze: • ogni combinazione lineare di integrali primi è ancora un integrale primo; • la parentesi di Poisson di due integrali primi è ancora un integrale primo (basta applicare l’identità di Jacobi). Quest’ultima proprietà potrebbe sembrare una strada per “generare” nuovi integrali primi: in realtà i nuovi integrali primi che si ottengono in questo modo sono quasi sempre integrali che “dipendono funzionalmente” dagli integrali già noti. L’antisimmetria permette di ottenere immediatamente una versione parziale in ambito hamiltoniano del Teorema di Noether. Infatti possiamo usare una qualsiasi funzione f per scrivere un “sistema di equazioni di Hamilton” di cui f sia la Hamiltoniana. 368 LEZIONI DI SISTEMI DINAMICI Lungo le soluzioni di questo sistema la derivata totale di una funzione g sarà data da {g, f }. Ma se f è un integrale primo del sistema di Hamiltoniana H sia ha {f, H} = −{H, f } = 0. Quindi la funzione di Hamilton H risulta costante lungo le traiettorie del flusso generato dal sistema di Hamiltoniana f , che quindi è un gruppo (locale) di simmetrie della Hamiltoniana H. 9.3 Derivazione variazionale delle equazioni di Hamilton Come le equazioni di Lagrange, anche le equazioni di Hamilton possono essere derivate da un principio variazionale che non differisce di molto da quello che ci ha condotto alle equazioni di lagrange. Infatti il punto di partenza resta l’integrale di azione, ovvero l’integrale della Lagrangiana tra due tempi fissati. In questo caso però la Lagrangiana sarà espressa tramite la funzione di Hamilton e le variabili (q, p), e l’azione prenderà la forma t2 l pk q̇k − H(q, p) dt . (9.13) t1 k=1 Si noti che ora la funzione integranda contiene le derivate prime delle q ma non le derivate delle p. Di conseguenza non si chiederà alle variazioni di soddifare delle condizione agli estremi per le p ma solo per le q. Quindi il principio variazionale richiederà l’annullarsi della variazione dell’azione espressa dalla (9.13) con le condizioni q(t1 ) = q 1 e q(t2 ) = q 2 , cioè t2 l pk q̇k − H(q, p) dt 0 = δ t1 = t2 t1 k=1 l k=1 ∂H ∂H pk δ q̇k + δpk q̇k − δqk − δpk ∂qk ∂pk dt Ora “scarichiamo” le derivate nei termini δ q̇k integrando per parti e, utilizzando il fatto che la variazione della q è nulla agli estremi, otteniamo t2 t1 l ∂H ∂H −p˙k δqk + δpk q̇k − δqk − δpk dt , ∂qk ∂pk (9.14) k=1 da cui, per l’arbitrarietà delle δqk e δpk , seguono le equazioni di Hamilton (9.5). manuali Biomedica Branchi R., Le impronte nel paziente totalmente edentulo Branchi R., Riabilitazione protesica del paziente oncologico testa-collo Martinelli E., Rieducazione del piede. Problematiche biomeccaniche e posturali statiche e dinamiche Martinelli E., Sviluppo del dolore rachideo in gravidanza. Mutamenti della biomeccanica rachidea, problematiche posturali, prevenzione e attività fisica adattata pre e post parto Martinelli E., Rieducazione posturale. Fondamenti per la progettazione della postura Martinelli E., Prevenzione del mal di schiena di origine meccanica con attività motoria e comportamentale. Approfondimenti di patomeccanica e biomeccanica rachidea Rossetti R., Manuale di batteriologia clinica. Dalla teoria alla pratica in laboratorio Rucci L., Testo Atlante di embriologia clinica della Laringe. La chirurgia conservativa compartimentale della regione glottica Rucci L., Clinical Embryology of Human Larynx for Conservative Compartmental Surgery. A Text and Atlas Magliulo A., Elementi di economia del turismo Visentini L., Bertoldi, M., Conoscere le organizzazioni. Una guida alle prospettive analitiche e alle pratiche gestionali Scienze Tecnologiche Borri C., Pastò S., Lezioni di ingegneria del vento Borri C., Betti M., Marino E., Lectures on Solid Mechanics Cidronali A., Paolo Colantonio P. e Lucci L., Antenne Integrate Attive: Quaderni del Dottorato di Ricerca in Ingegneria dell’Informazione dell’Università di Firenze Gulli R., Struttura e costruzione / Structure and Construction Policicchio F., Lineamenti di infrastrutture ferroviarie Umanistica Bertini F., Risorse, conflitti, continenti e nazioni. Dalla rivoluzione industriale alle guerre irachene, dal Risorgimento alla conferma della Costituzione repubblicana Bombardieri L., Graziadio G., Jasink A.M., Preistoria e Protostoria egea e cipriota Bombi A.S., Pinto G., Cannoni E., Pictorial Assessment of Interpersonal Relationships (PAIR). An analytic system for understanScienze ding children’s drawings Bart J.C.J., Polymer Additive Analytics. InduBaldini S., Marini D., Vorrei. Corso di lingua strial Practice and Case Studies italiana di livello elementare 1. Libro di teCaramelli D., Antropologia molecolare. Masto e libro degli esercizi nuale di base Lo Nostro P., Peruzzi N., Spontaneamente. Borello E., Mannori S., Teoria e tecnica delle comunicazioni di massa Esercizi Risolti di Chimica Fisica Ricci R., Lezioni di Sistemi Dinamici, a cura di Brandi L., Salvadori B., Dal suono alla parola. Percezione e produzione del linguaggio tra Lorenzo Barletti, Angiolo Farina, Lorenzo neurolinguistica e psicolinguistica Fusi, Federico Talamucci Scialpi A., Mengoni A. (a cura di), La PCR e le Coniglione F., Lenoci M., Mari G., Polizzi G. (a cura di), Manuale di base di Storia della sue varianti. Quaderno di laboratorio filosofia Simonetta M.A., Short history of Biology from Marcialis N., Introduzione alla lingua the Origins to the 20th Century paleoslava Spinicci R., Elementi di chimica (nuova Michelazzo F., Nuovi itinerari alla scoperta edizione) del greco antico. Le strutture fondamentali della lingua greca: fonetica, morfologia, Scienze Sociali sintassi, semantica, pragmatica Ciampi F., Fondamenti di economia e gestione Peruzzi A., Il significato inesistente. Lezioni delle imprese sulla semantica Giovannini P. (a cura di), Teorie sociologiche Peruzzi A., Modelli della spiegazione alla prova scientifica Maggino F., L’analisi dei dati nell’indagine statistica. Volume 1. La realizzazione dell’indagi- Sandrini M.G., Filosofia dei metodi induttivi e logica della ricerca ne e l’analisi preliminare dei dati Maggino F., L’analisi dei dati nell’indagine Trisciuzzi L., Zappaterra T., Bichi L., Tenersi per mano. Disabilità e formazione del sé statistica. Volume 2. L’esplorazione dei nell’autobiografia dati e la validazione dei risultati Quest’opera si basa sugli Appunti per il corso di sistemi dinamici scritti dal professor Riccardo Ricci nel 2005 e successivamente rielaborati fino all’anno della sua scomparsa, avvenuta nel 2013. Partendo dall’ultima versione, i curatori hanno intrapreso un’opera di rivisitazione e ampliamento che ha portato al presente manuale. Il testo si rivolge agli studenti triennali dei corsi di Matematica, Fisica e Ingegneria e intende presentare gli argomenti fondamentali della meccanica Lagrangiana, della dinamica dei corpi rigidi e dei principi variazionali, con qualche cenno alla meccanica Hamiltoniana. Luigi Barletti è professore associato di Fisica Matematica presso l’Università di Firenze, dove svolge attività di ricerca nell’ambito delle teorie cinetiche classiche e quantistiche con applicazioni ai dispositivi ottici ed elettronici. Angiolo Farina è ricercatore in Fisica Matematica presso l’Università di Firenze. Ha al suo attivo numerose pubblicazioni nei settori dei problemi a frontiera libera e della fluidodinamica. Lorenzo Fusi è ricercatore di Fisica Matematica presso l’Università di Firenze, dove svolge attività di ricerca nell’ambito fluidodinamica nonNewtoniana. Federico Talamucci è ricercatore presso l’Università di Firenze. Dal 2000 svolge attività didattica per lezioni ed esercitazioni dei corsi di Meccanica nella Scuola di Scienze Matematiche, Fisiche e Naturali.

RELATED PAPERS

RELATED TOPICS

Log In

Lezioni di Sistemi Dinamici

Lezioni di Sistemi Dinamici

Related Papers

RELATED PAPERS

RELATED TOPICS