Uno dei problemi fondamentali della fisica è poter e dover replicare un esperimento in qualsiasi altro laboratorio. Quello che però è più appetibile è la possibilità di ottenere una legge matematica che permetta di “prevedere” o “predire” cosa potrebbe accadere qualora si ripetano certe condizioni fisiche indipendenti. In poche parole date alcune cause quale effetto dovremo attenderci?
In questo modo siamo in grado di predire quanto tempo impiegherà un auto per arrivare da A fino a B data una certa potenza, oppure quale sarà la probabilità di ritrovare una certa particella in una certa zona (a livello quantistico), o ancora che tempo meteorologico potrebbe fra qualche giorno.
A volte il fenomeno permette di elaborare una semplice legge matematica ( F = m*a ) ma non è sempre così e dipende dal tipo di sistema. Si pensi appunto al sistema climatico: la quantità di variabili presenti è molto elevata e il sistema è caotico; modificando leggermente le condizioni iniziali è possibile divergere in scenari diversi se non in statistiche diverse. E’ possibile ottenere anche in questo caso una legge matematica per poter predire il futuro?
Ottenere una legge matematica precisa è poco probabile però qualcosa si può fare. Basta considerare qualche principio fisico e trattare il risultato finale come qualcosa che si avvicina molto a una previsione.
Innanzitutto bisogna constatare che effettivamente vi sia una correlazione tra i fenomeni considerati e bisogna quantificarla, magari attraverso il Coefficiente di Pearson o il Correlation Ratio.
Appurato che non si stia cercando il nulla (e nemmeno l’acqua calda), bisogna scegliere il metodo per rappresentare matematicamente il nesso tra i fenomeni. Un metodo che abbiamo già visto è il modello a reti neurali artificiali. Un altro metodo molto simile è l’interpolazione: presi N punti, tra di essi passerà un solo polinomio di grado N-1. Quindi se per esempio abbiamo N coppie di dati, per esempio l’andamento della pressione con gli accumuli di pioggia, possiamo creare una funzione che passa per tutti questi punti e che allo stesso tempo dia una stima del comportamento del sistema nei punti intermedi (cioè quei punti compresi tra la prima coppia e l’ultima coppia di dati).
In questo grafico mostriamo un esempio con 6 coppie di punti. Notiamo in blu la funzione reale (di cui trovate l’equazione nel titolo) e in rosso quella interpolata (attraverso il metodo di Lagrange).
Geniale, vero? Questo metodo è tanto bello quanto poco utilizzabile nel nostro contesto: infatti, volendo effettuare una previsione per un valore di pressione al di fuori del dominio considerato entreremmo nell’ambito dell‘estrapolazione. Quest’ultima è molto rischiosa, come mette in evidenza il contro – esempio di Runge: la funzione che cerca di rappresentare la realtà può divergere notevolmente quando si cercano dati estranei al dominio. Dopo tutto la funzione di interpolazione nasce basandosi sui dati del dominio iniziale e nulla sa di tutto ciò che non appartiene al dominio. Non solo: la funzione utilizzata nel contro – esempio di Runge è frazionale e invece la funzione interpolante è un polinomio, quindi la prima avrà un evidentissimo asintoto mentre la seconda no. Nel prossimo grafico possiamo analizzare i risultati: riuscite ad apprezzare la differenza tra funzione reale e interpolante nei punti di ascissa x = +/- 6 ?
Tuttavia è pur sempre possibile considerare dati estrapolati che non si allontanino molto dal dominio, dove l’errore tra dato previsto e realtà è pressocché ancora piccolo; si badi che questa tecnica va presa con estrema cautela e bisognerebbe avere moltissimi dati su cui interpolare.
Non è finita. Ammettiamo di aver trovato una funzione interpolante molto conveniente e che non siamo in overfitting; immaginiamo di studiare un sistema caotico come quello climatico e che vogliamo fare delle previsioni, anche a brevissima scadenza: chi ci assicura che il sistema è in quella situazione predicibile o meno? Fino a ora abbiamo appena intravisto un metodo statistico per fare una “previsione” ma nulla abbiamo detto del perché si possa fare e di come trattare i risultati ottenuti. Questo lo affronteremo in uno dei prossimi post.