mercoledì 16 dicembre 2015

I 3 errori che si fanno nel leggere ed utilizzare i dati.

Non so quanti di voi, questa estate, hanno seguito la vicenda di Stefano Feltri sul sito de "Il fatto quotidiano".
Il misfatto è presto riassunto. Il buon Feltri, di punto in bianco, se ne esce con un post in cui sostiene una cosa di per sé abbastanza risaputa: cioè che i laureati in Lettere faticano più di altri a trovare lavoro.
Subito si scatenano i commenti.
C'è chi gli si oppone con solide e pertinenti critiche, del tipo "Tua madre è una troia!", e chi invece preferisce utilizzare espressioni più volgari.
Nulla di tutto questo sarebbe mai accaduto se vivessimo in un mondo in cui il saper leggere i dati facesse parte delle competenze di base di ciascun individuo.
Insomma, qui non stiamo parlando di quale delle teorie delle superstringhe è la più convincente, stiamo parlando di un fatto di per sé molto facile da verificare. Ma quando si parla di queste cose, c'è sempre chi fa confusione.
Questo accade perché, in un certo senso, le scienze umani e sociali sono più complicate della fisica quantistica.
E' "l'elemento umano" il problema...
Per esempio, basta leggere i post di Feltri e le centinaia di commenti per scovare decine e decine di errori. Il giornalista non ha detto niente di che, il suo discorso è ampiamente condivisibile, ha fatto però uno dei tre errori in lista (la gente che ha commentato non ne parliamo).
Segue, senza pretese di completezza, una lista (povera: solo tre elementi) dei più frequenti errori che si compiono quando si leggono, studiano e citano i dati... questi sconosciuti...

1) Errori che hanno a che fare con gli insiemi.
Poco più sopra devo aver detto che "in un certo senso" le scienze umane e sociali sono più complicate delle fisica...
...a causa di questo fantomatico "elemento umano".
Uno dei problemi delle scienze umane e sociali è che tutti gli oggetti che studia sono costruzioni arbitrarie. Non è come quando si parla di atomi: anche un atomo è un insieme di elettroni, protoni e neutroni, ma l'atomo è lì e si comporta (ad un certo livello) come un oggetto a sé stante; non siamo stati noi a dargli dignità ontologica.
Per gli oggetti delle scienze umane e sociali la storia è diversa, qualunque oggetto potremmo mai scegliere, questo è sempre una costruzione di elementi più piccoli che noi, solo noi, abbiamo messo insieme e chiamato in un certo modo. Centinaia di errori dipendono da questa caratteristica.
Il primo di questi è il dare per scontato che tutti gli insiemi abbiano, per loro natura, la caratteristica di essere "internamente omogenei". E cioè credere che qualunque pezzo, anche microscopico, di un dato insieme debba avere le stesse caratteristiche di tutto l'insieme visto e studiato nella sua complessità.
Questo è, ovviamente, impossibile dato che l'insieme l'abbiamo creato noi arbitrariamente.
Facciamo l'esempio di Roccacannuccia.
Roccacannuccia è una ridente località del centro-nord Italia.
Gli abitanti di Roccacannuccia, i roccacannuccesi, sono amichevoli e amanti della buona tavola.
A Roccacannuccia ha sede una piccola università con due soli dipartimenti: Lettere e Filosofia ed Ingegneria¹.
Entrambi i dipartimenti hanno tre corsi di studio.
Per Lettere e filosofia:
1) Lettere greco-romane;
2) Filologia del libro persiano;
3) Scienze della comunicazione.
E per Ingegneria:
1) Ingegneria dei sistemi robotici;
2) Ingegneria aero-nucleare;
3) Ingegneria bio-meccanica.
L'istituto di statistica di Roccacnnuccia produce, ogni anno, statistiche sugli iscritti all'università.
I dati sono, ovviamente, aggiornati al 2014 e sono i seguenti:
Lettere greco-romane: 500 iscritti;
Filologia del libro persiano: 500 iscritti;
Scienze della comunicazione: 4.000 iscritti;
Ingegneria dei sistemi robotici: 3.000 iscritti;
Ingegneria aero-nucleare: 3.000 iscritti;
Ingegneria bio-meccanica: 3.000 iscritti.
Il dipartimento di Lettere e Filosofia.
Questa estate però un assessore del comune di Roccacannuccia ha proposto di chiudere il dipartimento di Lettere e filosofia perché, a suo dire: "E' indecente che corsi come Scienze della comunicazione rimangano aperti a succhiare soldi dal comune. Signori, il dipartimento di Ingegneria ha 9.000 iscritti, mentre quello di Lettere solo 5.000".
L'errore vi sarà apparso subito palese, eppure la maggioranza delle persone continua a caderci.
C'è chi lo fa, appunto, per errore, ma anche chi costruisce deliberatamente insiemi per dimostrare le proprie dichiarazioni.
E' una variazione sul tema di questo primo errore, una versione diversa. Costruire insiemi, includendo o escludendo elementi, di modo che soddisfino le proprie preferenze. E' il caso di quando, per esempio, la gente va in giro dicendo che in Italia ci sono pochissimi iscritti nelle facoltà scientifiche, e poi cita i dati delle università di Matematica, Fisica, Chimica e Biologia e dice "Visto! Pochissimi iscritti!". Il tizio ha deliberatamente omesso dalle facoltà scientifiche proprio Ingegneria che, di iscritti, ne ha una marea.

2) Ragionare in termini assoluti per dimostrazioni in base percentuale e viceversa.
Questa dovrebbe essere una cosa abbastanza scontata per i più e invece anche qui si fa un sacco di confusione. Penso per esempio a quando ho sentito dire che in tutti i paesi europei ci sarebbero molti più studenti di ingegneria che in Italia e giù a citare dati in termini assoluti.
A quanto pare sarebbe proprio questo il problema dell'Italia!
Che la gente preferisce iscriversi a Filologia moderna piuttosto che ad Ingegneria.
Che spiegato in altre parole vuol dire che in Italia, sul totale dei laureati, gli iscritti a Filologia moderna sono troppi.
Ma semplicemente non è vero; l'Italia è uno dei paesi europei con la percentuale più grande di studenti di ingegneria sul totale. Il problema è che, nel nostro paese, ad essere pochi sono i laureati in generale. Quindi, anche se la percentuale di studenti di ingegneria è maggiore, il loro numero netto ed assoluto è inferiore. Capito l'inganno? Qualcuno potrebbe dire "Sì, ma almeno io con Ingegneria lavoro!". Ok, sono assolutamente d'accordo con te, ma questo non cambia le conclusioni sopra esposte.

3) Trarre conclusioni diverse per lo stesso dato, a parità di condizioni, per due oggetti diversi.
Ritorniamo ancora al ritornello secondo il quale le scienze umane e sociali sarebbero più complicate della fisica.
Lo so che non siete d'accordo, ma facciamo un esempio.
Se un fisico vuole sapere qual è il comportamento di una determinata particella che attraversa un determinato campo non deve far altro che prendere quella particella e spararla in quel campo e prendere nota dei risultati. Non deve far altro che leggere i dati ed arriverà a conclusioni per lo più univoche.
Nelle scienze umane e sociali la faccenda non è così meccanica. Possiamo osservare l'oggetto quando vogliamo e trascrivere tutti i dati che ci sembrino interessanti, ma al momento di arrivare alle conclusioni sarà sempre un bel guaio trovare quelle corrette.
Un dato.
Ho parlato con molte persone che hanno detto "Ad Ingegneria ci sono molti più iscritti che a Scienze della comunicazione. Ovviamente... la prima è un'università seria; la seconda è un cazzata".
Ma anche altre persone che hanno detto "A Scienze della comunicazione ci sono moltissimi più iscritti che ad Ingegneria, ovvio no! Ma ti pare! Oggi vogliono tutti andare a fare un'università del cazzo, invece di Ingegneria che è difficilissima!".
E pensate un po', ho incontrato anche persone che prima dicevano l'una e, a distanza di tempo, dicevano l'altra.
E anche persone che hanno aspettato che io dicessi loro il vero dato prima di propendere per l'una o l'altra.
Ma non dovrebbe essere possibile trarre conclusioni opposte per lo stesso dato nello stesso contesto. La conclusione dovrebbe essere già chiara nella mente di una persona prima di leggere i dati.
Come? Direte voi. Conclusioni prima dell'osservazione? Non è un metodo scientifico questo!
In effetti non mi sono spiegato bene. Non intendendo che bisogna sapere già le conclusioni prima dell'osservazione, ma che almeno bisogna aver chiaro a quale conclusioni corrisponda ogni variazione nel fenomeno osservato.
Il fisico che osserva la particella nel campo, nel vederla comportarsi in un certo modo esclama "E' un elettrone!" perché sa che gli elettroni si comportano in quel modo. Se la particella si fosse comportata in un modo diverso avrebbero esclamato, ovviamente, un'altra cosa.
Avete capito la questione?
Quindi prima di scendere a leggere la prossima frase, in cui è contenuto il dato vero, dovreste decidere se secondo voi un ristretto numero di iscritti è indice di difficoltà o di stupidità di una laurea (ovviamente tutte e due queste conclusioni sono delle cagate... ma visto che la gente ci tiene ad operare correlazioni sul numero degli iscritti, fate pure...).
(Gli studenti di Ingegneria, nella realtà, sono mooolti di più di quelli di Scienze dalla comunicazione...).

Ovviamente a me non frega un cacchio della diatriba tra studenti di ingegneria e resto del mondo.
Questo era solo un pretesto.
Questi errori non vengono fatti solo quando si parla di università, ma quasi sempre.
Quando si parla di pseudoscienze, parapsicologia... vaccini e autismo... insomma molto spesso.
Ma rimane aperta una sola questione ora.
Qualcuno di voi potrebbe dire che vi ho sdoganato delle statistiche sulle università senza citare la fonte (Roccacannuccia a parte che, nel caso non l'abbiate capito, è una città di fantasia).
Ma come?
La gente può andare in giro a sparare dati senza citare le fonti e io mo so' l'unico che lo deve fare?
Ma andate a fanc... anzi!
Facciamo così: ho preso tutto da AlmaLaurea; non vi dirò di più.
Se volete controllare, fatelo!
Così fate un po' di esercizio nella ricerca e lettura dei dati.

¹ Perché Ingegneria? Che non pensiate che dietro questa scelta ci siano intenti diffamatori verso questi studi. Ho solo notato che ogni volta che utilizzo la parola "ingegneria" in un post, le visualizzazioni impennano in maniera esponenziale. La userò più spesso.

Nessun commento: