Un Bombarolo

There is nothing, nowhere, neither on earth nor in heavens, that can make the true untrue or the untrue true. (Bartolomeo Vanzetti)

Io Masia non lo capisco.

Ogni lunedì, per tutto l’inverno, Fabrizio Masia, direttore di EMG, ha snocciolato sondaggi elettorali al TG di Mentana, su La7. Attraverso l’ottimo sito del Governo http://www.sondaggipoliticoelettorali.it è possibile vedere i risultati di diversi sondaggi, tra i quali gli ultimimesi di rilevazioni di EMG: in particolare, ho guardato dal 6 marzo al 31 luglio. I sondaggi sono fatti attraverso interviste telefoniche, scegliendo un campione della popolazione in modo “mirato”, perché sia rappresentativo. Il campione è, in ogni sondaggio, di 1000 persone.

Guardo i dati di un partito piccolo, il PSI. Nei vari sondaggi le stime danno (in oridne cronologico) 1.2%, 1.3%, 1.2%, 1.2%, 1.3%, 1.4%, 1.4%, 1.3%, 1.3%, 1.3%, 1.3%, 1.4%, 1.2%, 1.2%, 1.3%, 1.3%, 1.2%, 1.2%, 1.2%, 1.3%, 1.2%. Contando che, dei 1000 intervistati, circa la metà dichiara di non voler andare a votare o di non aver ancora deciso per chi votare, queste percentuali corrispondono sempre a 6 o 7 persone che dichiarano di voler votare PSI. Ora, 21 casi non sono un’enormità di dati, dal punto di vista statistico, ma qua c’è qualcosa che non mi spiego. Diciamo che in media ci aspettiamo 6.5 voti per il PSI: allora, facendo tanti campioni tutti equivalenti, ci dovremmo aspettare una fluttuazione di ±2.5 voti tra un campione e l’altro. Questo vuol dire che, anche senza contare che dal primo all’ultimo sondaggio sono passati quasi 5 mesi, da un sondaggio all’altro mi dovrei aspettare (molto grossolanamente) da 4 a 9 voti, ovvero percentuali tra lo 0.8% e l’1.8% circa. Una fluttuazione di questo tipo sarebbe comunque statisticamente irrilevante. Contando inoltre che i campioni sono diversi, perché fatti a tempi diversi, ci dovrebbero essere fluttuazioni ancora più grandi.

Invece no. Il PSI prende sempre gli stessi 6 o 7 voti, nei sondaggi di Masia. Non sono sicurissimo di come dare un valore numerico a questa coincidenza, ma, per i ricordi vaghi di statistica (studiata 15 anni fa) che ancora ho, direi che fare 21 campioni di una distribuzione di Poisson con media 6.5 e ottenere sempre 6 o 7 dovrebbe essere estremamente improbabile. Diciamo che non dovrebbe esserci più di una probabilità su 100 miliardi, che è come dire che c’è il 99.999999999% di probabilità che ci sia qualcosa che dovrei chiedere a Masia per capire come è riuscito ad ottenere questo risultato.

Update: al 18 settembre il PSI è accreditato da Masia dell’1.4%. La serie statistica è sempre più improbabile.

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: