Titolo

Sondaggi e risultati veri

6 commenti (espandi tutti)

La conclusione è che i sondaggi italiani devono iniziare a prendere più sul serio il non voto. Se il fenomeno del non voto riguarda in modo relativamente casuale tutti gli schieramenti politici, ossia tecnicamente se la preferenza di voto e la partecipazione sono variabili stocastiche indipendenti, allora ignorare la partecipazione al voto non fa danni.

 

Sandro, scusa la mia ignoranza. Cosa vuol dire la parte in neretto? Se è una cosa che pensi non vale nemmeno la pena, tanto è lungo, fa nulla.

Vuol dire che se non c'è ragione per pensare che l'astensionismo (il non voto) colpisca più alcune parti politiche di altre, allora possiamo ignorare la mancata partecipazione al voto nel formulare i sondaggi.

È una questione di tecnica di campionamento. Supponiamo ci sia una popolazione in cui il 5mila individui sono a favore del partito  A e 5mila sono a  favore del partito B. Solo l'80% della popolazione vota, ma l'astensionismo è ugualmente distribuito tra i favorevoli ad A e i favorevoli a B. Ossia, 4mila persone effettivamente voteranno A e 4mila voteranno B.

Ora supponiamo che tu sia un sondaggista e chiami a caso 1000 persone. Di queste (più o meno) 500 ti diranno che sono a favore di A e 500 a favore di B. In realtà di questi 1000 solo 800 (sempre più o meno) andranno a votare. Ma la risposta che ottieni è giusta, ossia A prende il 50% e B anche. Questo perché non esiste relazione tra il fatto di astenersi e il fatto di votare A o B, ossia se voti A la tua probabilità di astenerti  è la stessa che se voti B.

Ma ora considera uno scenario alternativo, un po`estremo. Solo i favorevoli ad A si astengono, i favorevoli a B votano senza eccezione, e l'astensionismo è sempre il 20%. A questo punto il risultato elettorale vero sarà che A prende 3000 voti e B ne prende 5000. Però il sondaggista che chiede semplicemente per chi l'intervistato è a favore otterrà il risultato che l'elezione finirà 50-50. È esattamente in questi casi che l'astensione crea problemi alla correttezza dei sondaggi. La decisione di astenersi non è indipendente dalla preferenza elettorale, per cui ignorando la decisione di astensione si sbagliano le stime.

Sembrerebbe che basti chiedere se l'interrogato andrà effettivamente a votare. Ma l'esperienza insegna che la cosa non è così semplice, perché la gente non ama dire che non vota. È vero in amerika ed è vero in Italia. Nei polls americani si cerca di stimare la probabilità di partecipazione al voto con domande indirette, ma ovviamente è una scienza molto inesatta.

Temo di avere fatto un pessimo servizio a Sandro Brusco, postando su Malvino in risposta ad un articolo di commento ai risultati elettorali. Dalla risposta di Castaldi, mi sono reso conto che mi ero spiegato male e ho cercato di rimediare dicendo più o meno così (in attesa che sia approvato il commento).

Il post di Sandro Brusco riguarda la discordanza tra i sondaggi e i risultati elettorali a sfavore del PDL. Nell'ipotesi che il sondaggio sia indipendente e la metodologia seguita sia corretta, l'argomento di Brusco è che la differenza tra i due dati sia spiegabile con l'astensionismo. Nessuna considerazione politica, solo tecnica.

Spero di non avere fatto altro danno.

 

Luca, nessun danno. Anzi, come dicono in pubblicità, se ne parli bene o se ne parli male purché se ne parli :-).

Scherzi a parte, la tua puntualizzazione è completamente corretta. Stavo solo cercando di porre un domanda metodologica sui problemi che hanno avuto i sondaggi. Se qualcuno ha altre ipotesi, sarei contento di sentirle.

Nei polls americani si cerca di stimare la probabilità di partecipazione al voto con domande indirette, ma ovviamente è una scienza molto inesatta.

Beh infatti immagino sia la stessa tecnica usata dalle aziende di marketing per mettere in relazione stili di vita con decisioni di acquisto o preferenza di prodotti. In genere queste tecniche sono lineari e quindi non hanno nulla a che vedere con la probabilità, ma sfruttano il concetto di metrica.

L'unica tecnica che usa un metodo di minimizzazione di varianza e poi a posteriori una probabilità bayesiana di appartenenza ad un gruppo è l'analisi discriminante.

per come la vedo io già la regressione lineare serve a poco o a niente ed è basata sulla minima varianza (come la discriminante), figuriamoci poi aggiungere un passo successivo di inferenza bayesiana...metodi sicuramente molto eleganti, ma non credo che Gauss avrebbe approvato...