Titolo

Sondaggi e risultati veri

4 commenti (espandi tutti)

È una questione di tecnica di campionamento. Supponiamo ci sia una popolazione in cui il 5mila individui sono a favore del partito  A e 5mila sono a  favore del partito B. Solo l'80% della popolazione vota, ma l'astensionismo è ugualmente distribuito tra i favorevoli ad A e i favorevoli a B. Ossia, 4mila persone effettivamente voteranno A e 4mila voteranno B.

Ora supponiamo che tu sia un sondaggista e chiami a caso 1000 persone. Di queste (più o meno) 500 ti diranno che sono a favore di A e 500 a favore di B. In realtà di questi 1000 solo 800 (sempre più o meno) andranno a votare. Ma la risposta che ottieni è giusta, ossia A prende il 50% e B anche. Questo perché non esiste relazione tra il fatto di astenersi e il fatto di votare A o B, ossia se voti A la tua probabilità di astenerti  è la stessa che se voti B.

Ma ora considera uno scenario alternativo, un po`estremo. Solo i favorevoli ad A si astengono, i favorevoli a B votano senza eccezione, e l'astensionismo è sempre il 20%. A questo punto il risultato elettorale vero sarà che A prende 3000 voti e B ne prende 5000. Però il sondaggista che chiede semplicemente per chi l'intervistato è a favore otterrà il risultato che l'elezione finirà 50-50. È esattamente in questi casi che l'astensione crea problemi alla correttezza dei sondaggi. La decisione di astenersi non è indipendente dalla preferenza elettorale, per cui ignorando la decisione di astensione si sbagliano le stime.

Sembrerebbe che basti chiedere se l'interrogato andrà effettivamente a votare. Ma l'esperienza insegna che la cosa non è così semplice, perché la gente non ama dire che non vota. È vero in amerika ed è vero in Italia. Nei polls americani si cerca di stimare la probabilità di partecipazione al voto con domande indirette, ma ovviamente è una scienza molto inesatta.

Temo di avere fatto un pessimo servizio a Sandro Brusco, postando su Malvino in risposta ad un articolo di commento ai risultati elettorali. Dalla risposta di Castaldi, mi sono reso conto che mi ero spiegato male e ho cercato di rimediare dicendo più o meno così (in attesa che sia approvato il commento).

Il post di Sandro Brusco riguarda la discordanza tra i sondaggi e i risultati elettorali a sfavore del PDL. Nell'ipotesi che il sondaggio sia indipendente e la metodologia seguita sia corretta, l'argomento di Brusco è che la differenza tra i due dati sia spiegabile con l'astensionismo. Nessuna considerazione politica, solo tecnica.

Spero di non avere fatto altro danno.

 

Luca, nessun danno. Anzi, come dicono in pubblicità, se ne parli bene o se ne parli male purché se ne parli :-).

Scherzi a parte, la tua puntualizzazione è completamente corretta. Stavo solo cercando di porre un domanda metodologica sui problemi che hanno avuto i sondaggi. Se qualcuno ha altre ipotesi, sarei contento di sentirle.

Nei polls americani si cerca di stimare la probabilità di partecipazione al voto con domande indirette, ma ovviamente è una scienza molto inesatta.

Beh infatti immagino sia la stessa tecnica usata dalle aziende di marketing per mettere in relazione stili di vita con decisioni di acquisto o preferenza di prodotti. In genere queste tecniche sono lineari e quindi non hanno nulla a che vedere con la probabilità, ma sfruttano il concetto di metrica.

L'unica tecnica che usa un metodo di minimizzazione di varianza e poi a posteriori una probabilità bayesiana di appartenenza ad un gruppo è l'analisi discriminante.

per come la vedo io già la regressione lineare serve a poco o a niente ed è basata sulla minima varianza (come la discriminante), figuriamoci poi aggiungere un passo successivo di inferenza bayesiana...metodi sicuramente molto eleganti, ma non credo che Gauss avrebbe approvato...