Il margine di errore nei sondaggi della consistenza elettorale di un partito piccolo

/ Articolo / Il margine di errore nei sondaggi della consistenza elettorale di un partito piccolo
  • Condividi

Post un po' pesante tecnicamente ma che dovrebbe chiarire alcuni dubbi o curiosità per gli appassionati di sondaggi elettorali. Cosa significa il margine di errore indicato, e qual è la sua grandezza esatta?

Il più recente sondaggio elettorale (SWG per conto di Agorà - RAI3) vede "FARE di Oscar Giannino" al 2,5%. Siamo vicini o lontani dal fatidico 4% necessario per entrare alla Camera dei Deputati? Il sondaggio ha usato un campione di 1500 intervistati, che implica un margine di errore di ±2.5% (che aumenta a ±3.1% se il campione è di 1000 intervistati, e ±4.4% con 500 intervistati). I sondaggi riportano (quasi sempre) queste cifre accompagnandole da altre frasi come "livello di rappresentatività del campione del 95%". Se nel sondaggio 2.5% dei rispondenti si sono espressi per FARE, con un margine di errore di più o meno 2.5% viene naturale concludere che "abbiamo il 95% di probabilità di ricevere fra lo zero ed il 5% dei voti" (aggiungo: se il voto si svolgesse ora).

L'affermazioni non è del tutto corretta, perché (1) l'interpretazione finale è imprecisa o vaga nella migliore delle ipotesi; (2) l'interpretazione corretta assume che il campione selezionato sia casuale e rappresentativo della popolazione degli elettori; (3) assume inoltre che vi siano due forze in campo con rappresentatività uguale. Se uno dei partiti è piccolo, i margini di errore sono diversi. 

1. L'interpretazione del margine di errore

Si fa spesso una grossa confusione sull'interpretazione del significato degli intervalli di confidenza, o margini di errore che dir si voglia. Quando un partito viene dato al 35% con un intervallo di confidenza al 95% di ±3%, l'interpretazione corretta è che SE il partito avesse davvero il 35% dei consensi nella popolazione, e SE avessimo la possibilità di effettuare molti sondaggi campionando casualmente sempre lo stesso numero di elettori (ma non necessariamente gli stessi), ALLORA questo partito riceverebbe in ciascuno di quei campioni fra il 32% ed il 38% dei voti nel 95% di questi campioni (95% circa, in realtà la percentuale di campioni con questa caratteristica si avvicina al 95% all'aumentare del numero dei campioni effettuati). In altre parole, solo nel 5% dei campioni si otterrebbe un numero di votanti per quel partito inferiore al 32% o superiore al 38%.

Se questo significhi, come spesso si tende a pensare quando si leggono i sondaggi, che quel partito prenderà fra il 32 ed il 38% dei voti con probabilità 95%dipende da varie cose, non ultima una discussione noiosa e in parte filosofica su cosa pensiate significhi la parola "probabilità" con la quale non voglio tediare me stesso e soprattutto voi lettori. 

2. La selezione del campione

Non parlo molto di questo aspetto perché non ne so granché, basti dire che la vera difficoltà per il sondaggista sta nella selezione del campione. Insomma questo è l'aspetto più importante, in un certo senso. Fai il sondaggio via internet? Rischi di sovrastimare i giovani, che hanno preferenze elettorali diverse dagli anziani. Usi l'elenco del telefono? Non trovi i giovani che hanno solo il cellulare... etc... Il sondaggista quindi deve correggere il campione, esercizio difficile ed in parte arbitrario. Questa è la prima causa dell'imprecisione dei sondaggi, ed influisce in modo speciale nel tentativo di rilevare la forza elettorale di partiti minori.  

3. L'asimmetria delle forze in campo

I margini di errore riportati, come ho detto, assumono che vi siano due partiti di uguali dimensioni in termini di elettorato. Spesso si dimentica che il margine di errore non dipende solo dalla dimensione del campione, ma anche dall'asimmetria dell'elettorato. Quando i partiti hanno consistenza diversa, il margine di errore, a parità di dimensione del campione, è inferiore (in valore assoluto) a quello riportato, ma può essere molto più grande in percentuale per il partito più piccolo. Inoltre, il margine di errore quando i partiti sono diversi non è simmetrico attorno alla media. Ho fatto dunque alcune simulazioni assumendo una grande popolazione di elettorii, e ho calcolando l'intervallo di confidenza. I risultati sono riportati nella seguente tabella:

Dimensione campionariaConsistenza del partitoIntervallo di confidenza 95%
5002.5%1.2% - 3.8%
10001.6% - 3.5%
15001.7% - 3.3%
5004%2.4%  - 5.8% 
10002.8% -  5.3%
15003.1% - 5%
5006.5%4.4% - 8.8%
10005% - 8.1%
15005.3% - 7.8%

La figura riporta in dettaglio i risultati dei votanti al partito con forza del 4% su 5000 campioni di 1000 persone (su una popolazione di 5 milioni di elettori - quest'ultimo parametro ha solo un piccolissimo effetto sui risultati per dimensioni così grandi della popolazione). Come si può vedere, alcune simulazioni producono risultati vicini al 2% e superiori al 6% ma la stragrande maggioranza sta fra il 3 ed il 5%, coerentemente con quanto riportato nella tabella sopra. 

Appendice

Per chi volesse calcolarsi gli intervalli di confidenza, la formula che fornisce un risultato simmetrico ma approssimato (per i nerds: approssimato perché assume l'approssimazione della binomiale a una normale) dell'intervallo di confidenza è la seguente: 

1.96*sqrt(p(1-p)/(n+4))

dove p è la forza effettiva del partito nella popolazione (per esempio, 0.04 per indicare il 4%), ed n è la dimensione del campione. Aggiungere e sottrarre il valore calcolato dalla formula a p per trovare l'intervallo di confidenza.

Per chi volesse invece simulare i risultati, il codice R  è il seguente

 

# dimensione campionaria
Ncampione <- 1000

# Frazione di votanti per il partito
fidshare <- 0.04

Nelettori <- 5000000
Nsimulazioni <- 5000 
# 5 milioni è un numero sufficientemente alto per ottenere una approssimazione ottima.
# Lo stesso vale per il numero di simulazioni: 5000 sono sufficienti

simulatedShare <- c(rep(FALSE,Nsimulazioni))
popolazione <- c(rep(0,Nelettori))

popolazione[1:Nelettori*fidshare] = 1

for(i in 1:Nsimulazioni) {
    campione = sample(popolazione,Ncampione, replace=FALSE)
    simulatedShare[i] <- sum(campione)/Ncampione
}

simulatedShare<-sort(simulatedShare)
intervallo = c(simulatedShare[round(0.025*Nsimulazioni)],simulatedShare[round(0.975*Nsimulazioni)])

intervallo
hist(simulatedShare)

 

Indietro

Commenti

Ci sono 32 commenti

Sulla dimensione sono incuriosito dai sondaggi di Scenari Politci: dicono di avere un database di 14mila indirizzi mail oltre a raggiungere altri 6mila contatti occasionali con banner etc.
Ovviamente essendo l'utente a prendere l'iniziativa soffrono del problema di autoselezione (chi ha più fanboys risulterà pesare più del dovuto); però i risultati sulle principali coalizioni sembrano in linea con quelli degli altri istituti, e proprio il M5S che a mio avviso più dovrebbe soffrire di sovrastima per l'autoselezone degli utenti viene segnato in netto calo.
Insomma, sembra che 4 anni di attività abbiano aiutato ad omogeneizzare il database dei contatti, oltre il fatto che con 20mila dati riescono potenzialmente a far emergere meglio i partiti altrove sotto-rappresentati.

database di 20mila utenti non significa 20mila risposte. Il tasso di risposta e' molto basso, tutti i sondaggi che vedo contengono al piu' 1500 risposte. Il guadagno in termini di margine di errore e' minimo all'aumentare delle risposte, quindi ci si ferma ad un livello ritenuto "ragionevole"

L'analisi riportata è fatta in ambito probabilistico, non statistico.

In ambito statistico l'analisi si può fare come segue.

Neanche io mi intendo tanto di campionamento casuale, perché essendo un fisico, nrmalmente, facendo bene gli esperimenti, ci   pensa madre natura a fornire un campione casuale.

Supponiamo quindi di avere un campione casuale di 1500 elettori e di avere ottenuto una proporzione del 2.5%, cioè 37,5 voti.

L'interpretazione che viene data nell'articolo:

 Quando un partito viene dato al 35% con un intervallo di confidenza al 95% di ±3%, l'interpretazione corretta è che SE il partito avesse davvero il 35% dei consensi nella popolazione, e SE avessimo la possibilità di effettuare molti sondaggi campionando casualmente sempre lo stesso numero di elettori (ma non necessariamente gli stessi), ALLORA questo partito riceverebbe in ciascuno di quei campioni fra il 32% ed il 38% dei voti nel 95% di questi campioni (95% circa, in realtà la percentuale di campioni con questa caratteristica si avvicina al 95% all'aumentare del numero dei campioni effettuati). In altre parole, solo nel 5% dei campioni si otterrebbe un numero di votanti per quel partito inferiore al 32% o superiore al 38%.....

non è del tutto corretta. Secondo la interpretazione frequentista di Neyman, che è spiegata bene  qui, la spiegazione è la seguente: quando un partito viene dato al 35% con una incertezza del ±3%, cioè in un intervallo [32%,38%], vuole dire che l'intervallo trovato ha una probabilità del 95% di contenere il valore vero della popolazione.

Ovvero, l'intervallo è stato ottenuto con una tecnica che ha il 95% di successo.

Ovvero, se ripeto 100 volte il campionamento con la stessa tecnica di analisi, il valore vero starà dentro l'intervallo 95 volte (in media).

Questa probabilità si chiama anche probabilità di ricoprire il valore vero da parte dell'intervallo (coverage). Con le variabili binomiali a spettro discreto, questa probabilità deve essere un po' modificata, e le formule danno in realtà una probabilità ≥95% (overcoverage probability).  La formula più famosa che fa questo è quella di Clopper-Pearson, riportata sempre nel sito di wikipedia.

In rete i calcolatori di Clopper-Pearson ci sono, ma quelli che ho trovato non accettano prove >1000.

Ho scritto un programma scilab, che potete trovare qui (è il mio libro, scusate la debolezza imperdonabile), che calcola l'intervallo di confidenza con la formula di Clopper-Pearson e con la formula approssimata  di Wilson con correzione di continuità. Il risultato è il seguente:

Numero prove 1500, successi 37.5, CL 95%

    Clopper-Pearson  [0.0177, 0342]

    Wilson+c.c   [0.0185, 0.0338]

cioè un valore tra 1.8% e 3.4%  con copertura ≥95%.

 

 


grazie dell'appendice, era esattamente la discussione filosofica che volevo evitare ma va benissimo affrontarla se si vuole. A me questa interpretazione non dice molto (non capisco cosa significhi la frase "vuole dire che l'intervallo trovato ha una probabilità del 95% di contenere il valore vero"), ma e' un limite mio e ma capisco che qualcuno puo' avere gusti diversi. 

 

vuole dire che l'intervallo trovato ha una probabilità del 95% di contenere il valore vero della popolazione.

 

Caro Alberto R., i due ovvero sono corretti, ma la precisazione che li precede no.

Quando si dice al 95%  la media è compresa in un intervallo di confidenza non significa che vi è una probabilità del 95% che il "vero" parametro della popolazione che si sta stimando giaccia in quell'intervallo, ma invece che il metodo adottato produce un intervallo corretto nel 95% di tutti i possibili campioni, proprio come Andrea Moro indica. Lo spaccamento del capello sta nel fatto che l'intervallo di confidenza al 95% una volta estratto il campione in questione ha due sole possibilità, contiene il vero parametro di interesse oppure no. Cioè prima vi è il 95% di probabilità di creare un intervallo che contenga il parametro, dopo no.

Mi permetto; come potete pensare ad una distribuzione di intenti di voto "normale" in un soggetto politico vergine?

 

Quell'intervallo di confidenza (la definizione di Andrea Moro è a mio avviso assolutamente corretta) è realmente in questo caso un "limite fiduciale"...ovvero ha un valore legato alla fiducia che riponiamo nelle risposte del sodaggio. Fiducia soggettiva e quindi parziale.

 

Un caro saluto a tutti,

Ho molto apprezzato, prof. Moro, la sua trattazione "for dummies" dell'errore associato ai sondaggi.

Avrei un paio di domande:

1) lei dice che si approssima la distribuzione come normale. Ora, dato che l'affidabilità è del 95%, possiamo concludere che la deviazione standard sia pari ad un quarto dell'intervallo di incertezza da lei indicato?

2) facciamo l'ipotesi che in partito X aumenti, nel corso del tempo, il valore medio nei sondaggi. Mi aspetto che al diminuire del valore dell'insieme intersezione tra gli intervalli di errore, per esempio nel caso di due sondaggi consecutivi, aumenti la probabilità che la forzante non sia di tipo casuale.

Magari con un esempio mi spiego meglio. Nell'ipotesi che il partito X venga "sondato" per quattro settimane consecutive e si rilevi una percentuale di centrobanda del 2%, 2%, 3% e 4% gli errori associati saranno i seguenti (affidabilità del 95% e campione di numerosità 1000):

 

Prima settimana

Media=2%

Min (2%)=1,13%

Max(2%)=2,87%

 

Seconda settimana

Media=2%

Min (2%)=1,13%

Max(2%)=2,87%

 

Terza settimana

Media=3%

Min (3%)=1,94%

Max(2%)=4,06%

 

Quarta settimana

Media=4%

Min(4%)=2,79%

Max(4%)=5,21

 

Ora, un confronto tra la prima e la seconda settimana ci dice che nulla è accaduto, le bande di errore sono perfettamente sovrapposte.

Un confronto tra prima e terza settimana evidenzia una sovrapposizione tra le bande di errore mentre tra le prima e la quarta questa sovrapposizione "praticamente" non esiste più. In quest'ultimo caso lo spostamento non sarà dovuto al caso 19 volte su 20.

La mia domanda è: esiste una relazione approssimata che permetta il calcolo della probabilità associata all'errore casuale nel caso di intersezione? In altri termini possono correlare la probabilità di casualità all'intersezione tra le bande di oscillazione. Sono alla ricerca di qualcosa che consenta affermazioni del genere: "Il partito X si è mosso di un punto percentuale sulla media. E questo spostamento ha la probabilità del 70%, 30%, Y% di essere casuale".

 

Mi può bastare anche un riferimento bibliografico.

 

Grazie

 

Marzio Marigo

(1) Nelle simulazioni non ho assunto normalita', che comunque non mi sembra influisca molto sui risultati. 

(2) Si puo' certamente tener conto delle sovrapposizioni. Se sapessimo per certo che i campioni sono completamente diversi, e assumendo che i "gusti" della gente non siano cambiati, si possono semplicemente sommare i risultati e trovare un intervallo di confidenza piu' stretto sulla nuova media. Ma di solito l'intento delle societa' e' misurare il cambiamento delle preferenze nel tempo, e sono abbastanza convinto che le societa' abbiano lo stesso pool di intervistati da cui estraggono risposte, quindi non sarei molto propenso ad usare informazioni da due campionamenti diversi fatti in date diverse per calcolare le probabilita' che stai cercando. 

A quaranta giorni dal voto state ancora al 2.5%: mi spiace, e benché d'accordo su alcune delle cose che Giannino dice (nonostante i toni boldrineschi degli ultimi mesi alla radio), il voto alla vostra lista è oggettivamente un voto disperso.

Se vi foste alleati con Berlusconi o al limite con Monti magari vi avrei votato. Ma siccome il sistema è pur sempre maggioritario, in queste condizioni un voto a voi è come votare PD.

Credo che sia presto per dire se FFid entrerà in parlamento o meno.

Manca ancora di un mese di campagna elettorale, e magari anche grazie alla par condicio i promotori avranno modo di farsi conoscere al grande pubblico.

Inoltre, la concezione di "voto utile" ha senso solamente se si ha paura di un preciso partito che rischia di vincere, per cui ogni voto che va non ai partiti che possono contrastarlo in parlamento sarà disperso, quindi inutile. Con questa scusa non ci muoviamo da 20 anni, quindi c' è qualcosa che non va in questo ragionamento.

 

Infine, io sono un semplice simpatizzante e aderente, ma credo che pensare a FFid alleata con BS indichi la totale incomprensione degli intenti del movimento. Mettere al primo punto la constatazione che la classe politica degli ultimi venti anni ha miseramente fallito e poi allearsi con l' uomo simbolo di questo periodo, nonché uno dei maggiori responsabili della situazione in cui ci troviamo sarebbe stato un completo nonsense.

Tre brevissime considerazioni:

1. Credo che al di là di ogni piattaforma programmatica, l'ipotesi di una alleanza con il PdL risulti meramente inaccettabile per il nostro Movimento. Il PdL, infatti, così come il PD, l'UDC e le altre gerontopolitìe che affollano il nostro Parlamento, è tra i maggiori responsabili del Declino cui Noi ci opponiamo, ma, a differenza delle altre formazioni politiche, si presenta caratterizzata da un fardello di interessi privatistici, attitudine corruttiva, disdoro pubblico e qualità scadente dei suoi rappresentanti, tale da configurarsi quale antitesi, in termini ideali e civili, rispetto a ciò che Noi vogliamo esprimere. Sarebbe semplicemente vendere l'anima al diavolo.

2. Se anche si riscontra una piattaforma politica per alcuni versi convergente con quanto dichiarato da esponenti pidiellini, la fattispecie in realtà acquisisce scarso rilievo, perchè ciò che conta, in politica come in qualunque altro ambito sia pubblico che privato, non è ciò che si proclama, ma ciò che si pone in essere, e, possibilmente, si realizza. Ossia, se mi trovassi a discorrere in metropolitana con un individuo che affermi di condividere, anche in modo convincente in termini affabulatori, i miei stessi valori ed orizzonti comportamentali e progettuali, ma poi appena sceso alla fermata impronti i suoi comportamenti a tutt'altro, più che pensare ad una convergenza meramente ideale, mi verrebbe da riflettere su una grande propensione e capacità mistificatoria, connotazione molto peggiore rispetto a qualunque reale divergenza programmatica.

3. Se anche il nostro Movimento fosse oggi al 2,5%, dopo pochi mesi dall'emersione alla scena politica, ritengo che per un insieme di individui composti in un aggregato, che non fanno del populismo la propria bandiera (il che renderebbe ovviamente tutto più semplice in termini di propaganda e consenso elettorale), ma improntano i propri comportamenti e la ricerca del consenso ad espressioni, forme e contenuti comunicativi del tutto differenti in termini qualitativi rispetto a quelli della politica tradizionale, sia un grande risultato. L'importante, ovviamente, adesso come in futuro, non è quello di avere come proprio orizzonte prospettico l'ingresso o meno a ruoli elettivi, ma il farlo non privando la nostra battaglia e i nostri comportamenti di nessuno dei riferimenti ideali che hanno animata la nostra nascita. Solo in tal modo avremo delle prospettive reali di produrre un cambiamento, in quanto Movimento e insieme dei suoi esponenti, allorquando dovessimo ascendere a ruoli elettivi, senza partorire anche involontariamente"mutazioni" del proprio dna. Insomma, i valori, gli ideali, i programmi sono il nostro oggetto sociale, e perdere piena aderenza ad essi, qualunque sia il fine, porterebbe solo a deragliare. Politìa italica docet... 

Scusi Moro, ho riguardato l'articolo per una curiosità mia. Il +4 a denominatore nella formula dell'appendice da dove esce? Riprovando a dimostrarla non dovrebbe esserci.

Buona domanda, confesso che ho preso la formula da qualche articolo, ma ora non ricordo la fonte...