Come hanno funzionato le previsioni per il Senato

/ Articolo / Come hanno funzionato le previsioni per il Senato
  • Condividi
La metodologia "uniform national swing" per la previsione dei seggi al Senato sembra aver funzionato bene. Gli errori sono derivati principalmente dal fatto che i sondaggi erano chiaramente sbagliati per quanto riguarda le percentuali della Sinistra Arcobaleno e al fatto che la coalizione PD ha aumentato i propri voti più al Senato (dove nel 2006 aveva preso meno) che alla Camera.

Durante questa tornata elettorale ci siamo cimentati con l'improbo compito di prevedere la distribuzione dei seggi al Senato. In questo post abbiamo spiegato la metodologia utilizzata, nota come "uniform national swing", una distribuzione uniforme sul territorio della crescita o decrescita di un partito.

Dal punto di vista empirico, la previsione dei dati per il Senato si scontrava con due grosse difficoltà:

1) L'indisponibilità di sondaggi a livello regionale. L'ipotesi di lavoro usata per risolvere il problema è quella della distribuzione uniforme dei cambiamenti. Si tratta ovviamente di un'ipotesi molto forte ma, in assenza di dati regionali, sembra meglio delle alternative (che consistono essenzialmente nell'assegnare arbitrariamente tassi diversi di crescita o decrescita di un partito nelle diverse regioni).

2) L'indisponibilità di sondaggi a livello nazionale relativi al Senato; praticamente tutti i sondaggi erano relativi alla Camera. L'ipotesi di lavoro qui è che gli incrementi e decrementi a livello nazionale per la Camera sono identici a quelli del Senato.

C'erano inoltre due problemi addizionali.

a) I partiti e le coalizioni presenti nell'elezione del 2008 erano differenti da quelli dell'elezione 2006. Nella maggior parte dei casi era abbastanza facile collegare le forze del 2006 a quelle del 2008, ma in alcuni casi minori (Rosa nel Pugno, Mussolini, scissionisti DS e altre cosucce) non era ovvio quale fosse la cosa giusta da fare.

b) Non avevamo alcun controllo sulla qualità dei sondaggi che venivano usati come input per la predizione.

Bene, adesso i dati delle elezioni sono praticamente definitivi, quindi ci possiamo porre la domanda: come ha funzionato il modello previsivo? Quali ipotesi hanno creato i maggiori problemi? Per chi si stufa presto di leggere ecco la risposta: il modello ha funzionato abbastanza bene e i problemi principali sono derivati dal punto 2) e dal punto b). Il tasso di crescita dei voti della coalizione PD alla Camera è stato più basso che al Senato (dove il PD partiva da una percentuale più bassa), e questo ha causato una sottostima dei seggi PD. I sondaggi sono stati un problema perché hanno sbagliato clamorosamente il risultato della Sinistra Arcobaleno; a dir la verità non hanno fatto così male per gli altri partiti.

Veniamo ai dettagli. Prima domanda: qual è stata la previsione finale che abbiamo fatto usando la media Tocqueville? Partiamo comparando i risultati della media sondaggi con il risultato effettivo della Camera.

 Sondaggi
 
  (media Tocqueville)  
 
Dato effettivo
PdL 44,4 46,81
 
PD 37,8 37,54
 
UDC 6,0 5,62
 
SA 6,6 3,08
 
DX2.42.4
 
PS1.2
 
1
 

Come si vede, il risultato di PD e UDC è stato previsto quasi con esattezza (oltre a quello dei partiti minori escusi dalla ripartizione, Socialisti e La Destra). Il risultato del PdL è stato sottostimato, par di capire perché nessuno ha compreso l'esplosione della Lega, e il risultato di SA è stato gravemente sovrastimato.

Confrontiamo ora i risultati finali in termini di seggi esclusivamente per le regioni del porcellum

(escludendo quindi Estero, Val d'Aosta, Trentino Alto-Adige e Molise)

che sono quelle oggetto dell'analisi. Si tratta di 299 seggi, la seguente tabella descrive la predizione sui seggi che risultava dai sondaggi e quella effettiva che si è realizzata.

 Sondaggi
(media Tocqueville)  
Dato effettivo
PdL 160 167
PD 125 129
UDC 2 3
SA 12 0

Le variazioni rispetto al dato effettivo riflettono gli errori dei sondaggi, combinati con le caratteristiche del sistema elettorale. In verità l'errore sul PdL, di per sé, non genera grossi sbagli nell'assegnazione dei seggi. Infatti, in tutte le regioni in cui il primo partito è sotto il 55%, una sottostima di due-tre punti non ha alcuna conseguenza in termini di seggi. Il vero problema è stato l'errore su SA. Il dato dei sondaggi la dava oltre la soglia dell'8% in diverse regioni, e in tutte queste regioni sottraeva seggi al secondo arrivato. In altre parole, secondo la media sondaggi l'effetto "regioni rosse" c'era, e in più SA sottraeva qualche seggio addizionale al PD dove questo è minoritario (per esempio in Piemonte).

Ovviamente non possiamo farci molto se i sondaggi sono sbagliati. Però il bello dei dati elettorali è che alla fine il dato vero sulla forza dei partiti viene rivelato. Possiamo quindi porre la seguente domanda: se avessimo avuto sondaggi perfetti quanto avremmo sbagliato nell'attribuzione dei seggi? La risposta a questa domanda ci fornisce un'idea di quanto siano buone o cattive le ipotesi di omogeneità di comportamento tra Camera e Senato e tra regioni. Se mettiamo nel foglio di calcolo i dati veri della Camera otteniamo il seguente risultato.

 Seggi: previsione
in base ai risultati Camera
Dato effettivo
 
PdL 173167
PD 126129
 
UDC 03
 
SA 00
 

Quindi sovrastimiamo PdL e sottostimiamo PD e UDC. Per l'UDC questo è dovuto al fatto che i nostri calcoli la danno appena sotto la soglia in Sicilia. Per il PD il problema è che i dati della Camera sottostimano la crescita del partito al Senato. La situazione infatti è la seguente.

 2006 2008 rapporto 08/06
Coalizione PD Camera 36,6537,54 1,02
Coalizione PD Senato
 
33,61 38,01
 
1,13
 

Nelle ultime elezioni l'Ulivo si è presentato unito alla Camera e diviso al Senato, e ha preso circa il 3% in meno al Senato (non ci furono grosse variazioni invece per IDV e RNP). In queste elezioni questo effetto si è annullato, le percentuali di Camera e Senato sono praticamente identiche. Ma questo ha significato un aumento assai più forte al Senato che alla Camera. Quindi, assumendo che i voti al Senato amentassero come alla Camera abbiamo sottostimato il risultato del PD al Senato.

Quindi l'ultima domanda è: se avessimo avuto sondaggi perfetti nazionali per il Senato quanto avremmo sbagliato nell'attribuzione dei seggi? L'errore in questo caso si può attribuire totalmente all'ipotesi di "uniform national swing", ossia l'errore ci puo dire quanto il risultato elettorale è dovuto a una distribuzione non omogenea tra le regioni della crescita o decrescita dei diversi partiti. Questa è la tabella.

  

Seggi: previsione
in base ai risultati Senato

 
Dato effettivo
PdL 165 167
PD 134 129
UDC 0 3
SA 0 0

Se compariamo questi dati con la distribuzione effettiva dei seggi direi che l'ipotesi "uniform national swing" ha funzionato abbastanza bene, almeno per quanto riguarda la distribuzione dei seggi. Se siete interessati all'analisi completa, qui c'è il foglio di calcolo con la comparazione regione per regione. I seggi vengono previsti esattamente in 12 regioni su 17. In Toscana sottostimiamo il PD di un seggio, mentre in Campania lo sovrastimiamo di un seggio (la debolezza del PD in Campania era attesa). In due regioni sbagliamo ad attribuire il premio. In Abruzzo è semplicemente il caso che i due partiti sono vicini. In Calabria il risultato del PD è nettamente inferiore a quello nazionale (l'effetto Fuda-Loiero, anche questo atteso e discusso). Infine, in Sicilia sbagliamo di poco la previsione su UDC, che resta sopra la soglia e prende 3 seggi.

Direi che, tutto sommato, la metodologia non ha fatto niente male. Con i dati "giusti", ossia i dati nazionali del Senato, l'ipotesi di "uniform national swing" avrebbe sbagliato la previsione sul PdL, quella che più contava, solo di due seggi.

 

Indietro

Commenti

Ci sono 15 commenti

Per quanto non conti troppo per la qualità delle previsioni dei seggi al

senato, l'altro partito per il  quale i sondaggi hanno clamorosamente sbagliato e' la Lega. Come nota Chris

Hanretty qui,

la cosa interessante e’ che l’errore dei sondaggi sulla SA e’ in valore

assoluto (ma di segno opposto) simile a quello che riguarda la Lega.


La cosa sorprendente di queste elezioni è, secondo me, il fatto che gli

elettori (o i potenziali elettori) della Sinistra Arcobaleno non erano in buona

parte né frontopopolari, né castocomunisti (qui

le definizioni di Sandro). In altri termini, le preferenze dei vecchi elettori

di Bertinotti and his friends sono molto piu’ eterogenee di quello che ci si

aspettava.

 

 

Lunedi' pomeriggio ho modificato il vostro foglio mettendoci appunto i risultati del senato 2006 e le proiezioni nazionali per il senato, e in effetto la vittoria larga del Pdl-Lega al Senato appariva chiara prima che si avessero dati o proiezioni regionali. In particolare, appariva certa nonostante le regioni in bilico (Lazio e Liguria), per via del crollo di SA. Potevano esserci dubbi solo se chi aveva votato SA 2 anni fa nelle regioni rosse l'avesse votata di nuovo. Tra l'altro, rivotare SA in quelle regioni sarebbe stato voto utile sia a SA che al PD. Chiaramente il voto utile "alla Brusco" non l'ha scelto nessuno. E ci avrei scommesso.

 

Il voto utile di solito è possibile definirlo in modo chiaro solo quando è scelto da poche persone. Sono tipicamente i militanti di partito o altre poche persone con un interesse molto forte per le cose politiche; tali persone, tra l'altro, sono anche quelle in posizione migliore per risolvere eventuali problemi di coordinamento.

L'ipotesi che si fa, e che ho fatto anch'io, è che la stragrande maggioranza della gente non ha tempo e voglia di elucubrare sugli effetti del proprio voto e semplicemente lo dà al partito che sente più vicino. Se la percentuale di popolazone che vota strategicamente fosse ampia

sarebbe molto più difficile o impossibile definire cosa è il voto

utile. Se la frazione di popolazione che vota in modo strategico è larga allora ci sono equilibri multipli e il voto utile non si può più definire in modo univoco. In questa elezione il voto utile, anche se limitato, poteva essere importante per il gioco delle soglie e dei premi; se pochi voti fanno scattare la soglia o il premio allora anche una minuscola percentuale (0,5%, per esempio) della popolazione che sceglie il voto utile può cambiare il risultato in modo importante.

Ovviamente per decidere qual è il voto utile occorre stimare la probabile distribuzione del voto "sincero" o "naive". Qui è dove i sondaggi sono stati misleading, dal momento che hanno sbagliato la previsione su SA. I sondaggi erano invece abbastanza accurati per l'UDC. Se, per esempio, il PdL avesse spostato lo 0,2% di elettori sull'UDC in Puglia (questo è possibile farlo usando solo i militanti) allora il PD avrebbe perso almeno un seggio e il PdL non ne avrebbe perso nessuno. 

Il crollo di SA era palesemente di un evento inatteso e difficile da prevedere. Un crollo di dimensioni simili, con un partito che perde il 70% dei suoi voti, nella storia recente si è visto solo per la Lega tra il 1996 e il 2001, ma veniva da un punto di picco. La debacle di SA è invece avvenuta in soli due anni e a partire da un risultato che era stato abbastanza stabile in multiple elezioni. Questo è ciò che lo rende così sorprendente.

Mi piacerebbe sapere come spiegano i sondaggisti il loro universale fallimento nel prevedere il risultato di SA. Ho guardato la serie storica dei sondaggi su tocqueville.it e nessuno ha mai dato un numero inferiore al 6%. Come è possibile che fossero TUTTI così sbagliati? E solo per un partito? È ovvio che c'è qualche difetto nella metodologia. Oppure la fuga da SA è avvenuta nelle ultime due settimane?

 

 

 

Mi incuriosisce il riferimento ad Hayek. Me lo spieghi?

 

Tento l'esegesi del Michelepensiero: probabilmente si riferisce all'illusione, sempre presente a sinistra, di poter pianificare a tavolino quelli che sono essenzialmente processi caotici in un sistema altamente distribuito.

 

Mi sembra che Sandro e Michele usino due diverse nozioni di voto utile. Michele sembra riferirsi a quello che in campagna elettorale fu chiamato "voto utile", ossia un voto a PD o PDL perche' altrimenti sembrava un voto sprecato contro il proprio nemico. Sandro aveva argomentato che la legge elettorale rendeva non ovvio quale fosse il "voto utile" al Senato, e che si poteva tentare di fare qualche previsione (che poi i partiti, se volevano, potevano a loro volta tentare di implementare in porzioni limitate e fedeli del proprio elettorato). Emersero vari paradossi, tra cui il fatto che gli elettori UDC dovevano votare in massa SA al Senato in Toscana ecc. ecc.

L'unico a tentare di parlare di voto utile alla Camera sono stato io, nel senso che, se si credeva a Veltroni che diceva che il divario era piccolo, gli elettori di SA avrebbero fatto bene a votare in massa PD alla camera, anche "rischiando il quorum" scrissi, per far arrivare il PD alla maggioranza e far diventare ago della bilancia i loro senatori (tra l'altro guadagnati con il "voto utile" di Brusco in alcune regioni). Il piano era di realizzare la seconda tabella nel post di Brusco che stiamo leggendo, ulteriormente migliorata dalle previsioni di Veltroni (che assicuravano ben piu' di 125 senatori, diciamo 137 a148 per il PDL).

Probabilmente questo mio disegno e' stato raccolto (naturalmente non che qualcuno mi abbia letto, ma nella parte sulla Camera coincideva con il "voto utile" nel linguaggio di Berlusconi e Veltroni). Quello che e' mancato e' stato il voto utile al Senato nel senso di Brusco, che pero', visto il collasso di SA, avrebbe dovuto avere forme (SA che vota PD in alcune regioni e PD che vota SA in altre) e proporzioni (fino al 5% di spostamento) da renderlo, come rileva Michele, non implementabile.

 

Berlusconi sembra essersi convinto che questo sistema elettorale non e' poi male, il che non e' vero: seguendo la prima analisi di Brusco che i voti tra destra e sinistra non si sono poi tanto spostati negli anni (questa volta c'e' stata una fluttuazione seria, ma non e' detto che non torni indietro), tutto e' stato deciso dal fatto che questa volta la sinistra era divisa. La prossima volta dipende da chi e' diviso, oppure si torna allo scontro all'ultimo voto con Senato senza maggioranza.

Se pero', come quindi pare, la legge elettorale rimarra' questa, almeno c'e' di buono che anche la prossima volta ci si potra' divertire a fare previsioni.

 

 

È vero che probabilmente qua c'è anche un problema semantico. Io sono stato molto chiaro nel definire il voto utile come "voto strategico", voto dato da persone che osservano e capiscono il sistema elettorale, cercano di farsi l'idea migliore possibile di cosa sceglierà la stragrande maggioranza della popolazione che vota sinceramente e usa il suo voto per massimizzare la sua utilità.

Se chiamiamo "voto utile" anche quello dell'elettore di sinistra che vota Veltroni perché Veltroni gli ha raccontato che lui ce la può fare allora anything goes. Per me questi sono elettori a cui piace Veltroni e che votano sinceramente. La quasi equivalenza in tutte le regioni del voto di Camera e Senato secondo me è abbondante evidenza di quanto sia stato minuscolo il voto strategico, come c'era da attendersi. Credo comunque che l'esempio più chiaro di come il voto perso da SA non sia stato strategico sia dato dal Trentino, che per il Senato ha un sistema molto vicino al maggioritario all'inglese. Con questo sistema, a differenza del porcellum, quale fosse il voto utile risultava chiarissimo senza stare a far calcoli: votate solo i due candidati principali. Ebbene, alla Camera SA ha preso il 3,1 mentre al Senato in vari collegi ha preso intorno all'8%. A causa della dispersione di questo voto il PD ha perso i seggi di Trento e della Valsugana. Perché questi elettori di SA hanno scelto PD alla Camera e SA al Senato? Certo non perché sono strategici, ma perché i candidati non gli piacevano e non c'era il simbolino del PD ma quello dell'alleanza autonomista.

Ci sono miriadi di esempi del genere che indicano univocamente una schiacciante prevalenza del voto sincero, non solo in Italia. Nel 2006 l'Ulivo prese il 3% in più di voti alla Camera che al Senato, in buona misura sottratti ai partiti che poi hanno formato SA. L'unica ragione apparente era che sulla scheda della Camera c'era l'Ulivo mentre al Senato c'erano DS e Margherita separati; votare Ulivo alla Camera era antistrategico, serviva solo a far rischiare il quorum ai partitini della sinistra. Nel 2001 Rifondazione prese gli stessi voti alla Camera proporzionale e al Senato, anche se al Senato l'ovvio voto strategico era scegliere Ulivo per impedire la vittoria di Berlusconi; anche lì nessun bisogno di coordinamento, nessun bisogno di calcoli complicati, nemmeno nessuna incertezza su quale potesse essere il voto utile. E anche nel 2001 di voto utile si parlava, Bertinotti arrivò a definirlo una bestemmia (perché aveva paura che gli sottraesse voti al Senato). Come in questa elezione, se ne parlava solo tra gli addetti ai lavori. La stragrande maggioranza degli elettori il voto utile non lo capisce e non lo usa.

 

 

Giovedi è uscito un interessante report sui flussi elettorali, segnalato prontamente da Andrea Mancia. Trovate qui il pdf. I numeri sono abbastanza simili a quelli di Consortium , usciti su Repubblica nello stesso giorno. Chiaro che non ci dicono il PERCHÈ gli elettori di estrema sinistra si sono spostati verso il PD in modo massiccio, ma ci dicono almeno in che misura. Noto anche l'astensione che gioca fortemente contro SA. Interessanti anche i dati regione per regione: in Campania, per esempio, la fuga da SA e' stata preponderantemente verso l'astensione o verso altre formazioni minori (probabilmente altri gruppuscoli comunisti). Nelle Marche e in Toscana, idem: forte astensione degli elettori di SA. Stessa cosa si vede nelle regioni del Nord. Sto cercando da un po' di capire le metodologie utilizzate, ma non riesco a trovare dettagli, se qualcuno li trova mi faccia sapere.

Oggi invece, sempre su Repubblica, e sempre da Consortium, arriva una analisi del voto per professione e altre caratteristiche dell'elettore. La cosa secondo me interessante (visto che le altre più o meno confermano cose che gia sapevamo da un decennio circa) è questa: "[...] il centrodestra vince il confronto anche fra coloro che sono in

possesso di un titolo di studio superiore: Lega e Pdl hanno il 44,2 per

cento contro il 34,3 per cento del Pd e il 4,7 di Di Pietro". Questo mi risulta essere un cambio decisamente forte rispetto agli ultimi anni, dove di solito Berlusconi non otteneva molti voti da persone con un livello di istruzione superiore. 

 

E' proprio vero quindi che il valore della laurea, con buona pace dei sostenitori del valore legale, si e' definitivamente deteriorato... ;)

 

Ciao a tutti,

volevo solo salutare a tutti e presentarmi:

sono Roberto, e sono al quarto anno di Ph.D. in Economics alla Duke University.

Congratulazioni per il sito molto interessante e saro' molto attivo nel dibattito.

 

Roberto

 

 

 

Corriere.it stamattina scrive:

 

Patto Lega-Pdl sui ministri

Calderoli sarà vicepremier


09:47 POLITICA Incontro ad Arcore con Berlusconi sul futuro governo: decisi i ministeri dei «lumbard». Bossi alla Riforme, Maroni all'Interno, Zaia all'Agricoltura. Resta il nodo Lombardia

 

Al di la' di ulteriori considerazioni, sono l'unico a pensare che Bossi non sia in condizione di fare il ministro?