Carenze normative ed eccessiva semplificazione
Sondaggi insondabili. Alcune note metodologiche sui sondaggi politici diffusi dai mezzi di comunicazione di massa
Premessa
I cosiddetti sondaggi, altresì noti come indagini campionarie, costituiscono ormai da diversi anni uno degli strumenti più utilizzati dai mezzi di comunicazione di massa del nostro paese per presentare al pubblico descrizioni della realtà sociale reputate “oggettive” e “scientifiche”. È sufficiente sfogliare i principali quotidiani nazionali o seguire qualche talk show di successo per vedere come giornalisti, commentatori e conduttori televisivi si avvalgano regolarmente dei sondaggi per spiegare al pubblico cosa pensano gli italiani, quali sono le loro preoccupazioni principali, quante volte vanno al cinema, per chi voteranno alle prossime elezioni politiche, e così via.
Già copiosi in tempi normali, nei periodi – come quello attuale – di campagna elettorale i sondaggi fioriscono a dismisura in virtù del loro ruolo di moderni oracoli prêt-à-porter, di agili strumenti “scientifici” in grado di frugare fra gli orientamenti politici degli italiani e portare alla luce le loro intenzioni di voto. I sondaggi pre-elettorali, insomma, vengono visti come una sorta di finestra sul futuro, affacciandosi alla quale è possibile intravedere gli scenari politici venturi e ricavare la materia prima con la quale dare vita ad appassionati dibattiti mediatici.
Ma fino a che punto dobbiamo credere ai sondaggi diffusi dai mezzi di comunicazione di massa? In quale misura possiamo ritenerli strumenti genuinamente scientifici in grado di fornire descrizioni accurate dei fenomeni sociali che si propongono di studiare? Qui di seguito cercherò di rispondere – sia pure sommariamente – a questi interrogativi presentando alcune osservazioni sul valore metodologico dei sondaggi politici attualmente realizzati in Italia a uso dei mezzi di comunicazione di massa. Innanzitutto illustrerò brevemente gli aspetti salienti delle norme che, nel nostro paese, regolano la pubblicazione e diffusione dei sondaggi sui mezzi di comunicazione di massa, sottolineandone la sostanziale inadeguatezza. Quindi, utilizzando alcuni esempi, mostrerò come tale carenza normativa si traduca nella propensione a realizzare sondaggi politici che, in generale, non possiedono i requisiti minimi necessari per poter essere considerati strumenti scientifici di conoscenza della realtà. Infine, concluderò la discussione avanzando qualche semplice proposta per restituire ai sondaggi politici – o di qualunque altro tipo – un po’ di credibilità. Data la natura di questa rubrica, le mie argomentazioni avranno un carattere informale e, pertanto, saranno completamente prive di formule matematiche e riferimenti bibliografici. Mi limito a consigliare, per coloro che volessero approfondire gli aspetti meno tecnici della questione, la lettura dell’ottimo saggio di Giancarlo Gasperoni “I sondaggi politici in Italia. Tra arretratezza e diffidenza”, pubblicato nel volume I sondaggi politici nelle democrazie contemporanee, a cura di Piergiorgio Corbetta e Giancarlo Gasperoni (Bologna, Il Mulino, 2007).
Autorità senza autorevolezza (scientifica)
La rilevanza dei sondaggi come fonte pubblica di informazione è talmente riconosciuta nel nostro paese che l’Autorità per le Garanzie nelle Comunicazioni – con due delibere approvate nel 2002 e nel 2003 – ha emanato un regolamento che disciplina la pubblicazione e diffusione dei sondaggi sui mezzi di comunicazione di massa. Questo regolamento si pone due obiettivi principali, entrambi degni di lode: chiarire cosa si intende per sondaggio e prescrivere le informazioni metodologiche di cui ogni sondaggio deve essere corredato per poter essere reso pubblico, cioè diffuso sui mezzi di comunicazione di massa.
Per quanto riguarda il primo obiettivo, in apparenza l’intenzione del legislatore è perentoria: come si legge nel sito dell’Autorità (http://www.agcom.it/sondaggi/sondaggi.htm), scopo del regolamento è fornire “una rigorosa definizione di sondaggio che esclude ogni possibile confusione con altre forme di raccolta di dati e notizie (indagini, servizi, inchieste) e chiarisce che la disciplina regolamentare deve intendersi circoscritta ai sondaggi strettamente intesi, in quanto effettivamente rappresentativi di un campione statistico selezionato con modalità scientifiche”. Al di là di qualche contorsionismo lessicale, queste parole non lasciano adito a dubbi e testimoniano il fermo desiderio dell’Autorità di imporre un modello scientifico di sondaggio. Peccato, però, che questa lodevole intenzione sia stata tradotta in norma in modo alquanto maldestro: l’articolo 1 del regolamento, infatti, definisce sondaggio “ogni rilevazione di opinioni, comportamenti, giudizi, atteggiamenti, previsioni, atti e fatti effettuata con metodo campionario, probabilistico o non probabilistico, che consente di generalizzare i risultati al collettivo di riferimento”.
Ora, come può confermare qualunque studente che sia stato esposto ai rudimenti della teoria dei campioni, questa definizione è decisamente stramba in quanto mette sullo stesso piano i sondaggi basati su campioni probabilistici e quelli basati su campioni non probabilistici, riconoscendo a entrambi la capacità di “generalizzare i risultati al collettivo di riferimento”. La stravaganza di tale equivalenza statuita ex lege è presto detta: se da un lato è senz’altro vero che – seguendo rigorosamente determinate procedure – i risultati ottenuti da campioni probabilistici possono essere (quasi) sempre generalizzati alla popolazione di riferimento, dall’altro lato è altrettanto vero che i risultati ottenuti da campioni non probabilistici possono essere generalizzati alla popolazione di riferimento solo accettando assunti molto forti che, nella maggior parte dei casi, non sono giustificabili sul piano teorico e/o verificabili sul piano empirico. Questa differenza deriva dal fatto che mentre la relazione che lega un campione probabilistico alla popolazione dalla quale è stato estratto è teoricamente nota e, quindi, può essere utilizzata per valutare l’accuratezza degli stimatori di interesse e definire l’incertezza che circonda le stime campionarie corrispondenti, il nesso fra un campione non probabilistico e la sua popolazione di riferimento è sostanzialmente ignoto e, in larga misura, neppure conoscibile. In altri termini, i campioni non probabilistici – a differenza di quelli probabilistici – sono scatole nere che producono le proprie stime celandone i meccanismi generativi sottostanti.
Trascurando la differenza sostanziale che esiste fra campioni probabilistici e non probabilistici, il legislatore conia un inedito ossimoro statistico e attribuisce ai sondaggi basati su campioni non probabilistici virtù che, in realtà, non possiedono. Ora, poiché i disegni di campionamento non probabilistici sono molto meno costosi e molto più facili da eseguire dei disegni di campionamento probabilistici, è evidente che i produttori di sondaggi – confortati dalla normativa vigente –tenderanno a ricorrere ai primi, decisamente più vantaggiosi quando nessuno si preoccupa di valutare la qualità scientifica – e, quindi, il grado di credibilità – dei risultati di ricerca. L’intenzione iniziale di riservare il termine “sondaggio” a procedure di rilevazione dei dati fondate su un metodo rigoroso, dunque, viene vanificata e l’attività sondaggistica assume i tratti di un vero e proprio free-for-all in cui, di fatto, è consentito tutto e il contrario di tutto.
Dunque, nella sua forma attuale il regolamento in materia di pubblicazione e diffusione dei sondaggi sui mezzi di comunicazione di massa appare un po’ come il proverbiale rimedio peggiore del male: nato apparentemente per porre fine a “sondaggio selvaggio”, in realtà ha finito per legittimarlo, sia pure aumentandone (almeno in parte) la trasparenza. Tuttavia, poiché non sono molti i cittadini che possiedono gli strumenti cognitivi per vedere e comprendere ciò che sta dietro tale trasparenza, di fatto i (pochi) meriti della norma scivolano sullo sfondo e non riescono a esercitare alcun effetto positivo sul valore scientifico dei sondaggi, contribuendo così a minarne la credibilità.
Alcuni esempi
Come ho appena osservato, la vaghezza che caratterizza il regolamento emanato dall’Autorità per le Garanzie nelle Comunicazioni non ha per nulla contribuito a migliorare la qualità dei sondaggi pubblicati e diffusi sui mezzi di comunicazione di massa italiani. Al contrario: la mancanza di regole chiare e rigorose ha spinto verso un abbassamento degli standard di settore e favorito la diffusione di sondaggi la cui qualità è dubbia e, comunque, difficile da valutare. Un paio di esempi, tratti dai sondaggi politici effettuati nello scorso mese di febbraio, mi aiuteranno a chiarire il senso di questa critica; a tal fine, la mia “evidenza empirica” sarà costituita dalle note metodologiche che, ai sensi di legge, sono depositate presso il sito www.sondaggipoliticoelettorali.it.
Per cominciare, consideriamo un sondaggio effettuato da Ispo Srl fra il 15 e il 18 febbraio 2008, finalizzato a rilevare le intenzioni di voto degli italiani; i dati raccolti in questa ricerca sono stati illustrati e commentati in un articolo di Renato Mannheimer pubblicato sul Corriere della Sera del 23 febbraio 2008 e intitolato “Destra al 3 per cento. Ma può attrarre il 12”. Conformemente a quanto previsto dalla norma vigente in materia di diffusione dei sondaggi politici ed elettorali sui mezzi di comunicazione di massa, la nota metodologica che accompagna il sondaggio fornisce – fra le altre – tre informazioni sulle quali vorrei soffermarmi:
- Alla voce Criteri seguiti per la formazione del campione il documento recita: “Campione rappresentativo della popolazione italiana in età di voto per sesso, età, scolarità, professione, area geografica, dimensione del comune di residenza”. Cosa significa questa dichiarazione? Difficile saperlo. Se con l’espressione “criteri seguiti per la formazione del campione” il legislatore avesse inteso riferirsi al disegno di campionamento utilizzato nel sondaggio, allora ci saremmo aspettati di trovare, in corrispondenza di questa voce, le seguenti informazioni: meccanismo prescelto di selezione delle unità di campionamento, definizione dell’eventuale procedura di stratificazione della popolazione di riferimento, numero e natura degli stadi di campionamento. Nel loro insieme, queste informazioni ci avrebbero permesso di capire se il disegno di campionamento prescelto è di tipo probabilistico o non probabilistico, ma in loro assenza possiamo solo fare delle ipotesi al riguardo. In ogni caso, l’informazione riportata dalla nota metodologica in corrispondenza della voce in questione è poco credibile: formalmente, un campione può dirsi rappresentativo di una data popolazione in termini di un dato insieme di variabili X solo se la distribuzione di probabilità congiunta di tutte queste variabili all’interno del campione approssima l’analoga distribuzione all’interno dell’intera popolazione. Ora, a parte il fatto che la distribuzione di probabilità congiunta delle variabili sesso, età, scolarità, professione, area geografica e dimensione del comune di residenza all’interno della “popolazione italiana in età di voto” è ignota a chiunque – e, quindi, non può essere in alcun modo confrontata con l’analoga distribuzione all’interno del campione – dovrebbe apparire evidente che ci vorrebbe un campione decisamente molto grande per “rappresentare” in modo soddisfacente una distribuzione così complessa, probabilmente qualche decina di migliaia di casi. Poiché, però, il campione effettivo è formato da soli 800 casi, ecco che qualunque ambizione di “rappresentatività” così ampia è destinata a rimanere insoddisfatta.
- Alla voce Metodo di raccolta delle informazioni il documento recita: “Interviste telefoniche C.A.T.I. (computer assisted telephone interview). Margine di approssimazione: 3,5%. Elaborazione dati: Spss”. Qui la nota stonata è costituita dalla seconda espressione che, presa alla lettera, significa: ogni valore percentuale stimato utilizzando i dati del sondaggio e presentato in questo articolo si colloca all’interno di un intervallo di confidenza pari a P ± 3,5%, dove P denota il valore percentuale stimato. Quali sono gli elementi stonati di questa dichiarazione? Innanzitutto, non è specificato da nessuna parte il livello di confidenza al quale si riferisce il margine di approssimazione pari a 3,5%: probabilmente si tratta del canonico 95%, ma è impossibile dedurlo dalle informazioni riportate. In secondo luogo, dire che il margine di approssimazione di tutte le stime è pari a 3,5% non ha alcun senso: il margine di approssimazione non esiste in sé, ma è sempre funzione della specifica stima alla quale viene applicato. Il grafico riportato nell’articolo, ad esempio, mostra che, secondo il sondaggio Ispo, la Destra avrebbe il 2/3% di consensi dell’elettorato; facciamo pure 3%. Ora, se applico il margine di approssimazione del 3,5% a questa stima, ottengo un intervallo di confidenza intorno alla stima stessa che va da 3–3,5% = –0,5% a 3+3,5% = 6,5%; è evidente che, trattandosi di percentuali, il limite inferiore dell’intervallo non può mai essere negativo e, quindi, il nostro intervallo di confidenza è privo di senso. Infine, per le ragioni accennate nel paragrafo precedente, i margini di approssimazione delle stime campionarie possono essere calcolati in modo corretto solo quando il disegno di campionamento utilizzato è di tipo probabilistico; francamente, non scommetterei molto su questa eventualità e, quindi, direi che l’informazione in questione è, oltre che scorretta, fuorviante, in quanto induce il lettore a pensare che il sondaggio sia stato condotto rispettando tutti i crismi della teoria dei campioni e, quindi, che i suoi risultati siano veramente generalizzabili alla popolazione di riferimento.
- Alla voce Numero delle persone interpellate e universo di riferimento il documento recita: “N. casi: 800. Universo di riferimento: popolazione italiana residente in età di voto”. Qui il documento è ineccepibile, nel senso che fornisce esattamente le informazioni richieste dal legislatore. Si noti, tuttavia, che tali informazioni non dicono nulla su un aspetto rilevante di qualsiasi sondaggio: il suo tasso di risposta. Ciò che sappiamo è che le “persone interpellate” sono 800, ma chi sono le “persone interpellate”? Se corrispondessero esattamente alle unità campionate, allora il tasso di risposta del sondaggio sarebbe pari a 100%: un vero record! Se invece, come sembra più probabile, le “persone interpellate” fossero solo quelle che hanno accettato di farsi intervistare, allora il tasso di risposta del sondaggio potrebbe scendere a valori molto più bassi: 60%? 50%? 30%? 10%? Non c’è modo di saperlo leggendo la nota metodologica e, senza questa informazione, viene a mancare un tassello fondamentale per valutare in modo sensato la qualità dei risultati di un sondaggio. Possiamo però consolarci: se il campione – come è lecito sospettare – è stato selezionato utilizzando un disegno di campionamento non probabilistico, allora il vero tasso di risposta del sondaggio non può essere calcolato. Anche in questo caso, però, sarebbe utile sapere se gli 800 casi che compongono il campione effettivo sono stati selezionati al primo colpo oppure – come è più probabile – sono il distillato di un ampio numero di tentativi di intervista, la maggior parte dei quali è sfociata in un rifiuto; in questo secondo caso, i nostri dubbi sulla credibilità del sondaggio aumenterebbero ulteriormente.
Il secondo sondaggio sul quale vorrei soffermarmi brevemente è stato effettuato da Gfk Eurisko fra il 18 e il 20 febbraio 2008 allo scopo di rilevare diversi aspetti dell’orientamento politico degli italiani, nonché le loro intenzioni di voto; i dati raccolti in questa ricerca sono stati illustrati e commentati in un articolo di Fabio Bordignon e Roberto Biorcio pubblicato su la Repubblica del 25 febbraio 2008 e intitolato “Pd in ripresa: a 6 punti dal Pdl. Prezzi in testa alle priorità”. Le informazioni riportate nella nota metodologica che accompagna questo sondaggio alle voci Metodo di raccolta delle informazioni e Numero delle persone interpellate e universo di riferimento sono state compilate con gli stessi criteri – e, quindi, con gli stessi limiti – evidenziati nell’esempio precedente, con l’unica differenza che questa volta non si fa riferimento ai margini di approssimazione delle stime, né al software statistico utilizzato per elaborare i dati e calcolare le stime. C’è, invece, qualcosa di nuovo alla voce Criteri seguiti per la formazione del campione che, in questo caso, recita: “Campione rappresentativo della popolazione italiana, stratificato per aree geografiche ed ampiezza demografica dei centri, con quote pre-assegnate di sesso ed età. Il campione è stato controllato ex post su 5 parametri: area geografica, ampiezza centri, sesso, età, istruzione. Fonte per la distribuzione dei parametri: dati Istat”. Nonostante l’apparenza di una maggiore precisione, anche in questo caso ci troviamo di fronte a un linguaggio personalizzato che tende a rifuggire dagli standard scientifici della disciplina nota come survey methodology. A parte il discutibile ricorso alla rassicurante ma spesso fuorviante espressione “campione rappresentativo della popolazione italiana” (vedi osservazioni precedenti), la duplice menzione di “stratificazione” e “quote” solleva qualche perplessità, in quanto la prima si utilizza nei disegni di campionamento probabilistici, mentre le seconde sono la pietra angolare dei principali disegni di campionamento non probabilistici. Le due procedure possono convivere nello stesso disegno di campionamento solo quando quest’ultimo è un disegno multistadio misto, ad esempio un disegno a due stadi con stratificazione al primo stadio, estrazione probabilistica delle unità primarie di campionamento ed estrazione per quote (cioè non probabilistica) delle unità finali di campionamento. Nella nota metodologica, però, non si parla di stadi di campionamento; quindi, o l’informazione fornita è incompleta, o la distinzione fra “strati” e “quote” diventa superflua, in quanto i primi possono essere assimilati alle seconde senza perdita di generalità.
Decisamente oscura è anche l’affermazione secondo la quale “il campione è stato controllato ex post su 5 parametri: area geografica, ampiezza centri, sesso, età, istruzione. Fonte per la distribuzione dei parametri: dati Istat”: a parte l’uso improprio del termine “parametri” (probabilmente gli autori intendevano dire “variabili”), in questo caso non è chiaro se il verbo “controllare” sia stato usato alla lettera – cioè, i ricercatori hanno confrontato le distribuzioni di area geografica, ampiezza centri, sesso, età e istruzione osservate nel campione con le analoghe distribuzioni ricavabili dai dati Istat (per inciso: quali?) – oppure come sinonimo di “post-stratificare”: sono due cose piuttosto diverse.
Ad alimentare la confusione del lettore, infine, contribuisce anche la nota metodologica riportata nell’articolo, dove si legge: “Le stime sulle intenzioni di voto (curate da Roberto Biorcio) sono state realizzate tenendo sotto controllo la distribuzione territoriale, i caratteri socio-demografici e i precedenti comportamenti elettorali”. Anche qui non è chiaro cosa significhi “tenere sotto controllo” tutte queste variabili, dato che l’espressione “tenere sotto controllo”, nel linguaggio statistico standard, si applica generalmente alle operazioni di stima di effetti causali – o, più in generale, di determinati parametri di interesse – mediante appositi modelli matematici: qualche informazione più precisa al riguardo sarebbe stata utile per valutare meglio i risultati del sondaggio.
Conclusioni e qualche proposta
Gli esempi illustrati sopra mostrano che, a causa della sua mancanza di rigore, la normativa vigente in materia di pubblicazione e diffusione dei sondaggi sui mezzi di comunicazione di massa ha favorito la proliferazione di sondaggi la cui qualità è perlomeno dubbia e, comunque, difficile da valutare, dato che le note metodologiche che accompagnano per legge i sondaggi stessi sono spesso laconiche, lacunose e compilate utilizzando una terminologia imprecisa o, addirittura, scorretta. Poiché la questione della qualità dei sondaggi non sembra preoccupare molto giornali, radio e televisioni, che ne diffondono acriticamente i risultati senza curarsi della loro credibilità, e poiché i produttori di sondaggi non sembrano in grado di darsi autonomamente delle regole soddisfacenti, sarebbe opportuno che l’Autorità per le Garanzie nelle Comunicazioni tornasse sui propri passi ed elaborasse un regolamento più preciso ed esigente. Rispetto a quello attuale, tale regolamento dovrebbe: (a) chiarire la distinzione fra disegni di campionamento probabilistici e disegni di campionamento non probabilistici, sottolineando in particolare le differenze fra i due disegni in termini di possibilità di generalizzare i risultati di ricerca alla popolazione di riferimento; e (b) chiedere ai produttori di sondaggi di fornire note metodologiche che illustrino – in maniera esaustiva e con un’appropriata terminologia scientifica – sia il disegno di ricerca adottato ex ante, sia i modi e la misura in cui tale disegno è stato effettivamente realizzato, cosicché il lettore interessato possa ricostruire i meccanismi che hanno generato le stime e, quindi, valutare la loro qualità/credibilità.
Nello stesso tempo, le comunità scientifiche più direttamente interessate alla questione (in particolare statistici, sociologi e scienziati della politica) dovrebbero fare del proprio meglio per sensibilizzare i mezzi di comunicazione di massa e l’opinione pubblica a una fruizione più accorta dei sondaggi, chiarendo nelle sedi opportune i criteri per valutarne la qualità. In gioco non c’è solo la credibilità dei sondaggi in sé, ma anche dell’analisi scientifica dei fenomeni sociali: se i sondaggi attualmente diffusi dai mezzi di comunicazione di massa dovessero essere percepiti dal pubblico come il principale strumento attraverso il quale la sociologia o la scienza della politica studiano la realtà sociale, le nostre discipline rischierebbero di perdere molta della loro reputazione. Poiché quest’ultima è già abbastanza ridotta, forse varrebbe la pena prendere la cosa sul serio e correre ai ripari.