X Redattore Sociale 28-30 novembre 2003

Volo Radente

Workshop: Giornalismo e... numeri: tecniche, letture, usi, rappresentazioni

Incontro con Andrea Mancini. Conduce Carlo Giorgi. Interviene Roberto Sgalla

Andrea MANCINI

Andrea MANCINI

Direttore centrale Dati strutturali dell’Istat.

 

Carlo GIORGI

Carlo GIORGI

Giornalista, collabora tra l’altro con Il Sole 24 Ore, Famiglia Cristiana e il Gruppo Espresso. Ricopre anche la carica di direttore responsabile del mensile Terre di mezzo. 

ultimo aggiornamento 30 novembre 2007

Roberto SGALLA

Roberto SGALLA

Responsabile delle relazioni esterne del Ministero dell’Interno, Dipartimento Pubblica Sicurezza.

ultimo aggiornamento 01 dicembre 2006

Carlo Giorgi*

Fra qualche giorno, dal 3 al 5 dicembre, ci sarà un grande convegno dell'Istat a Roma e verrà presentata la seconda indagine di vittimologia. Personalmente sono molto curioso di vedere quanto spazio i giornali daranno a questo evento, perché seppur estremamente importante sarà poco sensazionalista. Staremo a vedere.
Ci sono dei sistemi per avvicinarsi alla criminalità reale: sistemi dell'autodenuncia, il sistema dell'indagine vittimologica. Inoltre la criminalità percepita - che di per se è un dato soggettivo - ma è estremamente raro che qualcuno di noi incontri la incontri. Statisticamente è complicato pensare che ognuno di noi possa essere scippato, derubato in casa, senza parlare di fatti ancora più gravi.
Ciò da una parte ci potrebbe rassicurare, invece proprio perché non è la criminalità a incidere sul sistema della percezione, ma sono altri fattori di degrado - degrado urbano, degrado sociale, gli immigrati, i tossici, il dramma della prostituzione - che non hanno quasi nulla a che vedere con la criminalità, provocano in ognuno una certa percezione della criminalità e un tasso di paura altissimo. Un esempio banalissimo è la diversa risposta che si da a domande simili ma diversamente circostanziate.

Alla domanda: ti senti insicuro? Si risponde si. Ma alla domanda: Ti senti insicuro nel tuo quartiere? Si risponde no. Uno potrebbe dire la contraddizione massima, invece è la spiegazione di questo fenomeno. C'è la percezione di qualche cosa che chiaramente fa sentire insicuri, poi nel proprio ambitola percezione cambia.
Parlavo l'altro giorno con il segretario della Confesercenti e gli chiedevo qual era la percezione oggi dei commercianti e lui sosteneva - sempre molto empiricamente, o sulla base di statistiche vere o false,io direi statistiche credibili o meno credibili - lui diceva che oggi i commercianti hanno molta meno paura di ieri. Alla domanda: per quali motivi? Una delle risposte - questa non risultava dall'indagine - è perché per 6-7 mesi "per fortuna" non c'è una ripetitività, non ci sono fatti criminali che coinvolgono commercianti, non c'è una ripetitività rapida, come è successo a Milano vi ricordate anno scorso, che in 15 giorni uccisero purtroppo 6-7 tra tabaccai, gioiellieri, orefici e via di seguito? La percezione è un elemento estremamente importante, che non ha nulla a che vedere con i dati. I dati, comunque, sono estremamente soggettivi, sono interpretabili, contestabili, strumentalizzabili. Si potrebbe dire che questi siano gli aspetti negativi, ma è così.
Vi faccio alcuni esempi per rendervi conto.
Le variazioni in positivo e in negativo. Scusate mi sono dimenticato di fare una premessa fondamentale, perché sennò questo ragionamento corre il rischio di non avere una gamba su cui si regge. La premessa è che oggi la sicurezza è una delle questioni maggiori sul terreno.
Nel piano dell'agenda della politica in genere è a uno dei primi posti. Questo significa che anche il consenso si costruisce sul versante della sicurezza, ecco perché dico che poi il dato non ha una sua oggettività - anche se la dovrebbe avere visto che è numero e ci hanno insegnato a scuola che più oggettivo di un numero non ci dovrebbe essere nient'altro - invece in questo caso è proprio la soggettività portata alle estreme conseguenze. Credo che sul tema della sicurezza si costruisce molto il consenso politico. Vi faccio alcuni esempi concreti per non annoiarvi e per rendere anche esplicito e plastico il ragionamento.
Viene presentato un rapporto sulla sicurezza. Vengono presi come paragone alcuni reati come il furto in abitazione. Ci può essere un dato oggettivo - nel 2002 o nel 2003 ci sono stati 1 milione e 300 mila reati - ma prendere un anno come riferimento cosa significa? Poco o nulla. Il dato va sempre comparato per poter avere un significato quanto meno interpretabile. Come può essere comparato? Ecco qui subentra poi il gioco della strumentalità, o il gioco della comparazione. Va comparato con una serie storica

Andrea Mancini*

Partirei dal titolo di un libro che è stato pubblicato recentemente negli Stati Uniti e che si chiama: "Dannate menzogne e statistiche".
Un articolo apparso su un quotidiano degli Stati Uniti nel '95, che per ogni anno, fin dal 1950 il numero di bambini americani sparati, cioè uccisi con armi da fuoco, è raddoppiato ogni anno. Questa notizia contiene un errore, un errore di sintassi se volete, però agisce sui numeri in maniera spropositata e vediamo perché. Ipotizziamo che nel 1950 soltanto un bambino negli Stati Uniti fosse stato sparato, il risultato informativo di quella regola detta nel titolo dell'articolo equivarrebbe a dire nel 1995 in America sono stati uccisi da armi da fuoco 35000 miliardi di bambini. Infatti, se voi raddoppiate il numero 1 per 45 volte, quanti sono gli anni che trascorrono tra il 1950 e il 1995, abbiamo questo risultato assolutamente spropositato, che è senza significato. Questo è un titolo che, però agisce sulla percezione delle persone che leggono il giornale nella direzione dell'allarmismo.

In realtà il titolo corretto avrebbe dato un risultato in termini di cifre assolutamente diverso. Con questo voglio dire che bisogna documentarsi sul significato delle informazioni statistiche.
Le informazioni statistiche sono generalmente costruite in maniera complessa, sia perché prevedono un'organizzazione di produzione di un dato statistico - ad esempio la raccolta dei dati molto articolata - sia perché si basano su definizioni, classificazioni che sono estremamente rilevanti per poi leggere i dati.

Per evitare di diffondere informazioni statistiche errate è necessario documentarsi sul significato dei dati che si presentano ed è per questo motivo che tutti gli istituti di statistica a livello di organizzazioni internazionali, ma anche a livello nazionale e via, via anche a livello regionale - se esistono - usano i meta dati, sono impegnati a produrre i meta dati. Cosa sono i meta dati? Sono le informazioni che illustrano il significato dei dati statistici e i metodi che vengono seguiti per produrli.
Prendiamo l'esempio dell'Istat. L'Istat diffonde ogni anno 139 comunicati stampa di 16 tipi differenti; praticamente un comunicato stampa ogni più o meno 2 giorni e mezzo. Questa è una media, sono distribuiti lungo l'anno, moltissimi sono a livello mensile, altri sono a livello trimestrale e alcuni sono a livello annuale. Ciascuno di questi comunicati riporta in fondo, quando è finita la notizia diciamo del momento, delle note informative che sono seguite anche da un glossario dei temi dove ci sono le definizioni. Possiamo misurare i metri lineari senza aver definito prima il metro? Questo è il problema, bisogna conoscere queste note informative e questo glossario. La stessa cosa avviene per circa 50 statistiche su cui annualmente si fondano i principali risultati delle rivelazioni non congiunturali. Quando si parla, ad esempio, di dati di struttura sulla povertà, abbiamo una nota rapida che viene diffusa, o una statistica in breve di questo tipo. Anche qui ci sono le note informative, c'è il glossario, ma poi in tutti i volumi pubblicati dall'Istat, quelli che vanno più in approfondimento e anche nelle loro versioni elettroniche esposte sul sito Internet che vedete qui proiettato, sono inseriti dei capitoli di note metodologiche. Queste note metodologiche sono la dichiarazione di ciò che è stato fatto, come si arriva a quel dato. In alcune occasioni l'Istat diffonde poi delle note informative per la stampa. Per esempio, questo avviene generalmente in occasione di due eventi: quando c'è una revisione periodica delle serie storiche, che viene effettuata normalmente in occasione di innovazioni metodologiche, oppure di mutamenti delle classificazioni, oppure quando viene fatto un aggiornamento delle fasi di riferimento e dei sistemi di ponderazione.
Tutti gli anni, ad esempio, a gennaio si fa una conferenza stampa con nota informativa, messa anche sul sito internet: i giornali vengono avvisati una settimana prima quando si fa l'aggiornamento del sistema di ponderazione dell'indice dei prezzi al consumo. Tutti gli anni, dal 1998, tra la fine di gennaio e l'inizio di febbraio, c'è questo evento. Una collana di volumi "norme e metodi" raccoglie invece delle analisi più approfondite. Come vedete bisogna tener conto dell'elemento informativo che va oltre il numero, oltre il risultato di una rilevazione statistica, di un'elaborazione meramente numerica ed entra nel merito di come il risultato è costruito. Questo è un punto che a me sembra estremamente rilevante e richiede una preparazione che non può essere giocata sulle 2 ore che seguono il comunicato quando si deve scrivere il pezzo, il punto è che la persona deve essere specializzata, deve essersene occupata, si deve tenere aggiornata.

Dall'America vorrei passare a un'arguzia italiana . Spesso, soprattutto ultimamente, viene citata una poesia di Trilussa, che rammenta che la media di mezzo pollo a testa è una bugia. Va bene? Io sono perfettamente d'accordo con Trilussa e dico pure che è una banalità. Anche in questo caso, in effetti, Trilussa commette un errore di fondo. Qual è questo errore?
È il fatto che nelle statistiche si usano le medie per sintetizzare in modo quantitativamente corretto, cioè scientifico, l'andamento di fenomeni economici e sociali, ma le statistiche non sono le medie, le medie annullano la variabilità dei fenomeni e nessuno più degli statistici conosce questo fenomeno. Per evitare di dare segnali sbagliati con la media, infatti, le statistiche si fondano su classificazioni dei fatti economici e sociali, che consentono di disaggregare i fenomeni osservati e di misurarne le differenze.
Questo è un passaggio importante. La statistica comincia con le definizioni e la classificazione.

Dobbiamo stabilire che cosa vogliamo misurare , come lo definiamo e poi come lo classifichiamo.
Solo dopo che abbiamo fatto questo lavoro metodologico, questo lavoro di approfondimento, possiamo partire con la rilevazione, che è un fatto organizzativo. Tutto ciò che sta dietro, in preparazione, è molto rilevante, perché ci consente poi di analizzare la variabilità dei fenomeni. L'analisi della variabilità dei fenomeni è posta al centro dei metodi statistici: questo è un punto su cui vorrei illustrarvi alcuni significativi esempi. Che cos'è questo grafico assurdo? Questo grafico assurdo è una cosa che va sotto il nome di "Curva di Lorenz". In questo caso l'abbiamo applicato al reddito familiare prima e dopo l'intervento ridistribuivo dello Stato.
Questo è il reddito della distribuzione primario - quello di chi lavora, produce e guadagna - poi interviene lo stato, che ridistribuisce le pensioni, le imposte, i sussidi alle imprese, altri tipi di sussidi alle famiglie: è questa la distribuzione secondaria del reddito. Allora se noi prendiamo il caso, diciamo, dell'equo distribuzione. Quanto più mi allontano, tanto più vuol dire che il reddito è lontano dalla equo-distribuzione. Questa curva che vedete qua sotto è la curva in Italia, riferita all'anno '99 - io vi parlo appositamente di dati vecchi perché voglio ragionare, non voglio dare informazioni e notizie, voglio ragionare sulle meta informazioni, non m'interessa essere update rispetto ai dati, a quello ci pensano i comunicati, ci pensano i giornali a darli. Questa curva dice delle cose importanti: dice per esempio che il 40%, il primo 40% delle famiglie in Italia becca soltanto come reddito primario 7-8%.
E scorrendo i dati arriviamo all'ultimo 90% che ha invece l'80% del reddito. Tutto questo ci dice che c'è una forte sperequazione tra i redditi delle famiglie, ma poi arriva la ridistribuzione del reddito, per esempio, come "reddito lordo totale". Questo reddito lordo totale è in realtà tutto ciò che include le pensioni e anche i trasferimenti pubblici. Vedete che abbiamo una forte ridistribuzione. Il primo 20% delle famiglie, quelle più povere o meno ricche diciamo così, passa da una percentuale molto bassa il 2-3% a una percentuale che comunque raddoppia, o forse anche più. Anche qua il 40% passa dal 7 all'8% fino ad oltre. Quindi da questo punto di vista abbiamo un forte effetto della ridistribuzione attraverso i trasferimenti pubblici.
La terza linea, che rappresenta il reddito disponibile delle famiglie dopo la tassazione, dopo l'effetto dell'imposizione.
Si recupera ancora in equodistribuzione perché ci si avvicina alla bisettrice, però tuttavia questo effetto è inferiore a quello che deriva dalla sola applicazione dei trasferimenti.

Cosa ho fatto in questa maniera? Ho cominciato a girare intorno al problema del reddito medio per famiglia. Mentre il reddito medio per famiglia è il mezzo pollo a testa, qui si comincia a dire che non tutti sono uguali, non tutti mangiano il pollo. Allora vedete che quella di Trilussa è una banalità. Si dispone di indicatori che ci consentono di fare anche un confronto.
Vorrei passare ancora sulla curva di Lorenz e farvi vedere alcune cose che ne derivano, che sono interessanti a mio avviso: vi ho riportato l'indice del Gini. Gini è stato uno statistico italiano, che ha prodotto delle innovazioni forti, fra cui questo indice di confrontazione che è usato in tutto il mondo. Il reddito primario lordo non include i trasferimenti pubblici di nessun genere, l'indice di concentrazione è pari a 51,5%.
Diciamo quindi che è un livello abbastanza elevato di concentrazione del reddito. Che cosa succede se passo a un reddito che tenga conto delle pensioni? Delle pensioni di invalidità, vecchiaia e superstiti, le cosiddette ivs. Bene, succede che guadagno ben 11,2 punti in termini di diminuzione della concentrazione, dato dalla differenza di queste due voci. Voi capite che questo significa che le pensioni distribuiscono parecchio. Se poi dopo ci metto tutti gli altri trasferimenti pubblici, quanto recupero? Passo dal 40,3 al 30,9. C'è sempre una diminuzione della concentrazione, ma è soltanto di 1,2 punti percentuali, quindi è molto bassa.
Se poi metto il reddito disponibile, quindi ci metto sopra le imposte - voi sapete che le imposte sul reddito sono soprattutto quelle delle persone fisiche, sono ad aliquote progressive e quindi sono in qualche modo a favore della redistribuzione - quanto recuperiamo? Recuperiamo 3,1 punti percentuali e da questo punto di vista mi sembra chiaro quali sono le scelte di politica fiscale.
Per politica fiscale non intendo soltanto le entrate, ma anche le uscite in termini di ridistribuzione, politica di bilancio se volete, sotto il profilo della concentrazione dei redditi familiari.

Qui si parla di "reddito familiare equivalente". Ma che cosa si intende per equivalente? Bisogna fare riferimento a famiglie che hanno una struttura diversa. Ci sono quelle di una persona, ci sono quelle di 2 persone, la media è 2. E siamo è di nuovo a mezzo pollo. In realtà io devo tener conto che ci sono famiglie composte in maniera differente e per rendere il tutto equivalente a una famiglia di 2 persone, devo utilizzare una scala.
Si tratta della scala ise: chi vuole commentare questi dati deve andare a documentarsi sulla scala Ise. Non lo faremo qua, non vi preoccupate, però volevo dirvi che si tratta di un segnale importante. Vado avanti. Per Ise si intende "indicatore di situazione economica". Questa è un'altra cosa interessante a mio avviso ed uno strumento più semplice dell'indice di Gini. Qui abbiamo a che fare con una statistica televisiva, che si può trasmettere facilmente ma non mi limito a mettere gli istogrammi. Ci metto anche i numeri.
Vediamo un attimo cosa significa tutto ciò. I trasferimenti pubblici netti, cioè al netto delle imposte, sul reddito disponibile delle famiglie, incidono per il primo decile - il primo 10% delle famiglie più povere, diciamo così - per il 49,4%, cioè 7383 sta a 14903 come 14 sta a 100. E più vado avanti più il rapporto diminuisce.
Il secondo decile - questa classe di famiglie - ha il 42% coperto da trasferimenti. Questa qua ha il 33%, questa qui il 30%, il 28% e così via fino ad arrivare all'ultima che ha 12,7%, che comunque è notevole se pensiamo che un reddito medio qui è di 140 milioni di lire. Questi sono dati del '99 espresso ancora in lire. Andiamo avanti. Noi sappiamo che in Italia c'è il problema delle zone ricche e delle zone più povere: come pesa l'intervento dello Stato, cioè i trasferimenti pubblici netti sul reddito disponibile? Partiamo sempre dai dati iniziali dei redditi.
Ecco, qui abbiamo che nel nord-ovest pesi il 22%, al nord-est il 20%, qui il 21%, qui al sud il 25%.. e si arriva ad un massimo del 27,6% nelle isole. Allora questo è poco? È tanto? Non sta a me giudicarlo, questo starà agli analisti, agli economisti, ai sociologi, ad altri, ai politici.

Come vedete abbiamo a che fare con un'informazione per la valutazione delle politiche pubbliche, che non è la media. Qui il criterio territoriale è di definire quali sono le regioni che stanno dentro al sud, quali quelle dentro al centro. Per esempio l'Emilia Romagna cos'è centro o nord ovest, o nord est? Per definizione - una volta per tutte - si decise che l'Emilia Romagna sta nel nord est. È sbagliato? Non importa, non lo dichiaro.capite? Vi voglio presentare 3 esempi di analisi delle distribuzioni. Si tratta di pensioni e pensionati.
La differenza tra pensioni e pensionati sta nel fatto che un pensionato può prendere più di una pensione. Questa curva, che è l'interpolazione degli istogrammi, rappresenta la distribuzione del numero di pensioni per classe d'importo al 31/12/2001.In quella data avevamo 22.410.000 pensioni, trattamenti pensionistici. Se io vi do la tecnica di Trilussa vi dico che il valore medio della pensione è 8000 e sta qua, qui dentro, va bene? Però - tenendo conto di ciò che si diceva prima sulla teoria di Trilussa - vi sto dicendo una bugia, perché in realtà vi posso dire molto meglio qual è la classe modale, quale è la classe dove cade il valore mediale, quale è il valore mediale e così via. Questa è una distribuzione asimmetrica: ci sono molti trattamenti con poco e pochi trattamenti con molto. Alla fine si arriva ad avere qualcuno con 30.000 € e più all'anno di reddito pensionistico.

Ma è possibile che si diano tutti questi soldi a questi pensionati? Così ricchi? Allora vado a vedere come ho definito le pensioni? L'ho definito come frequenza assoluta, cioè numero assoluto di pensioni, trattamenti pensionistici.
Quindi nella classe di dimensione 30.000€ e più, posso avere pure quello che ha 70.000€, posso avere pure l'ex governatore della banca d'Italia, posso avere pure - che ne so- il grandissimo dirigente d'impresa. Voglio dire che la classe è aperta. Attenzione, questo non è confrontabile a delle classi chiuse! Vado avanti. Ultima cosa su questo.Se cambio lo strumento della misura, cioè la variabile, la distribuzione cresce. Sembra una cosa molto strana. Allora andiamo a verificare cosa posso utilizzare al posto della frequenza assoluta. Che cos'è? Ecco, questa è la distribuzione dei pensionati, identica alla precedente, tranne che in questo punto in cui ho cambiato la variabile: ho usato densità di frequenza assoluta, che cos'è? Non è altro che il numero di pensionati nella classe, in ciascuna classe, diviso l'ampiezza della classe.
Io so, in Italia, il nome della persona che prende il reddito pensionistico più elevato - non ve lo dico, non avete paura, ho il segreto statistico - però lo conosco, so quanto percepisce, d'accordo? Allora a questo punto cosa succede? Succede che se io divido tra 30.000 e questo numero finale della distribuzione, divido il numero dei pensionati che stanno lì dentro, ottengo un indice che è normalizzato. Lo faccio per tutte le classi e come vedete cambia un po' il profilo, soprattutto in questo settore qua, perché non ho più quel tacco. 30000 e più sono recuperati da questa standardizzazione che rimette un pochino a posto le cose rispetto a quello che in precedenza era un effetto semplicemente numerico.
Tutto questo discorso per dimostrare come, poi, i fenomeni vadano analizzati con indicatori che di volta in volta possono cambiare secondo le esigenze, secondo gli aspetti delle misurazioni.

Ma guardiamo anche alla questione di eterogeneità . Prima ho detto che la prima cosa che fanno gli statistici è definire, classificare. Se io non definisco e non classifico, ho delle grosse difficoltà. Se invece classifico riesco poi a fare le classi della distribuzione e a risalire a tutti questi indicatori. Nel 1999 l'Istat ha deciso di fare un primo censimento delle istituzioni no-profit.
Qui mi vorrei soffermare un attimo. Nella statistica ufficiale, quella cioè dei conti economici nazionali e così via, quella che conta, le istituzioni no-profit non esistono, sono oscurate. Di fatto non esistono come settori istituzionali. Esiste il settore delle imprese, delle imprese finanziarie, delle famiglie, della pubblica amministrazione, delle istituzioni private al servizio delle famiglie. Noi abbiamo deciso, nell'ambito di una ricerca internazionale, di lanciare - e siamo stati i primi in Europa - il censimento delle istituzioni no-profit. Bene, abbiamo avuto i seguenti risultati.
Le istituzioni attive - ed abbiamo anche una definizione, ovviamente, che adesso non vi cito altrimenti ci stiamo fino a domani qua, ma potete andarla a vedere se vi interessa - sono 221.000. Nell'industria in senso anglosassone il numero dei dipendenti era 531.000, quindi abbastanza consistente. Il numero dei volontari attivi era 3.221, però soltanto 33.600 istituzioni, pari cioè al 15,2%, avevano utilizzato lavoratori dipendenti. Questi 531.000 non stanno su 221.000, ma stanno soltanto su 31.000, mentre le istituzioni che avevano utilizzato i volontari erano 177.000 pari a 80%. Ciò vuol dire che i volontari sono distribuiti parecchio nelle organizzazioni, invece i dipendenti no, sono concentratissimi. Questo è un segnale importante. Ma chi sono queste istituzioni no-profit? È possibile che esista l'85% che non ha dipendenti? Come funzionano? Con i volontari risponderete. Si, ma questo significa qualche cosa, evidentemente c'è un problema di rappresentazione.

Allora il problema di rappresentazione è anche un problema di classificazione. Bisogna avere dei criteri per stabilire se queste istituzioni sono market o non market, almeno in prevalenza e allora gli devo andare a chiedere il bilancio, dove prendi le risorse? Dalle donazioni?
O produci servizi e li vendi sul mercato, anche se poi non distribuisci gli utili? Allora voi capite che c'è un enorme problema di classificazione. Questo è stato il lavoro del censimento delle istituzioni no-profit. Il numero medio di dipendenti per unità istituzionale era pari a 16 prendendo in considerazione i 33.000 istituzioni con dipendenti, ma diventa il 2,4% se si prende come riferimento i 221.000. Allora dove sta la verità?
La verità ovviamente sta nel fatto che i vi devo dare le informazioni in modo che voi possiate dire che c'è una forte concentrazione di dipendenti su poche istituzioni. Queste sono le più grosse, quelle sono quelle che vanno sul market, quelle che prendono i finanziamenti pubblici più interessanti e così via discorrendo.
Se volete potete andare a vedere i dettaglio. Io adesso vado avanti, perché quello che mi interessa è farvi vedere come anche qui si abbia un problema di eterogeneità. Dentro a questo settore delle istituzioni no-profit non si può restare sulla superficie. Dire che sono soltanto 221.000 è offrire la quadratura ma un economista, un sociologo, anche un giornalista, non può fare riferimento a 221.000, deve entrare nel merito, deve entrare nella distribuzione di una classificazione e deve discutere la classificazione.

Roberto Sgalla*

L'Istat, per dare il numero dei partecipanti alle manifestazioni, ha come unica fonte le questure. Questa è una querelle che va avanti da anni, non è da oggi. Noi non abbiamo strumenti scientifici per contare i dimostranti, voglio dire che non c'è un contapersone una cellula fotoelettrica che man mano che passa la gente conta le persone così come non ci sono altri sistemi di rilevamento di persone. Noi abbiamo un sistema molto empirico che è quello di sostenere che in un metro quadro ci stanno 3 o 4 persone. Di solito le toponomastiche descrivono quanto è grande una piazza, uno stadio, un luogo fisico che contiene una manifestazione e si moltiplica 3 o 4 - cioè il numero delle persone - e si ha un dato oggettivo.

È chiaro che questo è un elemento su cui noi riflettiamo spesso, abbiamo stimoli e input di altra natura che spesso ci fanno dare dei dati, magari a ribasso, comunque non completamente rispondenti alla realtà e lì nasce subito la polemica.
Credo, però, che la soluzione migliore sarebbe quella di affidare ad un ente terzo il calcolo dei partecipanti alle manifestazioni, attraverso strumenti anche se non scientifici al massimo, ma con strumenti che possano dare una certezza approssimativa o comunque vicina alla realtà. Pochissime volte abbiamo avuto dati in cui manifestanti e questura hanno collimato.
Ve ne cito uno in positivo, il G8, la manifestazione dell'anno dopo. Dopo un anno vi ricordate a Genova ci fu di nuovo una manifestazione, bene in quel caso per un fatto non voluto, manifestanti e questure hanno dato esattamente lo stesso numero, cioè 100.000 manifestanti. L'altro elemento che su versante della sicurezza non è assolutamente quantificabile è l'elemento della prevenzione.
E' un tema che purtroppo i giornali, proprio perché il caporedattore chiede dati, spesso li manipolano. Vengono manipolati già per il solo fatto che passano da una mano all'altra. Ultimamente c'è uno sforzo a livello europeo, c'è una rete di prevenzione del crimine istituita a livello europeo all'interno dei paesi membri, s'è riunita pochi giorni fa a Roma proprio nel quadro del semestre a presidenza italiano. Si tratta di una rete che ha come obiettivo quello di individuare un sistema di valutazione proprio in riferimento all'attività di prevenzione.

Sono stati individuati già 5 indicatori anche se non è ancora chiaro come misurare alcuni di essi. Uno è, per esempio, il livello di apprezzamento del pubblico nei confronti delle forze di polizia. Come dicitura va pure bene ma poi bisogna capire qual è esattamente la scientificità di quel rilevamento. L'altro, e questo è un po' più obiettivo, è la variazione dell'andamento statistico dei reati che è un dato significativo.

Che i furti nel 2002 siano stati 1.300.000 è già un dato preoccupante... ma quanti di questi sono stati scoperti e quanti sono arrivati a giudizio con relativa condanna? Sono due pesi completamente diversi e il secondo potrebbe essere un fortissimo peso "rassicurativo", sapere che su 1 milione e 300 mila furti ne sono stati scoperti solo 200 mila e 20 mila sono arrivati a giudizio. Non è proprio rassicurante, se su 1 milione e 300 mila magari ne abbiamo scoperti 800 mila e 500 mila sono andati a giudizio, poi bisogna capire come funziona il sistema carcerario. Quello è un altro problema che, per fortuna, oggi non tocca a me commentare. Eravamo al problema dei delitti scoperti e quelli che sono arrivati a giudizio.
E arriviamo al livello d'insicurezza dei cittadini. Su questo versante devo dire l'indagine vittemologica aiuta molto, riesce a individuare, capire qual è il livello d'insicurezza. Quarto: l'impiego e l'ottimizzazione delle forze di polizia.
Questi sono gli indicatori che almeno sul piano teorico sono stati individuati accanto all'elencazione delle buone prassi.

Chiudo con una sollecitazione che ha offerto il titolo "volo radente", che è stata ripresa questa mattina. Cioè i giornalisti possono volare in modo radente o possono volare alto. Allora mi sono permesso di individuare 8 elementi di come, sul piano della comunicazione e della sicurezza, si possa fare volo radente. E' evidente che l'inverso sarebbe il volo alto. Primo: il problema dei dati. Come si recepiscono, anzi dove si recepiscono, dove si vanno a trovare i dati? Quali sono le sedi che hanno i dati? E in particolar modo cito un caso: l'attività ispettiva del parlamento.
Uno degli strumenti fondamentale della politica è l'attività ispettiva, specialmente oggi in una ridistribuzione di competenze, in cui il potere legislativo, a livello di vari fonti viene ridistribuito. Pensate alle regioni che oggi legiferano in maniera primaria su tantissime leggi tanto è vero che nascono anche conflitti di competenza tra le leggi nazionali e quelle regionali. Oggi il parlamento nel senso più ampio, trasversalmente, potrebbe assolvere al ruolo di attività ispettiva e sul "piano dei numeri". E' complicato negare dati a un parlamentare. Anche quelli che sono molto sensibili sul piano politico. Sentivo prima la discussione sugli immigrati, credo che oggi quelli che li riguardano siano tra i dati più sensibili sul piano della politica. Chiaramente il parlamento è sovrano su questo versante, è la sede per antonomasia dove si potrebbe fare una riflessione sui dati in maniera seria e coerente. Il problema è, appunto, dove trovare i dati, chi li fornisce. Secondo: l'uso spregiudicato delle ricerche o meglio dei sondaggi. Credo che questo sia uno dei modi più bassi per fare informazione. Parlo del mio versante, sempre informazione e sicurezza. Mi è capitato di leggere alcune note del garante della privacy che in effetti chiede che sui sondaggi vengano indicati criteri, metodi, ecc. Voi prendete i sondaggi che vengono fatti sulla sicurezza, le percentuali.
Si tratta di elementi creano dati oggettivi anche se, magari, si tratta di sondaggi fatti con un campione estremamente poco significativo, disaggregato. Terzo: le statistiche che vengono riattualizzate. Statistiche vecchie, dati vecchi che vengono resi attuali cambiando la data, o comunque la data non viene messa per non essere poi smentiti.
Ecco che i dati di qualche anno fa diventano dati di oggi, ricerche di qualche anno fa diventano ricerche di oggi. Si verificano quelli che noi definiamo "restauri" dei dati. C'è una grande discussione su come si fanno i restauri, voi sapete il restauro può essere conservativo, aggiuntivo, ecc., su questo versante sono sempre aggiuntivi, manca un dato? Niente paura, viene aggiunto.
Ed ecco che a volte si leggono dei dati veramente assurdi e poco credibili. Basta leggere i giornali per averne conferma. Io ho sempre detto che bisogna fare la media di quello che pubblicano i giornali.... Quinto: le proiezioni, l'arbitrarietà nelle proiezioni. Senza dare la croce addosso a nessuno, ci sono stati dei momenti in cui, per esempio, si sono avuti dei problemi nel tentare di dare dei dati sugli immigrati clandestini, sui cittadini immigrati clandestini, in cui è complicato fare proiezioni.
Sesto: la pigrizia dei giornalisti. Pubblicano quello che gli viene dato senza un minimo di criticità, spesso senza capacità di confrontare, magari anche con la contraddizione di dati che, in più d'una occasione, fanno apparire una cosa diversa dall'altra. Settimo: la scelta, cioè il metodo.
È vero chi fornisce i dati spesso li dà già, come dire, piuttosto scremati, proprio per il motivo che dicevo prima. Se poi a questo il giornale per motivi di spazio o per altri motivi - editoriali o altro - decide tra quelli che vengono dati di sceglierne altri, o di sceglierne solo alcuni per pubblicarli solo in parte, voi immaginate dal dato di partenza a quello che arriva al lettore quale possa essere la completezza dell'informazione. Quasi niente. O almeno arriva solamente il messaggio che si vuol fare arrivare. Otto: la non assoluta omogeneità dei dati. Si ha a che fare spesso con dati completamente eterogenei.

Andrea Mancini*

Questa tabella che ho alle spalle è pubblicata, la trovate nel rapporto annuale dell'Istat che vi ho distribuito proprio nell'approfondimento dei prezzi al consumo. Io oggi ho utilizzato, come sempre, soltanto dati pubblicati che sono noti.
Vi ho anche detto che sono dati a volte anche arretrati nel tempo perché il problema era di metodo e non di contenuti informativi.
Rispetto a questa tabella direi che dimostra che l'Istat dà ragione ai consumatori senza smentirsi, perché questi sono dati costruiti mese per mese. Ci sono dei punti, delle voci di spesa del paniere delle famiglie italiane che hanno avuto una rilevazione dei prezzi che ha dato luogo a questi incrementi. Questo era il senso del messaggio.

La questione del paniere ha dietro un problema di rappresentanza , non sindacale, ma di rappresentanza statistica. Sono tanti o sono pochi 960 prodotti? Facciamo il ragionamento in un'altra maniera. Esiste un collegamento per genere di prodotti... per esempio tra un divano a 3 posti e un divano a 2 posti, che è stato uno dei punti del processo intentato da alcune associazioni dei consumatori contro l'Istat di fronte al Tar. Si chiedeva: "Perché ci mettete il divano a 2 posti e non quello a 3 posti?". Il divano a tre posti ha un certo prezzo che è di livello superiore a quello a 2 posti perché chiaramente è più grosso.
L'andamento del prezzo, comunque, sarà simile. Lo stesso vale per le pentole: non è che possiamo prendere tutte le pentole, sarebbe una cosa impossibile. Si scelgono dei prodotti rappresentativi e il peso non viene attribuito alla pentola, viene attribuito ai consumi di quel tipo di generi di consumo, il pentolame vario.
Ecco, dunque, il problema di rappresentatività. Noi non arriveremo mai a poter chiedere alle famiglie quanto spendete in padelle o in pentole Lagostina. E' chiaro?
Dobbiamo fare riferimento a un problema di rappresentatività di alcuni prodotti tipici di una classe più ampia.
Il problema è che io non voglio, fra l'altro, avere una rappresentazione dei livelli, ma semplicemente delle variazioni.
Quindi il problema è nel mercato delle pentole se c'è più domanda o maggiori costi di produzione.
Questo mi dà degli effetti, poi, sui prezzi.

Arrivo all'ultima questione che è quella delle dichiarazioni dell'euro; mi dovete spiegare sotto il profilo economico se l'Istat sta dicendo che l'inflazione in Italia è più bassa che in Europa? Dove il tasso d'inflazione italiano si è mantenuto per mesi e mesi al 2,8-2,9% contro i 2,1, 2% europeo, chi è che ha l'inflazione più elevata? E in termini relativi quest'inflazione, cioè in termini di competitività delle nostre merci è forte la differenza o è piccola? 2,8-2,1 vuol dire che ci stanno 7 punti di differenza per lo meno, 0,7 punti percentuali di differenza, se fate la differenza 2,8 meno 2,1 fa 0,7, questi 0,7 rappresentano su 2,1 il tasso medio d'inflazione europea il 33%. È come se io avessi un'inflazione molto più elevata di quella europea, un terzo in più. Questo mi dovete spiegare se significa che l'inflazione italiana è bassa.
Scusate stiamo in un'area monetaria europea, da un punto di vista economico io voglio, come economista, non come statistico, una spiegazione di questo fenomeno. Quando mi darete tale spiegazione io vi seguirò su altri ragionamenti, ma questa è una spiegazione che pretendo, perché sono e voglio mantenermi come una persona che usa la logica, d'accordo?

Claudia Silvestri*

Io lavoro per riviste specializzate, faccio servizi di tecnologia informatica. Si tratta di un settore molto influenzato dai dati. Io lavoro con dati di società di mercato quindi la mia domanda a Mancini riguarda proprio questo. Che consiglio darebbe a un giornalista per valutare effettivamente questi dati?
Vi ricorderete che negli anni del boom si avevano delle percentuali di crescita di alcuni settori stratosferiche, poi sono state smentite dai fatti, poi ci sono stati gli imprevisti, ecc. Io, comunque, anche di fronte a fonti autorevoli, spesso non so cosa pensare.
Tra l'altro le analisi di mercato sono spinte da pressioni varie, hanno pressioni delle aziende del settore, magari fanno le ricerche su commissione, insomma le variabili sono tante. Lei che consiglio mi dà?

Cristiano Piccinelli*

Sono della scuola di giornalismo di Perugina. Volevo chiedere al dottor Mancini perché di fronte a un divario fra inflazione percepita e inflazione misurata dall'Istat, quest'ultima non pubblica né sul sito né nei suoi volumi tutte le variazioni dei 960 prodotti, ma solo poco più di 200?

Intervento 

Siamo andati molto sull'economico invece io volevo sapere un'altra cosa sempre dal dottor Mancini. Io mi occupo spesso di statistiche che hanno a che fare col crimine. L'Istat fornisce in genere dati che sono di uno o due anni prima quando fotografa queste realtà. Noi però facciamo cronaca, quindi il dato di tendenza, dell'anno precedente - se non si può avere prima quello attuale - ce lo fornisce magari il dipartimento di pubblica sicurezza, oppure altri. Credo che l'Istat attinga credo a fonti simili, o al ministero di giustizia. Come mai passa tanto tempo? Io di recente sono stato a un convegno sulla giustizia minorile. Il vostro delegato che partecipava aveva dati e proiezioni anche degli ultimi mesi, però non li poteva dare, era tabù, era una cosa che non si può dare perché fino a quando non è certo. Ma erano cose già successe. vorrei capire come mai c'è così tanta differenza, grazie.

Andrea Mancini*

Parto da quest'ultima cosa. Io non mi occupo di statistiche giudiziarie visto gli argomenti che ho trattato quindi non conosco esattamente il processo di produzione di quel tipo di dati. Si tratta di dati che comunque, l'ha detto prima Sgalla, hanno una provenienza amministrativa. Ciò vuol dire che non sono rilevati dall'Istat direttamente a campione ma attraverso una fonte amministrativa che sono le corti di giustizia, quindi il ministero di grazia e giustizia e le sue rilevazioni. Spesso questi dati richiedono un lungo periodo di tempo di assemblaggio.
Vi posso fare l'esempio del valore aggiunto, qui devo una risposta ancora economica riferendomi a delle statistiche strutturali sulle imprese. Attualmente noi abbiamo fuori il 2001 e stiamo producendo il 2002. Quando abbiamo cominciato a produrre il 2002? Noi abbiamo mandato i questionari a giugno del 2003 perché mandarli prima sarebbe stato inutile.
Ecco già 6 mesi di ritardo, tempo che si perde semplicemente perché non siamo sicuri che le imprese abbiano fatto i conti. i bilanci vengono approvati dalle assemblee a maggio-giugno, nel caso delle società di mercato. Da lì comincia il processo.
I tassi di risposta crescono molto lentamente: attualmente siamo al 33-34% dopo alcuni mesi di rilevazione e quindi tramite solleciti poi via via si va avanti.
Noi utilizziamo anche dati amministrativi tipo, per esempio i bilanci civilistici. Questi pure arrivano con un ritardo, quindi alla fine la regola europea è che i dati strutturali dell'impresa vengono fatti al T+18, 18 mesi dopo, i dati del 2002 saranno prodotti entro giugno del 2004 a 18 mesi di distanza. Questo è lo standard, perché appunto il discorso è piuttosto complesso.

Per quanto riguarda le indagini di mercato è una domanda piuttosto difficile, perché le indagini di mercato hanno una tecnica completamente diversa . Le indagini statistiche dalle rilevazioni statistiche hanno tecniche diverse. Da questo punto di vista bisognerebbe essere molto puntuali sulle meta informazioni.
In realtà il messaggio che vi ho dato all'inizio era proprio questo: attenzione, vi potete fidare di più di chi dice come vengono fatte le cose, di chi invece non ha modo di dirvelo, perché non è attrezzato, o per tanti motivi insomma.
Da questo punto di vista bisognerebbe andare a vedere concretamente quali sono le metodologie usate. Si diceva dell'innovazione tecnologica, in particolare l'uso dell'ICT information comunication tecnology: credo che ci sia un elemento da parte della statistica ufficiale, cioè quello di dare i quadri di rappresentazione generale; per esempio quante imprese usano il cd e in che modo? Avere le informazioni di quadro vuol dire avere, se non altro, un panorama generale che può aiutare a orientare rispetto a indagini specifiche fatti da altri. Siccome sono fenomeni nuovi la statistica sull'ICT è abbastanza recente, quindi non c'è ancora una serie temporale consistente, parte dal 99-2000 e via via la stiamo collezionando. Si parlava del valore aggiunto, brevemente: il valore aggiunto faceva riferimento a una delle tavole.
Attenzione, qui c'è un problema. Io ho parlato di indicatori di performance che sono dei rapporti, non sono delle dimensioni di valore aggiunto, poi si ha tutto il problema della dimensionalità.
Quello che lei diceva è riconoscibile da altri tipi di dati per esempio quello della distribuzione del valore aggiunto come livello nei vari anni, nelle varie serie temporali. Dai dati emerge che, sicuramente, negli ultimi anni il nord-est si è rivelata una delle aree più vivaci.
Vengono pubblicati a vari livelli le 207 voci di prodotto e le 560 posizioni rappresentative. Alle associazioni dei consumatori, nell'ambito dei tavoli tecnici, abbiamo anche consegnato i dati relativi ai 960 prodotti, però c'è un problema che è quello che vi dicevo prima: soltanto le posizioni rappresentative possono essere ricondotte a pesi. Non ricordo esattamente la proporzione ma su 560 posizioni rappresentative solo una parte veniva spacchettata a 960 e lì non c'è la possibilità di avere il peso sui singoli 960, soltanto sulle posizioni rappresentative.
È un problema metodologico insomma. 


* Testo non rivisto dall'autore. Le qualifiche, se non diversamente specificato, si riferiscono al momento del seminario.