Discriminazione tra uomo e donna? Si e no...

Nel 1973 l'Università della California a Berkeley fu denunciata per pregiudizi nei confronti delle donne che avevano chiesto l'ammissione a scuole di specializzazione di quella università. Infatti, i dati raccolti nell'autunno di quell'anno, riportati nella tabella qui sotto, mostravano che gli uomini che avevano fatto richiesta di ammissione alle scuole di specializzazione avevano più probabilità di essere ammessi rispetto alle donne, la differenza essendo così grande che non poteva spiegarsi con semplici “fluttuazioni statistiche”.

 

 

 

 

Richieste di ammissione

Percentuali di ammissione

Uomini

8442

44 %

Donne

4321

35 %

 

Quando gli uffici centrali dell'università chiesero dati più dettagliati ai singoli dipartimenti, venne fuori un interessante enigma. Infatti, come si vede dalla seconda tabella, emerse allora che nessun dipartimento era in realtà “prevenuto” nei confronti delle donne, anzi in molti di essi si riscontrava una percentuale di ammissione significativamente a favore delle donne!

 

 

 

Uomini

Donne

Dipartimenti

Richieste di ammissione

Percentuali di ammissione

Richieste di ammissione

Percentuali di ammissione

A

825

62 %

108

82 %

B

560

63 %

25

68 %

C

325

37 %

593

34 %

D

417

33 %

375

35 %

E

191

28 %

393

24 %

F

272

6 %

341

7 %

 

Tale apparente contraddizione, nota come paradosso di Yule-Simpson, in realtà ha una spiegazione (relativamente) semplice: tendenzialmente, le donne facevano richieste di ammissione in dipartimenti con criteri di selezione più duri, che avevano quindi bassi tassi di ammissione anche fra i candidati più qualificati, mentre gli uomini tendenzialmente facevano richieste di ammissione in dipartimenti con criteri meno duri, con più alti tassi di ammissione, e questo comportava, in generale, una minore percentuale di ammissione per le donne.

Se ci rifacciamo alla nostra figura è come se i pesci rossi fossero le donne e i blu gli uomini. Se contiamo semplicemente il numero dei pesci scampati alle reti, sembrerebbe che i blu siano più abili a superare le reti, come i maschi dell'università a passare gli esami, al contrario è vero l'inverso (essendo i rossi più piccoli). L'effetto è dovuto solo al fatto che i rossi hanno tentato di passare in maggioranza fra le maglie più strette della seconda rete e pertanto sono risultati sfavoriti.

Dal punto di vista matematico, dunque, non vi è alcun paradosso, ma i risultati sono certamente non intuitivi, poiché, a certe condizioni, si possono avere situazioni in cui il comportamento di sottogruppi è diverso dal comportamento complessivo. Il paradosso di Yule-Simpson si verifica ogniqualvolta le correlazioni che sono presenti tra diversi insiemi di campioni vengono invertite quando gli insiemi sono combinati insieme, ignorando, cioè, una o più variabili nascoste. Un altro esempio di paradosso di inversione riguarda, invece, le condanne a morte comminate dai tribunali, le cui percentuali sono leggermente più alte se ad essere difeso è un uomo bianco rispetto ad uno di colore. Tuttavia, se si osservano i dati sulle esecuzioni, vale esattamente il contrario, il chè si spiega con il fatto che le punizioni sono più severe (ovvero, vengono eseguite più prontamente), se riguardano un uomo di colore. Ancora, in ogni regione della Francia, il consumo di patate è più alto tra i contadini, piuttosto che tra i non-contadini, ma la tendenza è invertita nel complesso: evidentemente, molto contadini vivono in regioni dove si mangiano poche patate.

Il paradosso di Yule-Simpson può avere serie ripercussioni in statistica medica, quando si deve indagare l'efficacia di nuovi farmaci. Infatti, se un farmaco viene usato per curare una certa malattia e si testa la sua efficacia in due diversi campioni di pazienti, per esempio giovani e anziani, può accadere che esso sia efficace sia per i pazienti giovani che per quelli anziani, ma in percentuale diversa nei due campioni. Mettendo allora insieme i dati di tutti i pazienti, giovani ed anziani, sembra che il farmaco non solo sia inefficace, ma addirittura dannoso! Ad esempio, dividendo il numero totale di pazienti giovani in due sottogruppi, solo al primo dei quali viene somministrato un dato farmaco, si riscontra una guarigione nel 90% dei casi nei pazienti trattati con il farmaco, mentre si ha una guarigione del solo 80% dei casi nei pazienti non trattati. Analogamente, si ha un tasso di guarigione del 20% per i pazienti anziani trattati con il farmaco, mentre il tasso di guarigione scende al 10% per i pazienti anziani non trattati. Cosa succede se si mettono insieme i dati di tutti i pazienti, giovani e anziani? Tutto dipende dalla percentuale di giovani (e quindi di anziani) nei due casi. Ad esempio quanto più nel gruppo dei trattati abbondano gli anziani tanto più la percentuale di guarigione si avvicina al 20%, se invece nel gruppo dei non trattati abbondano di gran lunga i giovani la percentuale di guarigione diventa prossima all'80%. In un caso del genere potrebbe pertanto sembrare che un farmaco efficace faccia male a tutti! E cosa forse ancora peggiore, nel caso inverso un farmaco dannoso, potrebbe essere considerato efficace. Quando si fanno esperimenti per testare l'efficacia di un farmaco, è dunque necessario che nel gruppo di pazienti trattati le variabili che possono influenzare notevolmente la guarigione (nel caso considerato, ad esempio, l'età) siano distribuite in modo molto simile a come sono distribuite nei pazienti non trattati. Ciò equivale a dire che i due gruppi devono contenere giovani e anziani nella stessa percentuale di casi, ma questo può essere difficile da realizzare. La difficoltà aumenta quando le categorie non sono così ben identificabili come nel caso di giovani e anziani, ma più sottili o comunque inaspettate in quanto non banali. Per avere un risultato indiscutibile a proposito di un nuovo farmaco dovrebbe infatti essere note tutte le altre cause (le variabili statistiche appunto) da cui dipende la possibilità di guarigione dalla malattia non solo l'eta, come ad esempio la storia clinica dei pazienti trattati e poi ripartire i due campioni di persone in maniera adeguata. Spesso ciò è impossibile e bisogna accontentarsi pertanto di statistiche con un certo margine di errore.

S. Esposito, fisico

Per ulteriori informazioni: http://it.wikipedia.org/wiki/Paradosso_di_Simpson