La traduzione automatica in inglese ti fa sembrare un maschio di mezza eta'
MARKETING |

La traduzione automatica in inglese ti fa sembrare un maschio di mezza eta'

TRE STUDIOSI DELLA BOCCONI HANNO INDIVIDUATO UNA DISTORSIONE ALGORITMICA NELLA TRADUZIONE DA DIVERSE LINGUE EUROPEE ALL'INGLESE DEI SISTEMI DI GOOGLE, BING E DEEPL

Immaginate una bambina cresciuta in una cittadina abitata solo da uomini di mezza età. Per i primi dieci anni della sua vita, sente solo uomini sulla sessantina parlare di lavoro, libri, sport, salute e denaro. Che tipo di strana lingua pensate che parlerà quando lascerà la cittadina?
 
Qualcosa di simile accade ai più comuni sistemi di traduzione automatica, secondo un nuovo studio di Dirk Hovy, professore associato di Computer Science alla Bocconi, e di due ricercatori post-doc del suo laboratorio, Federico Bianchi e Tommaso Fornaciari. Per addestrare un sistema di traduzione basato sul machine learning, lo si alimenta con grandi quantità di testi e lo si lascia imparare per esperienza. Se gli si forniscono documenti scritti per lo più da maschi di mezza età, anche le traduzioni suoneranno come se fossero state scritte da uomini di quella fascia d'età.
 
Lo studio analizza le traduzioni in inglese da quattro lingue europee (tedesco, francese, italiano e olandese) prodotte da tre sistemi commerciali (Google Translate, DeepL e Bing). Il team di ricerca ha fornito sia i testi originali sia le loro traduzioni ad altri sistemi di machine learning, chiamati classificatori, addestrati a prevedere l'età e il sesso di chi scrive un testo.
 
Partendo da un set di dati ripartiti in modo uniforme tra autori di sesso femminile e maschile, i classificatori hanno erroneamente previsto la distribuzione di genere delle traduzioni in inglese. Nelle traduzioni dal tedesco, hanno stimato la percentuale di testi scritti da uomini al 63-64% (a seconda del sistema commerciale utilizzato), al 57-64% per le traduzioni dall'italiano e al 52-55% dall'olandese. I testi francesi sono tradotti in modo piuttosto fedele in termini di genere e solo il 51% sembra scritto da maschi.
 
Nella direzione opposta, traducendo dall'inglese verso altre lingue, gli autori trovano evidenze contrastanti: le traduzioni in francese e in tedesco suonano più femminili, quelle in italiano e in olandese più maschili.
 
Infine, gli autori hanno ripetuto l'esercizio per prevedere le fasce d'età. In questo caso, i sistemi di traduzione automatica hanno prodotto traduzioni in inglese che suonano in modo sproporzionato come se fossero scritte da sessantenni.
 
Ciò che Hovy e i suoi colleghi hanno individuato è una distorsione algoritmica precedentemente sconosciuta. “Questi sistemi sono comunemente usati per tradurre una vasta gamma di documenti”, dice Hovy, “e possono finire per normalizzare e rafforzare alcuni stereotipi. Tornando alla bambina cresciuta in una cittadina di soli uomini di mezza età: non è solo che lei suonerebbe strana al resto del mondo, ma anche che il resto del mondo - donne, giovani e così via - le suonerebbe in qualche modo sbagliato”.
 
“Fino a poco tempo fa, per la traduzione automatica lo stile del testo non era una preoccupazione. I ricercatori si preoccupavano di produrre una buona traduzione in termini di contenuto”, conclude Hovy. “C'era una mancanza di consapevolezza della distorsione e delle sue conseguenze. Tuttavia, la mia impressione è che ora stiano cercando di affrontare il problema”.
 
Dirk HovyFederico BianchiTommaso Fornaciari, "'You Sound Just Like Your Father'. Commercial Machine Translation Systems Include Stylistic Biases", in Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. 2020.
 

di Fabio Todesco
Bocconi Knowledge newsletter

News

  • Perche' le aziende familiari sono piu' resilienti

    Alcune caratteristiche delle famiglie imprenditoriali amplificano le capacita' del top management team di assorbire e riprendersi dagli shock, secondo un'analisi di Bocconi, Unicredit e AIDAF  

  • Una mappa dell'attrattivita' degli investimenti nelle infrastrutture agroalimentari

    Uno studio a cura di Stefano Gatti, titolare della cattedra Antin Infrastructure Partners in Infrastructure Financing, traccia le tendenze di lungo periodo e mette a confronto le varie applicazioni in un settore sempre piu' importante  

Seminari

  Settembre 2022  
Lun Mar Mer Gio Ven Sab Dom
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30    

Seminari

  • Enrico Diecidue: Timing and skewness of information revelation: evidence on information structures and compound lotteries

    ENRICO DIECIDUE - INSEAD

    Room 3-E4-SR03 (Rontgen)

  • Stefano Rossi, Bocconi University: The Coherence Side of Rationality: Rules of Thumb, Narrow Bracketing, and Managerial Incoherence in Corporate Forecasts

    STEFANO ROSSI - Università Bocconi

    Sala seminari 2-e4-sr03 - Via Roentgen, 1