Nel volume La Lingua Italiana nell'Era Digitale viene presentata un’introduzione alle tecnologie linguistiche e alle relative principali aree di applicazione. Ne parliamo con i ricercatori che hanno curato il volume.
Le istituzioni dell’UE spendono circa un miliardo di euro l’anno per mantenere la politica di multilinguismo. Secondo alcune stime, il mercato europeo per la traduzione e l’interpretariato si aggira intorno a 8.4 miliardi di euro e ci si aspetta che aumenti del 10% l’anno. Ma si tratta di una spesa davvero necessaria?
Essendo la diversità linguistica europea un patrimonio culturale fondamentale, garantire una politica di multilinguismo in Europa ha un'importanza imprescindibile. Sarebbe impensabile sostituire l’attuale Europa multilingue con un'Europa in cui una singola lingua finisse per sostituire tutte le altre ma, allo stesso tempo, occorre evitare che la diversità linguistica diventi un ostacolo insormontabile e che i costi diventino insostenibili. Considerando che le lingue d’Europa sono circa ottanta, risulta evidente che l’apprendimento delle lingue da solo non possa bastare per superare i confini linguistici.
Quale contributo possono dare le moderne tecnologie del linguaggio per abbattere i confini linguistici?
Le tecnologie del linguaggio hanno un ruolo crescente per ridurre le barriere linguistiche. Ad esempio, l’area degli scambi commerciali su Web, per definizione parte della rete globale, richiede tecnologia sempre più sofisticate per dare accesso facile a consumatori di lingue diverse. Compiti quali la “localizzazione” di siti web (ad esempio siti per l’acquisto di biglietti aerei), la traduzione di manualistica e di annunci commerciali, sono oramai percepiti come necessari per aprire potenzialità di mercato non ancora sfruttate. Un secondo settore di forte impatto sociale per le tecnologie del linguaggio riguarda strumenti a supporto dell’apprendimento delle lingue, particolarmente per ridurre le difficoltà collegate ai flussi di emigrazione.
Con un inglese sempre più lingua dominante – vedi l’animato dibattito sui corsi universitari in lingua inglese nelle Università italiane – non sarà in futuro ipotizzabile un’Europa monolingua?
L’inglese è già la lingua della comunicazione scientifica, della tecnologia, del commercio. Ma difficilmente si sostituirà alle lingue nazionali in tutti i contesti d’uso. Possiamo quindi ragionevolmente ipotizzare uno scenario in cui aumenterà il bilinguismo dove l’inglese è sempre il secondo termine della coppia. Ma la diversità linguistica che costituisce una delle ricchezze culturali dell’Europa non scomparirà, anzi. Accanto ad un consolidamento dell’inglese come lingua della comunicazione internazionale, si assiste ad un risveglio della sensibilità verso il valore di identità e patrimoni linguistici minoritari e regionali che fa ben sperare per la sopravvivenza della diversità linguistica europea.
In quale situazione tecnologica si trova la nostra lingua?
Le tecnologie per la lingua italiana sono significativamente più povere rispetto a quelle disponibili per la lingua inglese. Questo fatto contribuisce ad ampliare il distacco in termini di utilizzo reale, in particolare per le applicazioni disponibili su Web o su dispositivi mobili. Le maggiori differenze tecnologiche tra italiano e inglese si notano in particolare nel settore delle cosiddette “risorse linguistiche”, che sono indispensabili per il buon funzionamento delle tecniche statistiche utilizzate dalla maggior parte dei sistemi automatici.
La percentuale di utenti internet che parlano italiano subirà una diminuzione nel prossimo futuro. Che ruolo possono svolgere le tecnologie del linguaggio in questo campo?
Sono fondamentali. Dal momento che gran parte delle attività odierne si svolgono online, su Internet e attraverso tablet e smartphone, è necessario che queste attività possano essere svolte usando la nostra lingua madre. Tuttavia, se una lingua non viene supportata adeguatamente dalle tecnologie linguistiche la comunicazione o l'interazione digitale comincia a farsi difficoltosa, ed è molto probabile che venga abbandonata a favore di altre lingue che sono meglio supportate. Così, la gamma dei contesti d'uso si restringerà sempre di più, portando gradualmente alla scomparsa della lingua da Internet. Le tecnologie linguistiche hanno un forte potenziale inclusivo, perché consentono a tutti coloro che non parlano inglese o un’altra delle lingue dominanti di accedere ai contenuti e ai servizi offerti dalla Rete usando la propria lingua. In tal senso, consentono di abbattere le barriere linguistiche, e consentire a tutti di accedere alla rivoluzione digitale e all’alfabetizzazione informatica. Ma ne faranno le spese tutti i parlanti monolingui, perché tagliati fuori dai contenuti disponibili in lingue diverse dall'italiano e questo, lungi dall'essere un impulso alla globalizzazione, sarebbe prima di tutto un impoverimento del tessuto culturale europeo, e del patrimonio di diversità linguistica che racchiude.
E' possibile scaricare il volume a questo link
Bernardo Magnini è ricercatore senior alla FBK di Trento, dove è co-responsabile della Unità di Ricerca su Tecnologie del Linguaggio. I suoi interessi sono nel campo del trattamento automatico del linguaggio, in particolare l’interpretazione semantica, settori in cui ha pubblicato più di 130 articoli scientifici. Ha avviato la realizzazione di risorse computazionali per la lingua italiana e coordina EVALITA, la campagna di valutazione per il trattamento dell’italiano, sia scritto che parlato. Ha coordinato progetti di ricerca internazionali ed è professore a contratto all’Università di Bolzano. Attualmente coordina il Gruppo di Lavoro su Natural Language Processing della Associazione Italiana Intelligenza Artificiale.
Nicoletta Calzolari è Associato presso il CNR-ILC, già Direttore dell’ILC (2003-08). Ha una lunga esperienza di coordinamento di progetti internazionali, europei e nazionali e di iniziative di carattere strategico. Ha coordinato recentemente il Network europeo FLaReNet. E’ Presidente di ELRA, vice-presidente di META-TRUST, membro permanente dell’ICCL, convenor dell’ISO Lexicon WG, membro dell’ESFRI Social Sciences and Humanities Thematic Working Group, membro del META-NET Council, presidente dell’Associazione PAROLE, è stata chair dello Scientific Board di CLARIN, membro dell’ACL Exec, e membro di molti International Committees e Advisory Boards (e.g., ELSNET, SENSEVAL, ECOR, SIGLEX, …). General Chair di LREC (dal 2004) e di COLING-ACL-2006, co-editor-in-chief del Journal Language Resources and Evaluation, Springer.
Claudia Soria, linguista, ricercatrice al CNR presso l'Istituto di Linguistica Computazionale di Pisa. I suoi interessi di ricerca si sono da sempre rivolti alle risorse linguistiche nel loro ciclo di vita completo, dalla creazione alla rappresentazione alla valutazione. E' tra gli autori di LMF, Lexical Markup Framework, uno standard ISO per la rappresentazione di lessici computazionali. Da qualche anno è professionalmente e personalmente impegnata nella valorizzazione e protezione del patrimonio linguistico italiano, con particolare riguardo all'uso di tecnologie di Trattamento automatico del linguaggio per la preservazione e la rivitalizzazione di lingue minacciate e minoritarie.
Manuela Speranza, linguista, è ricercatrice presso la Fondazione Bruno Kessler di Trento (ex-ITC-irst) dal 2000. I suoi interessi di ricerca includono creazione e distribuzione di risorse linguistiche e metodologie di valutazione. E' stata coinvolta nell'organizzazione delle passate edizioni della campagna di valutazione EVALITA (2007, 2009 e 2011). Attualmente, all'interno del progetto europeo NewsReader, sta lavorando alla creazione di un corpus annotato manualmente con entità, eventi, e relazioni tra eventi.