La finalità dell’apprendimento profondo è creare una macchina che superi il test di Turing : “when a human is interacting with it, for the human it will not possible to conclude if it he is interacting with a human or a machine”[Turing, A.M 1950].

 

L’apprendimento profondo (in inglese deep learning) è quel campo di ricerca dell’apprendimento automatico e dell’intelligenza artificiale che si basa su diversi livelli di rappresentazione, corrispondenti a gerarchie di caratteristiche di fattori o concetti, dove i concetti di alto livello sono definiti sulla base di quelli di basso. Alcuni algoritmi per l’apprendimento profondo furono sviluppati negli anni 50 e molti di loro sono utilizzati nelle reti neurali.

Una delle tecniche più potenti alla base dell’apprendimento delle macchine è basata sulle Reti Neurali. Ispirati dal funzionamento del cervello umano il neurofisiologo Warren McCulloch ed il logico Walter Pits studiarono una rete neurale composta da reti di funzioni enormemente connesse che mappano il percorso dagli input alle output desiderati.

Le reti neurali hanno la capacità linguistica di derivare significati da dati imprecisi e complicati e possono essere utilizzate per estrarre schemi e rilevare tendenze troppo complesse per essere notate dagli umani o da altre tecniche informatiche. Una rete neurale può essere pensata come una sorta di  espertodella categoria delle informazioni che gli sono state date da analizzare. Tale esperto può essere utilizzato per effettuare delle proiezioni e per rispondere a domande.

#Europeandayoflanguages

27 Settembre 2017 | | Commenti disabilitati

http://www.youreporter.it/video_Jubin_Abutalebi_a_Roma

In occasione della Giornata Europea delle Lingue #Europeandayoflanguages si è tenuto a Roma il Seminario dal titolo:” Europei si nasce, Poliglotti si diventa”. L’Unione Europea, attraverso la Direzione Generale della Traduzione della Commissione Europea, possiede uno dei servizi di traduzione più grandi del mondo. I servizi linguistici e di traduzione dell’Unione Europea sostengono e rafforzano il multilinguismo e assicurano che la Commissione produca documenti scritti in maniera chiara in tutte le lingue ufficiali.

Il convegno internazionale « Census », organizzato da François Bougard e Matthieu Cassin dell’Institut de recherche et d’histoire des textes e da  Amandine Postec (Biblioteca Nazionale di Francia) riunirà nei giorni 12-13 ottobre 2017, molti esperti europei, esponenti di università e biblioteche a Parigi , per riflettere sulle  pratiche correnti di censimento di manoscritti nelle banche dati di riferimento e nei cataloghi on line delle biblioteche. Tale condivisione di esperienze costituirà un’occasione per evidenziare i nuovi temi di ricerca ed i miglioramenti che si fanno strada attraverso nuovi e diversi strumenti e cataloghi.

Le aziende che  censiscono  e  catalogano i manoscritti stanno cambiando: le opere su carta sono accompagnate o sono sempre più soppiantate da supporti elettronici.

A fronte di una variegata diversità di soluzioni tecniche il Convegno propone una riflessione collettiva che coinvolge ricercatori e istituzioni di conservazione. La finalità del convegno, opportunità offerta dall’ 80 ° anniversario dell’ IRHT (L’Institut de recherche et d’histoire des textes) , è quella di confrontare le esperienze in diversi paesi ed in diversi ambiti linguistici, al fine di riflettere sulle modalità di mettere in comune e di mettere on line censimenti e descrizioni di manoscritti per lingua, paese e tipo di manoscritto.

Il convegno si terrà:

Giovedì 12 ottobre 2017 presso:

Institut de recherche et d’histoire des textes

Site Iéna, Salle Jeanne-Vielliard

40 avenue d’Iéna, 75116 Paris

 

Venerdì 13 ottobre  2017 presso:

Bibliothèque nationale de France,

Petit auditorium du site François Mitterrand

avenue de France, 75013 Paris

Il norvegese lingua V2

12 Settembre 2017 | | Commenti disabilitati

Il Norvegese è una cosiddetta lingua  V2. Ciò  vuol dire che il verbo mantiene necessariamente la seconda posizione nella frase. In una frase quale “Jeg kommer fra Brasil” (Io vengo dal Brasile), non si fa tanta attenzione alla posizione del verbo poiché è simile all’italiano , ma in “Nå bor Karl i Oslo” (Adesso Karl vive ad Oslo.) la posizione del verbo è diversa perché il norvegese si attiene strettamente alla regola della V2 nella frase!

Monastero di Santa Caterina nel SinaiIl termine palinsesto nel linguaggio dei filologi si ascrive al codice di pergamena su cui, raschiata la prima scrittura, si può scrivere un nuovo testo (dal greco palímpsestos che vuol dire “raschiato di nuovo”). Il termine raggiunse la notorietà quando il filologo Angelo Mai (1782-1864) trovò, tra i palinsesti della Biblioteca Vaticana, testi di Frontone e Cicerone, in particolare il De Re Publica.

Circa 130 palinsesti sono stati scoperti nel Monastero di Santa Caterina nel Sinai secondo il sito della Early Manuscript Electronic Library, www.emel-library.org/ che sta portando alla luce i testi originali. Con l’avvento dell’Islam nel VII secolo i siti cristiani nel deserto del Sinai cominciarono a sparire ed il Monastero di Santa Caterina si trovò relativamente isolato. I monaci furono, quindi, costretti a riutilizzare le vecchie pergamene per la scarsità delle forniture. Per scoprire i testi segreti dei palinsesti I ricercatori hanno fotografato molte volte migliaia di pagine, illuminando ogni pagina con luci di colore diverso. Successivamente hanno affidato le informazioni ottenute all’algoritmo di un computer che ha fatto la ripartizione tra i testi più recenti e quelli più antichi.

A partire dal 2011, i ricercatori hanno fotografato 74 palinsesti per circa  6.800 pagine nascoste.  I testi rinvenuti vanno dal IV al XII secolo e sono state così  scoperte circa 108 pagine di poesie greche sconosciute e forse la prima ricetta attribuibile al medico greco Ippocrate. I rinvenimenti più interessanti sono quelli dei testi manoscritti in lingue ancora oscure come l’Albanese caucasico, lingua parlata da comunità cristiane in quello che è oggi l’Azerbaigian. Nell’antichità classica gli Albani si schierarono con i persiani contro Alessandro Magno e Gaugamela (331 a.C.) e il loro regno, confinava con l’Armenia e l’Iberia, e rimase una delle più importanti entità politiche della regione caucasica tra i secoli I a.C. e VII d.C. Di questo popolo non sappiamo quasi nulla. A parte i ritrovamenti archeologici, come quelli notevolissimi di Mingecaur (Azerbaigian), degli Albani non ci sono giunte testimonianze dirette. Se ebbero una letteratura, essa è andata totalmente perduta: sopravvivono soltanto l’alfabeto e brevi iscrizioni lacunose e di ardua interpretazione. Altri documenti riportati alla luce finora nei palinsesti di Santa Caterina nel Sinai sono in aramaico cristiano palestinese, una lingua impostata sul siriaco e sul greco.

Intelligenza artificiale e traduzioni

24 Agosto 2017 |  Tagged | Commenti disabilitati

L’intelligenza artificiale sta già creando problemi alla forza lavoro e continuerà a farlo a mano a mano che aumenteranno le sue capacità. Sembra un processo inevitabile quello che porterà l’intelligenza artificiale a svolgere tutte quelle mansioni di tipo amministrativo che fanno perdere tempo ai manager, facendolo meglio e a minor costo della forza lavoro umana. Ma, per quanto riguarda i campi della creatività e dell’innovazione il fatto che l’intelligenza artificiale possa fare meglio dell’uomo è ancora una questione fortemente controversa. Per quanto concerne l’automazione dei servizi linguistici è tuttora la qualità a dar man forte all’attività umana se si paragona, ad esempio, una traduzione fatta da una macchina con quella di un essere umano. E non sono pochi a reputare, forse giustamente, che ci saranno sempre limiti alla creatività di un computer. Le prime dieci imprese al mondo erogatrici di servizi linguistici sono state valutate in base a due fattori: analisi predittiva e rischio. Da un lato, la predittività di un contenuto e dall’altro il rischio che nasce dal non aver tradotto correttamente il contenuto. Per esempio la documentazione di tipo legale e giuridica è abbastanza imprevedibile, mentre molto prevedibile risulta essere la traduzione concernente i manuali dei macchinari e delle attrezzature pesanti. I testi di carattere legale appaiono oggi i meno pertinenti per la traduzione automatica ed il rischio connesso tende ad essere elevato. Tenuto conto dell’analisi predittiva e del rischio, che ancora non viene correttamente gestito dai traduttori basati sull’intelligenza artificiale, i traduttori umani dovrebbero specializzarsi al presente in particolare  sul linguaggio del marketing, sul linguaggio giuridico-legale e sulle scienze medico-biologiche che sembrano ancora le meno adatte all’automazione.

Dichiarazione Universale dei Diritti dell'Uomo in BhojpuriA settant’anni dall’indipendenza dell’India (15 agosto 1947) non si può non fare un accenno ad almeno ad una delle sue tante lingue e la scelta di una lingua parlata e diffusa da migranti sembra essere la scelta corretta. Il Bhojpuri ( circa 25.000.000 di parlanti) è una lingua appartenente alla famiglia delle lingue indoarie, ramo della famiglia linguistica indoeuropea, ed è parlata nella parte nord-orientale dell’India e nella regione del Terai in Nepal. In India questo idioma si parla in prevalenza nell’ Uttar Pradesh orientale, ad ovest del Bihar e nell’estrema parte nord occidentale del Jharkhand . Dal punto di vista socio-linguistico, il Bhojpuri è una delle sette lingue Hindi (Haryanvi, Braj, Awadhi, Bhojpuri, Bundeli, Bagheli and Kannauji). Il Bhojpuri è stato riconosciuto come una delle lingue nazionali del Nepal ed ha uno status ufficiale nelle isole Fiji come Fiji Hindi. È lingua riconosciuta anche in Guyana, Suriname e Mauritius.

Inoltre il Bhojpuri è diffuso anche in Pakistan, Jamaica, Belize, ed in altre zone dei Caraibi e del Sud Africa. Una variante del Bhojpuri delle Suriname è nota anche come Sarnami Hindustani, Sarnami Hindi o solo Sarnami ed ha subito l’influenza, dal punto di vista lessicale,  del Sranan Tongo Creole e dall’olandese. In Mauritius un dialetto del Bhojpuri  continua ad essere usato e localmente è chiamato Bojpury. L’utilizzo di tale dialetto in Mauritius, però, sta scemando ed oggi è utilizzato soltanto dal 5% della popolazione. Il Bhojpuri storicamente si scriveva in Kaithi ma dal 1894 tale scrittura è stata sostituita dall’alfabeto Devanagari.

Scrivere in maiuscolo i sostantivi costituisce una peculiarità della corretta scrittura della lingua tedesca che si è sviluppata e consolidata nel corso dei secoli. Poiché la scrittura in maiuscolo dei sostantivi ha esercitato un’influenza determinante in tedesco anche le nuove regole ufficiali sulla corretta scrittura,  dopo l’ultima riforma ortografica che ha fissato alcuni ulteriori criteri per la corretta grafia delle parole, non è stata accettata da tutti, soprattutto da alcuni importanti giornali, quali la Frankfurter Allgemeine Zeitung e il Bild.  A questo proposito va ricordata l’importante riforma del 1998. Per la corretta scrittura della lingua tedesca un ruolo importante è quindi svolto dalle maiuscole e dalle minuscole. Le regole fino alla recente riforma erano piuttosto complicate e non sempre esaustive, in quanto comprendevano molte eccezioni e casi particolari.

In genere vengono scritti in maiuscolo i sostantivi, i nomi propri ed i titoli. Le più importanti modifiche della recente riforma  sono, comunque,  le seguenti:

1. Sostantivo in combinazione con preposizione : in Bezug auf > in precedenza:  in bezug auf

2. Sostantivo in combinazione con verbo : Eis laufen > in precedenza: eislaufen

3. Aggettivo sostantivato : im Allgemeinen > in precedenza: im allgemeinen

4. Momenti del giorno in combinmazione con ieri, oggi, ecc: morgen Abend > in predenza morgen abend

5. denominazione di una lingua in combinazione con preposizione> auf Deutsch, auf Italienisch > in precedenza:  auf deutsch, auf italienisch;

6. Coppie di aggettivi per indicare persone: Groß und Klein  > in precedenza groß und klein.

 

Elly Van Gelderen (Arizona State University) e Judith Tonhauser (Ohio State University)  partecipano a Roma al Festival Festival delle Scienze 2017 dall’11 al 14 maggio. Il loro campo di studi è:  Cambiamenti nel linguaggio. Elly van Gelderen ha esplorato nei suoi studi il modo in cui i significati linguistici cambiano nel tempo seguendo un processo sistematico e unidirezionale. Ad esempio in lingue come l’inglese le forme negative deboli come “I didn’t do it” vengono via via sostituite da quelle più forti come “I never did”. Mentre è opinione comune che tale tipo di alterazioni siano il sintomo della ‘decadenza’ di una lingua, la linguistica li vede come naturali effetti del processo di acquisizione del linguaggio, quello per cui i bambini rielaborano in modo più ‘economico’ l’input ricevuto. Tali mutamenti vanno sicuramente accolti più che temuti.  Judith Tonhauser, ha studiato il modo in cui i significati variano (o non variano) nelle varie lingue del mondo. In particolare, si è concentrata sui modi in cui l’inglese e il guaraní, una lingua parlata in Sud America, si differenziano nella localizzazione temporale di eventi. A differenza dell’inglese, il guaraní non segna il tempo sui verbi, ma fa un uso produttivo di marcatori temporali sui sostantivi, per esprimere significati simili ad esempio a “ex studente”. Questo esempio illustra come significati analoghi possono essere veicolati da strumenti grammaticali anche molto diversi tra loro. Più in generale, tali studi scientifici rafforzano l’idea che le indagini comparative dei diversi linguaggi ancora parlati sulla Terra siano fondamentali per approfondire la nostra conoscenza della lingua e dei cambiamenti ad essa associati. 

 

La lingua guaraní

21 Aprile 2017 |  Tagged , | Commenti disabilitati

La lingua guaraní è una lingua tupi-guaraní parlata in Paraguay e altri stati dell’America meridionale. Il nome stesso  Paraguay deriva dalle parole guaraní “para”, che significa “questo lato” e “guay” che significa “fiume”.Dal 2007 è divenuta una delle sessantatré lingue con cui il Papa pronuncia il suo messaggio natalizio durante la benedizione Urbi et Orbi. Il guaraní è una lingua agglutinante, a sillabe aperte (consonante-vocale, vocale da sola, le sillabe non terminano per consonante). L’accento tonico cade di norma sull’ultima sillaba delle parole. La lingua guaraní possiede undici vocali, sei semplici a, e, i, o, u, y e sei vocali nasalizzate corrispondenti, un glottal stop, annotato con un apostrofo e denominato puso. Le parole in guaraní non hanno né caso né genere. Non esiste l’articolo ed il segno del plurale spesso si omette.

Con la promulgazione nel 2011 della Legge delle Lingue, (La Ley de Lenguas)  il Paraguay ha tentato di modificare una realtà: lo squilibrio tra le lingue ufficiali – il guaraní e il castigliano – che vede la prima, sebbene parlata dalla maggioranza della popolazione (86%), non diffusa a livello istituzionale né nei luoghi del potere.
In questo modo, il governo ha tentato di rendere effettivo il mandato costituzionale che nel 1992 ha proclamato il Paraguay “un paese multiculturale e bilingue”, un concetto che ha dato adito a discussioni in merito a come rivalorizzare il guaraní e sancire la fine del bilinguismo biforcuto, ossia, un sistema dove una delle lingue ha un trattamento superiore all’altra.  
Una studiosa della lingua guaraní è Judith Tonhauser, professore associato di linguistica alla Ohio State University. È laureata in linguistica computazionale alla University of Stuttgart e ha conseguito un dottorato in linguistica alla Stanford University. Ha condotto attività di ricerca su temporalità, contenuti proiettivi, struttura delle informazioni e intonazione in inglese e guaraní paraguaiano, una lingua tupi-guaraní parlata in Paraguay; coltiva un particolare interesse per le metodologie di ricerca sul significato.

Tra le sue pubblicazioni sul guaraní si segnalano :

“The prosody of focus in Paraguayan Guaraní”, Cynthia G. Clopper and Judith Tonhauser, International Journal of American Linguistics 79(2):219-251.2013

“Temporal reference in Paraguayan Guaraní, a tenseless language”, Linguistics & Philosophy: 34(3):257-303. 2011

“The synchrony and diachrony of differential object marking in Paraguayan Guaraní”, Cory Shain and Judith Tonhauser, Language Variation and Change 22(3): 321-346. 2011

 

http://www.youreporter.it/video_Judith_Tonhauser