27/12/2010 di Redazione

IBM ha una ricerca sulla punta della lingua

IBM ha premiato un interessante ricerca dell'Università di Tor Vergata di Roma. Si sta cercando di creare un sistema per il riconoscimento del linguaggio naturale nella nostra lingua, che possa facilitare e migliorare le tecnologie linguistiche.

Tra i tanti interessi di IBM ci sono anche le scienze linguistiche, e per questo l'azienda ha riconosciuto con un premio il gruppo di ricerca ART della Professoressa Maria Teresa Pazienza dell'Università di Roma Tor Vergata.

Traduttore Universale, sarà marchiato IBM?

Il gruppo lavora alle "tecnologie del linguaggio naturale, e in particolare allo sviluppo di un analizzatore robusto e scalabile per la lingua italiana" l'obiettivo a breve termine è quello di creare un "web semantico" migliore, ma non possiamo evitare di pensare a traduttori simultanei come quelli che abbiamo visto nella serie Enterprise e simili.

"Il progetto premiato mira a sviluppare, sulla piattaforma UIMA (Unstructured Information Management Architecture) Chaos, un parser sintattico precedentemente realizzato dal gruppo ART", spiega il comunicato stampa.

UIMA consente a vari sistemi di elaborazione del linguaggio naturale di interagire in modo coordinato; questa piattaforma è alla base del sistema di question-answering IBM Watson, recentemente passato alle cronache perché IBM lo metterà alla prova in un telequiz (Jeopardy), con avversari veri; dovrà rispondere a domande posto in linguaggio comune, appunto, e questa è la grande sfida. 

La ricerca del Pesce Babele continua. L'avete visto?

L'italiano in rete è una lingua minoritaria, ma i navigatori che lo usano abitualmente sono comunque 30 milioni (in crescita). Un nomero che evidentemente è sufficiente per giustificare ricerche e investimenti. "Ciò nonostante, le risorse linguistico-computazionali aperte per l'italiano sono ancora limitate e IBM Italia è impegnata a colmare questa lacuna. Col sostegno all'Associazione Senso Comune (www.sensocomune.org), che include la Prof. Pazienza tra i referenti scientifici, si intende costituire una risorsa lessicale aperta per la lingua italiana. Il progetto Chaos, dal canto suo, ha proprio l'obiettivo di sviluppare tecnologie di parsing robuste e scalabili per la nostra lingua", continua il documento.

ARTICOLI CORRELATI