MUNST Multilingual Natural Speech Technology ITC-irst

 
 
Dicembre 2002
Tesi di laurea 
presso l'ITC-irst di Trento
http://www.fbk.eu/IRST

 
Centro per la Ricerca Scientifica e Tecnologica

L'ITC-irst svolge attività di ricerca e sviluppo nei settori della microelettronica e dell'informatica avanzata. L'attività di ricerca è organizzata in progetti finalizzati.


 
Progetto MUNST
(Multilingual Natural Speech Technology)

Il progetto mira all'avanzamento della tecnologia del riconosci- mento automatico del parlato in settori strategici dell'Information Technology: come l'elaborazione di archivi multimediali e la traduzione automatica.  Il progetto  partecipa a progetti  di livello internazionale che coinvolgono i più importanti attori del settore (laboratori di ricerca, industrie, archivi, televisioni, etc.). 

Argomenti 
Elaborazione di archivi audio

La comunicazione dei media sta rapidamente muovendosi verso il formato digitale e importanti attori del settore (giornali, radio, televisioni) hanno già cominciato a digitalizzare i propri archivi. La disponibilità in rete di informazioni multimediali attraverso "biblioteche digitali" ha innescato la richiesta di applicazioni avanzate sia da parte dei produttori di informazione che del pubblico. Questo motiva la necessità di sviluppare nuove tecnologie che migliorino la gestione e l'accesso all'informazione multimediale. Nell'ambito delle attività sullo sviluppo di tecnologie mirate all'elaborazione di archivi digitali audio, sono disponibili posizioni  nei seguenti campi di ricerca:
- segmentazione e classificazione di segnali audio 
- indicizzazione  di documenti audio 
- tecniche di accesso all'informazione audio
- riconoscimento automatico del parlato
- sviluppo di  moduli software


Traduzione automatica del parlato

La traduzione automatica del parlato è un'area di ricerca di significativo impatto per molte applicazioni. Il problema è però troppo vasto per poter essere affrontato nel caso generale che occorre circoscrivere avendo cura di non comprometterne l'applicabilità. In particolare è importante limitare il dominio della conversazione in modo da poter prevedere con buona approssimazione sia i vocaboli utilizzati che i concetti espressi, consentendo però la libertà nella formulazione delle frasi. Nell'ambito delle attività sullo sviluppo di tecnologie mirate alla traduzione automatica del parlato, sono disponibili posizioni nei seguenti campi di ricerca:
- estrazione del contenuto del messaggio
- valutazione di sistemi di traduzione automatica
- metodi statistici di traduzione automatica
- sviluppo di moduli software di traduzione automatica


Contattare:
Marcello Federico
tel. 0461 314552 
federico@fbk.eu
Ricerca
Le tecnologie del riconoscimento automatico del parlato hanno ottenuto negli ultimi anni notevoli risultati. Sono oggi disponibili modelli statistici sofisticati per segmentare o classificare segnali acustici e per trascrivere il parlato continuo. L'accuratezza e l'efficienza di questi modelli è però legata alla disponibilità di grandi campioni di dati su cui addestrare i loro parametri. Molta attività di ricerca è comunque ancora necessaria per raggiungere prestazioni paragonabili a quelle umane.

Requisiti
Buona comprensione scritta dell'inglese scientifico. Padronanza dei linguaggi di programmazione C/C++ o JAVA. Buon curriculum di studi. È gradita la conoscenza di nozioni in almeno una delle seguenti discipline: linguaggi formali, teoria della probabilità e statistica, teoria dell'informazione, linguistica computazionale, elaborazione numerica del segnale. 

 
 
 

Home Page/Activities /Staff/ Thesis/Publications /Restricted