Chiara Sabatti Assistant Professor of Statistics and Human Genetics UCLA Ricostruire un vocabario ignoto. Nell'analisi della sequenza di DNA, nello studio di come i bambini imparino il linguaggio e per la lettura automatica di testi scritti in lingue orientali, si pone il problema di segmentare una sequenza di lettere in ``parole'' appartenenti a un vocabolario ignoto. Illustrero` un modello statistico per affrontare il problema e discutero` approcci per determinare il numero di vocaboli nel dizionario.