|
Abbiamo implementato un algoritmo di S.Cucerzand e D.Yarowsky per realizzare un riconoscitore di entità nominali indipendente dal linguaggio. Il sistema apprende partendo da un ristretto insieme di regole, per mezzo di ripetute iterazioni in cui svolge un'analisi sintattica di un testo scritto in linguaggio naturale (es. degli articoli di giornale, blog, ...) basata sulle caratteristiche (features), genera nuove regole e mantiene quelle "migliori".
Abbiamo testato il sistema facendogli riconoscere tre entità nominali (Nomi di persona, Località e Nomi di organizzazioni/aziende) all'interno di una raccolta di articoli di giornali statunitensi. Il progetto è stato programmato in C per il corso di Linguistica Computazionale. Il pacchetto è provvisto di Makefile funzionante in sistemi Linux/GCC.
Prossimi sviluppi: testare il sistema su una lingua differente dall'inglese (l'italiano, ad esempio) ed effettuare alcune misurazioni sulla bontà dell'algoritmo nel distinguere le varie entità nominali. Relazione(pdf.gz | odt.gz) Sorgenti(tar.gz)
Aggiungi questa pagina al tuo Social Network preferito
|
|
Ultimo aggiornamento Martedì 04 Novembre 2008 00:42 |
Un messagio di benvenuto a Stefania e a tutte le persone nuove!!! Continuate a scriverci e a seguirci!!!
Ciao ragazzi....bellissimo sito e bellissima iniziativa.....ho anche io questo "ospite sgradito" in testa!...1bacione grande grande e in bocca al lupo a tutti quanti!!!!!!
Grazie Nadia, l'esame dei seni petrosi li ha fatti a Milano tuo figlio o tutto a Pisa? Grazie
Grazie valeria,farò sapere ora devo trovare un buon medico Ciao
ciao e scusami se ti rispondo solo ora.. allora a me hanno dato per quasi due mesi il nicetile, 3 volte al giorno,l'expose, il b-total ( o qualcosa di simile ) e il laroxyl. siccome il mio corpo n...