Home Progetti Riconoscimento di entità nominali
Riconoscimento di entità nominali PDF Stampa E-mail

Abbiamo implementato un algoritmo di S.Cucerzand e D.Yarowsky per realizzare un riconoscitore di entità nominali indipendente dal linguaggio. Il sistema apprende partendo da un ristretto insieme di regole, per mezzo di ripetute iterazioni in cui svolge un'analisi sintattica di un testo scritto in linguaggio naturale (es. degli articoli di giornale, blog, ...) basata sulle caratteristiche (features), genera nuove regole e mantiene quelle "migliori".

Abbiamo testato il sistema facendogli riconoscere tre entità nominali (Nomi di persona, Località e Nomi di organizzazioni/aziende) all'interno di una raccolta di articoli di giornali statunitensi.

Il progetto è stato programmato in C per il corso di Linguistica Computazionale. Il pacchetto è provvisto di Makefile funzionante in sistemi Linux/GCC

Prossimi sviluppi:  testare il sistema su una lingua differente dall'inglese (l'italiano, ad esempio) ed effettuare alcune misurazioni sulla bontà dell'algoritmo nel distinguere le varie entità nominali.

Relazione

(pdf.gz | odt.gz)

Sorgenti

(tar.gz)



Aggiungi questa pagina al tuo Social Network preferito
Commenti
Nuovo Cerca RSS
Commenta
Nome:
Email:
 
Website:
Titolo:
UBBCode:
[b] [i] [u] [url] [quote] [code] [img] 
 
 
:angry::0:confused::cheer:B):evil::silly::dry::lol::kiss::D:pinch:
:(:shock::X:side::):P:unsure::woohoo::huh::whistle:;):s
:!::?::idea::arrow:
 
Please input the anti-spam code that you can read in the image.

3.26 Copyright (C) 2008 Compojoom.com / Copyright (C) 2007 Alain Georgette / Copyright (C) 2006 Frantisek Hliva. All rights reserved."

Ultimo aggiornamento Martedì 04 Novembre 2008 00:42
 

My Network

Delicious/francesco.spegni
C'è dell'altro...

La striscia del giorno

Parliamo di...