BDBComp
Parceria:
SBC
Uma Abordagem de Aprendizagem Híbrida para Extração de Informação em Textos Semi-Estruturados

Eduardo F. A. SilvaFlávia A. BarrosRicardo B. Prudêncio

Information Extraction (IE) aims to extract from textual documents only the relevant data. This paper presents a hybrid approach to the problem of IE that combines text classification techniques and Hidden Markov Models (HMM). The IE system generates an initial output using text classification techniques, which is refined by a HMM. The implemented prototype was used to extract information from bibliographic references, reaching a precision rate of 87,48% in a test set of 3000 references.

http://www.lbd.dcc.ufmg.br/colecoes/enia/2005/047.pdf

Caso o link acima esteja inválido, faça uma busca pelo texto completo na Web: Buscar na Web

Biblioteca Digital Brasileira de Computação - Contato: bdbcomp@lbd.dcc.ufmg.br
     Mantida por:
LBD