BDBComp
Parceria:
SBC
Avaliação da Influência da Remoção de Stopwords na Abordagem Estatística de Extração Automática de Termos

Ígor Assis Braga

A criação de produtos terminológicos é importante para a difusão e a organização de conhecimentos. Essa tarefa pode ser auxiliada pela extração automática de termos, que vem sendo tratada como um problema de Processamento de Língua Natural. Neste artigo, é investigada a interação entre a abordagem estatística de extração de termos e a remoção de stopwords. Experimentos sobre dois córpus mostram que é benéfico fazer a remoção de stopwords em bigramas, independente se antes ou depois da aplicação de uma medida estatística. Como resultado da investigação, pode-se recomendar as medidas estatísticas mais apropriadas para o caso em que é possível remover stopwords e para o caso em que essa remoção não pode ser feita.

http://www.lbd.dcc.ufmg.br/colecoes/stil/2009/018.pdf

Caso o link acima esteja inválido, faça uma busca pelo texto completo na Web: Buscar na Web

Biblioteca Digital Brasileira de Computação - Contato: bdbcomp@lbd.dcc.ufmg.br
     Mantida por:
LBD