BDBComp
Parceria:
SBC
Grupos gramaticais e sintáticos em categorização automática com Support Vector Machines

Cassiana Fagundes da SilvaRenata Vieira

Uma das grandes problemáticas encontradas no processo de categorização é a alta dimensionalidade dos documentos e atributos. Normalmente essa alta dimensionalidade é representada pela abordagem denominada bag of words1. No entanto, esse problema pode ser resolvido na etapa de pré-processamento com a utilização de algoritmos para remoção de termos irrelevantes (stopwords) e redução dos termos semanticamente relacionados ao mesmo radical (stemming). Outra alternativa é o uso de técnicas de Processamento de Linguagem Natural (PLN) com o objetivo de preparar os dados de forma a permitir que se obtenha uma representação mais aproximada ao conteúdo dos documentos. Na literatura vários trabalhos podem ser encontrados adotando a união de áreas como PLN e MT [Aizawa, 2001], [Gonçalves and Quaresma, 2003], [Moschitti and Basili, 2004] e [Silva et al., 2004]. Sob esta perspectiva, este estudo tem como foco principal analisar o impacto de diferentes combinações gramaticais (em grupos contendo: substantivos, verbos e sintagmas nominais) no aprendizado do classificador com o algoritmo Support Vector Machines (SVM).

http://www.lbd.dcc.ufmg.br/colecoes/enia/2005/082.pdf

Caso o link acima esteja inválido, faça uma busca pelo texto completo na Web: Buscar na Web

Biblioteca Digital Brasileira de Computação - Contato: bdbcomp@lbd.dcc.ufmg.br
     Mantida por:
LBD