BDBComp
Parceria:
SBC
Uma Arquitetura Híbrida LSTM-CNN para Reconhecimento de Entidades Nomeadas em Textos Naturais em Língua Portuguesa

Carlos A. E. M. JúniorLuciano A. BarbosaHendrik T. Macedo

Existem modelos de classificadores que realizam bem a tarefa do reconhecimentode entidades nomeadas em texto a partir de grandes esforçosem definir muitas características baseando-se em conhecimento especializado.Neste trabalho é proposta uma arquitetura de Rede Neural Profunda que utilizauma rede LSTM para detectar entidades nomeadas sobre vários corporada língua portuguesa do Brasil. Além disso, são usados word embeddings prétreinadose uma rede CNN para extração automática de features das palavraspara geração de vetores de char embeddings. No trabalho são definidoscenários para experimentação onde a arquitetura proposta é comparada comuma arquitetura que também utiliza word e char embeddings, obtendo melhordesempenho utilizando-se apenas word embeddings, e em outro cenário a arquiteturaproposta é comparada com um classificador CRF, obtendo melhordesempenho.

http://www.lbd.dcc.ufmg.br/colecoes/eniac/2016/021.pdf

Caso o link acima esteja inválido, faça uma busca pelo texto completo na Web: Buscar na Web

Biblioteca Digital Brasileira de Computação - Contato: bdbcomp@lbd.dcc.ufmg.br
     Mantida por:
LBD