Carlos N. Silla Jr., Andre G. Hochuli, Celso A. A. Kaestner.
Neste trabalho é apresentada a arquitetura de uma plataforma automatizada para a extração de informações e sumarização de notícias em português, obtidas a partir da web. Esta plataforma foi aplicada a um estudo para a extração de informações sobre notícias de jogos de futebol. Foram realizados três experimentos visando estabelecer limites inferiores (baselines) para experimentos futuros, e também para observar o comportamento de sumarizadores existentes atuando de forma complementar à tarefa de extração.
http://www.lbd.dcc.ufmg.br/colecoes/til/2004/005.pdf
Caso o link acima esteja inválido, faça uma busca pelo texto completo na Web: Buscar na Web