BDBComp
Parceria:
SBC
Complementação dos Dados no Contexto do Processo de ETL

Lívia de Souza RibeiroMaria Cláudia CavalcantiRonaldo Ribeiro Goldschmidt

Os dados contidos em um Data Warehouse (DW) típico são provenientes de diversas fontes. É necessário que os valores contidos no DW apresentem boa qualidade para que numa futura análise dos mesmos seja apresentado resultado coerente. Entretanto, dados de algumas fontes podem não estar disponíveis em determinadas datas/períodos. Assim, é comum ocorrer ausência de valores na tabela de fatos do DW. No processo de carga deste ambiente, conhecido como ETL ("Extration, Tranformation, Load"), a etapa de Transformação tem como objetivo principal melhorar a qualidade dos dados, amenizando os problemas existentes na base. Assim sendo, esta etapa também trata dos dados ausentes no ambiente de DW. Uma das abordagens utilizadas na resolução do problema da ausência dos valores nas tabelas é a técnica de imputação de dados. Esta técnica consiste no preenchimento das ausências em uma tabela com novos valores. Entre as técnicas de imputação, a mais utilizada é a observação dos valores presentes na tabela para a geração de um novo valor. No entanto, esta técnica não leva em consideração o enriquecimento da tabela. No contexto do processo ETL os dados das dimensões podem ser utilizados para enriquecimento da tabela de fatos. A proposta deste trabalho, portanto, é o desenvolvimento de uma estratégia para tratar do problema de ausência de valores na tabela de fatos de um DW, durante o processo de ETL, considerando o enriquecimento da mesma, no sentido de obter melhores resultados de imputação.

http://www.lbd.dcc.ufmg.br:8080/colecoes/wtdbd/2009/010.pdf

Caso o link acima esteja inválido, faça uma busca pelo texto completo na Web: Buscar na Web

Biblioteca Digital Brasileira de Computação - Contato: bdbcomp@lbd.dcc.ufmg.br
     Mantida por:
LBD