Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
PCS-SGBD Projeto de sistema analítico Trabalho em grupo de 2 ou 3 alunos Orientações Gerais O projeto consiste no desenvolvimento de uma aplicação simples de BI&A, compreendendo as etapas de modelagem dimensional, ETL e análise em ferramenta OLAP. Estas orientações são gerais e serão estendidas de acordo com as especificidades de cada caso, dependendo das fontes de dados selecionadas pela equipe. Em princípio, o projeto compreenderá as seguintes etapas: Selecionar uma ou mais fontes de dados reais, com, no mínimo, três arquivos (csv, planilhas, tabelas ou equivalentes) que sejam relacionados através de campos comuns. Dada a disponibilidade de dados reais, as fontes devem ser públicas, obtidas em portais de dados abertos governamentais ou privados, como, por exemplo: http://dados.gov.br/ http://www.transparencia.org.br http://www.portaltransparencia.gov.br/ http://www.transparencia.rj.gov.br http://riotransparente.rio.rj.gov.br/ páginas de Acesso à Informação publicados por órgãos públicos e outros portais similares, nacionais e internacionais. Existem portais internacionais que publicam datasets de dados abertos, utilizados em competições de análise de dados. https://www.kaggle.com/ Além dos dados brutos, é desejável que as fontes possuam também dicionário de dados que contenha a descrição dos campos e o relacionamento entre os arquivos através de campos comuns. Formular, pelo menos, três questões de análise do “negócio” (no caso, sob o ponto de vista do cidadão comum) sobre as fontes de dados selecionadas, como, por exemplo, Total ou Média de despesas com compras de remédios, por ano, por município, por órgão responsável, por fornecedor, por convênio. Obter um esquema relacional dos arquivos selecionados, seja por engenharia reversa de banco de dados ou por construção do esquema através de dicionário de dados. Desenhar o esquema relacional na ferramenta SQL Power Architect Community Edition. Observação: alternativamente, as etapas 1 e 2 podem ser supridas com um banco de dados transacional com dados reais, para o qual exista ou se obtenha o esquema relacional. Converter o esquema relacional num esquema estrela, com, pelo menos, uma tabela de fatos e três tabelas de dimensão. Desenhar o esquema estrela na ferramenta SQL Power Architect Community Edition e gerar as tabelas correspondentes no PostgreSQL, database <Nome_do_Projeto>, schema public. Carregar os dados disponíveis nas fontes selecionadas, usando o Pentaho Data Integration, nas tabelas do PostgreSQL, realizando os passos (steps) necessários de extração e transformação. Salvar a sequência de passos em um arquivo <Nome_do_Projeto>.ktr. Criar um cubo OLAP com a finalidade de responder às questões formuladas na etapa 1, usando o SQL Power Architect Community Edition. Publicar o cubo numa ferramenta de análise como Tableau ou Power BI. Usando o cubo OLAP publicado, realizar, pelo menos, as seguintes ações: análises correspondentes às questões formuladas na etapa 1; relatórios e gráficos sobre as mesmas questões. Apresentar o trabalho, de acordo com roteiro a ser definido, em data a ser estabelecida. Obs: Os artefatos a serem entregues para avaliação serão definidos caso a caso, com base nos passos do trabalho acima estabelecidos. Em breve, serão postadas tarefas no Moodle relativas às etapas do projeto.