Análise de Dados
-
Conhecimentos de Base Recomendados
-
-
Objetivos
Reconhecer os desafios e necessidades específicas da persistência e análise de grandes volumes de dados
Conhecer as etapas de desenvolvimento de um projeto BI/Analytics
Modelar e dimensionar um Data wharehouse, selecionando de entre abordagens alternativas
Compreender as necessidades e boas práticas de codificação do processo ETL, considerando fontes de dados heterogéneas
Realizar questões analíticas através das extensões OLAP ao SQL
Selecionar sistemas OLAP e configurar a estrutura subjacente de dados conhecendo as respetivas implicações para a análise dos mesmos
Selecionar e diferenciar classes de algoritmos de data mining, bem como os pressupostos da sua utilização
Construir suportes de visualização e interação com resultados de diferentes análises dos dados, sobre plataformas existentes- Saber conduzir um projeto de BI
- Realizar modelos de dados
- Selecionar e aplicar algoritmos adequados para o problema
-
Métodos de Ensino
Exposição teórica de conceitos. Análise de casos de estudo. Aplicação prática dos conceitos.
As aulas seguirão um calendário inicialmente apresentado aos alunos contendo aulas presenciais, remotas e tarefas/milestones entregaveis. As aulas remotas exploram o uso das tecnologias envolvidas em ambiente digital, este e respetivos métodos, nas matérias selecionadas, de forma mais pedagógicamente produtiva. As aulas presencias mantêm exposição, exploração de exemplos/casos de estudo e exercicios de introfução e enquadramento das matérias. O numero de aulas na modalidade remota é inferior a 50% das aulas totais. -
Estágio(s)
Não
-
Programa
Revisão de conceitos fundamentais de Bases de Dados Relacionais
Conceitos e Definições elementares
O Processo de desenho de uma BD
Níveis de abstração, Modelos e Notações
Conversão do modelo E-R para MR
Formas normais
Linguagem SQL
Projetos BI e Datawarehousing
Sistemas Operacionais vs Sistemas de Apoio à Decisão
História dos Sistemas de Apoio à Decisão
Motivação dos projectos Business Intelligence
Modelos de dados multidimensionais
Modelação Dimensional
Obtenção de dimensões
Metáfora do cubo de dados
Navegação no cubo de dados
Tabelas de factos e dimensões
Granularidade da tabela de factos
Chaves e dimensões degeneradas
Chaves substitutas
Esquemas estrela e snowflake
Análise de Dimensões (inteligibilidade vs desempenho)
Modelação de factos: medidas
Recomendações complementares à modelação
Projecto de Data warehouses
Características de gestão de um projecto de criação e manutenção de um Data Warehouse
Desenho físico de data warehouses
Carregamento e manutenção do Data warehouse – O Processo ETL
Data Mining
Objetivos e tarefas típicas
Principais classes de métodos
Métodos representativos: Agrupamento, Classificação, Associação
Avaliação e modelos de classificação -
Demonstração de conteúdos
-
-
Demonstração da metodologia
-
-
Docente(s) responsável(eis)
Cláudio Miguel Garcia Loureiro dos Santos Sapateiro - 1.º Semestre
-
Bibliografia
Ralph Kimball e Margy Ross; The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, Wiley, 2002
Foster Provost, Tom Fawcett; Data Science for Business: What you need to know about data mining and data-analytic thinking (, O'Reilly Media, 2013. ISBN: 1449361323
Detalhes do curso
-
Código
MEC111014
-
Modo de Ensino
PRESENCIAL
-
ECTS
7.5
-
Duração
Semestral
-
Horas
15h Orientação Tutorial
30h Práticas e Laboratórios
30h Teórico-Práticas
