
Análise e Tratamento de Dados Multivariados
-
Conhecimentos de Base Recomendados
-
-
Objetivos
Pretende-se nesta unidade curricular transmitir conceitos de probabilidades e estatística de modo a que os estudantes saibam aplicar e compreender técnicas estatísticas avançadas para a descrição estatística multivariada, cujo objectivo consiste em resumir e descrever os aspectos mais relevantes num conjunto de dados. Irão ser abordadas noções fundamentais da teoria da amostragem e de modelos probabilísticos discretos e contínuos. Aprofunda-se a abordagem à inferência estatística com referência aos testes de hipóteses. A abordagem teórica será sempre que possível acompanhada de exemplos ligados à biologia. Pretende-se também que os conhecimentos adquiridos nesta UC constituam uma base sólida para outras UC do plano de estudos deste curso.
-
Métodos de Ensino
Aulas teóricas-práticas onde serão, sempre que possível, apresentados exemplos de aplicação da matéria exposta com recurso a dados biológicos. Os estudantes vão dispor de um conjunto de fichas (disponibilizadas a partir do Moodle da ESTBarreiro/IPS) para consolidar a aprendizagem, sendo algumas resolvidas em sala de aula e outras realizadas em trabalho autónomo, com posterior supervisão do docente. Nas aulas será utilizado o software R.
-
Estágio(s)
Não
-
Programa
1. Introdução ao ambiente R - Fundamentos da linguagem e manipulação de dados em R;
2. Análise descritiva e apresentação gráfica avançada, com recurso ao R;
3. Modelos probabilísticos discretos e contínuos.
4. Análise de Regressão – regressão linear simples e Regressão linear múltipla- construção e validação do modelo; previsão;5. Testes de Hipóteses - hipóteses estatísticas, região crítica e critério de decisão, erros associados a uma decisão estatística;
5.1 Testes de ajustamento do Qui-Quadrado;
5.2 Testes paramétricos para amostras independentes:Teste Kolmogorov-Smirnov e Shapiro-Wilk – para testar se a distribuição é Normal; Teste Levene – para testar a homogeneidade de variâncias; Teste t-student e ANOVA - para comparação de médias populacionais.5.2 Testes não paramétricos: Teste Wilconxon; Teste Mann-Whitney; Teste Kruskal-Wallis.
5.3 Testes para comparação amostras emparelhadas;
6. Análise Multivariada. -
Demonstração de conteúdos
Esta UC procura proporcionar os conhecimentos necessários à análise e tratamento de dados estatísticos multivariados. Procura-se ainda, que os estudantes desenvolvam as competências e capacidades para usar e implementar, em ambiente R, funções que permitam a análise de um conjunto de dados específico.
-
Demonstração da metodologia
Esta UC tem como objectivo permitir que os estudantes sejam capazes de analisar os vários tipos de dados que aparecem nos problemas, a resolver, na área da Bioinformática.
Nas aulas teóricas-práticas serão lecionados alguns dos métodos estatísticos disponíveis na literatura para a análise de dados multivariados, sendo os mesmos, sempre que possível, aplicados a situações reais. Atendendo a que a escolha dos métodos estatísticos para uma análise estatística depende da amostra e do objetivo pretendido no estudo, a aplicação destes métodos requer muita prática, assim, a avaliação desta UC é composta por um trabalho a desenvolver pelos alunos e por um teste ou exame. -
Docente(s) responsável(eis)
-
-
Métodos de Avaliação
-
Bibliografia
Daniel W. W.; Biostatistics: a Foundation for Analysis in the Health Sciences., Wiley, 2005
Gama, S.; Pedrosa, A.; Introdução Computacional à Probabilidade e Estatística, Porto Editora, 2007
Oliveira, A.; Bioestatística Descodificada, Bioestatística, Epidemiologia e Investigação, Lidel, 2014
Guimarães, R. C.; Cabral, J. A. S.; Estatística., McGraw-Hill, 1999
Wackerly, D. D., Mendenhall, W. & Scheaffer, R. L.; Mathematical Statistics with Applications, Boston: PWS-Kent Publishing Company., 1996
Detalhes do curso
-
Código
BINF013
-
Modo de Ensino
PRESENCIAL
-
ECTS
5.5
-
Duração
Semestral
-
Horas
7.5h Orientação Tutorial
60h Teórico-Práticas