Automatic Information Extraction - Opção
-
Conhecimentos de Base Recomendados
Probabilidades e Estatistica
Inteligência Artificial -
Objetivos
- Aquisição de conhecimento para a formulação de um problema prático usando técnicas de reconhecimento de padrões
- Assegurar que os alunos adquirem capacidade de implementação e utilização de vários algoritmos de classificação supervisionada e não-supervisionada
- Fornecer competências teóricas e práticas para efetuar análise inteligente de dados não estruturados, nomeadamente em textos, e em particular recorrendo a exemplos comuns na internet, tais como páginas web, mensagens assíncronas e de e-mail, usando as técnicas de reconhecimento de padrões adquiridas nesta UC.
- Contacto com um conjunto de aplicações de análise inteligente de dados não estruturados incluindo a classificação documental, sistemas de recomendação web, análise de sentimentos em redes sociais, deteção de cibercrime, e outros.
- Desenvolvimento nos alunos da curiosidade científica e de capacidades para investigar aspetos inovadores na área de reconhecimento de padrões. -
Métodos de Ensino
Aulas teórico-práticas: exposição com auxílio de slides e exercícios de consolidação.
Aulas de laboratório: Exercícios de programação para resolver no computador, enquadrados por uma contextualização teórica prévia.
Será ainda estimulada a aprendizagem ativa por parte dos alunos, relativamente a aspetos do progama da UC ligados à aprendizagem automática, que os alunos desejem aprofundar de forma autónoma.
A utilização de meios de ensino à distância decorrentes da situação atual é documentada em anexo -
Estágio(s)
Não
-
Programa
Aspetos lecionados principalmente nas aulas teórico-práticas:
1. Introdução ao Reconhecimento de Padrões
1.1. Natureza do Problema
1.2. Áreas de Aplicação
1.3. Classificação Supervisionada e não-Supervisionada
2. Árvores de Decisão
2.1. Aprendizagem por Indução.
2.2. Algoritmo ID3
2.3. Regras Lógicas
3. Projeto de Classificador
3.1. Espaço vetorial de características
3.2. Funções Discriminantes
3.3. Matriz de confusão
3.4. Critério de avaliação
4. Redução de Dimensionalidade: Seleção vs. Extração de Características
5. Teoria da Decisão
5.1. Classificação Supervisionada Paramétrica: Modelo das Observações
5.1.1. Classificador de máximo a posteriori (MAP)
5.1.2. Classificador de Bayes
5.1.3. Estimação Paramétrica do Modelo das Observações
5.2. Classificação Supervisionada Não-Paramétrica
5.2.1. Classificador k-NN
6. Classificação não-Supervisionada
6.1. Algoritmo K-Médias
6.2. Clustering Hierárquico
Aspetos lecionados principalmente nas aulas prático-laboratoriais:
7. Mineração de Texto
7.1. Informação não Estruturada
7.2. Expressões Regulares
7.3. Operações Elementares
7.4. Técnicas de Pre-processamento
7.5. Seleção e Extração de Características
7.6. Categorização de Textos
7.7. Avaliação de Desempenho
8. Descoberta de Conhecimento
8.1. Medidas de Similaridade
8.1.1. Coocorrência de termos
8.1.2. Cosseno
8.1.3. Similaridade semântica
8.2. Pesquisa de documentos na web
8.3. Extração de Informação
8.3.1. Extração de Entidades
8.3.2. Extração de Relações
9. Aplicações -
Demonstração de conteúdos
-
-
Demonstração da metodologia
-
-
Docente(s) responsável(eis)
Joaquim Belo Lopes Filipe - 2.º Semestre
-
Bibliografia
Ronen Feldman and James Sanger, ; The Text Mining Handbook: Advanced Approaches In Analyzing Unstructured Data, Cambridge University Press. ISBN: ISBN-13 978-0-521-83657-9
Jorge Salvador Marques; Reconhecimento de Padrões, IST-Press, Lisboa
Detalhes do curso
-
Código
MEC121022
-
Modo de Ensino
PRESENCIAL
-
ECTS
7.5
-
Duração
Semestral
-
Horas
203h Teórico-Práticas
