\[\large{\textbf{Universidade Federal do Paraná - Departamento de Estatística}}\] \[\large{\textbf{CE225 - Modelos Lineares Generalizados}}\] \[\large{\textbf{Prof. Cesar Augusto Taconeli}}\] \[\large{\textbf{2º Semestre - 2017}}\]
Objetivo - Apresentar ao aluno a teoria e aplicações dos Modelos Lineares Generalizados, propostos originalmente em Nelder e Wedderburn (1972), que configuram extensões dos modelos lineares clássicos (com erros normalmente distribuídos) e que permitem analisar a relação funcional entre um conjunto de variáveis independentes e uma variável aleatória dependente com distribuição pertencente à família exponencial de distribuições.
Carga horária semanal: 04
Carga horária semestral: 60
Ementa
Família exponencial de distribuições: definição, propriedades e principais membros. Estrutura do modelo linear generalizado. Estimação, testes de hipóteses e métodos de diagnóstico em modelos lineares generalizados. Modelos para dados discretos. Modelos para dados contínuos assimétricos.
Conteúdo programático
MODELO LINEAR CLÁSSICO: Definição e propriedades do modelo linear com erros normais. Modelo de Regressão Linear. Modelo de Análise de Variância. Limitações do modelo linear clássico.
FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES: Definição e propriedades das distribuições pertencentes à família exponencial. Principais membros.
MODELO LINEAR GENERALIZADO: Introdução. Definição e propriedades do modelo. Funções de ligação, ligação canônica. Função desvio.
INFERÊNCIA PARA MLGs: Métodos de estimação e propriedades dos estimadores. Intervalos de confiança. Testes de hipóteses. Testes baseados na função desvio.
VERIFICAÇÃO DO MODELO: Avaliação do ajuste do modelo. Seleção de covariáveis e da função de ligação. Tipos de resíduos e análise gráfica. Identificação de pontos influentes.
MODELOS PARA DADOS DISCRETOS: Modelos para dados binários e proporções. Modelos para dados de contagem. Modelos log-lineares para tabelas de distribuição de frequências. O caso de super-dispersão e excesso de zeros em problemas de contagens.
MODELOS PARA DADOS CONTÍNUOS: O modelo linear geral como caso particular dos modelos lineares generalizados. Modelagem de dados com distribuição contínua assimétrica: distribuições Gama e Normal Inversa.
Procedimentos didáticos
Aulas teóricas e práticas, com atividades expositivas (usando quadro-negro e projetor). Trabalhos propostos a serem desenvolvidos ao longo do semestre.
Horário e local
Terça-Feira: 20hs45 - 22hs15 - Sala Multimídia - DEST.
Sexta-Feira: 19hs00 - 20hs30 - Sala Multimídia - DEST.
Critérios de avaliação
Serão consideradas, a titulo de avaliação, as seguintes atividades, duas provas individuais e sem consulta (P1 e P2), além de trabalhos (T) propostos pelo docente. A média dos trabalhos e as notas de cada prova terão mesmo peso na composição da média final.
Datas das provas
Prova 1: 29/09/2017
Prova 2:
Referências Bibliográficas
Bibliografia básica
PAULA, Gilberto A. MODELOS DE REGRESSÃO com apoio computacional
CORDEIRO, G.M.; DEMÉTRIO, C.G.B. Modelos Lineares Generalizados e Extensões
AGRESTI, Alan. Foundations of linear and generalized linear models. John Wiley & Sons, 2015.
Bibliografia complementar
CASELLA, G.; BERGER, R. L. Inferência estatística-tradução da 2ª edição norte-americana. Centage Learning, 2011.
DAVISON, Anthony Christopher; HINKLEY, David Victor. Bootstrap methods and their application. Cambridge university press, 1997.
DOBSON, Annette J.; BARNETT, Adrian. An introduction to generalized linear models. CRC press, 2008.FOX, John. Applied regression analysis, linear models, and related methods. Sage Publications, Inc, 2.ed. 2008.
FARAWAY, Julian J. Linear models with R. CRC Press, 2014.
FARAWAY, Julian J. Extending the linear model with R: generalized linear, mixed effects and nonparametric regression models. CRC press, 2016.
MCCULLAGH, P.; NELDER, J.A. Generalized Linear Models. Chapman & Hall, 2.ed.,1989.
MYERS, R. H., MONTGOMERY, D. C., VINING, G. G., & ROBINSON, T. J. Generalized linear models: with applications in engineering and the sciences. John Wiley & Sons, 2012.
MONTGOMERY, Douglas C.; PECK, Elizabeth A.; VINING, G. Geoffrey. Introduction to linear regression analysis. John Wiley & Sons, 2012.
Resoluções
Resolução 62/16- Calendário acadêmico 2017
Resolução 37/97- Normas básicas dos cursos de graduação da UFPR
Trabalhos
Trabalho 1 - Modelos lineares
Data limite para entrega: 25/08
Apresentação: 01/09
Observações: O grupo 5 não encaminhou o relatório por e-mail. O grupo 8 não entregou o trabalho em nenhuma das duas versões solicitadas.
Trabalho 2 - Regressão para dados binários
Data limite para entrega: 24/10
Apresentação: 27/10
Apresentações:
Grupo 2, com discussão do grupo 7;
Grupo 4, com discussão do grupo 9;
Grupo 5, com discussão do grupo 4.
Observações: Os demais grupos não encaminharam o relatório por e-mail até o momento.
Trabalho 3 - Regressão para dados de contagens
Data limite para entrega: 27/11
Apresentação: 28/11
Apresentações:
Grupo 1, com discussão do grupo 6;
Grupo 6, com discussão do grupo 2;
Grupo 7, com discussão do grupo 5;
Grupo 10, com discussão do grupo 1.
Alguns links com bases de dados:
http://www.stat.ufl.edu/~winner/datasets.html
http://archive.ics.uci.edu/ml/datasets.html?task=reg
https://www.kaggle.com/datasets
http://www.ipardes.pr.gov.br/imp/index.php
Recursos computacionais
The R Project for Statistical Computing
RStudio - Open source and enterprise-ready professional software for R
Blogs e listas de discussão
R-Br;
Materiais complementares
Artigo - Nelder e Wedderburn (1972)
Capítulo de tese - Antonio Fernando Vieira (PUC-Rio)
Bootstraping Regression Models
Modelos de Regressão para Dados de Contagens com o R
Regression Models for Count Data in R
Generalized Additive Models for Location, Scale and Shape in R
Dissertação Rafael Moral (Gráficos meio normais com envelopes simulados)
Slides
Aula 2 - Revisão de Modelos Lineares
Aula 3 - Modelo linear com erros heterocedásticos
Aula 4 - Família exponencial de distribuições
Aula 5 - Modelo Linear Generalizado
Aula 6 - Estimação em modelos lineares generalizados
Aula 7 - Inferência em modelos lineares generalizados
Aula 9 - Seleção de covariáveis
Aula 10 - Diagnóstico do ajuste de MLGs
Aula 11 - Regressão para dados binários
Aula extra - O problema da (quase) separação
Aula 12 - Regressão para dados binários - predição
Aula 13 - Regressão para dados de contagens
Aula 14 - Regressão para dados de contagens com super dispersão
Aulas 13 e 14 (complemento) - O efeito da superdispersão (simulação)
Aulas 15 - Regressão para dados contínuos assimétricos
Códigos R
Disponíveis
Exemplo - Reação química + tipos de embalagens (Modelo com erros normais)
Exemplo - Vendas de cosméticos (Modelo com erros normais)
Exemplo - Data frame cars (Mínimos quadrados ponderados)
Exemplo - Estimação em modelos lineares generalizados
Exemplo - Sinistros de Automóveis (Dados de contagens)
Exemplo - Selecão de covariáveis
Exemplo - Avaliação da qualidade do ajuste usando simulação
Exemplo - Besouro da Farinha (Dados binários)
Exemplo - Estimação em MLG usando bootstrap
Exemplo - Plebiscito no Chile (Dados binários)
Exemplo - Análise de risco de crédito (Dados binários)
Exemplo - Análise de risco de crédito (Descrição)
Exemplo - Quedas de idosos (Dados de contagens)
Exemplo - Cromossomos anormais (Regressão Poisson com termo offset)
Exemplo - Executivos compartilhados (Regressão para contagens com super dispersão)
Exemplo - Número de consultas ao médico - Austrália
Exemplo - Tempo de vida de turbinas de avião (Dados contínuos assimétricos)
Em breve
Exemplo - Detecção de Spams (Dados binários)
Exemplo - Aluguel de imóveis (Dados contínuos assimétricos)
Exemplo - Executivos + cevada (Modelos de quase verossimilhança)
Vinhetas produzidas pelo Lineu (monitor da disciplina)
Vinheta 1 - Modelo Linear (erros normais)
Vinheta 2 - Regressão para dados binários
Vinheta 3 - Regressão para dados de contagens
Exemplos de relatórios (alunos de outras ofertas)
Bases de dados
Exemplo - Sinistros de automóveis
Exemplo - Vendas de cosméticos
Exemplo - Risco de crédito (documentação)
Listas de exercícios
Modelos lineares: Exercícios 19 a 25 do capítulo 1 do livro do professor Gilberto de Paula. Os dados estão disponíveis no pacote labestData (PaulaEx1.13.19 a PaulaEx1.13.25).