\[\large{\textbf{Universidade Federal do Paraná - Departamento de Estatística}}\] \[\large{\textbf{CE225 - Modelos Lineares Generalizados}}\] \[\large{\textbf{Prof. Cesar Augusto Taconeli}}\] \[\large{\textbf{2º Semestre - 2017}}\]


Notas - Atualizado em 18/12


Objetivo - Apresentar ao aluno a teoria e aplicações dos Modelos Lineares Generalizados, propostos originalmente em Nelder e Wedderburn (1972), que configuram extensões dos modelos lineares clássicos (com erros normalmente distribuídos) e que permitem analisar a relação funcional entre um conjunto de variáveis independentes e uma variável aleatória dependente com distribuição pertencente à família exponencial de distribuições.

Carga horária semanal: 04

Carga horária semestral: 60


Ementa

Família exponencial de distribuições: definição, propriedades e principais membros. Estrutura do modelo linear generalizado. Estimação, testes de hipóteses e métodos de diagnóstico em modelos lineares generalizados. Modelos para dados discretos. Modelos para dados contínuos assimétricos.


Conteúdo programático

MODELO LINEAR CLÁSSICO: Definição e propriedades do modelo linear com erros normais. Modelo de Regressão Linear. Modelo de Análise de Variância. Limitações do modelo linear clássico.

FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES: Definição e propriedades das distribuições pertencentes à família exponencial. Principais membros.

MODELO LINEAR GENERALIZADO: Introdução. Definição e propriedades do modelo. Funções de ligação, ligação canônica. Função desvio.

INFERÊNCIA PARA MLGs: Métodos de estimação e propriedades dos estimadores. Intervalos de confiança. Testes de hipóteses. Testes baseados na função desvio.

VERIFICAÇÃO DO MODELO: Avaliação do ajuste do modelo. Seleção de covariáveis e da função de ligação. Tipos de resíduos e análise gráfica. Identificação de pontos influentes.

MODELOS PARA DADOS DISCRETOS: Modelos para dados binários e proporções. Modelos para dados de contagem. Modelos log-lineares para tabelas de distribuição de frequências. O caso de super-dispersão e excesso de zeros em problemas de contagens.

MODELOS PARA DADOS CONTÍNUOS: O modelo linear geral como caso particular dos modelos lineares generalizados. Modelagem de dados com distribuição contínua assimétrica: distribuições Gama e Normal Inversa.


Procedimentos didáticos

Aulas teóricas e práticas, com atividades expositivas (usando quadro-negro e projetor). Trabalhos propostos a serem desenvolvidos ao longo do semestre.


Horário e local

Terça-Feira: 20hs45 - 22hs15 - Sala Multimídia - DEST.

Sexta-Feira: 19hs00 - 20hs30 - Sala Multimídia - DEST.


Critérios de avaliação

Serão consideradas, a titulo de avaliação, as seguintes atividades, duas provas individuais e sem consulta (P1 e P2), além de trabalhos (T) propostos pelo docente. A média dos trabalhos e as notas de cada prova terão mesmo peso na composição da média final.


Datas das provas

Prova 1: 29/09/2017

Prova 2:


Referências Bibliográficas

Bibliografia básica

PAULA, Gilberto A. MODELOS DE REGRESSÃO com apoio computacional

CORDEIRO, G.M.; DEMÉTRIO, C.G.B. Modelos Lineares Generalizados e Extensões

TURKMAN, Maria Antónia Amaral; SILVA, Giovani Loiola. Modelos Lineares Generalizados: da teoria à prática. In: VIII Congresso Anual da Sociedade Portuguesa de Estatística, Lisboa. 2000

AGRESTI, Alan. Foundations of linear and generalized linear models. John Wiley & Sons, 2015.

Bibliografia complementar


Resoluções

Resolução 62/16- Calendário acadêmico 2017

Resolução 37/97- Normas básicas dos cursos de graduação da UFPR


Trabalhos

Trabalho 1 - Modelos lineares

Data limite para entrega: 25/08

Apresentação: 01/09

Orientações para os trabalhos

Composição dos grupos

Relatório - Grupo 1

Relatório - Grupo 2

Relatório - Grupo 3

Relatório - Grupo 4

Relatório - Grupo 6

Relatório - Grupo 7

Relatório - Grupo 9

Relatório - Grupo 10

Observações: O grupo 5 não encaminhou o relatório por e-mail. O grupo 8 não entregou o trabalho em nenhuma das duas versões solicitadas.

Trabalho 2 - Regressão para dados binários

Data limite para entrega: 24/10

Apresentação: 27/10

Apresentações:


Relatório - Grupo 1

Relatório - Grupo 2

Relatório - Grupo 3

Relatório - Grupo 4

Relatório - Grupo 5

Relatório - Grupo 6

Relatório - Grupo 7

Relatório - Grupo 9

Observações: Os demais grupos não encaminharam o relatório por e-mail até o momento.


Trabalho 3 - Regressão para dados de contagens

Data limite para entrega: 27/11

Apresentação: 28/11

Apresentações:


Relatório - Grupo 1

Relatório - Grupo 2

Relatório - Grupo 3

Relatório - Grupo 4

Relatório - Grupo 5

Relatório - Grupo 6

Relatório - Grupo 7

Relatório - Grupo 9

Relatório - Grupo 10


Alguns links com bases de dados:

http://www.stat.ufl.edu/~winner/datasets.html

http://archive.ics.uci.edu/ml/datasets.html?task=reg

http://college.cengage.com/mathematics/brase/understandable_statistics/7e/students/datasets/mlr/frames/frame.html

https://www.kaggle.com/datasets

http://www.ipardes.pr.gov.br/imp/index.php


Recursos computacionais

The R Project for Statistical Computing

RStudio - Open source and enterprise-ready professional software for R

The R Book

labestData

Quick R


Blogs e listas de discussão

R-Br;

Stack overflow - R.

R-bloggers


Materiais complementares

Maximum Likelihood Estimation

Apostila de Regressão Linear

Artigo - Nelder e Wedderburn (1972)

Capítulo de tese - Antonio Fernando Vieira (PUC-Rio)

Bootstraping Regression Models

Modelos de Regressão para Dados de Contagens com o R

Regression Models for Count Data in R

Generalized Additive Models for Location, Scale and Shape in R

Randomized Quantile Residuals

Dissertação Rafael Moral (Gráficos meio normais com envelopes simulados)


Slides

Aula 1 - Introdução

Aula 2 - Revisão de Modelos Lineares

Aula 3 - Modelo linear com erros heterocedásticos

Aula 4 - Família exponencial de distribuições

Aula 5 - Modelo Linear Generalizado

Aula 6 - Estimação em modelos lineares generalizados

Aula 7 - Inferência em modelos lineares generalizados

Aula 8 - Análise de deviance

Aula 9 - Seleção de covariáveis

Aula 10 - Diagnóstico do ajuste de MLGs

Aula 11 - Regressão para dados binários

Aula extra - O problema da (quase) separação

Aula 12 - Regressão para dados binários - predição

Aula 13 - Regressão para dados de contagens

Aula 14 - Regressão para dados de contagens com super dispersão

Aulas 13 e 14 (complemento) - O efeito da superdispersão (simulação)

Aulas 15 - Regressão para dados contínuos assimétricos


Códigos R

Disponíveis

Exemplo - Reação química + tipos de embalagens (Modelo com erros normais)

Exemplo - Vendas de cosméticos (Modelo com erros normais)

Exemplo - Data frame cars (Mínimos quadrados ponderados)

Exemplo - Estimação em modelos lineares generalizados

Exemplo - Sinistros de Automóveis (Dados de contagens)

Exemplo - Selecão de covariáveis

Exemplo - Avaliação da qualidade do ajuste usando simulação

Exemplo - Besouro da Farinha (Dados binários)

Exemplo - Estimação em MLG usando bootstrap

Exemplo - Plebiscito no Chile (Dados binários)

Exemplo - Análise de risco de crédito (Dados binários)

Exemplo - Análise de risco de crédito (Descrição)

Exemplo - Quedas de idosos (Dados de contagens)

Exemplo - Cromossomos anormais (Regressão Poisson com termo offset)

Exemplo - Executivos compartilhados (Regressão para contagens com super dispersão)

Exemplo - Número de consultas ao médico - Austrália

Exemplo - Tempo de vida de turbinas de avião (Dados contínuos assimétricos)

Em breve

Exemplo - Detecção de Spams (Dados binários)

Exemplo - Aluguel de imóveis (Dados contínuos assimétricos)

Exemplo - Executivos + cevada (Modelos de quase verossimilhança)


Vinhetas produzidas pelo Lineu (monitor da disciplina)

Vinheta 1 - Modelo Linear (erros normais)

Vinheta 2 - Regressão para dados binários

Vinheta 3 - Regressão para dados de contagens


Exemplos de relatórios (alunos de outras ofertas)

Relatório 1

Relatório 2

Relatório 3


Bases de dados

Exemplo - Sinistros de automóveis

Exemplo - Reação Química

Exemplo - Vendas de cosméticos

Exemplo - Preços de imóveis

Exemplo - Risco de crédito

Exemplo - Risco de crédito (documentação)


Listas de exercícios

Modelos lineares: Exercícios 19 a 25 do capítulo 1 do livro do professor Gilberto de Paula. Os dados estão disponíveis no pacote labestData (PaulaEx1.13.19 a PaulaEx1.13.25).

2ª Lista de Exercícios

3ª Lista de Exercícios