\[\large{\textbf{Universidade Federal do Paraná - Departamento de Estatística}}\] \[\large{\textbf{CE225 - Modelos Lineares Generalizados}}\] \[\large{\textbf{Prof. Cesar Augusto Taconeli}}\] \[\large{\textbf{2º Semestre - 2018}}\]


Notas - Atualizado em 14/12


Objetivo - Apresentar ao aluno a teoria e aplicações dos Modelos Lineares Generalizados, propostos originalmente em Nelder e Wedderburn (1972), que configuram extensões dos modelos lineares clássicos (com erros normalmente distribuídos) e que permitem analisar a relação funcional entre um conjunto de variáveis independentes e uma variável aleatória dependente com distribuição pertencente à família exponencial de distribuições.

Carga horária semanal: 04

Carga horária semestral: 60


Ementa

Família exponencial de distribuições: definição, propriedades e principais membros. Estrutura do modelo linear generalizado. Estimação, testes de hipóteses e métodos de diagnóstico em modelos lineares generalizados. Modelos para dados discretos. Modelos para dados contínuos assimétricos.


Conteúdo programático

MODELO LINEAR CLÁSSICO: Definição e propriedades do modelo linear com erros normais. Modelo de Regressão Linear. Modelo de Análise de Variância. Limitações do modelo linear clássico.

FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES: Definição e propriedades das distribuições pertencentes à família exponencial. Principais membros.

MODELO LINEAR GENERALIZADO: Introdução. Definição e propriedades do modelo. Funções de ligação, ligação canônica. Função desvio.

INFERÊNCIA PARA MLGs: Métodos de estimação e propriedades dos estimadores. Intervalos de confiança. Testes de hipóteses. Testes baseados na função desvio.

VERIFICAÇÃO DO MODELO: Avaliação do ajuste do modelo. Seleção de covariáveis e da função de ligação. Tipos de resíduos e análise gráfica. Identificação de pontos influentes.

MODELOS PARA DADOS DISCRETOS: Modelos para dados binários e proporções. Modelos para dados de contagem. Modelos log-lineares para tabelas de distribuição de frequências. O caso de super-dispersão e excesso de zeros em problemas de contagens.

MODELOS PARA DADOS CONTÍNUOS: O modelo linear geral como caso particular dos modelos lineares generalizados. Modelagem de dados com distribuição contínua assimétrica: distribuições Gama e Normal Inversa.


Procedimentos didáticos

Aulas teóricas e práticas, com atividades expositivas (usando quadro-negro e projetor). Trabalhos propostos a serem desenvolvidos ao longo do semestre.


Horário e local

Segunda-Feira: 19hs00 - 20hs30 - Sala Multimídia - DEST.

Quinta-Feira: 20hs45 - 22hs15 - Sala Multimídia - DEST.


Critérios de avaliação

Serão consideradas, a titulo de avaliação, as seguintes atividades, duas provas individuais e sem consulta (P1 e P2), além de trabalhos (T) propostos pelo docente. A média dos trabalhos e as notas de cada prova terão mesmo peso na composição da média final.


Datas das provas

Prova 1: 08/10/2018: 19hs, sala multimídia.

Prova 2: 22/11/2018: 20hs45, sala multimídia.

Exame Final: 10/12/2018: 19hs, sala multimídia.


Referências Bibliográficas

Bibliografia básica

PAULA, Gilberto A. MODELOS DE REGRESSÃO com apoio computacional

CORDEIRO, G.M.; DEMÉTRIO, C.G.B. Modelos Lineares Generalizados e Extensões

TURKMAN, Maria Antónia Amaral; SILVA, Giovani Loiola. Modelos Lineares Generalizados: da teoria à prática. In: VIII Congresso Anual da Sociedade Portuguesa de Estatística, Lisboa. 2000

AGRESTI, Alan. Foundations of linear and generalized linear models. John Wiley & Sons, 2015.

Bibliografia complementar


Resoluções

Resolução 30/17- Calendário acadêmico 2018

Resolução 37/97- Normas básicas dos cursos de graduação da UFPR


Trabalhos

Orientações

Atribuição e datas


Trabalho 1

Relatório - Grupo 1

Relatório - Grupo 2

Relatório - Grupo 3

Relatório - Grupo 4

Relatório - Grupo 5

Relatório - Grupo 6

Relatório - Grupo 7

Relatório - Grupo 8

Relatório - Grupo 9

Relatório - Grupo 10


Trabalho 2

Relatório - Grupo 1

Relatório - Grupo 2

Relatório - Grupo 3

Relatório - Grupo 4

Relatório - Grupo 5

Relatório - Grupo 6

Relatório - Grupo 7

Relatório - Grupo 8

Relatório - Grupo 9


Alguns links com bases de dados disponíveis:

http://www.stat.ufl.edu/~winner/datasets.html

http://archive.ics.uci.edu/ml/datasets.html?task=reg

http://college.cengage.com/mathematics/brase/understandable_statistics/7e/students/datasets/mlr/frames/frame.html

https://www.kaggle.com/datasets

http://www.ipardes.pr.gov.br/imp/index.php


Recursos computacionais

The R Project for Statistical Computing

RStudio - Open source and enterprise-ready professional software for R

The R Book

labestData

Quick R


Blogs e listas de discussão

R-Br;

Stack overflow - R.

R-bloggers


Materiais complementares

Maximum Likelihood Estimation

Apostila de Regressão Linear

Artigo - Nelder e Wedderburn (1972)

Capítulo de tese - Antonio Fernando Vieira (PUC-Rio)

Bootstraping Regression Models

Modelos de Regressão para Dados de Contagens com o R

Regression Models for Count Data in R

Generalized Additive Models for Location, Scale and Shape in R

Randomized Quantile Residuals

Artigo Rafael Moral (Gráficos meio normais com envelopes simulados)

Métodos de regularização - pacote glmnet


Módulo 1 - Introdução

Slides


Módulo 2 - Revisão de modelos lineares

Slides

Códigos - Reação química + tipos de embalagens (Modelo com erros normais)

Códigos - Vendas de cosméticos (Modelo com erros normais)


Módulo 3 - Modelo linear com erros heterocedásticos

Slides

Códigos - Data frame cars (Mínimos quadrados ponderados)


Módulo 4 - Família exponencial de distribuições

Slides


Módulo 5 - Modelos lineares generalizados

Slides


Módulo 6 - Estimação em modelos lineares generalizados

Slides

Códigos - Estimação em modelos lineares generalizados

Códigos - Sinistros de Automóveis (Dados de contagens)


Módulo 7 - Inferência em modelos lineares generalizados

Slides


Módulo 8 - Análise de deviance

Slides

Códigos - Avaliação da qualidade do ajuste usando simulação


Módulo 9 - Seleção de covariáveis

Slides

Códigos - Selecão de covariáveis


Módulo 10 - Diagnóstico do ajuste de MLGs

Slides

Códigos -Análise de resíduos


Módulo 11 - Regressão para dados binários

Slides

Slides - quase separação

Códigos - Auditoria

Dados - Auditoria

Códigos - Besouro da Farinha

Códigos - Estimação em MLG usando bootstrap

Códigos - Plebiscito no Chile


Módulo 12 - Regressão para dados binários - predição

Slides

Códigos - Análise de risco de crédito

Descrição - Análise de risco de crédito

Códigos - Base de dados sobre spams


Módulo 13 - Regressão para dados de contagens

Slides

Códigos - Quedas de idosos

Códigos - Cromossomos anormais (Regressão Poisson com termo offset)


Módulo 14 - Regressão para dados de contagens com super dispersão

Slides

Códigos - superdispersão (simulação)

Códigos - Executivos compartilhados

Códigos - Número de consultas ao médico (Austrália)

Códigos - Suplementação de ferro em ratos

Dados - Suplementação de ferro em ratos

Códigos - Doença da cevada

Dados - Doença da cevada


Módulo 15 - Regressão para dados contínuos assimétricos

Slides

Códigos - Tempo de vida de turbinas de avião

Códigos - Valor de sinistros


Exemplos adicionais

Códigos - Detecção de Spams (Dados binários)

Códigos - Aluguel de imóveis (Dados contínuos assimétricos)

Códigos - Executivos + cevada (Modelos de quase verossimilhança)


Vinhetas produzidas pelo aluno Lineu Alberto Cavazini de Freitas (monitor da disciplina)

Vinheta 1 - Modelo Linear (erros normais)

Vinheta 2 - Regressão para dados binários

Vinheta 3 - Regressão para dados de contagens


Exemplos de relatórios (alunos de outras ofertas)

Relatório 1

Relatório 2

Relatório 3


Bases de dados

Exemplo - Sinistros de automóveis

Exemplo - Reação Química

Exemplo - Vendas de cosméticos

Exemplo - Preços de imóveis

Exemplo - Risco de crédito

Exemplo - Risco de crédito (documentação)


Listas de exercícios

Modelos lineares: Exercícios 19 a 25 do capítulo 1 do livro do professor Gilberto de Paula. Os dados estão disponíveis no pacote labestData (PaulaEx1.13.19 a PaulaEx1.13.25).

2ª Lista de Exercícios

3ª Lista de Exercícios