Prof. Jéfer Benedett Dörr
UFPR Palotina • Licenciatura em Computação
Avatar Prof. Jéfer Benedett Dörr
DEE645 • 2026/1

Introdução à Ciência de Dados

Licenciatura em Computação • UFPR Palotina

📅 23/02 - 27/06/2026 ⏱️ 30 horas 📚 15 encontros 💻 EAD Assíncrono 📜 Ficha 2
🎓 UFPR Virtual - Introdução à Ciência de Dados EaD - Jéfer
Progresso do aluno
0/13 (0%)

Módulos da Disciplina

MÓDULO 00

Apresentação da Disciplina: Introdução à Ciência de Dados

Boas-vindas à disciplina! Visão geral do curso, metodologia de ensino, ferramentas utilizadas, cronograma, sistema de avaliação, pré-requisitos, expectativas e apresentação do plano de ensino completo. *Ementa: objetivos da disciplina, competências a serem desenvolvidas, bibliografia recomendada (livros, artigos e recursos online) e conexão com o mercado de trabalho. *Ferramentas: introdução ao ambiente de desenvolvimento (Python, Jupyter, Google Colab, VS Code), bibliotecas essenciais (Pandas, NumPy, Matplotlib, Scikit-learn) e configuração do setup inicial. *Metodologia: formato das aulas (teóricas/práticas), cronograma detalhado por semana, entregas, projetos, exercícios e formas de avaliação (provas, trabalhos, participação).

MÓDULO 01

Setup & Ambiente Python

Instalação e configuração do ambiente Python, Anaconda, IDEs (Spyder, PyCharm), Jupyter Notebooks e Google Colab.

Fundamentos Python

Variáveis, operadores, strings, estruturas de controle, listas, tuplas, funções, arquivos, try/execpt, venv, pip, requirements, PEP8, programação funcional e orientação a objetos.

MÓDULO 02

Estatística e Conceitos Fundamentais de Data Science

Estatística descritiva e inferencial, probabilidade, distribuições, correlação, regressão linear, validação, métricas e fundamentos que sustentam o Machine Learning. *Estatística: média, mediana, variância, desvio padrão, quartis, distribuição, probabilidade, amostragem, intervalo de confiança correlação, confiança .... *Ciência de Dados: matriz de confusão, heatmap, precisão, f1-score, curva ROC e AUC, overfitting, cross validation .....

📓
MÓDULO 03

NumPy + Pandas I — Exploração de Dados

Introdução às principais bibliotecas de apoio em Ciência de Dados (Arrays, CSV, DataFrames): *NumPy para arrays e cálculos numéricos e *Pandas para carregar, explorar e descrever datasets reais (CSV/Excel).

MÓDULO 04

Data Wrangling com Pandas II

Identificação e tratamento de valores nulos (NaN), estratégias de imputação, remoção de duplicatas, correção de tipos de dados e garantia de qualidade para análise e Machine Learning.

MÓDULO 05

Pandas III – Agregações e Respostas

Filtros, groupby e pivot_table para transformar dados em respostas reais.

MÓDULO 06

Visualização de Dados

Matplotlib e Seaborn: histogramas, pizza, dispersão, mapas, detecção de outliers e leitura de gráficos.

MÓDULO 07

ML I - Introdução ao Machine Learning

Conjuntos de dados, atributos, tipos de aprendizado, feature selection, cross validation, matriz de confusão, target e treino/teste.

MÓDULO 08

ML II – Regressão Linear

Regressão linear simples, mínimos quadrados, prática e métricas básicas para regressão. Previsão de valores contínuos com Regressão Linear. Baseline, treino/teste, métricas (MAE, RMSE, R²), análise de resíduos e uso de datasets sintéticos e reais.

MÓDULO 09

ML III — Classificação I (KNN, Naive Bayes, SVM)

Classificação na prática: baseline, treino/teste, métricas (Accuracy, Precision, Recall, F1), Matriz de Confusão e escolha do modelo. Três clássicos: KNN, Naive Bayes e SVM. Distâncias (euclidiana/manhattan), KNN para classificação e regressão, sklearn: fit, predict, score.

MÓDULO 10

ML IV – Classificação II (Regressão Logística e Árvores de Decisão)

Da curva sigmóide que entrega probabilidades à árvore que cria regras automáticas: aprenda a dominar os modelos clássicos que formam a base das decisões inteligentes em problemas reais.

MÓDULO 11

ML V – Ensembles (Random Forest, XGBoost e Boosting)

Descubra por que a união faz a força: combine centenas de modelos para obter previsões ultra-precisas. Domine o Random Forest e o XGBoost, as ferramentas favoritas para vencer competições e resolver problemas complexos no campo.

MÓDULO 12

ML VI – Unsupervised Learning (Clustering: K-Means e PCA)

Aprenda a identificar padrões ocultos em dados agrícolas sem precisar de rótulos. Use o K-Means para criar zonas de manejo inteligentes e o PCA para reduzir a complexidade de imagens de satélite e sensores, focando no que realmente importa para a produtividade.

MÓDULO 13

Deep Learning: Redes Neurais, CNNs e Visão Computacional no Agro

Mergulhe no poder das Redes Neurais Profundas. Deixe o computador 'enxergar' pragas e doenças em imagens de drone. Aprenda a usar Keras, PyTorch e YOLOv8 para criar soluções de alta precisão que estão revolucionando o monitoramento agrícola em tempo real.

MÓDULO 14

Ao Alto e Além: Visão Computacional Avançada e o Ciclo no Campo

Vá além das caixas e classifique cada pixel. Aprenda como a segmentação de instâncias (U-Net e SAM) permite calcular biomassa e aplicar defensivos com taxa variável, do voo do drone à decisão inteligente no talhão.

MÓDULO 15

INTERFACES: Transformando Modelos em Apps: Gradio e Streamlit no Agro

Não deixe sua IA presa no código. Aprenda a criar interfaces web profissionais em minutos para que qualquer pessoa possa usar seus modelos de detecção de pragas ou previsão de safra, direto pelo navegador ou celular.

MÓDULO 16

PROJETO FINAL: Do Dado ao Produto e Encerramento

Chegou a hora de consolidar tudo! Construa um produto de dados ponta a ponta (coleta, limpeza, modelagem e interface web) focado em resolver um problema real. Prepare seu portfólio e celebre o fim da sua jornada na introdução à Ciência de Dados!