Introdução à Ciência de Dados

Módulos da Disciplina

MÓDULO 00

Apresentação da Disciplina: Introdução à Ciência de Dados

Boas-vindas à disciplina! Visão geral do curso, metodologia de ensino, ferramentas utilizadas, cronograma, sistema de avaliação, pré-requisitos, expectativas e apresentação do plano de ensino completo. *Ementa: objetivos da disciplina, competências a serem desenvolvidas, bibliografia recomendada (livros, artigos e recursos online) e conexão com o mercado de trabalho. *Ferramentas: introdução ao ambiente de desenvolvimento (Python, Jupyter, Google Colab, VS Code), bibliotecas essenciais (Pandas, NumPy, Matplotlib, Scikit-learn) e configuração do setup inicial. *Metodologia: formato das aulas (teóricas/práticas), cronograma detalhado por semana, entregas, projetos, exercícios e formas de avaliação (provas, trabalhos, participação).

Apresentação Metodologia Plano de Ensino

MÓDULO 01

Setup & Ambiente Python

Instalação e configuração do ambiente Python, Anaconda, IDEs (Spyder, PyCharm), Jupyter Notebooks e Google Colab.

Fundamentos Python

Variáveis, operadores, strings, estruturas de controle, listas, tuplas, funções, arquivos, try/execpt, venv, pip, requirements, PEP8, programação funcional e orientação a objetos.

Hands-on Setup

MÓDULO 02

Estatística e Conceitos Fundamentais de Data Science

Estatística descritiva e inferencial, probabilidade, distribuições, correlação, regressão linear, validação, métricas e fundamentos que sustentam o Machine Learning. *Estatística: média, mediana, variância, desvio padrão, quartis, distribuição, probabilidade, amostragem, intervalo de confiança correlação, confiança .... *Ciência de Dados: matriz de confusão, heatmap, precisão, f1-score, curva ROC e AUC, overfitting, cross validation .....

Teoria Estatística

MÓDULO 03

NumPy + Pandas I — Exploração de Dados

Introdução às principais bibliotecas de apoio em Ciência de Dados (Arrays, CSV, DataFrames): *NumPy para arrays e cálculos numéricos e *Pandas para carregar, explorar e descrever datasets reais (CSV/Excel).

Prática NumPy Pandas Datasets

MÓDULO 04

Data Wrangling com Pandas II

Identificação e tratamento de valores nulos (NaN), estratégias de imputação, remoção de duplicatas, correção de tipos de dados e garantia de qualidade para análise e Machine Learning.

Fundamentos Prática Pandas Limpeza de Dados

MÓDULO 05

Pandas III – Agregações e Respostas

Filtros, groupby e pivot_table para transformar dados em respostas reais.

Prática Pandas Análise

MÓDULO 06

Visualização de Dados

Matplotlib e Seaborn: histogramas, pizza, dispersão, mapas, detecção de outliers e leitura de gráficos.

Hands-on Visualização

MÓDULO 07

ML I - Introdução ao Machine Learning

Conjuntos de dados, atributos, tipos de aprendizado, feature selection, cross validation, matriz de confusão, target e treino/teste.

Teoria Datasets

MÓDULO 08

ML II – Regressão Linear

Regressão linear simples, mínimos quadrados, prática e métricas básicas para regressão. Previsão de valores contínuos com Regressão Linear. Baseline, treino/teste, métricas (MAE, RMSE, R²), análise de resíduos e uso de datasets sintéticos e reais.

Teoria Hands-on Regressão ML

MÓDULO 09

ML III — Classificação I (KNN, Naive Bayes, SVM)

Classificação na prática: baseline, treino/teste, métricas (Accuracy, Precision, Recall, F1), Matriz de Confusão e escolha do modelo. Três clássicos: KNN, Naive Bayes e SVM. Distâncias (euclidiana/manhattan), KNN para classificação e regressão, sklearn: fit, predict, score.

Teoria Sklearn Modelos Clássicos

MÓDULO 10

ML IV – Classificação II (Regressão Logística e Árvores de Decisão)

Da curva sigmóide que entrega probabilidades à árvore que cria regras automáticas: aprenda a dominar os modelos clássicos que formam a base das decisões inteligentes em problemas reais.

Teoria Hands-on Scikit-Learn Métricas de Saúde Interpretabilidade

MÓDULO DEPLOY

INTERFACES: Transformando Modelos em Apps: Gradio e Streamlit no Agro

Não deixe sua IA presa no código. Exporte os modelos. Aprenda a criar interfaces web profissionais em minutos para que qualquer pessoa possa usar seus modelos de detecção de pragas ou previsão de safra, direto pelo navegador ou celular.

Hands-on Deploy Gradio Streamlit Web Apps Prototipagem

MÓDULO PROJETO

PROJETO FINAL: Do Dado ao Produto e Encerramento

Chegou a hora de consolidar tudo! Construa um produto de dados ponta a ponta (coleta, limpeza, modelagem e interface web) focado em resolver um problema real. Prepare seu portfólio e celebre o fim da sua jornada na introdução à Ciência de Dados!

Projeto Prático Portfólio Agro 5.0 Introdução introduzida

⚠️ Conteúdo Avançado / Opcional

A partir daqui, exploramos técnicas de alta performance e Deep Learning.

MÓDULO 11

ML V – Ensembles (Random Forest, XGBoost e Boosting)

Descubra por que a união faz a força: combine centenas de modelos para obter previsões ultra-precisas. Domine o Random Forest e o XGBoost, as ferramentas favoritas para vencer competições e resolver problemas complexos no campo.

Teoria Hands-on Agro 5.0 Random Forest XGBoost Performance

MÓDULO 12

ML VI – Unsupervised Learning (Clustering: K-Means e PCA)

Aprenda a identificar padrões ocultos em dados agrícolas sem precisar de rótulos. Use o K-Means para criar zonas de manejo inteligentes e o PCA para reduzir a complexidade de imagens de satélite e sensores, focando no que realmente importa para a produtividade.

Teoria Hands-on Clustering Zonas de Manejo K-Means PCA Escalonamento

MÓDULO 13

Deep Learning: Redes Neurais, CNNs e Visão Computacional no Agro

Mergulhe no poder das Redes Neurais Profundas. Deixe o computador 'enxergar' pragas e doenças em imagens de drone. Aprenda a usar Keras, PyTorch e YOLOv8 para criar soluções de alta precisão que estão revolucionando o monitoramento agrícola em tempo real.

Deep Learning Keras & PyTorch Visão Computacional Redes Neurais YOLOv8 GPU/Colab

MÓDULO 14

Ao Alto e Além: Visão Computacional Avançada e o Ciclo no Campo

Vá além das caixas e classifique cada pixel. Aprenda como a segmentação de instâncias (U-Net e SAM) permite calcular biomassa e aplicar defensivos com taxa variável, do voo do drone à decisão inteligente no talhão.

Visão Avançada Segmentação Ciclo Completo U-Net SAM (Meta) Taxa Variável

🚀 Próximo Passo na Jornada

Quer ir além da disciplina?

Este curso aprofunda conceitos fundamentais de Inteligência Artificial, como busca, aprendizado de máquina e redes neurais, utilizando Python na prática.

Ideal para quem quer evoluir de Ciência de Dados para IA.

🎓 Acessar curso CS50 AI