Módulos da Disciplina
Apresentação da Disciplina: Introdução à Ciência de Dados
Boas-vindas à disciplina! Visão geral do curso, metodologia de ensino, ferramentas utilizadas, cronograma, sistema de avaliação, pré-requisitos, expectativas e apresentação do plano de ensino completo. *Ementa: objetivos da disciplina, competências a serem desenvolvidas, bibliografia recomendada (livros, artigos e recursos online) e conexão com o mercado de trabalho. *Ferramentas: introdução ao ambiente de desenvolvimento (Python, Jupyter, Google Colab, VS Code), bibliotecas essenciais (Pandas, NumPy, Matplotlib, Scikit-learn) e configuração do setup inicial. *Metodologia: formato das aulas (teóricas/práticas), cronograma detalhado por semana, entregas, projetos, exercícios e formas de avaliação (provas, trabalhos, participação).
Setup & Ambiente Python
Instalação e configuração do ambiente Python, Anaconda, IDEs (Spyder, PyCharm), Jupyter Notebooks e Google Colab.
Fundamentos Python
Variáveis, operadores, strings, estruturas de controle, listas, tuplas, funções, arquivos, try/execpt, venv, pip, requirements, PEP8, programação funcional e orientação a objetos.
Estatística e Conceitos Fundamentais de Data Science
Estatística descritiva e inferencial, probabilidade, distribuições, correlação, regressão linear, validação, métricas e fundamentos que sustentam o Machine Learning. *Estatística: média, mediana, variância, desvio padrão, quartis, distribuição, probabilidade, amostragem, intervalo de confiança correlação, confiança .... *Ciência de Dados: matriz de confusão, heatmap, precisão, f1-score, curva ROC e AUC, overfitting, cross validation .....
📓NumPy + Pandas I — Exploração de Dados
Introdução às principais bibliotecas de apoio em Ciência de Dados (Arrays, CSV, DataFrames): *NumPy para arrays e cálculos numéricos e *Pandas para carregar, explorar e descrever datasets reais (CSV/Excel).
Data Wrangling com Pandas II
Identificação e tratamento de valores nulos (NaN), estratégias de imputação, remoção de duplicatas, correção de tipos de dados e garantia de qualidade para análise e Machine Learning.
Pandas III – Agregações e Respostas
Filtros, groupby e pivot_table para transformar dados em respostas reais.
Visualização de Dados
Matplotlib e Seaborn: histogramas, pizza, dispersão, mapas, detecção de outliers e leitura de gráficos.
ML I - Introdução ao Machine Learning
Conjuntos de dados, atributos, tipos de aprendizado, feature selection, cross validation, matriz de confusão, target e treino/teste.
ML II – Regressão Linear
Regressão linear simples, mínimos quadrados, prática e métricas básicas para regressão. Previsão de valores contínuos com Regressão Linear. Baseline, treino/teste, métricas (MAE, RMSE, R²), análise de resíduos e uso de datasets sintéticos e reais.
ML III — Classificação I (KNN, Naive Bayes, SVM)
Classificação na prática: baseline, treino/teste, métricas (Accuracy, Precision, Recall, F1), Matriz de Confusão e escolha do modelo. Três clássicos: KNN, Naive Bayes e SVM. Distâncias (euclidiana/manhattan), KNN para classificação e regressão, sklearn: fit, predict, score.
ML IV – Classificação II (Regressão Logística e Árvores de Decisão)
Da curva sigmóide que entrega probabilidades à árvore que cria regras automáticas: aprenda a dominar os modelos clássicos que formam a base das decisões inteligentes em problemas reais.
ML V – Ensembles (Random Forest, XGBoost e Boosting)
Descubra por que a união faz a força: combine centenas de modelos para obter previsões ultra-precisas. Domine o Random Forest e o XGBoost, as ferramentas favoritas para vencer competições e resolver problemas complexos no campo.
ML VI – Unsupervised Learning (Clustering: K-Means e PCA)
Aprenda a identificar padrões ocultos em dados agrícolas sem precisar de rótulos. Use o K-Means para criar zonas de manejo inteligentes e o PCA para reduzir a complexidade de imagens de satélite e sensores, focando no que realmente importa para a produtividade.
Deep Learning: Redes Neurais, CNNs e Visão Computacional no Agro
Mergulhe no poder das Redes Neurais Profundas. Deixe o computador 'enxergar' pragas e doenças em imagens de drone. Aprenda a usar Keras, PyTorch e YOLOv8 para criar soluções de alta precisão que estão revolucionando o monitoramento agrícola em tempo real.
Ao Alto e Além: Visão Computacional Avançada e o Ciclo no Campo
Vá além das caixas e classifique cada pixel. Aprenda como a segmentação de instâncias (U-Net e SAM) permite calcular biomassa e aplicar defensivos com taxa variável, do voo do drone à decisão inteligente no talhão.
INTERFACES: Transformando Modelos em Apps: Gradio e Streamlit no Agro
Não deixe sua IA presa no código. Aprenda a criar interfaces web profissionais em minutos para que qualquer pessoa possa usar seus modelos de detecção de pragas ou previsão de safra, direto pelo navegador ou celular.
PROJETO FINAL: Do Dado ao Produto e Encerramento
Chegou a hora de consolidar tudo! Construa um produto de dados ponta a ponta (coleta, limpeza, modelagem e interface web) focado em resolver um problema real. Prepare seu portfólio e celebre o fim da sua jornada na introdução à Ciência de Dados!
Código de backup
Se o navegador limpar o cache, você pode restaurar seu progresso colando o código abaixo. (Dica: guarde no e-mail, WhatsApp, Drive etc.)