Esse é um curso completo para a formação de Cientista de Dados, com mais de 250 exercícios de A-Z, abordando desde os conceitos mais básicos até os mais avançados. Foca em metodologias ativas, onde o aluno é protagonista nesse processo, assim, trazemos diversos exercícios resolvidos, notebooks de resumo dos conteúdos e muito mais, com o foco na aprendizagem da programação baseada na prática e simulação de problemas reais (como limpeza de dados, tratamento de missings, separação de dados em treino e teste, agrupamento e junção de datasets, dentre outros).
Neste sentido, o curso possui exercícios resolvidos sobre as principais bibliotecas do Python para Data Science: NumPy, Pandas, Matplotlib e Seaborn. Além do que, busca resgatar conceitos elementares da Álgebra Linear, por meio da biblioteca NumPy.
Em linhas gerais, o curso apresenta exercícios que englobam as principais funções do NumPy para Data Science, como funções de agregação, definição de matrizes, operações matricias, dentre outras. Quanto ao Pandas, busca-se oferecer um panorama geral partindo da definição de Series e DataFrames, inspeção de datasets, seleção booleana, filtro de linhas de colunas, remoção de linhas e colunas, tratamento de dados ausentes, funções de agrupamento e junção, abertura e escrita de arquivos, funções de estatística descritiva, dentre outros tópicos.
Por fim, apresentam-se diversos problemas relacionados a visualização de dados, com as bibliotecas Matplotlib e Seaborn, a partir de datasets clássicos. Noções de Séries temporais e Finanças também são introduzidas. Há ainda exemplos de como preparar um dataset para um projeto de Machine Learning.
O curso possui ainda um E-book de fundamentos de Python, abordando os seguintes tópicos:
- Primeiros passos com Python!
- Declaração de variáveis e tipos primitivos
- Strings
- Operadores
- Estruturas condicionais
- Estruturas de repetição
- Estruturas de dados