Sou um Cientista de dados em formação , buscando dados, limpando, manipulando, analisando os dados. Criando modelos de Machine Learning supervisionado (regressão e classificação)e não supervisionado(clusterização)overfitting e underfitting, conjuntos de treino/validação/teste e validação cruzada. Com dados estruturado e não estruturados. Deploy e storytelling dos projetos . Estudando sempre em evolução.
Conheça mais sobre os meus projetos, publicações na área de dados.
- Meu perfil no [Linkedin](https://www.linkedin.com/in/aruanacortezdatascientist/
- Meu perfil no Instagram
- Minha página no Facebook
- Visite meu site Site
- Conheça minhas publicações Medium
- Meu canal no YouTube
Projeto de análise e construção de modelos de previsão, classificação ,recomendação e Série temporal.
- Coleta de dados
- Primeiros passos para a coleta de dados.
- Passamos para etapa de manipulação de dados com Python puro e Pandas.
- Visualização Exploratóriade dados
- Como os dados estão distribuídos?
- Há outliers? Se sim, como podemos lidar com eles?
- Quais visualizações podemos fazer para facilitar o entendimento desses dados?
- Existe correlação entre as colunas? Como podemos medir tal correlação?
- Com os dados que temos à disposição, qual seria o jeito mais fácil e simples para montarmos um preditor, classificadro e um sistema de recomendação ?
- Visualizações das distribuições, dispersão (scatter plot), pairplot, heatmap e boxplot.
- Estatistica Descritiva distribuição, média, mediana, moda, desvio padrão, tipos de distribuições quartis e tratamento de outliers.
- Modelagem do algoritimo.
- Tunar os hiperparametros
- Avaliar as métricas dos modelos
- Deploy