Este projeto contém três questões medianas de aprendizado de máquina resolvidas com Python. O objetivo é demonstrar habilidades práticas na aplicação de algoritmos de aprendizado de máquina para resolver problemas específicos.
data/
: Contém os conjuntos de dados utilizados nas questões.notebooks/
: Contém os notebooks Jupyter com as soluções das questões.scripts/
: Contém scripts Python utilizados para preprocessamento de dados e treinamento de modelos.results/
: Contém os resultados e visualizações gerados pelos notebooks.
-
Questão 1: Classificador KNN para o conjunto de dados Iris
- Algoritmo utilizado: K-Nearest Neighbors (KNN)
- Descrição da solução: Implementação de um classificador KNN para o conjunto de dados Iris, com divisão dos dados em conjuntos de treino e teste, treinamento do modelo e avaliação da precisão.
-
Questão 2: Regressão Linear para prever o preço de casas com base no conjunto de dados Boston Housing
- Algoritmo utilizado: Regressão Linear
- Descrição da solução: Utilização da regressão linear para prever o preço de casas, com divisão dos dados, treinamento do modelo e avaliação do desempenho usando o erro quadrático médio (MSE).
-
Questão 3: Árvore de Decisão para classificar o conjunto de dados Wine
- Algoritmo utilizado: Árvore de Decisão
- Descrição da solução: Implementação de uma árvore de decisão para classificar o conjunto de dados Wine, com divisão dos dados, treinamento do modelo e avaliação da precisão.
-
Questão 4: Clusterização K-Means do conjunto de dados Iris
- Algoritmo utilizado: K-Means
- Descrição da solução: Utilização do algoritmo K-Means para agrupar o conjunto de dados Iris e visualização dos clusters resultantes.
-
Questão 5: Análise de Componentes Principais (PCA) do conjunto de dados Digits
- Algoritmo utilizado: PCA
- Descrição da solução: Aplicação da Análise de Componentes Principais (PCA) ao conjunto de dados Digits para reduzir a dimensionalidade para 2 componentes principais e visualização dos dados.
- Python 3.x
- Bibliotecas necessárias:
- numpy
- pandas
- scikit-learn
- matplotlib
- seaborn
- jupyter
-
Clone este repositório:
git clone https://github.com/BackandDeveloper/seu-repositorio.git
-
Navegue até o diretório do projeto:
cd seu-repositorio
-
Instale as dependências
pip install -r requirements.txt
-
Execute os notebooks Jupyter:
jupyter notebook
Os resultados das análises e modelos treinados estão disponíveis na pasta results/. Cada notebook contém visualizações e métricas de desempenho dos modelos.
Contribuições são bem-vindas! Sinta-se à vontade para abrir issues e pull requests.
Este projeto está licenciado sob a MIT License.
Para mais informações, entre em contato:
📧 | Email: [email protected]