Projeto de Machine Learning para prever a qualidade de instrutores em instituições de ensino com base em avaliações de estudantes.
🔗 Dataset utilizado: Turkiye Student Evaluation Dataset (Kaggle)
Este projeto visa desenvolver um modelo de Machine Learning capaz de prever a qualidade de instrutores com base em avaliações de estudantes. O dataset contém respostas de alunos sobre diversos aspectos do ensino, como clareza, ritmo, material didático e interação.
✔️ Classificar instrutores em categorias de desempenho
✔️ Identificar quais fatores mais impactam a avaliação dos alunos
✔️ Comparar diferentes algoritmos de ML para encontrar o melhor modelo
- Python 🐍
- Pandas
- Scikit-learn 🧠⚙️
- Matplotlib/Seaborn
- Jupyter Notebook
- Distribuição das notas dos instrutores
- Correlação entre variáveis
- Identificação de dados faltantes
- Regressão Logística
- Random Forest
- KNeighborsClassifier
- Acurácia
- Matriz de Confusão
- Curva ROC (para classificação binária/multiclasse)
| Modelo | Acurácia (%) | Precisão (%) |
|---|---|---|
| Regressão Logística | 78.60 | 93.52 |
| Random Forest | 90.12 | 98.97 |
| KNeighborsClassifier | N/A | 84.70 |
- O Random Forest obteve o melhor desempenho neste dataset
Se tiver dúvidas ou sugestões principalmente, entre em contato:
Email: 2pedrohss@gmail.com
LinkedIn: Pedro Henrique