Skip to content

TheSinnerAR/F1-Data-Mining

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

F1 Driver Clustering

Este proyecto aplica técnicas de clustering (aprendizaje no supervisado) para agrupar pilotos de Fórmula 1 según su rendimiento histórico.

📊 Variables utilizadas

  • total_points: Total de puntos acumulados
  • avg_position: Posición promedio en carrera (menor = mejor)
  • total_wins: Cantidad de victorias
  • races_count: Cantidad de carreras disputadas

Todos los datos son normalizados y se eliminan outliers antes del análisis.


🧠 Técnica utilizada

Se utiliza el algoritmo KMeans para agrupar pilotos en 3 clusters. Los nombres de los grupos se asignan automáticamente según el rendimiento promedio:

  • 🟢 Top Tier: Pilotos con alto puntaje, buenas posiciones y muchas carreras.
  • 🟡 Midfield: Rendimiento intermedio.
  • 🟣 Backmarkers: Bajo puntaje y posiciones lejanas.

📈 Visualizaciones

  • Gráfico estático con matplotlib donde el tamaño de los puntos es proporcional a la cantidad de carreras (races_count).
  • Gráfico interactivo con Plotly donde podés ver nombre, puntos, victorias, y carreras al pasar el mouse.

🗂️ Archivos generados

  • 📊 output/driver_clusters.xlsx: contiene todos los pilotos con sus métricas y cluster asignado.
  • 📋 Resumen por consola: promedio de métricas por grupo.

🚀 Instrucciones

  1. Clonar el repositorio
  2. Configurar las variables en el archivo .env
  3. Ejecutar:
python src/clustering.py

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages