Después de bastante tiempo trabajando en ello, por fin publicó primera versión pública de DataPeloton 🚴♂️📊
Una web donde quiero transformar los datos del ciclismo en algo visual, interactivo y fácil de explorar.
https://t.co/GbHKkZBpgL
🧵👇🏻
La idea del análisis era explorar los datos disponibles.
📈 Como han rendido los equipos
👥 Como se distribuye la fuerza dentro de los bloques
🚴🏻♀️ Equipos a priori más equilibrados para una TTT
📊 Aprovechando la TTT de la #ParisNice, he hecho alguna visualización para ver cómo llegan los equipos.
No es un modelo ni una simulación. Son visualización basadas en resultados históricos y rendimientos individuales en ITTs.
Abro hilo 🧵
Por último, este heatmap, muestra el puesto medio de TTT por equipo y temporada.
Sirve para ver rápidamente:
• Consistencia
• Picos de rendimiento
• Temporadas más flojas
#ParisNice
El modelo tuvo bastante error en la velocidad exacta (y tampoco acertó el ranking) pero el resultado real entra dentro del rango estimado (54.94 ± 2km/h).
1️⃣ El corredor mejor valorado por el modelo era Ganna
2️⃣ Fue el único que superó la velocidad estimada.
#TirrenoAdriatico
🚴👩🏻💻He intentado modelar la crono de #TirrenoAdriatico usando datos de ITTs entre 2019-2016
No es una predicción perfecta (ni puede serlo), pero es un ejemplo de que se puede modelar con datos históricos y qué no. 🧵
Aun así, el ranking no es completamente absurdo viendo el historial de cronos de estos corredores.
Pero el ejercicio sirve para demostrar algo importante:
👉🏻El mayor límite de estos modelos no suele ser el algoritmo, si no los datos disponibles 🧠
#TirrenoAdriatico
🚴👩🏻💻He intentado modelar la crono de #TirrenoAdriatico usando datos de ITTs entre 2019-2016
No es una predicción perfecta (ni puede serlo), pero es un ejemplo de que se puede modelar con datos históricos y qué no. 🧵
Una alerta < 0.1 % no equivale a dopaje.
Significa que el cambio es estadísticamente anómalo y requiere revisión médica.
Otros módulos (como el esteroideo) usan umbrales distintos, pero la lógica es la misma:🕵️♂️ detectar incoherencias que luego los expertos deben explicar.
Se está hablando estos días del Pasaporte Biológico. Una de las herramientas más importantes contra la lucha del dopaje.
Pero, ¿que hay detrás de esta herramienta?
Muy ‘fácil’ ➡️ Estadística pura
Si un nuevo valor de OFF-score tiene una probabilidad < 0.1 % de encajar con el patrón histórico del atleta, el sistema lo marca como “atípico” 🚨
Ese umbral (p < 0.001) es el usado por la WADA en el módulo hematológico: probabilidad de 1 entre 1000 de que el valor encaje.