Big Data aplicado al fútbol

En este post veremos un breve resumen de las principales herramientas y proveedores de datos deportivos que se ven el siguiente Curso de Experto en Big Data Aplicado al Deporte

1.-Visualización de información con Microsoft Power BI

Herramienta líder de visualización (sencilla y accesible a cualquier usuario), gratuita en su versión desktop:

Ejemplo de visualización con datos ficticios de Lesiones:

Ver online

2.-Ficheros de tracking GPS - Raw Data  - ZXY

Un partido de fútbol consta de unos 5.400 segundos, si en cada segundo se toman 25 fotogramas de datos dispondríamos de 135.000 fotogramas por encuentro. En cada fotograma se incluye la información de los 23 actores del juego (22 jugadores y el balón), en el caso de los jugadores se dispone de coordenadas (x, y) mientras que en el caso del esférico se incluye la coordenada z para la altura.

No resulta complicado calcular que aproximadamente podríamos codificar un partido en más de 3 millones de coordenadas de datos. Es en este escenario el que el uso de tecnología Big Data en combinación con técnicas de Machine Learning nos ofrecen la posibilidad de analizar el juego como nunca antes habíamos visto. ¿Calcular la distancia hombre a hombre de una línea defensiva con los atacantes del equipo rival?, ¿Detectar secuencias y patrones de comportamiento del equipo rival?... con los datos de tracking generados por las cámaras de los estadios, en estos momentos ya es posible. Lejos quedan las estadísticas de velocidades punta, aceleraciones o metros recorridos, con estas nuevas fuentes las posibilidades se multiplican exponencialmente.

El ejemplo que expongo sobre estas líneas es uno de los muchos formatos de archivo que un club de fútbol profesional maneja en la actualidad. Los ficheros RAW data son proporcionados por la UEFA pero a día de hoy La Liga no los proporciona.

Ejemplo de análisis de ficheros Tracking RAW data con el lenguaje R y libreria soccermatics

Posición media del equipo ( sentido del juego derecha a izquierda)

Mapa de calor Lateral Izquierdo ( sentido del juego derecha a izquierda)

Vemos aquí los mapas de calor de las acciones con pelota del último partido entre el Real Madrid 2 (uso frecuente de las bandas) y el Barcelona 3 (juego abundante en el centro del campo).

(sentido del juego de izquierda a derecha)

3.- Opta Sports--> datos cuantitativos del juego, sus widgets son muy utilizados en prensa. Es proveedor oficial de La Liga.

4.- Instat--> Datos cuantitativos, posiciones x,y en el campo con acciones de los partidos

5.- Mediacoach--> Datos físicos y con análisis de vídeo

Datos ampliamente utilizados por los preparadores físicos de los equipos, análisis en vivo con productos propios:

  • Distancias Totales (con y sin posesión)
  • Distancias a (0-14km/h , 14-21 km/h, > 21 km/h,21-24km/h y  >24 km/h
  • Sprints
  • Velocidad Máxima
  • Velocidad Media
  • % minutos con posesión en Zona Defensa, Medios y Ataque con posesión

6.- Wyscout --> Herramienta que ha revolucionado el mundo del scouting

Cada futbolista tiene un perfil con información básica y estadísticas, así como acceso a un gran número de vídeos.

7.- Whoscored --> Portal de Estadísticas