El verdadero uso del «Big Data» y cómo puede ayudar al Betis

En 2011 el Betis empezó a implementar el Big Data (análisis de datos) con el programa Media Coach, siendo hoy uno de los equipos españoles que más apuesta por el «Smart Data»

«Se percibe que en el Betis tienen un interés creciente y que están incluso en foros donde hay grupos muy selectos de clubes trabajando»

«Estoy muy orgulloso de que el Betis haya estado en esos proyectos de los que antes se quedaba fuera»

Es cierto que el Real Betis está sufriendo una etapa de cambios bastante profundos. Desde la idea de juego que se pretendía instaurar con Setién –ahora puesta en duda tras su salida–, hasta la renovación de la dirección deportiva, de la que no ha querido formar parte Lorenzo Serra Ferrer. Sin obviar, por supuesto, a uno de los protagonistas que más comentarios ha generado tras la salida del balear: la «llegada» del famoso Big Data al Betis.

No obstante, resulta que no es un desconocido para el equipo verdiblanco, aunque sí parece serlo para su afición. «Pulsa el botón del Big Data y que fiche a Borja Iglesias», comentaba con sarcasmo estos días un anónimo en uno de los foros sobre la actualidad verdiblanca. Algo a lo que hacía referencia Ángel Haro, presidente del Real Betis, en la rueda de prensa con la que él y José Miguel López Catalán presentaban la remodelación de la dirección deportiva: «He leído a muchos de vosotros en los medios de comunicación hablar del Big Data con cierto sarcasmo. Y muchas de vuestras empresas invierten mucho en ella. Esto no es cuestión de Big Data sí o Big Data no. Es una herramienta importante que utilizan ‘equipitos’ como el Liverpool», zanjaba Haro en su declaración ante los medios.

En realidad, eso de «Big Data» es una expresión algo reduccionista que, de hecho, engloba una complejidad detrás que se aleja bastante de esa imagen de ser una simple «herramienta» o «una máquina». Cierto es que hay mucho secretismo sobre cómo y qué se analiza y quiénes están detrás de esa «máquina», lo que por supuesto lleva a la confusión a mucha gente sobre si realmente se está dejando en manos de «los ordenadores» el futuro del fútbol moderno. Como siempre, esta problemática también la predijeron los Simpsons, cuando Lisa quiso ser la entrenadora del equipo de Bart y decidió aplicar lo que mejor sabe hacer para ayudar al equipo a ganar: las matemáticas y el análisis de datos.

LOS INICIOS DEL BIG DATA EN EL BETIS

La verdad sea dicha: el famoso Big Data ahora mismo es solo una palabra de moda. En 2011 se llamaba «prospección y métodos de investigación», un naming mucho menos vendible, pero que empezaba a usarse en algunas ligas europeas. Uno de sus precursores en la liga española fue Anselmo Ruiz de Alarcón Quintero (Sevilla, 1979), quién llegó al Betis en 2011 y se encontró con una paradoja terrible: «Había una barrera cuando llegué al Betis, sobre el acceso a la plataforma que más datos nos proporcionaba en ese momento, que era la herramienta Media Coach. De hecho, cuando llegué, Ángel Becerra, que era la persona que ya estaba trabajando realizando los informes de rivales para el primer equipo, se encontró con una circunstancia similar a la mía: necesitaba utilizar el programa, pero no había ordenadores ni medios para hacerlo».

«Es como contratar el Movistar+ y no tener una televisión para verlo», resume Anselmo, que por aquel entonces trabajaba en el departamento de investigación y desarrollo de la cantera verdiblanca y quien actualmente trabaja como autónomo para el departamento de análisis de datos del primer equipo del Athletic Club, desde hace dos temporadas.

El programa que él y Becerra necesitaban usar, Media Coach, pertenece a Mediapro y era de compra obligada por la Liga. «Unos 30 o 35.000€ era lo que tenía que pagar el Betis por aquel entonces para tener acceso al programa, al cual tenían acceso, por supuesto, tanto equipos de Primera como de Segunda División», detalla Anselmo. «La paradoja con la que me encontré fue que, cuando llegué al Betis, el programa llevaba unos siete meses en funcionamiento y no se disponía de ningún equipo informático que fuera capaz de instalar y de usar el programa».

Media Coach generaba dos tipos de datos, «que son en los que se subdivide el Big Data: uno era tracking, un paquete de datos que te da la posición 50 veces por segundo, 25 en ese momento, de jugadores y balón en todo momento del partido. Y otro que es el eventing, un archivo que solo ocupa 1Mb que es de pases, tiros, tiros a puerta, paradas… Estos dos tipos de archivos, lo que te permitía este programa, en ese momento, era el primer acceso al Big Data», explica Anselmo.

Así, Ángel Becerra y él hicieron fuerza para que les consiguieran unos ordenadores con los que poder usar el programa. Pero, ¿cuál era su uso por aquél entonces? ¿Se aplicaba al primer equipo, a los fichajes? «Te puedo hablar de mi tarea en aquel entonces: generar valores de referencia en el fútbol profesional para la cantera. Tenía que reportar información de la cantera, primero al departamento médico, porque empecé trabajando ahí, desde el punto de vista de prevención de lesiones, y después, generar valores de referencia. Esa fue la primera autorización del Big Data en el fútbol».

Había, además, otra barrera y es que no se permitía el cableado ni el uso de dispositivos electrónicos en los banquillos. Hasta que la FIFA cambió esa directriz y, entonces, explotó el Big Data. «El primer cambio que hizo FIFA fue que lo autorizaba con fines médicos y ese fue el primer trabajo que yo realicé. Informes orientados a la prevención de lesiones. Después pasé a trabajar para la cantera, donde mi función era establecer valores de referencia del fútbol profesional, tanto en datos físicos como en datos de juego, para establecer cuáles eran los criterios o referencias que debían alcanzar los jugadores. Cuando esos jugadores alcanzaran la etapa profesional, claro».

Entrenamiento Betis 13 09 16

Estos datos, por supuesto, después eran analizados por el equipo técnico y la junta directiva. «Eran reuniones comunes, con miembros del consejo de administración a quienes se les reportaba esa información sobre los valores de referencia de datos físicos de jugadores, no de jugadores en concreto, pero de cuál era el valor de referencia que hacía que un extremo izquierdo estuviera por encima de los valores normales en alta intensidad, en distancia total y en datos relacionados con el juego».

CÓMO HA EVOLUCIONADO EL BIG DATA EN EL FÚTBOL (Y EN EL BETIS)

La evolución, desde aquellos inicios hasta ahora, ha sido increíble, porque también ha aumentado la oferta de datos y su aplicación: «Ha habido distintos proveedores que han ido ofreciendo más datos. Es decir, Media Coach es un sistema que sigue existiendo, que fundamentalmente se nutre de dos fuentes de datos, eventing, que los proporciona OPTA, una de las empresas que marcó el estándar, y los datos de tracking, que los proporciona Chryon Hego, una empresa sueca. Hay multitud de proveedores que han ampliado el abanico y que tienen distintos datos».

Por supuesto, el Big Data es un método que se trabaja en equipo y que abarca distintos ámbitos de acción en un club: cantera, primer equipo, rendimiento, estilo de juego, efectividad, venta de entradas y, cómo no, fichajes. Tras esa «máquina» o ese conjunto de herramientas, hay un equipo de expertos en el análisis de datos que intenta que cada una de esas parcelas sea, día a día, más competitiva.

En cuanto a los fichajes, el Big Data se encarga de encontrar perfiles de jugadores que se adapten a las necesidades del equipo y, también, a su presupuesto. No se trata sólo de encontrar jugadores de un determinado perfil, sino de llevar a cabo un modelo mixto que incluya, por supuesto, el seguimiento de los jugadores, por lo que, por mucho que se especule, el trabajo de una dirección deportiva, y su toma de decisiones, siempre va a ser determinante. Y lo será, también, de cara a la próxima temporada del Real Betis.

Pero, como veíamos antes, el Big Data abarca una parte mucho más importante que los fichajes: la globalidad del juego en equipo. «Soy el responsable de datos del primer equipo del Athletic Club, trabajo como externo, soy autónomo. No soy empleado, pero tengo como función ser responsable de datos de juego del primer equipo y tengo que contribuir a la realización de informes, junto a mis compañeros del departamento de análisis de juego, sobre el pre, durante y post partido», explica Anselmo.

«Además, tengo que realizar un análisis de la calidad de los datos, es decir, si hay un proveedor que nos da un dato erróneo, detectarlo, informarlo y ver cuál es la razón, y también establecer cuáles son los valores de referencia del fútbol profesional, es decir, cuándo se considera que un equipo está en debilidad, fortaleza o normalidad, por ejemplo, en balón parado, en ataque, en defensa, etc. Mi función es 90% colectivo y 10% individual. Después, otros compañeros míos de departamento sí tienen funciones más individuales».

DEL «BIG DATA» AL «SMART DATA»

Para trabajar el análisis de datos se establecen unos parámetros previos, definidos por glosarios y definiciones concretas sobre qué datos son importantes para tener en cuenta. «Por ejemplo, OPTA, de Media Coach, son manuales de 50-60 páginas. Stats, también tiene un manual. Hay cosas que parecen nimias pero que pueden marcar cuál es la clave. Por ejemplo, los tiros a puerta, en los estándares internacionales no incluyen los tiros al palo. Esto que puede parecer sin importancia, es clave a la hora de clasificar y ordenar información de distintos proveedores».

Aunque entre todos los índices que hasta ahora no se tenían en cuenta y que empiezan a cobrar importancia está el PPDA, un indicador de la presión realizada por los equipos. «Prácticamente se ha impuesto en el mercado ya que no se utilizaba nada hace cuatro o cinco años, y ya hay proveedores que lo están expandiendo. Es algo que está vivo, que todavía no ha cogido la dinámica del baloncesto o el béisbol», detalla Anselmo, quien descubrió la cultura del dato entre los años 2014 y 2016, cuando trabajó para Double Pass [la misma empresa que trabajó con la federación belga y la alemana hace una década] evaluando equipos de la MLS.

«Pude conocer la cultura del dato, porque muchos de los equipos de la MLS pertenecen a franquicias de baloncesto y béisbol. Observé allí, con Stats-Bombs, uno de los proveedores más importantes de la zona, uno de los líderes mundiales del mercado, que han conseguido utilizar no solo la tecnología sino la comprensión del juego, que era lo más complicado que tenían y lo han conseguido. Fueron uno de los que contribuyeron a este índice de PPDA».

La clave, por tanto, no reside en tener la información y los índices, sino en cómo estructurarlo «para saber cuáles son los cajones en los que se ordena esta información». Por su parte, Anselmo Ruiz, en su trabajo para el Athletic Club, utiliza dos grandes ramas, «que son ataque y defensa, y a partir de ahí hay una ramificación continua en la que se buscan regresiones, relaciones de influencia, pero la clave está en generar un modelo de interpretación de los datos y que esos cientos de índices estén ordenados, jerarquizados y estructurados».

Pero, ¿qué conseguimos con este análisis? ¿Cuál es la rentabilidad a corto plazo? «Más que rentabilidad, lo que se busca en estos casos como Liverpool, Leicester o la selección belga, es eficiencia. Es decir, es un pequeño matiz porque la rentabilidad es un retorno de la inversión, que del tiempo invertido o el dinero, se obtenga retorno. Son estructuras que tomaron ventaja, Roberto Martínez, Graham, el analista del Leicester que después lo fichó el Arsenal, trabajaban en el 2010 con Big Data y con archivos más sencillos de eventing. Y, aún así, generaron eso que se denomina Smart Data, más allá del Big Data, que solo consiste en recopilar. El Smart Data es estructurar, que no es ordenar, sino hacerlo con el orden que te hace obtener una ventaja competitiva, esa es la “rentabilidad”».

UNA DÉCADA: LA VENTAJA DE ALEMANIA, INGLATERRA Y BÉLGICA

Sobre su trabajo en el Athletic Club, Anselmo puede comentar poco. Y sobre el trabajo que está realizando la directiva del Betis, no quiere realizar comentarios «para no levantar suspicacias». No obstante, como profesional del análisis de datos, sí que tiene una visión globlal del trabajo que está realizando el Betis en cuanto a recopilación y análisis de datos: «En las reuniones en la Liga he sido testigo de cómo el Betis ha participado, en las últimas temporadas, en proyectos reducidos a un número de equipos que mostraron interés. Yo, como antiguo trabajador del Betis y andaluz, estoy muy orgulloso de que el Betis haya estado en esos proyectos de los que antes se quedaba fuera y que indican que hay una mentalidad adecuada»

Es más, Anselmo percibe, y eso sí que lo puede decir, «por el resto de clubes y de compañeros», que el Betis tiene un interés creciente y «que están incluso en foros donde hay grupos muy selectos de clubes trabajando, como una plataforma que se generó sobre Raw Data, el data en crudo, el Betis ha sido protagonista, ha participado, ha estado presente en todas las reuniones en la Liga, ha participado, y es algo que indica que están alcanzando la vanguardia en ese ámbito».

Ojalá lo hubiera sido, pero desgraciadamente el Real Betis no fue el primero, ni será el último, en usar el Big Data como una ventaja competitiva, desde la cantera al primer equipo, pasando por la venta de entradas, la prevención de lesiones, el análisis del rival o los fichajes. Desde hace una década se ha estado usando tanto en la Bundesliga como en la liga belga, a través de una consultoría externa denominada Double Pass. Los resultados, por supuesto, han sido más que evidentes, ya que hoy en día nadie se cuestiona la calidad de una selección como la belga o de jugadores como Lukaku, Hazard o Courtois.  Como notorio ha sido, sin duda, esa «rentabilidad» del uso de estas herramientas en equipos como en Manchester City, el Leicester o el Liverpool.

En el primer caso, el equipo de Manchester quería rentabilizar los tiros a puerta, dado que había un gran número de ocasiones que no conseguían convertir en gol. A través de la agencia STATS, el Manchester City empezó a analizar todos los datos que generaban por partido. «Si un equipo tiene una cifra xG («expected Goals») más alta que los objetivos reales marcados, será en general debido no aprovechar la finalización de una jugada o a un buen portero, o ambos», explica el diario Telegraph en este artículo.

«Al analizar todos los disparos de la temporada pasada y la temporada anterior, el equipo de STATS ha podido identificar una serie de patrones, que podemos utilizar para informar cómo podría funcionar esta temporada». El resultado de este año es evidente: un solo partido perdido desde enero, lo que le ha hecho ganar la Premier League por una ventaja mínima frente a su competidor más cercano, el Liverpool.

De hecho, justo ese era el problema de Jürgen Klopp en el Dormunt: la rentabilidad de los tiros a puerta. Eran mejores, tenían más ocasiones, pero no ganaban partidos. ¿Os suena de algo? A su tercera semana como entrenador del Liverpool, Klopp conoció a Graham, un tipo que llegó a su despacho con un montón de ordenadores y aparatos de todo pelaje. El resto ya es historia. Como también lo es la del Leicester, otro de los equipos que empezó a implementar las complejas técnicas de análisis de datos.

«Es claro que Alemania e Inglaterra nos llevan ventaja. Alemania, por la cultura del dato. La Bundesliga tiene una ventaja mayor sobre transparencia y trasferencia del uso del dato. E Inglaterra por inversión. Nosotros, ahora sí, podemos decir que estamos en un tercer lugar», detalla Anselmo, quien piensa que poco a poco se puede intentar alcanzar a Bundesliga. «Participo en reuniones privadas de clubes europeos, y percibo que hemos superado al resto de países, incluso Portugal, cuyos tres grandes equipos, en momentos puntuales, tenían ventajas sobre España, aunque estamos estrechando el espacio con Alemania». Es hora, pues, de avanzar.

Escrito por

Periodista y redactor de contenidos. Dice que «escribe, pero no le sale tan bien como el salmorejo» y, aún así, ha pasado por el Diario de Cádiz, El Confidencial y ABC de Sevilla. Como redactor, claro, no para hacer salmorejo. Gaditano nacido en Ronda y sevillano de adopción, como bético no dejan de preguntarle eso de: «¿Por qué eres del Betis, si no eres de Sevilla?». Pero le da coraje tener que responder una pregunta tan obvia.

No comments

LEAVE A COMMENT