Le Footoscope : la data-visualisation au service de l’analyse tactique

Le 2 octobre 2012 - Par qui vous parle de , Tags : , ,

Il n’aura pas fallu longtemps pour que la statistique nouvelle génération achève de conquérir le foot continental, longtemps hermétique à ce chiffrage des performances – très anglo-saxon dans l’âme.

Si son influence croissante est largement compréhensible dans le domaine purement sportif (quelques exemples), elle laisse plus circonspect dans son traitement journalistique, et ce malgré de nombreuses vertus. La faute à un usage encore limité – pour ne pas dire pathétique – du « chiffre » comme gadget narratif par les commentateurs hexagonaux, alors même qu’il pourrait être utilisé pour permettre au spectateur amateur de mieux comprendre ce qu’il regarde. Notre précédente tribune sur le sujet (Passer aux stats supérieures) ne disait pas autre chose : une autre statistique est possible.

C’est précisément l’objectif du Footoscope que de donner les « clés du match » au grand public, pour reprendre l’expression consacrée, en lui offrant un outil d’analyse tactique à la fois pertinent et décalé. Le projet, actuellement en phase expérimentale, vise notamment à tirer partie des bases de données statistiques que les clubs vont peu à peu mettre à disponibilité du grand public, en suivant l’exemple pionnier de Manchester City.

Surtout, et c’est ce qui fait sa spécificité par rapport aux autres (excellentes) applications disponibles, le Footoscope s’appuie sur l’expertise « géographique » de ses auteurs, s’intéressant davantage à la géo-contextualisation des données qu’à leur valeur purement quantitative. Plus d’explications sur les enjeux et méthodes du projet à lire ci-dessous. N’hésitez pas à nous faire part de vos questions en commentaire ou par mail !

Foot et stats : un mariage, deux raisons

Le Footoscope est un prototype d’application gratuite, développée par Fabien Girardin du Near Future Laboratory (think-tank de prospective), avec la collaboration de [pop-up] urbain (mon cabinet de prospective urbaine). Cette application est née d’une réflexion sur la pauvreté du traitement des statistiques dans les médias, mais aussi des nombreux liens qui unissent décryptage tactique et analyse urbaine (pour rappel, c’est précisément ce qui a donné naissance à ce blog… C’est d’ailleurs comme ça que j’ai rencontré Fabien).

De fait, le Footoscope répond à de nombreux critiques émises à l’égard de la visualisation des données footballistiques : comment permettre un meilleur usage de la statistique par le grand public, en particulier sur le plan de la compréhension tactique ? L’application souhaite ainsi dépasser les logiques de data-visualisation actuelles (que j’utilise moi-même dans mes analyses tactiques), qui se contentent de restituer les données brutes sur une cartographie du terrain, sans offrir d’information quant à la place du joueur et du ballon dans l’écosystème global du match.

Pour ce faire, Fabien Girardin a mis à profit son expertise des organisations réticulaires spatialisées, c’est-à-dire la manière dont s’agence un réseau d’objets dans un espace donné, ce qui correspond parfaitement à la définition d’une tactique footballistique :

La collecte et l’analyse de données statistiques est en plein essor, et représente à n’en point douter un enjeu majeur du monde de demain. Nos activités nous amènent régulièrement à traiter les implications de cette évolution, particulièrement dans le domaine de la ville et ses services. Nos travaux demandent une appréhension de l’espace, des réseaux qui le compose et des comportements humains s’y déploient.

De la donnée brute à la méta-donnée

Les data-visualisations ne proposent d’ailleurs aucune données chiffrées sur le nombre de passes ou de tirs réalisés ; c’est totalement volontaire. Comme expliqué plus haut, il ne s’agit pas d’observer les performances d’une équipe sur le plan quantitatif (ce qui n’a d’ailleurs aucun sens de manière isolée, puisqu’une donnée ne vaut que par comparaison à une autre), mais bien au contraire dans ses dimensions qualitatives.

A l’aide de variables plus ou moins complexes directement intégrées dans l’algorithme de visualisation, c’est-à-dire en géo-contextualisant ces données brutes, le Footoscope permet ainsi de révéler la morphologie d’une équipe sur un match ou une compétition. Pour les plus curieux, Fabien en a donné quelques précisions sur son blog (Footoscope: a deciphering tool for football amateurs) ; je ne saurais pas vous en dire beaucoup plus sur la partie technique, sinon qu’il s’agit de variables permettant de rendre compte l’influence d’un joueur dans l’animation du jeu de passe de l’équipe :

L’interface permet de sélectionner une équipe et ses joueurs pour :

  1. Découvrir la morphologie d’une équipe émergeant des données de positionnement de ses joueurs.
  2. Observer les flux dans l’équipe basés sur la transmission du ballon. Les arcs du réseau représentent la proportion de passes entre joueurs mesurée sur un ensemble d’une compétition, par match ou par minute.
  3. Décrypter l’importance de chaque joueur dans le jeu d’équipe à partir de son habilité à distribuer la balle (indicateur « d’intermédiarité » affiché par la taille du rond représentant chaque joueur).
  4. Estimer la propagation du ballon après 2 passes à partir d’un joueur, utile pour comprendre l’orientation du jeu.

Enjeux et perspectives de la spatialité footballistique

Le résultat est confondant, comme j’ai moi-même plus le constater aux débuts de l’application. Celle-ci a d’abord été testée sur des statistiques issues de la Coupe du Monde 2010, que Fabien m’a proposé d’analyser. Sept décryptages sont disponibles, qui rendent compte du potentiel de l’application dans l’analyse assez précise des identités de jeu de chaque équipe, au-delà des seules critères de formation ou de style habituellement mobilisés par les commentateurs.

On notera par exemple l’étonnante disposition suisse, qui explique ses résultats, les différences techniques des milieux portugais, ou la fascinante position de Keisuke Honda dans le système japonais, première équipe à véritablement jouer (et performer) sans attaquant en compétition internationale. L’Espagne 2012 a depuis montré où cela pouvait mener… (sur le sujet)

Fort de ce succès, Fabien a depuis intégré certaines données leakées par Manchester City dans le modèle, avec de nouvelles option de décryptage autour du match Bolton – MUFC d’août dernier. Plus particulièrement, deux outils me semblent apporter une réelle valeur ajoutée à l’application.

Situé sous la cartographie, le slider permet de choisir précisément les minutes du match que l’on souhaite analyser (alors qu’on ne peut habituellement qu’observer une mi-temps minimum). Il est ainsi possible d’évaluer l’évolution d’un joueur en fonction du remplacement de son vis-à-vis, par exemple, ou la réaction d’une équipe dans les dix minutes suivant un but. Les horizons sont aussi nombreux que les données disponibles.

Autre option, et non des moindres, le « Coverage » représente l’ensemble du terrain couvert par le joueur, par ses passes et ses ballons touchés. Pour un joueur comme Yaya Touré, la symétrie de la cartographie linéaire qui en résulte se révèle presque artistique, poétique, révélant ses qualités en termes d’équilibrage de l’équipe. Jamais le rôle de relayeur n’aura été si bien décrit que dans cette toile d’araignée presque parfaite, dans ses verticalités comme dans ses horizontalités. C’est, tout simplement, beau.

Voilà pour les premiers résultats. L’application est encore à l’état de prototype, et souffre d’ailleurs de quelques bugs de chargement, ne vous inquiétez pas. Mais elle a le mérite d’être en accès libre et gratuit (ici pour la Coupe du Monde, là pour Manchester City).

A votre tour, si vous le souhaitez, de vous amuser à triturer les bases de données pour révéler des systèmes réticulaires intéressants, des philosophies de jeu passées sous silence, ou des influences individuelles marquantes. L’objectif est expérimental : les commentaires sont donc plus que bienvenus, notamment pour proposer vos idées d’améliorations. Quelles données souhaiteriez-vous voire cartographiées ? Comment améliorer l’application ? Quelle utilisation souhaiteriez-vous en avoir ? La parole est à vous, en attendant la prochaine étape de ce Footoscope qui aura animé nos vacances estivales. Qu’on se le dise : une autre intelligence statistique est possible.

6 commentaires

  • Je salue l’initiative! C’est un debut tres interessant pour un passioné de foot et de stats comme moi.

    Une remarque comme ca : tu parles d’ « organisations réticulaires spatialisées » pour decrire l’approche. Je ne suis pas geographe, mais j’imagine que ca consiste a considerer l’equipe comme un ensemble de composantes liées les unes aux autres (l’activité des joueurs). Par contre tes analyses, et ce qu’on peut extraire de l’application CDM2010, restent toujours individuelles.

    Personnellement, ce que j’aurais aimé voir, c’est une approche qui va au dela de la notion de performance individuelle brute (passe, occupation de l’espace, etc), mais plutot une analyse globale de la perf de l' »organisation reticulaire » (i.e. l’equipe pour parler en vrais mots), ca pourrait etre des mesure de distance entre les lignes de la structure, d’occupation de la largeur, etc.

    La performance d’un joueur en particulier ne serait pas basé sur des statistiques individuelles, mais plutot sur sa contribution a la performance de l’equipe. Ce type d’analyse rendrait enfin justice a certains joueurs de l’ombre. Par exemple un joueur qui touche peu la balle mais realise toujours des choix simples et courts, et efficaces ne va pas ressortir des stats traditionnelles (a part parfois en taux de passe reussies), alors que son influence sur le jeu est gigantesque.

    Dans tous les cas, je salue l’initiative, et j’attends de voir la suite.

    • Merci pour les encouragements ! Et pour les propositions : c’est exactement dans le ton de ce qu’on souhaiterait mettre en place.

      Tout dépend des variables disponibles et de la complexité de la programmation, mais dans l’idée, tout ça me paraît parfaitement faisable. J’aime beaucoup ta proposition sur la distance entre les différents éléments (qui peuvent être les joueurs mais aussi un autre élément du terrain : des cages, de la ligne de touche, ou pourquoi pas de l’arbitre !)

      Ça fait directement écho à ma vision du football « totalitaire » (http://footballtotalitaire.wordpress.com/2012/01/19/training-day-les-sots-a-lelastique-inculquer-lharmonie/), dans lequel le bloc-équipe ne doit jamais être trop étiré, et les paires-trios de joueurs devant être en permanence à proximité ; après tout, c’est le principe même des triangulations guardiolesques !

      J’en parle à Fabien et il verra ce qu’il peut en faire. Mais quoiqu’il arrive, merci beaucoup de ta participation. On essayera progressivement de réunir les gens intéressés par le sujet et ses perspectives, donc stay tuned !

  • Bluffé par la limpidité des visualisations. On comprend quasi instantanément la manière dont une équipe à joué, voire la manière dont un match s’est déroulé. Je suis toujours assez circonspect devant les cartos « façon Gephi » lorsqu’elles concernent les relations entre sites ou utilisateurs de sites web (trop de nœuds, trop fouilli, difficiles à décrypter et du coup plus volontier réservées aux experts) mais pour le coup, avec 11 joueurs sur la durée d’un match, cela devient diablement parlant. Début très convaincant, bonne chance à vous !

  • C’est clair que les statistiques sont de plus en plus présentes dans le football professionnel. Et qui sait, ne serait-ce pas un futur métier dans les clubs, comme est né déjà plus tôt celui de l’adjoint préposé à la vidéo ?

  • Bonsoir , votre logiciel est ultra intéressante, je cherche a créer un centre de formation de foot , et ce logiciel me permettrais de bcp mieux entraîner les futurs joueurs, j’aimerais beaucoup si possible en parler avec vous ! Merci !

Laisser un commentaire