La défense, parent-pauvre de la datafoot ?

Le 8 février 2017 - Par qui vous parle de , Tags : , , , ,

Quiconque suit le football de près aura remarqué l’explosion de la data, de plus en plus utilisée tant par les clubs que les médias, essentiellement dans trois grands domaines : l’amélioration de la préparation (avant match), la représentation des matchs eux-mêmes (en temps réel ou décalé), et l’analyse a posteriori des performances (après match). Toutefois, dans les trois cas la data est avant tout un outil, un moyen permettant d’optimiser une démarche déjà existante (l’entraînement, le commentaire de match, etc.), et non un objectif en soi. Si elle occupe donc une place croissante dans le football, elle connaît aussi de nombreuses limites, mais aussi d’importants mésusages, tant par les coachs que les médias. C’est ce que nous allons voir ci-dessous.

schwab-770x470

Ces limites sont aujourd’hui pour la plupart bien commentés, notamment grâce à l’émergence de quelques blogueurs spécialisés (à l’instar de Julien Assuncao, qui fait un travail formidable pour démocratiser le sujet). Néanmoins, certaines restent plus impalpables et moins étayées, à l’image de celle qui nous concerne aujourd’hui. Dans ce billet, on abordera en effet l’épineuse question de la statistique défensive, un type de données sur lequel peu d’indicateurs canoniques tendent à émerger. Cette problématique illustre l’enjeu majeur de notre consommation de données actuelle, à savoir la nécessité de donner corps aux statistiques, littéralement. Ce besoin de contextualiser la data et de la garder au service de la réalité du terrain s’avère en effet indispensable, d’abord pour la rendre plus aisément compréhensible, mais aussi et surtout pour éviter les pièges et les mésinterprétations. En creux, c’est bien la notion de “data-literacy” qui se dessine, ou comment la compréhension des données complexes devient indispensable à l’analyse du football.

Datafoot, le sens de la mesure

Pourquoi s’intéresser spécifiquement au cas des statistiques défensives ? Il suffit de regarder les tableaux de données pour s’en convaincre aisément : les données défensives sont globalement moins éloquentes que leurs homologues d’attaque ou même du milieu de terrain. Comment mesurer la qualité d’un marquage à la culotte alors que, par définition, le défenseur ne touchera pas forcément le ballon ? C’est là une limite de tout objet mesurable, puisque ne sont prises en compte que les actions qui donnent lieu à une mesure « objectivée », c’est-à-dire quantifiable (une interception, un tacle, un dégagement…). Or, les gestes défensifs du type marquage, positionnement, ou couverture s’avèrent plus difficilement quantifiables, et c’est ce qui rend le sujet si complexe. Pour le dire en un mot, la défense échappe (encore) au marquage de la data.

Certes, les joueurs offensifs sont parfois eux aussi dans l’ombre de la donnée, à l’image des appels  dans le vide, qui ne sont pas forcément mesurables (ou alors avec des outils de suivi coûteux et peu démocratisés). Plus généralement, il en va de même pour le positionnement sans ballon d’un attaquant, et son influence sur le jeu de son équipe. On en avait d’ailleurs parlé sur les Dé-Managers, en reprenant l’allégorie du jeu de go. Mais bien qu’elle soit elle aussi concernée par ce flou de la mesure, la data offensive s’en sort plutôt bien, sûrement parce qu’elle est jugée plus prioritaire. Celle-ci s’est d’ailleurs largement étoffée ces dernières années, avec l’arrivée des Expected Goals notamment, un indicateur fondé sur un agglomérat de stats et reflétant, pour faire simple, la probabilité de marquer.

Ces recherches expérimentales démontrent l’intérêt porté à l’égard de la data offensive, qui contraste évidemment avec l’arrière-garde du terrain. Celle-ci, comme souvent, reste ainsi dans l’ombre, et c’est bien pour cela qu’il n’existe toujours pas d’équivalent aux ExpG concernant le secteur défensif. De surcroît, comme le rappelaient les auteurs de l’article précité, les ExpG ne sont pas sans défauts : elles occultent notamment divers éléments concrets mais non-mesurables tels que l’absence de tir… et le rôle de la défense. En effet, pour l’heure du moins, les ExpG ne sont pas en mesure de prendre en compte les positions défensives de l’adversaire sur une occasion donnée (malgré quelques tentatives d’équation encore en rodage). Une preuve supplémentaire de l’incapacité des statistiques à traiter avec autant d’égard les gestes défensifs que les actions offensives.

NWSL-xG-Distance-v-Pressure-no-rectanagle

De Stam à Umtiti, une brève histoire de lacunes statistiques

Pire, les statistiques nuisent parfois à la représentation des performances défensives. C’est un des travers de la data, engendré par une utilisation abusive et surtout hâtive, qui la rend parfois mal comprise même pas les plus grands coachs. Parmi les études de cas les plus commentés, l’exemple de Stam reflète à merveille les mésusages de la data défensive…

Les faits remontent à 2001 : Manchester trône alors au sommet de l’Europe, et l’usage de la donnée est alors balbutiante en Angleterre, terre pionnière en la matière. Sir Alex Ferguson fait ainsi partie des utilisateurs précoces de la statistiques, pour le meilleur et pour le pire… Comme le relate Simon Kuper dans l’ouvrage “Les attaquants les plus chers ne sont pas ceux qui marquent le plus”, Sir Alex Ferguson s’était en partie appuyé sur les statistiques pour vendre Jaap Stam, pourtant au sommet de son art. En effet, ses tableaux de données indiquaient qu’il taclait de moins en moins, amenant SAF à supposer le déclin de son défenseur vieillissant. Il n’en était évidemment rien : en réalité, c’est précisément l’expérience de Stam qui lui permettait de mieux se positionner, et donc de limiter au maximum les tacles inutiles. A la différence des statistiques offensives, la baisse d’un indicateur n’est donc pas synonyme de baisse de performance. Dans l’une de ses biographies, Sir Alex reconnaîtra a posteriori son erreur : trompé par les stats, il n’aurait évidemment pas dû vendre le divin chauve hollandais.

b8722ad9c83280a926db6a45f6e9aed0

Plus récemment, Le Libéro Lyon a brillamment mis en lumière un cas relativement similaire, en observant les statistiques de Samuel Umtiti dans ses dernières années lyonnaises. Celles-ci étaient en effet en chute libre, qu’il s’agisse des tacles, des interceptions, ou encore les duels aériens… Or, comme le démontre parfaitement Etienne M. dans son article, cette baisse n’était en aucun cas la preuve d’une baisse de niveau, mais en réalité d’un rôle défensif évoluant vers une plus grande spécialisation. Que ce soit dans l’équilibre avec son compagnon de charnière, dans la répartition de leurs rôles respectifs, mais aussi et surtout dans sa participation à la relance et à la construction du jeu, Le Libero Lyon a montré que ce n’étaient pas les statistiques défensives habituellement prises en compte qui soulignaient le mieux les performances du défenseur aujourd’hui catalan. Il n’est d’ailleurs pas étonnant que le club barcelonais l’ait recruté, et qu’il s’y épanouisse aujourd’hui dans ce rôle ; on peut même supposer que le Barça l’a justement souhaité pour ça…

Quels indicateurs pour quantifier la défense ?

A près de 15 ans d’intervalle, ces deux exemples illustrent les limites des statistiques défensives, qui traduisent relativement « mal » la réalité des performances, ainsi que la très lente maturation de ces sujets dans le monde football. Plus généralement, celui-ci semble en effet avoir un certain nombre de difficultés à traiter la question du jeu sans ballon par le chiffre. Plutôt logique, évidemment, mais cela se révèle particulièrement problématique dès lors qu’on aborde la question du jeu défensif, un rôle par définition « réactif » et non actif, et donc un temps de jeu essentiellement passé sans ballon. Sans parler de toutes les nuances relatives à certains gestes défensifs, tels que le tacle de la dernière chance ou la fameuse « faute tactique », sur laquelle nous reviendrons dans un prochain billet…

River Plate v FC Barcelona - FIFA Club World Cup Final

« La datafoot tentant de rattraper son retard, allégorie »

Au vu de ces éléments, une question se distingue : comment faire émerger de véritables indicateurs défensifs basés sur des statistiques disponibles, sans que ceux-ci ne soient trompeurs ou fallacieux ? A l’instar des travaux de recherches sur les Expected Goals (souvent menés par des blogueurs amateurs, on l’a dit), à quoi pourrait ressembler un « ExpG » défensif ? Quelles statistiques devrait-il agréger ? Comment anticiper des évolutions dans les rôles, l’expérience ? Cela implique-t-il forcément un suivi géolocalisé des joueurs (coûteux et complexe à mettre en place), ou bien cela peut-il s’en affranchir ?

De toutes ces interrogations, il ressort un constat général : il semble plus que nécessaire de mettre la data défensive au niveau de ses homologues offensifs. De tels indicateurs seront évidemment utiles aux clubs et aux médias pour l’analyse du jeu et des performance, mais pourraient plus généralement servir aussi à la compréhension du jeu défensif par le grand public. De quoi rendre ses lettres de noblesse à l’art de la défense, de lui conférer une meilleure place dans l’imaginaire du football, pour un supporter aguerri ou un enfant dans la cour de son école.

1 commentaire

  • J’ai un talent très riche en moi au niveau du football j’ai 17 ans je joue dans un petit centre de football en cote d’Ivoire pour le moment . je souhaite un jour devenir un véritable pros comme mon idole OZIL pas votre aide et conseil merci

Laisser un commentaire