Soutenance de thèse de Frank IMBACH

Ecole Doctorale
Sciences du Mouvement Humain
Spécialité
Sciences du Mouvement Humain - MPL
établissement
Aix-Marseille Université
Mots Clés
Modélisation,charge d'entrainement,fitness-fatigue,apprentissage automatique,performance athlétique,
Keywords
Modelling,training loads,training fitness-fatigue,machine-learning,athletic performance,
Titre de thèse
Modélisation des réponses aux charges d’entraînement pour guider la performance sportive.
Modelling responses to training loads to lead performance in sports
Date
Jeudi 9 Décembre 2021 à 14:00
Adresse
UFR STAPS 700 Avenue du Pic St-Loup 34070 Montpellier
Amphitheatre
Jury
Directeur de these M. Stéphane PERREY Université de Montpellier
Rapporteur M. Pierre DRUILHET Université Clermont Auvergne
Rapporteur M. Thierry BUSSO Université Jean Monnet
CoDirecteur de these M. Robin CANDAU Université de Montpellier
Examinateur M. Christophe LEY Université du Luxembourg
Examinateur M. Anne LAURENT Université de Montpellier
Examinateur M. Jacques PRIOUX ENS Rennes

Résumé de la thèse

Les premiers modèles des effets de l’entrainement sur la performance athlétique sont connus sous le nom de modèles "Fitness-Fatigue" (FFM). Un inconvénient majeur des FFMs réside dans le fait qu’ils ne sont constitués que d’une seule donnée d’entrée, bien que la performance athlétique soit multifactorielle. Dès lors, des approches multivariées propres aux statistiques et à l’apprentissage automatique ont été proposées pour différentes applications sportives. La quantification de la charge d’entraînement (CE) pour l’entraînement en résis- tance constitue une problématique de recherche à part entière. Dans une première étude, nous avons proposé une nouvelle méthode de quantification de la CE en accord avec des réponses physiologiques multiples à l’effort. Après avoir modélisé les profils couple-vitesse chez les participants, nous avons évalué des réponses phy- siologiques lors de 3 sessions d’effort en résistance à intensités variées et de volume égal. Les hautes intensités ont entrainé une fatigue musculaire plus importante caractérisée par des altérations neuromusculaires. A l’inverse, la consommation d’oxygène ainsi que les modifications métaboliques étaient supérieures lors d’efforts de plus faible intensité, indiquant des contributions énergétiques différentes. Ainsi, nous avons proposé un indice de CE basé sur les altérations neuromusculaires obser- vées à l’effort. Pondérer exponentiellement la CE par une constante de décroissance du taux d’augmentation de la force a montré de plus grandes corrélations avec les réponses physiologiques étudiées. Par ailleurs, l’information compressée de données multivariées dans une seule composante suite à une analyse en composantes principales pourrait représenter un indice de CE. Dans la deuxième étude, nous avons proposé une méthodologie de modélisation basée sur la généralisation des modèles. Nous avons comparé un modèle dose- réponse à des procédures de régularisation et modèles d’apprentissage automatique multivariés chez des patineurs élites. Les modèles de régularisation ont montré de meilleures performances en termes de généralisation et de précision. De plus, des modèles construits sur l’ensemble du groupe plutôt que par athlète apparaissaient plus pertinents dans un contexte d’échantillons de petite taille. Enfin, des approches en apprentissage automatique telles que les méthodes d’apprentissage ensemblistes pourraient améliorer le pouvoir prédictif des FFMs. Dans la troisième étude, nous avons modélisé les profils accélération-vitesse à partir des mesures de systèmes de localisation par satellite (GPS), puis avons tenté de prédire les coefficients de la relation accélération-vitesse. Tout d’abord, des modèles de prévision de séries chronologiques ont constitué une base de modéli- sation. Nous les avons par la suite comparés à une régression linéaire régularisée et un réseau de neurones récurrents utilisant des variables propres au GPS. Enfin, nous avons extrait des variables directement à partir des données GPS brutes pour effectuer la tâche de prédiction. Aucune différence significative n’a été observée entre les modèles en termes de précision. Étant donné le caractère multifactoriel de la performance athlétique, les performances prédictives étaient acceptables. L’utilisation de données extraites des domaines temporels et fréquentiels à partir des signaux bruts a montré des performances comparables aux autres modèles. Les données brutes semblent donc avoir un intérêt et devraient être analysées pour des problématiques relatives à la performance athlétique et à la survenue de blessure. Enfin, nous avons développé un système de suivi de l’entrainement pour des coureurs de fond. L’application propose un module de suivi de l’entrainement et un modèle prédictif basé sur une modélisation physiologique de la performance en course à pied. Un second développement a été réalisé sous la solution SAP analytics cloud, produisant des rapports automatisés et un suivi de joueurs d’une équipe de Rugby.

Thesis resume

The first models of training effects on athletic performance emerged with the work of Banister and Calvert through the so-called Fitness-Fatigue model (FFM). One major drawback of FFMs is that the features stem from a single source of data. That is not in line with the existing consensus about a multifactorial aspect of athletic performance. Hence, multivariate modelling approaches from statistics and machine-learning (ML) emerged. A research issue arises from the quantification of training Loads (TL) in resistance training (RT) which lack of physiological evidence. In the first study, we provided a new method of TL quantification in RT based on physiological observations. To achieve that, we initially modelled the torque-velocity profiles of fifteen participants during an isokinetic leg extension task and assessed a set of physiological responses to various resistance exercises intensities. Each session was volume-equated according to the formulation of volume load (i.e. the product of the number of repetitions and the relative intensity). Higher led to greater muscular fatigue described by neuromuscular impairments. Conversely, systemic and local pulmonary responses (measured through oxygen uptake) and metabolic changes (according to blood lactate concentrations) were more significant at low intensities, suggesting different contributions of metabolic pathways. From these results, we provided a new index of TL based on the neuromuscular impairments observed at exercise. We showed that to exponentially weight TL by the average rate decay of force development rate yielded better correlations with any of the significant physiological responses to exercise. In addition, information compressed within a principal component could be a valuable TL index. In the second study, we provided a robust modelling methodology that relies on model generalisation. Using data from elite speed skaters, we compared a dose-response model to regularisation methods and machine-learning models. Regularisation procedures provided the greatest performances in both generalisation and accuracy. Also, we highlighted the pertinence of computing one model over the group of athletes instead of a model per athlete in a context of a small sample size. Finally, ML approaches could be a way of improving FFMs through ensemble learning methods. In the third study, we modelled acceleration-velocity directly from global positioning system (GPS) measurements and attempted to predict the coefficients of the relationship between acceleration and velocity. First, a baseline model was defined by time-series forecasting using game data only. Then, we proceeded to multivariate modelling using commercial features. A regularised linear regression and a long short term memory neural network were compared. Finally, we extracted features directly from raw GPS data and compared these features to the commercial ones for prediction purposes. The results showed only slight differences between model accuracy, and no models significantly outperformed the baseline in the prediction task. Given the multi-factorial nature of athletic performance, using only GPS data for predicting such athletic performance criterion provided an acceptable accuracy. Using time-domain and frequency-domain features extracted from raw data led to similar performances compared to the commercial ones, despite being evidence-based. It suggests that raw data should be considered for future athletic performance and injury occurrence analysis. Finally, we developed an athlete management system for long-distance runners. This application provided an athlete monitoring module and a predictive module based on a physiological model of running performance. A second development was realised under the SAP analytics cloud solution. Team management and automated dashboards were provided herein, in close collaboration with a professional Rugby team.