Soutenance de thèse de Alberto VALDEOLIVAS

Ecole Doctorale
Sciences de la Vie et de la Santé
Spécialité
Biologie-Santé - Spécialité Bioinformatique et Génomique
établissement
Aix-Marseille Université
Mots Clés
VIEILLISEMENT,VIEILLISEMENT PRÉMATURÉ,MALADIES,PROGERIA,RÉSEAUX,MULTIPEX
Keywords
AGING,ACCELERATED AGING,DISEASES,PROGERIA,NETWORKS,MULTIPEX
Titre de thèse
Approches pour Explorer les Réseaux Biologiques Multiplex et Application aux Maladies du Vieillissement Prématuré
Approaches to Explore Multiplex Biological Networks and Application to Premature Aging Diseases
Date
Vendredi 15 Mars 2019 à 14:00
Adresse
Faculté de Médecine, 27 Boulevard Jean Moulin,13385 Marseille Cedex 5
Salle de Thèse n°2
Jury
Directeur de these Mme Anaïs BAUDOT Marseille Medical Genetics, UMRS910
CoDirecteur de these M. Pierre CAU Marseille Medical Genetics, UMRS910
Examinateur M. Jacques VAN HELDEN Lab. Technological Advances for Genomics and Clinics (TAGC), INSERM Unit U1090
Examinateur M. Nicolas THIERRY-MIEG Laboratoire TIMC-IMAG, CNRS
Rapporteur Mme Laura Inés FURLONG Research Programme on Biomedical Informatics (GRIB), Hospital del Mar Medical Research Institute (IMIM)
Rapporteur M. Antonio RAUSELL Imagine, Institut des maladies génétiques

Résumé de la thèse

Les gènes et les protéines n'agissent pas de manière isolée dans les cellules, mais interagissent plutôt dans des réseaux complexes d'interactions moléculaires. Ces interactions peuvent être modélisées sous forme de grands réseaux dans lesquels les nœuds sont des gènes ou des protéines et les arêtes représentent leurs interactions. Un ensemble de méthodes basées sur la théorie des graphes ont été développées pour extraire les connaissances fonctionnelles contenues dans les réseaux d'interaction protéine-protéine (PPI). Néanmoins, les réseaux cellulaires incluent des interactions de nature différente (par exemple, PPI, pathways et co-expression), qui peuvent être modélisées comme des réseaux multiplex, c’est-à-dire un ensemble de réseaux partageant les mêmes nœuds. Les réseaux multiplex ont permis de fournir une description plus précise des systèmes complexes dans plusieurs domaines. Cette thèse est focalisée sur le développement de nouveaux algorithmes étendant aux réseaux multiplexes certaines des état de l'art méthodes de la théorie des graphes en biologie computationnelle, ainsi que sur leur application à l'étude des maladies humaines. Concrètement, j'ai étendu l'algorithme Random Walk with Restart aux réseaux multiplex et hétérogènes. Nous avons démontré que notre méthode est capable de prendre avantage des différentes sources d'interaction pour améliorer les approches actuelles en matière de prédiction de gènes associés à une maladie. J'ai également participé au textit {Disease Module Identification DREAM Challenge} avec une méthode de clustering multiplex développée par notre équipe. Globalement, le fait de prendre en compte plusieurs couches dans les réseaux améliore la détection des modules dans certaines conditions. Du côté des applications, nous avons utilisé ces approches pour prédire de nouveaux gènes impliqués dans des maladies humaines, avec un accent particulier sur les maladies liées au vieillissement prématuré (PA). Les syndromes PA, également appelés syndromes progéroïdes, constituent un groupe de maladies génétiques rares qui ressemblent phénotypiquement à certains aspects du vieillissement physiologique précoce. En conséquence, un nombre significatif de modèles cellulaires et animaux ont été développés sur la base des mutations de gènes causant des maladies de PA. Ces études permettent à la fois d'identifier certains des mécanismes moléculaires altérés dans ces maladies et de donner des indices sur les différents agents moléculaires impliqués dans le vieillissement physiologique. Dans ce cadre, j’ai appliqué des Random Walks sur des réseaux multiplex pour décrire le paysage des dérégulations cellulaires associées à l’ensemble des maladies de PA. De plus, le dernier chapitre décrit mon travail d'analyse des données protéomiques et phosphoprotéomiques obtenus avec la spectrométrie de masse sur des lignées cellulaires du cancer de la prostate (PC) liées à l'évolution de la maladie. Mon objectif était d'identifier les événements moléculaires responsables de la progression de PC en stades résistants, extrêmement agressifs et incurables.

Thesis resume

Genes and proteins do not act isolated in cells but rather interact in complex networks of molecular interactions. These interactions can be modeled as large networks in which nodes are genes or proteins and edges represent their interactions. A bunch of graph-theory based methods have been developed to extract the functional knowledge contained in protein-protein interaction (PPI) networks. Nevertheless, cellular networks include interactions of different nature (eg. PPI, pathways and co-expression), which can be modeled as multiplex networks, i.e. collection of networks sharing the same nodes. Multiplex networks have shown to provide a more accurate description of complex systems in several fields. This thesis is focused on the development of new algorithms extending to multiplex networks some of the state-of-the-art graph-theory methods in computational biology, and their application to the study of human diseases. Concretely, I expanded the Random Walk with Restart algorithm to multiplex and heterogeneous networks. We demonstrated that our method is able to leverage the different interaction sources to outperform current approaches in the prediction of disease-associated genes. I also participated to the textit{Disease Module Identification DREAM Challenge} with a multiplex-tailored clustering method developed by our team. Overall, considering more than one network layer improves the detection of modules under certain conditions. On the application side, we used these approaches to predict new genes involved in human diseases, with a special focus on premature aging (PA) diseases. PA syndromes, also called Progeroid syndromes, are a group of rare genetic disorders that phenotypically resemble some of the aspects of physiological aging at an early age. Consequently, a significant number of cellular and animal models have been developed based on the mutations of PA disease-causative genes. These studies allow both to identify some of the altered molecular mechanism in these disorders, and to shed light about the different molecular agents involved in physiological aging. In this framework, I applied random walks on mutliplex networks to describe the landscape of cellular deregulations associated with the ensemble of PA diseases. In addition, the last chapter describes my work analysing proteomics and phosphoproteomics mass spectrometry data derived from prostate cancer (PC) cell lines related to the disease's progression. My goal was to identify molecular events responsible for the progression of PC to resistant stages, which are highly aggressive and incurable.