Soutenance de thèse de Fabio MARCHIANO

Ecole Doctorale
Sciences de la Vie et de la Santé
Spécialité
Biologie-Santé - Spécialité Bioinformatique et Génomique
établissement
Aix-Marseille Université
Mots Clés
Biologie computationnelle.,Biologie des systèmes,Mitochondries,Intégration des données omiques,Exploration visuelle des données,
Keywords
Computational biology,System biology,Mitochondria,Omics data integration,Visual data mining,
Titre de thèse
Intégration de données multi-omiques et exploration visuelle interactive des données pour explorer la dynamique du système mitochondrial
Multi-omics data integration and interactive visual data mining to explore mitochondrial system dynamics
Date
Vendredi 18 février 2022 à 10:00
Adresse
163 Av. de Luminy, 13009 Marseille
TPR2 3.04
Jury
Directeur de these Mme Bianca HABERMANN IBDM – Institut de Biologie du Développement de Marseille (UMR 7288)
Rapporteur M. Arnaud MOURIER CNRS IBGC – Bordeaux
Rapporteur Mme Irene PAPATHEODOROU EMBL-EBI – Cambridge
CoDirecteur de these M. Sebastien TEMPEL IBDM – Institut de Biologie du Développement de Marseille (UMR 7288)
Examinateur Mme Delphine POTIER CNRS CIML – Marseille
Examinateur M. Bart DEPLANCKE EPFL – Lausanne

Résumé de la thèse

La biologie systémique étudie les organismes vivants en tant que systèmes complexes, qui évoluent dans le temps, en étudiant les interactions dynamiques des entités qui les composent. Ces différentes entités biologiques peuvent être étudiées de manière intensive aujourd'hui grâce aux technologies à haut débit, qui nous permettent de collecter en une seule fois des "instantanés" à différentes échelles (comme l'ADN, l'ARNm, les protéines et/ou les métabolites) du système biologique d'intérêt. Ce volume croissant de données complexes et interconnectées doit être intégré, analysé et visualisé de manière significative afin d'être correctement interprété et de révéler des informations biologiques, qui sont souvent cachées en raison de la complexité inhérente des données. J'ai appliqué l'approche de la biologie systémique aux mitochondries. Ces organites subcellulaires étant largement étudiés et possédant un interactome relativement petit sont bien adaptés à ce type d'approche. Les mitochondries jouent un rôle central dans de nombreux processus cellulaires, notamment la production d'énergie cellulaire, la signalisation du calcium et l'apoptose. Des tissus différents, ainsi que des conditions de santé et d'âge différentes, sont caractérisés par une différence de morphologie et de composition mitochondriale qui est adaptée aux besoins de son environnement spécifique. La dérégulation de la dynamique mitochondriale est également liée au vieillissement ainsi qu'à plusieurs maladies telles que le diabète, les maladies neurodégénératives et le cancer. Pour mieux comprendre ces différences, nous avons développé la plateforme d'exploration visuelle de données (VDM) mitoXplorer, qui intègre un interactome mitochondrial sélectionné manuellement avec des données fournies par l'utilisateur et des données omiques publiques. De plus, j'ai implémenté l'outil dans une nouvelle version, mitoXplorer 2.0, en ajoutant des analyses intégratives telles que l'analyse d'enrichissement des processus mitochondriaux, la prédiction des facteurs de transcription et l'analyse des réseaux, afin d'aller au-delà de la visualisation et de l'exploration des données. En outre, j'ai développé l'analyse inter-espèces afin d'étudier si une observation est conservée entre les espèces. Avec mitoXplorer 2.0, les scientifiques expérimentaux et computationnels intéressés par le décryptage de la dynamique mitochondriale disposent de la plateforme web dédiée la plus complète, interactive et conviviale disponible à ce jour. De plus, en suivant toujours l'approche de la biologie systémique, j'ai développé le web tool AnnoMiner qui permet d'intégrer et d'exploiter visuellement différentes données omiques, c'est-à-dire des données épigénétiques et d'occupation de facteurs de transcription avec des données transcriptomiques. Cet outil permet, d'une part, d'annoter les données de régions génomiques fournies par l'utilisateur, telles que générées par ChIP-seq, ATAC-seq et des protocoles similaires, avec des caractéristiques génétiques. Les résultats de cette annotation peuvent en outre être intégrés aux résultats de RNA-seq, afin de mieux comprendre le rôle que certaines régions, ou acteurs de liaison à l'ADN, ont sur l'expression des gènes. D'autre part, AnnoMiner permet d'analyser l'enrichissement en facteurs de transcription ou en modifications d'histones de listes de gènes fournies par l'utilisateur. Cette fonction permet de prédire les gènes potentiellement régulateurs, en utilisant des centaines d'ensembles publics de données ChIP-seq de haute qualité que j'ai donc inclus dans la version 2.0 de mitoXplorer.

Thesis resume

System biology studies living organisms as complex systems, which evolve over time, studying the dynamic interactions of the entities they are composed of. These different biological entities can be investigated nowadays intensively through high-throughput technologies, which allow us to collect “snapshots” at different scales (such as DNA, mRNA, protein and/or metabolites) at once of the biological system of interest. This increasing volume of complex and interconnected data needs to be integrated, analyzed and visualized in a meaningful way in order to be correctly interpreted and reveal biological insights, which are often hidden due to the inherent complexity of the data. I applied the system biology approach to mitochondria. These sub-cellular organelles being widely studied and possessing a relatively small interactome are well-suited for this kind of approach. Mitochondria have a central role in many cellular processes, including cellular energy production, calcium signalling and apoptosis. Different tissues, as well as different health and age conditions, are characterized by a difference in mitochondrial morphology and composition which is tailored to suit the needs of its specific environment. Dysregulation of mitochondrial dynamics is also linked to ageing as well as several diseases such as diabetes, neurodegenerative diseases and cancer. To better understand these differences we developed the visual data mining (VDM) platform mitoXplorer, which integrates a manually curated mitochondrial interactome with user supplied as well as publicly available omics data. Moreover I implemented the tool to a novel version, the mitoXplorer 2.0, adding integrative analyses such as mito-process enrichment analysis, transcription factor prediction and network analysis, to go beyond data mining and visualization. Furthermore I developed the cross-specie analysis in order to investigate if an observation is conserved across species. With mitoXplorer 2.0, both experimental and computational scientists interested in deciphering mitochondrial dynamics are provided with the most complete, interactive and user-friendly dedicated web-based platform available at date. Moreover, always following the system biology approach, I developed the AnnoMiner web-server which allows to integrate and visually mine different omics data, i.e. epigenetic and transcription factor occupancy data with transcriptomics data. This tool helps, on the one hand, to annotate user provided genomic region data, as generated from ChIP-seq, ATAC-seq and similar protocols, with gene features. The results of this annotation can be furthermore integrated with RNA-seq results, to better understand the role which certain regions, or DNA binding actors, have on gene expression. On the other hand AnnoMiner allows transcription factor or histone modification enrichment analysis of user-provided gene lists. This function permits predicting genes potential regulators, by utilizing hundreds of public, high-quality ChIP-seq datasets which I therefore included in the mitoXplorer 2.0 version.