Soutenance de thèse de Margaux HAERING

Ecole Doctorale
Sciences de la Vie et de la Santé
Spécialité
Biologie-Santé - Spécialité Bioinformatique et Génomique
établissement
Aix-Marseille Université
Mots Clés
ataxie cérébelleuse,rna-seq,cellule unique,plateforme web,
Keywords
cerebellar ataxia,rna-seq,single cell,web platform,
Titre de thèse
Comprendre la contribution du type de cellule aux ataxies cérébelleuses grâce à l'exploration approfondie des données RNA-seq unicellulaires à l'aide des outils web mitoXplorer et ataxiaXplorer.
Understanding cell-type level contribution to Cerebellar Ataxias through deep mining of single-cell RNA-seq data using the mitoXplorer and ataxiaXplorer web tools.
Date
Mardi 29 Octobre 2024 à 10:00
Adresse
Hexagone 172 Av. de Luminy, 13009 Marseille
Auditorium
Jury
Directeur de these Mme Bianca HABERMANN IBDM - Centre National de Recherche Scientifique
Rapporteur Mme Marie SEMON Ecole Normale Superieure de Lyon
Rapporteur M. Carles CANTO École Polytechnique Fédérale de Lausanne
Examinateur M. Josselin NOIREL Conservatoire National des Arts et Metiers
Examinateur M. Cedric MAURANGE IBDM - Centre National de Recherche Scientifique
Président M. Andrew SAURIN IBDM - Centre National de Recherche Scientifique

Résumé de la thèse

Les données omiques, telles que le séquençage de l'ARN ou la protéomique, sont des techniques puissantes qui permettent d'étudier les profils d'expression cellulaire dans de nombreuses conditions différentes, telles que le développement, l'homéostasie, la progression d'une maladie ou la réponse à un traitement. Lorsqu'elle est réalisée au niveau des tissus, cette technique peut fournir des informations très précieuses sur la dynamique d'expression spécifique du tissu dans un ensemble varié de conditions. Toutefois, les tissus sont composés de nombreux types de cellules différents, dont les profils d'expression peuvent également varier. Pour vraiment comprendre la dynamique d'expression des types de cellules ou des cellules individuelles, nous devons réaliser de telles expériences au niveau de la cellule unique. Le single-cell RNA sequencing (sc-RNA-seq) est une technique de pointe qui permet d'établir le profil de l'expression des gènes au niveau de la cellule unique et peut donc donner un aperçu des processus biologiques à un niveau de détail et de résolution beaucoup plus élevé. Les mitochondries sont des organites hérités de la mère qui jouent un rôle central dans plusieurs processus cellulaires, notamment le métabolisme, la production d'énergie, la signalisation et la régulation de l'apoptose. La compréhension de la fonction mitochondriale et de son dérèglement dans les maladies nécessite des outils bioinformatiques spécifiques. mitoXplorer et mitoXplorer 2.0 sont de tels outils qui aident à analyser les données -omiques d'un point de vue mitochondrial. Toutefois, ces outils sont actuellement limités à l'analyse des données de bulk RNA-seq. Lorsqu'on étudie les troubles neurodégénératifs, tels que les ataxies spinocérébelleuses (SCA), qui peuvent souvent être liés à la perte de types de cellules spécifiques dans le cerveau, l'analyse en masse sera limitée par la résolution des données et la conclusion qui peut en être tirée. Dans cette thèse, je présente le développement d'outils conviviaux et basés sur le web pour plusieurs types de données transcriptomiques. Tout d'abord, j'ai développé une application R-shiny pour analyser les données bulk RNA-seq, RNfuzzyApp. Elle offre plusieurs outils pour l'analyse classique de l'expression différentielle. De plus, RNfuzzyApp est jusqu'à présent la seule application qui aide les utilisateurs à effectuer des analyses de séries temporelles avec l'algorithme de fuzzy clustering Mfuzz, en automatisant partiellement l’analyse de ces données. Deuxièmement, j'ai développé une mise à jour de la plateforme mitoXplorer 2.0 pour l'analyse de bulk centrées sur les mitochondries. Avec cette mise à jour vers mitoXplorer 3.0, la plateforme est désormais capable d'intégrer les données sc-RNA-seq. Pour le prétraitement des données, j'ai développé un script automatisé qui génère d'abord des données pseudo-bulk et effectue une analyse d'expression différentielle basée sur le pseudo-bulk en fonction des types de cellules annotés. Deuxièmement, le script extrait les mitogènes de la matrice de comptage des cellules uniques, créant un fichier sc-RNA-seq spécifique aux mitogènes prêt à l’importation dans la nouvelle plateforme mitoXplorer 3.0, avec de nouvelles interfaces interactives que j'ai développées. Enfin, j'ai participé au développement de la première plateforme sœur de mitoXplorer, ataxiaXplorer, afin d'explorer et d'analyser les données transcriptomiques bulk et single cell dans le contexte des ataxies cérébelleuses.

Thesis resume

Omics data, such as RNA-sequencing or proteomics, are powerful techniques to interrogate cellular expression profiles in many different conditions, such as development, homoeostasis, disease progression or treatment response. When done on tissue-level, it can give highly valuable insight into the specific expression dynamics of the tissue in a diverse set of conditions. Tissues, however, are composed of many different cell types, which can also vary in their expression patterns. To truly understand the expression dynamics of cell types or individual cells, we need to perform such experiments on the single-cell level. Single-cell RNA sequencing (sc-RNA-seq) is a cutting-edge technique that enables the profiling of gene expression at the single-cell level and thus can give insights into biological processes at a much greater detail and resolution. Mitochondria are maternally inherited organelles that play a pivotal role in several cellular processes including metabolism, energy production, signaling and regulation of apoptosis. Understanding mitochondrial function and its dysregulation in diseases requires specific bioinformatics tools. mitoXplorer and mitoXplorer 2.0 are such tools that aid in analyzing -omics data from a mitochondrial perspective. However, these tools are currently limited to analyzing bulk RNA-sequencing data. When looking at neurodegenerative disorders, such as Spinocerebellar Ataxias (SCAs), which often can be linked to the loss of specific cell types in the brain, bulk analysis will be limited by the resolution of the data and the conclusion that can be drawn from it. In this thesis, I present the development of user-friendly and web-based tools for several types of transcriptomics data. First, I developed a R-shiny app to analyze bulk RNA-seq data, RNfuzzyApp. It offers several tools for classical bulk differential expression analysis. Moreover, RNfuzzyApp is the so far only app that helps users perform time-series analysis with the fuzzy clustering algorithm Mfuzz, by partially automating the process for fuzzy clustering analysis. Secondly, I developed an update of the mitoXplorer 2.0 platform for mitochondria-centric data analysis of RNA sequencing data. With this update to mitoXplorer 3.0, the platform is now able to integrate sc-RNA-sequencing data. For data pre-processing, I developed an automated script that first generates pseudo-bulk data and performs pseudo-bulk based differential expression analysis based on annotated cell types. Secondly, the script extracts the mito-genes from the single-cell count matrix, creating a mito-gene specific scRNA-seq dataset for direct upload and data mining in the mitoXplorer 3.0 platform, with novel interactive interfaces that I have developed. Finally, I have been involved in the development of the first sister platform of mitoXplorer, ataxiaXplorer, to explore and analyze bulk- and single-cell transcriptomics data in the context of cerebellar ataxias.