Soutenance de thèse de Ganesh WARTHI

Ecole Doctorale
Sciences de la Vie et de la Santé
Spécialité
Biologie-Santé - Spécialité Microbiologie
établissement
Aix-Marseille Université
Mots Clés
codon,transformation bijective,insertion-deletion,,
Keywords
codon,bijective transformation,indel,,
Titre de thèse
Exploration de mécanismes de transcription et de traduction non-canoniques
Exploring putative unknown non-canonical transcriptions and translations
Date
Jeudi 21 Novembre 2019 à 10:00
Adresse
IHU-Méditerranée infection 19-21 Boulevard Jean Moulin, 13005 Marseille
Amphithéatre
Jury
Directeur de these M. Pierre-Edouard FOURNIER Aix-Marseille Université
Rapporteur M. Jacques DEMONGEOT Université Grenoble Alpes
Rapporteur M. Olivier CROCE Centre national de la recherche scientifique - Institute for Research on Cancer and Aging of Nice (IRCAN)
Examinateur Mme Florence FENOLLAR Aix-Marseille Université
CoDirecteur de these M. Hervé SELIGMANN The Hebrew University of Jerusalem

Résumé de la thèse

Le séquencage d'ARN et la spectrométrie de masse sont les méthodes les plus communément utilisées pour étudier les transcriptomes et protéomes cellulaires. Pourtant, de nombreux reads d’ARN et spectres de masse peptidiques générés par ces méthodes n'ont pas d'homologues dans le génome et sont ignorés car considérés comme des artéfacts. Ceci réulte en une perte d'information génétique potentiellement importante. Dans notre travail de thèse, nous avons exploré deux types de transcriptions non-canoniques pour identifier et expliquer la présence de reads d’ARN et de peptides produits par la mitochondrie humaine sans être prédits dans le génome. 1) les échanges systématiques de nucléotides: les nucléotides sont systématiquement échangés dans certains ARNs, selon l’un des 23 échanges systématiques. Ici, nous avons confirmé la réplicabilité du recouvrement mitogénomique par des ARN échangistes dans des souches purifiées de mitochondries humaines et dans le transcriptome de la cellule entière, en utilisant deux méthodes de séquencage différentes. Ceci confirme la transcription des ARN échangistes mitochondriaux. À partir de ces 23 échanges systématiques, nous avons identifié huit ARNs qui étaient non identifiés comme transformés selon l'échange systématique A↔T+C↔G dans des lymphomes non-Hodgkins associés au VIH, suggérant un mécanisme putatif du VIH pour éviter la réponse immune anti-VIH tout en induisant un cancer. L'analyse d'ESTs non identifiés du projet "FAPESP/LICR Human Cancer Genome project" nous a permis d’identifier l’origine génomique de 347 ESTs non identifiés, constituant une méthode unique pour identifier les ARNs non-canoniques. L'alignment de ces ESTs avec des gènes très actifs suggère que les transformations échangistes sont associées avec une forte activité des cellules normales et des cellules cancéreuses génétiquement instables. 2) Des délétions systématiques de nucléotides: dans ce cas, un nombre spécifique de nucléotides est systématiquement délété après chaque tanscription d’un codon, produisant des délétions d’ARN(delRNAs). Nous avons recherché des ARNs non canoniques qui délètent systématiquement 1 a 12 nucléotides après chaque triplet nucléotidique transcrit parmi dans les transcriptomes humains de la cellule entière et le transcriptome de souches purifiées de mitochondries, et dans la banque de données de séquences EST humaines de Genbank. Parmi tous les delRNAs détectés dans la banque de données EST, 55.63% recouvrent les mêmes régions que des delRNAs détectés dans les deux transcriptomes, confirmant l'existence des delRNAs, et excluant la possibilité de faux positifs ou de contamination. Un total de 227 delRNAs est confirmé dans les trois sets de données. Ces delRNAs détectés étaient pauvres en codons appartenant au code circulaire et régulant la détection du cadre de lecture des gènes, et riches en homopolymères connus pour induire des dérapages du cadre de lecture, suggérant une régulation de la del-transcription basée sur des motifs linéaires des séquences. Nous avons exploré deux banques de données de spectres de masse peptidiques, en considérant des codons élargis/des déletions systématiques de tailles 3+k (avec k de 0 à 12). Nous avons mis en évidence des biais en faveur de peptides codés par le cadre de lecture 0, vs +1 et +2 pour les delRNAs, pour tous les k. Les analyses ont aussi montré un biais d'insertion de pyrrolysines aux codons stops. Ceci est la première fois que la traduction de codons stops par la pyrrolysine est rapportée pour la mitochondrie. Les résultats indiquent la traduction dans la mitochondrie de peptides selon la traduction habituelle des delRNAs, et la traduction de mRNAs habituels selon des codons élargis. Les résultats de cette thèse montrent l'existence de transcriptions et traductions non-canoniques dans la mitochondrie humaine et indiquent aussi la transcription échangiste des chromosomes nucléaires humains.

Thesis resume

RNA sequencing and Mass Spectrometry are the most widely used methods to study complete cell transcriptomes and proteomes. However, many RNA reads and peptide spectra generated by these methods are nonhomologous to the template genome and are ignored, assuming these are artefacts, resulting in loss of valuable genetic information. Here, we explored two non-canonical transcription phenomena to identify and explain RNA reads and peptides generated in human mitochondria but not predicted in the human genome. 1) Systematic nucleotide exchanges: nucleotides are systematically exchanged in RNAs (called swinger RNAs) by one among 23 systematic exchanges between nucleotides, i.e. 9 symmetric (X ↔ Y, e.g. A ↔ C) and 14 asymmetric (X → Y → Z → X, e.g. T → C → A→ T) exchanges. Here, we confirmed the reproducibility of swinger RNAs in purified human mitochondrial lines and whole-cell transcriptome across two different sequencing methods. This confirms transcription of mitochondrial swinger RNAs. Using these 23 systematic exchanges, we identified eight previously unknown RNAs as A↔T+C↔G transformed swinger RNAs in HIV-associated non-Hodgkin's lymphoma (NHL), providing a putative mechanism through which HIV evades anti-HIV response and induces cancer. Analyses of unknown ESTs from the FAPESP/LICR Human Cancer Genome project identified genomic origins of 347 unknown ESTs (including 51 mitochondrial RNAs and 17 from non-coding nuclear regions) and provided a unique method to identify non-canonical RNAs obtained using next-generation sequencing. Alignment of these unknown ESTs with highly active genes suggests the association of swinger transformation with highly active normal and genetically unstable cancer cells. 2) Systematic nucleotide deletions: here a specific number of nucleotides is systematically deleted after each transcribed trinucleotide, producing deletion RNAs (delRNAs). We searched in the human whole-cell and purified mitochondrial transcriptomes, and in Genbank's human EST database delRNAs systematically deleting 1 to 12 nucleotides after each transcribed tri-nucleotides. Among the total delRNAs detected in the EST database, 55.63% of them mapped with delRNAs detected in both transcriptomes confirming that delRNAs exist, and excluding false positive matches or contamination. A total of 227 delRNAs were confirmed in all 3 datasets mapping on protein-coding genes and the hypervariable 2 D-loop region of mitogenome. These detected delRNAs had lower frequency of frameshift preventing circular code codons and had higher frequency of frameshift inducing homopolymers, providing evidence of motif-based regulation of del-transcription. We explored two mass spectrometry datasets assuming expanded codon/systematic deletion sizes 3+k (k from 0 to 12). Biases were detected for peptides encoded by frame 0, vs frame +1 and +2 for all ks. The bias for frame 0 decreases for k>2, suggesting a limit of ribosomal translation of expanded codons. Analyses also show bias for inserting pyrrolysine at stop codons, the first report of translation of mitochondrial translation of stops by pyrrolysine. Results indicated mitochondrial translation of peptides from regular translation of delRNA and translation of regular mRNAs by expanded anticodons. We also detected chimeric peptides partly encoded by regular codons, and contiguous parts by expanded codons (mono and dinucleotide expansions, 42 and 37 detected peptides, respectively). These peptides could result from regular translation of delRNAs (k= 1 to 2) or translation of regular mRNAs by expanded anticodons. Chimeric peptides are strong evidence for the hypothesis of delRNAs and translation by expanded anticodons expanding the coding potential of mitogenomes. Results in this thesis provide evidence of non-canonical transcription and translation in human mitochondria and also provide evidence of swinger transcription of human nuclear chromosomes.