Soutenance de thèse d'Apolline Bruley

Apolline Bruley, doctorante dans l'équipe Bioinformatique et BioPhysique (BIBIP), soutient sa thèse le lundi 5 décembre 2022 à 14 h.
Sorbonne Université - Campus Pierre et Marie Curie - 4 Place Jussieu - 75005 PARIS - IMPMC - Barre 22-23 - 4 e étage - salle 401
Exploitation de signatures des repliements protéiques pour décrire le continuum ordre/désordre au sein des protéomes
Résumé
Une fraction significative des protéomes reste non annotée, laissant inaccessible une partie du répertoire fonctionnel de la vie, incluant des innovations moléculaires ayant une valeur thérapeutique ou environnementale. Le manque d'annotation fonctionnelle est en partie dû aux limites des approches actuelles pour la détection de relations cachées, ou à des caractéristiques spécifiques telles que le désordre.
L'objectif de ma thèse a été de développer des approches méthodologiques reposant sur les signatures structurales des domaines repliés, afin de caractériser plus avant les séquences protéiques dont la fonction est inconnue, même en l'absence d'informations évolutives.
Tout d'abord, j'ai développé un score permettant d'estimer le potentiel de repliement d'une séquence d'acides aminés, basé sur sa densité en amas hydrophobes, correspondant principalement aux structures secondaires régulières. J'ai décrit
le continuum entre l'ordre et le désordre, couvrant différents états allant des conformations étendues aux globules fondus et ai caractérisé des cas d'ordre conditionnel. Ensuite, j'ai combiné ce score avec les prédictions de structure 3D
d'AlphaFold2 (AF2) disponibles pour 21 protéomes de référence. Une grande fraction des acides aminés des modèles AF2 associés à un très faible index de confiance est incluse dans des segments non repliables, soutenant la qualité d'AF2 comme prédicteur du désordre. Cependant, dans chaque protéome, de longs segments repliablesavec des prédictions AF2 de faible confiance présentent également des caractéristiques de domaines solubles et repliés. Cela suggère un ordre caché (conditionnel ou inconditionnel), qui n'est pas détecté par AF2 en raison du manque d'informations évolutives, ou des motifs de repliement non répertoriés. Enfin, à l'aide de ces outils, j'ai effectué une exploration préliminaire de protéines ou de régions non annotées, identifiées via le développement et l'application d'une nouvelle procédure d'annotation. Bien que ces séquences soient enrichies en désordre, une part importante d'entre elles présente des caractéristiques de type globulaire soluble. Ces séquences constituent de bons candidats pour defutures validations et caractérisations expérimentales. De plus, l'analyse de gènes de novo validés expérimentalement m'a permis de contribuer au débat encore ouvert sur les caractéristiques structurales des protéines codées par ces gènes, qui présentent un enrichissement en désordre et une grande diversité d'états structuraux.
Mots-clefs : dark protéome, amas hydrophobes, segmentsrepliables, protéines et régions intrinsèquement désordonnées, ordre caché, AlphaFold2
Leveraging protein fold signatures to describe the order/disorder continuum in proteomes
Abstract
A significant fraction of the proteomes remains unannotated, leaving inaccessible a part of the functional repertoire of life, including molecular innovations with therapeutic or environmental value. Lack of functional annotation is partly due to the limitations of the current approaches in detecting hidden relationships, or to specific features such as disorder.
The aim of my PhD thesis was to develop methodological approaches based on the structural signatures of folded domains, in order to further characterize the protein sequences with unknown function even in absence of evolutionary information.
First, I developed a scoring system in order to estimate the foldability potential of an amino acid sequence, based on its density in hydrophobic clusters, which mainly correspond to regular secondary structures. I disentangled the continuum
between order and disorder, covering various states from extended conformations (random coils) to molten globules and characterize cases of conditional order. Next, I combined this scoring system with the AlphaFold2 (AF2) 3D structure predictions available for 21 reference proteomes. A large fraction of the amino acids with very low AF2 model confidence are included in non-foldable segments, supporting the quality of AF2 as a predictor of disorder. However, within each proteome, long segments with very low AF2 model confidence also exhibit characteristics of soluble, folded domains. This suggests hidden order (conditional or unconditional), which is undetected by AF2 due to lack of evolutionary information, or unrecorded folding patterns. Finally, using these tools, I made a preliminary exploration of unannotated proteins or regions, identified through the development and application of a new annotation workflow.
Even though these sequences are enriched in disorder, an important part of them showcases soluble globular-like characteristics. These would make good candidates for further experimental validation and characterization. Moreover, the analysis of experimentally validated de novo genes allowed me to contribute to the still-open debate on the structural features of proteins encoded by these genes, enriched in disorder and displaying a great diversity of structural states.
Keywords: dark proteome, hydrophobic clusters, foldable segments, IDPs/IDRs, hidden order, AlphaFold2
Jury
- Jean-Christophe Gelly Maître de conférences, Université de Paris Rapporteur
- Raphaël Guérois - Directeur de recherche CEA, Université Paris Saclay Rapporteur
- Ingrid Lafontaine - Professeure, Sorbonne Université Examinatrice
- Anne Lopes - Maîtresse de conférences, Université Paris Saclay Examinatrice
- Lucie Bittner - Maîtresse de conférences, Sorbonne Université - Invitée
- Isabelle Callebaut - Directrice de recherche CNRS, Sorbonne Université Directrice de thèse
- Elodie Duprat - Maîtresse de conférences, Sorbonne Université - Co-encadrante
Photo : © IMPMC - Cécile Duflot
Egalement dans la rubrique
- Soutenance de thèse de Baptiste Truffet
- Soutenance de thèse d'Alexis Amouretti
- Soutenance de thèse de Lucie Huart
- Soutenance de thèse de Julien Rojas
- Soutenance de thèse de Steven Delhommaye
- Soutenance de thèse de Clémence Besançon
- Soutenance de thèse de Weibin Li
- Soutenance de thèse de Karen Palacio Rodriguez
- Soutenance de thèse d'Igor Rzepplinski
- Soutenance de thèse de Dania Zuniga
- Soutenance de thèse de Samantha Azedevo
- Soutenance de thèse de Mohamad Harastani
- Soutenance de thèse de Cécile Noirot
- Soutenance de thèse de Bin Zhao
- Soutenance de thèse de Fernando Igoa Saldana
- Soutenance de thèse de Marine Ciocco
- Soutenance de thèse de Hugo Kowalczyk
- Soutenance de thèse de Juliette Debrie
Zoom Science - Explorer la minéralogie du niobium grâce au rayonnement synchrotron pour comprendre la formation des gisements

La minéralogie du niobium (Nb) est complexe avec plus d’une centaine de minéraux caractérisés par des échanges multiples entre cations. Pour cette raison, leur identification sur la base d’analyse chimique est souvent équivoque. Identifier avec fiabilité les minéraux de Nb est pourtant primordial pour...
Contact
A. Marco Saitta
Directeur de l'institut
marco.saitta(at)sorbonne-universite.fr
Bruno Moal
Secrétaire général
33 +1 44 27 52 17
bruno.moal(at)sorbonne-universite.fr
Jérôme Normand
Gestion du personnel
Réservation des salles
jerome.normand(at)sorbonne-universite.fr
Antonella Intili
Accueil et logistique
Réservation des salles
antonella.intili(at)sorbonne-universite.fr
Ouafa Faouzi
Gestion financière
gestionimpmc@impmc.upmc.fr (gestionimpmc @ impmc.upmc.fr)
Cécile Duflot
Communication
cecile.duflot(at)sorbonne-universite.fr
33 +1 44 27 46 86
Contact unique pour l'expertise de matériaux et minéraux
Stages d'observation pour élèves de 3e et de Seconde
feriel.skouri-panet(at)sorbonne-universite.fr
Adresse postale
Institut de minéralogie, de physique des matériaux et de cosmochimie - UMR 7590
Sorbonne Université - 4, place Jussieu - BC 115 - 75252 Paris Cedex 5
Adresse physique
Institut de minéralogie, de physique des matériaux et de cosmochimie - UMR 7590 - Sorbonne Université - 4, place Jussieu - Tour 23 - Barre 22-23, 4e étage - 75252 Paris Cedex 5
Adresse de livraison
Accès : 7 quai Saint Bernard - 75005 Paris, Tour 22.
Contact : Antonella Intili : Barre 22-23, 4e étage, pièce 420, 33 +1 44 27 25 61
Fax : 33 +1 44 27 51 52