Aller au contenu Aller au menu Aller à la recherche

accès rapides, services personnalisés
Rechercher
Institut de minéralogie, de physique des matériaux et de cosmochimie
UMR 7590 - Sorbonne Université/CNRS/MNHN/IRD

Soutenance de thèse d'Apolline Bruley

Apolline Bruley, doctorante dans l'équipe Bioinformatique et BioPhysique (BIBIP), soutient sa thèse le lundi 5 décembre 2022 à 14 h.

Sorbonne Université - Campus Pierre et Marie Curie - 4 Place Jussieu - 75005 PARIS - IMPMC - Barre 22-23 - 4 e étage  - salle 401

 

Exploitation de signatures des repliements protéiques pour décrire le continuum ordre/désordre au sein des protéomes

Résumé

Une fraction significative des protéomes reste non annotée, laissant inaccessible une partie du répertoire fonctionnel de la vie, incluant des innovations moléculaires ayant une valeur thérapeutique ou environnementale. Le manque d'annotation fonctionnelle est en partie dû aux limites des approches actuelles pour la détection de relations cachées, ou à des caractéristiques spécifiques telles que le désordre.
L'objectif de ma thèse a été de développer des approches méthodologiques reposant sur les signatures structurales des domaines repliés, afin de caractériser plus avant les séquences protéiques dont la fonction est inconnue, même en l'absence d'informations évolutives.
Tout d'abord, j'ai développé un score permettant d'estimer le potentiel de repliement d'une séquence d'acides aminés, basé sur sa densité en amas hydrophobes, correspondant principalement aux structures secondaires régulières. J'ai décrit
le continuum entre l'ordre et le désordre, couvrant différents états allant des conformations étendues aux globules fondus et ai caractérisé des cas d'ordre conditionnel. Ensuite, j'ai combiné ce score avec les prédictions de structure 3D
d'AlphaFold2 (AF2) disponibles pour 21 protéomes de référence. Une grande fraction des acides aminés des modèles AF2 associés à un très faible index de confiance est incluse dans des segments non repliables, soutenant la qualité d'AF2 comme prédicteur du désordre. Cependant, dans chaque protéome, de longs segments repliablesavec des prédictions AF2 de faible confiance présentent également des caractéristiques de domaines solubles et repliés. Cela suggère un ordre caché (conditionnel ou inconditionnel), qui n'est pas détecté par AF2 en raison du manque d'informations évolutives, ou des motifs de repliement non répertoriés. Enfin, à l'aide de ces outils, j'ai effectué une exploration préliminaire de protéines ou de régions non annotées, identifiées via le développement et l'application d'une nouvelle procédure d'annotation. Bien que ces séquences soient enrichies en désordre, une part importante d'entre elles présente des caractéristiques de type globulaire soluble. Ces séquences constituent de bons candidats pour defutures validations et caractérisations expérimentales. De plus, l'analyse de gènes de novo validés expérimentalement m'a permis de contribuer au débat encore ouvert sur les caractéristiques structurales des protéines codées par ces gènes, qui présentent un enrichissement en désordre et une grande diversité d'états structuraux.

Mots-clefs : dark protéome, amas hydrophobes, segmentsrepliables, protéines et régions intrinsèquement désordonnées, ordre caché, AlphaFold2

Leveraging protein fold signatures to describe the order/disorder continuum in proteomes

Abstract
A significant fraction of the proteomes remains unannotated, leaving inaccessible a part of the functional repertoire of life, including molecular innovations with therapeutic or environmental value. Lack of functional annotation is partly due to the limitations of the current approaches in detecting hidden relationships, or to specific features such as disorder.
The aim of my PhD thesis was to develop methodological approaches based on the structural signatures of folded domains, in order to further characterize the protein sequences with unknown function even in absence of evolutionary information.
First, I developed a scoring system in order to estimate the foldability potential of an amino acid sequence, based on its density in hydrophobic clusters, which mainly correspond to regular secondary structures. I disentangled the continuum
between order and disorder, covering various states from extended conformations (random coils) to molten globules and characterize cases of conditional order. Next, I combined this scoring system with the AlphaFold2 (AF2) 3D structure predictions available for 21 reference proteomes. A large fraction of the amino acids with very low AF2 model confidence are included in non-foldable segments, supporting the quality of AF2 as a predictor of disorder. However, within each proteome, long segments with very low AF2 model confidence also exhibit characteristics of soluble, folded domains. This suggests hidden order (conditional or unconditional), which is undetected by AF2 due to lack of evolutionary information, or unrecorded folding patterns. Finally, using these tools, I made a preliminary exploration of unannotated proteins or regions, identified through the development and application of a new annotation workflow.
Even though these sequences are enriched in disorder, an important part of them showcases soluble globular-like characteristics. These would make good candidates for further experimental validation and characterization. Moreover, the analysis of experimentally validated de novo genes allowed me to contribute to the still-open debate on the structural features of proteins encoded by these genes, enriched in disorder and displaying a great diversity of structural states.

Keywords: dark proteome, hydrophobic clusters, foldable segments, IDPs/IDRs, hidden order, AlphaFold2

Jury

  • Jean-Christophe Gelly  Maître de conférences, Université de Paris                    Rapporteur
  • Raphaël Guérois - Directeur de recherche CEA, Université Paris Saclay     Rapporteur
  • Ingrid Lafontaine - Professeure, Sorbonne Université                                 Examinatrice
  • Anne Lopes - Maîtresse de conférences, Université Paris Saclay      Examinatrice
  • Lucie Bittner - Maîtresse de conférences, Sorbonne Université - Invitée
  • Isabelle Callebaut - Directrice de recherche CNRS, Sorbonne Université      Directrice de thèse
  • Elodie Duprat - Maîtresse de conférences, Sorbonne Université - Co-encadrante

 

Photo : © IMPMC - Cécile Duflot 

Cécile Duflot - 22/11/22

Traductions :

    Zoom Science - Amorpheus : un logiciel en libre accès pour l’analyse des données de diffusion de rayons X sur des systèmes liquides ou amorphes

    L’étude de la structure locale d’un liquide ou d’un solide amorphe soumis à des conditions extrêmes de pression et de température permet d’en déduire la densité, ainsi que la compressibilité, l’expansion thermique et, éventuellement, d’identifier des transitions de phase liquide-liquide. L’analyse et...

    » Lire la suite

    Contact

    A. Marco Saitta

    Directeur de l'institut

    marco.saitta(at)sorbonne-universite.fr

     

    Bruno Moal

    Secrétaire général

    33 +1 44 27 52 17

    bruno.moal(at)sorbonne-universite.fr

     

    Jérôme Normand

    Gestion du personnel

    Réservation des salles

    jerome.normand(at)upmc.fr

     

    Antonella Intili

    Accueil et logistique

    Réservation des salles

    antonella.intili(at)upmc.fr

     

    Ouafa Faouzi

    Gestion financière

    gestionimpmc@impmc.upmc.fr (gestionimpmc @ impmc.upmc.fr)

     

    Cécile Duflot

    Communication

    cecile.duflot(at)upmc.fr

    33 +1 44 27 46 86

     

    Expertiser une météorite

     

    Contact unique pour l'expertise de matériaux et minéraux

     

    Stages d'observation pour élèves de 3e et de Seconde

    feriel.skouri-panet(at)upmc.fr

     

    Adresse postale

    Institut de minéralogie, de physique des matériaux et de cosmochimie - UMR 7590

    Sorbonne Université - 4, place Jussieu - BC 115 - 75252 Paris Cedex 5

     

    Adresse physique

    Institut de minéralogie, de physique des matériaux et de cosmochimie - UMR 7590 - Sorbonne Université - 4, place Jussieu - Tour 23 - Barre 22-23, 4e étage - 75252 Paris Cedex 5

     

    Adresse de livraison

    Accès : 7 quai Saint Bernard - 75005 Paris, Tour 22.

    Contact : Antonella Intili : Barre 22-23, 4e étage, pièce 420, 33 +1 44 27 25 61

     

     

    Fax : 33 +1 44 27 51 52