The article provides a summary of protein modifications from UniProt database and an overview of research methods for major protein modifications: phosphorylation, acetylation and methylation, ubiquitination, and glycosylation.
Il y a 23,000 gènes dans le génome humain, cependant, ces gènes génèrent un protéome beaucoup plus large, du fait de la diversification au niveau post-transcriptionnel et post-traductionnel. Au niveau post-transcriptionnel, de multiples ARNm peuvent être générés à partir d’un même gène via épissage alternatif et, moins fréquemment, l’édition de l’ARN. Après traduction, beaucoup de protéines subissent des modifications et/ou des clivages pour obtenir les formes matures et fonctionnelles des protéines. La structure et la fonction des protéines sont diversifiées via une large gamme de modifications post-traductionnelles.
Le statut et le profil des modifications des protéines révèlent différentes fonctions des protéines dans des cellules spécifiques ou à une étape spécifique du développement ainsi que des dérégulations des fonctions protéiques dans les maladies. Dans cette revue, quatre types communs de modifications de protéines et les méthodes de recherche associées sont discutés: la phosphorylation, l’acétylation et la méthylation, l’ubiquitination, et la glycosylation.
Le protéome humain comprend plus de polypeptides fonctionnels que la collection de gènes dans le génome, en partie, du fait de modifications co- et post-traductionnelles (Fig 1A). Le but de la recherche en protéomique est d’obtenir une vision globale des protéines fonctionnelles présentes dans un type cellulaire ou un tissue particulier, dans les tissus sains et maladies. Un des secteurs important de la recherche protéomique est d’identifier les protéines qui sont modifiées post-traductionnellement et leurs sites de modification, de caractériser la fonction de ces modifications, et d’étudier l’interaction de la protéine modifiée avec un réseau cellulaire fonctionnel.
Durant les dernières décennies, plusieurs méthodes ont été développées pour étudier les modifications des protéines. Dans cette revue, nous nous concentrerons sur la spectrométrie de masse comme approche générale pour identifier une modification de protéine et sur des méthodes spécifiques pour la phosphorylation, comme le marquage à l’ortho-phosphate, pour l’ubiquitination, pour l’acétylation et la méthylation des histones dans le contexte du remodelage de la chromatine, et pour la glycosylation des protéines (Table 1 et Fig 1B). Des protocoles détaillés ne sont pas présentés et seront couvert plus tard.
modification | Fonction | méthode |
---|---|---|
phosphorylation | signalisation intracellulaire |
|
ubiquitination | dégradation de protéine |
|
acétylation et méthylation | régulation transcriptionnelle |
|
glycosylation | signalisation extracellulaire |
|
Durant les 20 dernières années, l’analyse en spectrométrie de masse est devenue un outil essentiel dans la détermination des types et des sites de modification des protéines. L’analyse en spectrométrie de masse peut être réalisée sur protéines purifiées et sur des mélanges de protéines comme les lysats [7, 8].
Un spectromètre de masse génère des ions en phase gazeuse à partir d’un échantillon, il les sépare en fonction de leur ratio masse/charge (m/z) et génère une trace de leur abondance. La spectrométrie de masse peut être utilisée pour la détermination du poids moléculaire de peptides et de protéines, pour déterminer la séquence en acides aminés de peptides et pour la détection de modifications post-traductionnelles, ainsi que la quantification relative de peptides et de protéines dans un échantillon. Cette méthode ne peut pas être utilisée pour la quantification absolue.
Pour préparer un échantillon pour l‘analyse en spectrométrie de masse, la protéine ou le lysat cellulaire est digéré en petits fragments peptidiques à l’aide d’enzymes comme la trypsine. Les fragments sont alors vaporisés et analysés pour déterminer leur valeur m/z. Comme les sites de digestion enzymatiques sont connus, un programme informatique détermine la séquence en acides aminés unique de chaque peptide en fonction de la masse. Le poids moléculaire ainsi que la charge d’un groupe tel qu’un groupe phosphate sont aussi connus, la phosphorylation d’un acide aminé spécifique dans un fragment particulier peut également être déterminée.
Un échantillon de protéines digéré peut être analysé par “matrix-assisted laser desorption/ionization (MALDI) peptide mapping” ou par un spectromètre de masse nanoelectrospray. L’utilisation de ces méthodes peut, cependant, conduire à une analyse incomplète avec certains peptides visibles et d’autres pas du tout. C’est souvent un problème majeur lors de l’analyse de mélanges complexes, de peptides modifiés, et des modifications post-traductionnelles. Les peptides sont d’abord séparés par chromatographie en phase inverse, avec collection de fractions qui sont ensuite analysées par spectrométrie de masse (une méthode connue comme LC/MS) (Fig 2B) [9]. Pour déterminer de manière plus précise la nature de la modification peptidique, la spectrométrie de masse en tandem (MS/MS) est souvent utilisée (Fig. 2A). Après la première étape de MS, l’ion peptidique est tamponné avec du gaz inerte ce qui induit une fragmentation supplémentaire. Ces fragments peptidiques sont ensuite analysés dans une deuxième étape de MS [10]. Certains peptides modifiés sont restés intacts durant ce processus, générant un pattern similaire à celui du peptide non modifié, alors que d’autres se fragmentent beaucoup, créant un pattern qui peut fournir des informations supplémentaires sur la nature et la location des acides aminés modifiés.
En plus d’être utilisée pour déterminer les modifications d’une protéine unique, la spectrométrie de masse est aussi utilisée pour générer de larges bases de données de protéines qui portent une modification particulière telle que la phosphorylation. Ceci implique généralement une étape de sélection par affinité avant l’analyse en spectrométrie de masse. De telles techniques sont utilisées pour définir un ‘sub-protéome’ portant cette modification, tel que le phosphoprotéome pour analyser le statut d’activation d’un réseau de signalisation comme dans le cancer [11].
La spectrométrie de masse a été utilisée pour identifier les quatre modifications citées ci-dessus. Cependant, l’analyse en spectrométrie de masse est coûteuse et requiert des équipements spécifiques et, souvent, des données plus quantitatives sont nécessaires. De ce fait, d’autres méthodes biochimiques sont généralement utilisées en conjonction avec la spectrométrie de masse pour analyser les modifications post-traductionnelles. Des revues plus détaillées sur les différentes méthodes de MS sont disponibles dans la littérature [7], [8].
La phosphorylation, ou l’addition d’un groupe phosphate sur un résidu serine, thréonine, ou tyrosine, est une des formes les plus communes de modification de protéine (Fig. 3A). La phosphorylation de protéines joue un rôle important dans les cascades de signalisation intracellulaire et est réversible, régulant ainsi le signal [12]. Plusieurs méthodes in vivo et in vitro sont utilisées pour déterminer l’état de phosphorylation d’une protéine, la phosphorylation d’un acide aminé particulier, et pour définir si une kinase(ou phosphatase) spécifique modifie une protéine d’intérêt.
La méthode d’analyse de l’activité des kinases utilisant le 32P-gamma-ATP en dosage radiométrique peut être utilisée pour déterminer l’état de phosphorylation d’une protéine in vitro [5]. C’est aussi la méthode de référence pour la détermination du rôle de kinases spécifiques. La protéine d’intérêt purifiée, la kinase et le 32P-gamma-ATP sont incubés dans un tampon de réaction. La solution de réaction est ensuite passée au travers d’un filtre pour lier la protéine et éliminer l’ATP non lié. Le niveau de phosphorylation (radio-isotope retenu sur le filtre) est détecté à l’aide d’un compteur à scintillation. Alternativement, le produit de réaction peut être résolu en SDS-PAGE, et visualisé par exposition sur un film radiographique. Cette méthode est moins quantitative mais permet de confirmer le poids moléculaire de la protéine phosphorylée.
La réaction peut également utiliser une phosphatase au lieu d’une kinase pour déterminer si une protéine phosphorylée est le substrat d’une phosphatase spécifique.
Pour mesurer la phosphorylation in vivo, la méthode de “radioactive pulse labelling” a été utilisée [13]. Des cellules sont cultivées en présence de P32-orthophosphate. La protéine d’intérêt est ensuite immunoprécipitée avec un anticorps spécifique, le radio-isotope retenu est quantifié à l’aide d’un compteur à scintillation ou résolu en SDS-PAGE et exposé sur un film radiographique. La méthode peut être utilisée pour mesurer la phosphorylation sous différentes conditions physiologiques. De plus, en conjonction avec une étape de “knock-down” de protéine, cette méthode peut également être utilisée pour déterminer l’implication d’une kinase ou phosphatase spécifique dans la modification de la protéine d’intérêt.
Il y a deux types d’anticorps phospho-spécifiques. Les anticorps anti- phospho-tyrosine, phospho-serine, et phospho-thréonine génériques qui se lient à n’importe quel résidu phospho-tyrosine, phospho-serine, and phospho-thréonine sans tenir compte des acides aminés voisins. La deuxième catégorie comprend les anticorps dirigés contre des épitopes phospho-spécifiques.
Après l’identification d’un site de phosphorylation putatif par une méthode in silico ou par spectrométrie de masse, les anticorps contre des sites de phosphorylation classiques commercialement disponibles peuvent être utilisés en conjonction avec une étape d’immunoprécipitation pour déterminer si la protéine d’intérêt est phosphorylée sur un site spécifique (par exemple le site canonique cyclin/cdk) [14]. Les anticorps générés contre un acide aminé phosphorylé spécifique telle qu’une phospho-tyrosine, peuvent également être utilisés (Fig. 3B). Ceci peut être suivi par la génération d’un anticorps phospho-spécifique pour l’épitope d’intérêt et l’analyse de la phosphorylation par Western blotting. Pour analyser un grand nombre d’échantillons, un ELISA peut être développé ou le substrat est capturé par l’anticorps coaté sur la plaque et détecté avec l’anticorps phospho-spécifique [15].
L’ubiquitination de protéine, ou l’attachement covalent d’ubiquitine à des protéines cibles, a été étudiée dans le contexte de la dégradation de protéines. Par exemple, le “turnover” de protéines lié à l’ubiquitination joue un rôle important dans le cycle cellulaire [16]. Cependant, des recherches récentes ont aussi révélé un rôle pour l’ubiquitination dans de multiples voies de signalisation indépendantes de la dégradation de protéines.
La diversité des signaux résultants de l’ubiquitine dépend des différentes façons par lesquels la protéine cible peut être modifiée par l’ubiquitine - la mono-ubiquitination sur un ou plusieurs sites, et la poly-ubiquitination via plusieurs liens possibles [17]. Les protéines substrat sont liées à l’ubiquitine via sept résidus lysine distincts sur l’ubiquitine (Lys6, Lys11, Lys27, Lys29, Lys33, Lys48 et Lys63). La formation d’une chaine poly-ubiquitine se produit lorsqu’un résidu lysine d’une ubiquitine se lie à la glycine carboxy-terminale d’une autre ubiquitine Les protéines poly-ubiquitinées sur des résidus lysine spécifiques sont généralement ciblées pour différents processus cellulaires. Donc le résultat fonctionnel de la poly-ubiquitination dépend des résidus lysines de l’ubiquitine utilisés. Ceci est déterminé par l’E2 spécifique (enzyme de conjugaison de l’ubiquitine) ou l’E3 (ubiquitine ligase), mais pas l’E1 (enzyme d’activation de l’ubiquitine) (Fig. 4A). La génération de chaines de poly-ubiquitine avec des liens lysine spécifiques créer une surface de liaison unique pour les domaines de liaison à l’ubiquitine des protéines d’interaction.
Les méthodes d’analyse de l’ubiquitination peuvent révéler l’ubiquitination sur des résidus lysine spécifiques ou confirmer le rôle de E3 spécifiques (ou E2) dans la modification de la protéine cible. La méthode la plus directe et communément utilisée pour démontrer l’ubiquitination in vivo est d’immunoprécipiter la protéine susceptible d’être ubiquitinée et de la soumettre à l’électrophorèse en SDS-PAGE et le Western blotting pour observer l’échelonnage typique des protéines ubiquitinées. La protéine cible, l’E3 ligase, et même l’ubiquitine sont souvent exprimées ectopiquement pour déterminer les effets de mutations (Fig. 4B). Des inhibiteurs de la dégradation par le protéasome tels que le MG132, sont fréquemment utilisés pour analyser l’ubiquitination K48 (dégradation-ciblage) de protéines cibles in vivo.
Les méthodes d’étude de l’ubiquitination in vitro (ou la protéine cible, l’ubiquitine, et l’E1, l’E2, et l’E3 sont fournies) peuvent être utilisées, en conjonction avec l’électrophorèse SDS-PAGE suivie par le Western blotting pour analyser l’ubiquitination de la protéine d’intérêt plus directement. Les mutations de résidus lysine dans la protéine d’intérêt peuvent permettre de déterminer le site d’attachement de l’ubiquitine. Inversement, dans le cas de la poly-ubiquitination, l’utilisation d’ubiquitine mutée sur des résidus lysines spécifiques peut fournir des informations sur les liens ubiquitine spécifiques. Pour découvrir de nouvelles protéines ubiquitinées,la purification de protéines utilisant l’ubiquitine suivie par la spectrométrie de masse peut être réalisée [18].
Les modifications épigénétiques (comme la phosphorylation, l’ubiquitination, l’acétylation et la méthylation) des histones conservées H2A, H2B, H3, et H4 joue un rôle régulateur important de l’expression des gènes [19]. Par exemple, l’acétylation et la méthylation des résidus lysine sur la région N-terminale des histones induit la formation des domaines de chromatine, tels que l’euchromatine et l’hétérochromatine, donc induit directement l’inactivation des gènes. Mesurer les modifications des histones représente une technique importante dans l’analyse de la régulation de l’expression des gènes [20].
Des collections larges d’anticorps sont commercialement disponibles pour tous les sites de modification d’histones connus. En utilisant ces anticorps, une immunoprécipitation de chromatine (ChIP) peut être réalisée [21]. Brièvement, les cellules ou les échantillons de tissus sont traités avec un agent de “cross-linking » comme le formaldéhyde pour lier les histones à la chromatine. La chromatine est soniquée ou traitée avec une nucléase pour générer des fragments d’ADN courts. Une immunoprécipitation (IP) est alors réalisée à l’aide d’un anticorps dirigé contre la modification d’histone désirée. Si le site putatif de modification d’histone dans un gène ou un promoteur est connu, la PCR peut être utilisée pour quantifier la présence de la modification d’intérêt à un site donné (Fig. 5A). Alternativement, cette méthode peut être utilisée pour identifier le site de modification d’histone dans une région promotrice générale ainsi que les cinétiques de modification d’histone à ce site (Fig. 5B).
Si le site de modification d’histone est inconnu, un ChIP-on-chip peut être réalisé pour identifier les régions du génome portant les modifications d’histone spécifiques [22]. Dans ce système, les fragments d’ADN de départ (IP input) et dans l’IP elle-même, sont marqués avec différents fluorophores. Les échantillons sont passés sur un chip présentant des sondes ADN, l’enrichissement d’un fragment d’ADN donné dans la fraction IP est en corrélation avec la localisation de l’histone modifiée d’intérêt avec un site donné du génome.
Les expériences de ChIP et ChIP-on-chip peuvent fournir des informations sur les modifications d’histones sur un promoteur d’intérêt, les cinétiques de changement dans le statut de modification, de même que sur la location des modifications d’histone concernant un gène ou une séquence régulatrice, ou sur l’ensemble du génome. Ces changements épigénétiques peuvent apporter des informations sur la régulation de gènes dans les fonctions normales ou sur la dérégulation qui se produit lors de maladie.
La glycosylation, ou l’attachement d’un groupe glycane se produit dans environ 50% des protéines totales, et joue un rôle dans les processus biologiques comme le développement embryonnaire, la division cellulaire, et la régulation de la structure protéique. Le statut de glycosylation d’une large variété de protéines change de manière significative pendant les évènements physiologiques normaux et lors de maladies (Par exemple l’inflammation, l’infection et le cancer). Donc, les méthodes d’analyse de la glycosylation des protéines peuvent apporter des informations importantes en recherche sur le pronostic de maladies ou à but thérapeutique.
Les deux types de glycosylations de proteines sont les N-glycosylations (ou le glycane est attaché à une asparagine) et les O-glycosylations (ou le glycane est attaché à une serine ou une thréonine). Les glycosylations diffèrent des modifications de protéines discutées ci-dessus car une large variété de glycanes a été décrite. L’analyse de la glycosylation de protéine permet d’identifier le glycane impliqué, la protéine modifiée, ou le site d’attachement. En général, l’analyse de la glycosylation peut utiliser trois approches différentes comme indiqué dans la Fig. 6A: l’analyse de glycanes libérés chimiquement ou enzymatiquement, la caractérisation des glycopeptides après digestion trypsique, ou la caractérisation des glycanes dans les glycoprotéines intactes.
Pour l’analyse des glycanes, la spectrométrie de masse parfois couplée avec une étape d’HPLC peut être utilisée. Les groupes de sucre sont d’abord libérés de la glycoprotéine soit enzymatiquement (peptide N glycosidase A ou F) ou chimiquement (hydazinolyse). L’analyse LC/MS peut alors être réalisée directement sur les oligosaccharides libérés. Alternativement, Le produit terminal réduit issu du clivage enzymatique ou chimique peut être marqué à l’aide d’un fluorophore. Les glycanes marqués au fluorophore peuvent alors être analysés à l’aide de différentes méthodes d’ HPLC, comme l’HPLC d’interactions hydrophiles [23].
Bien que les méthodes décrites ci-dessus apportent des informations sur des glycanes spécifiques, elles ne sont pas informatives en ce qui concerne l’identité de la protéine portant une modification spécifique ou sur le site d’attachement. Pour obtenir cette information, un clivage par endoprotéinase est réalisé (ex. digestion trypsique), et les glycopeptides sont analysés par LC/MS ou HILIC-MS/MS. Cette méthode peut fournir des informations sur soit toutes les protéines portant un groupe glycane particulier, ou sur le site d’attachement du glycane dans une protéine particulière [24]. Par exemple, dans la Fig. 6B, l’effet de l’incubation avec les bactéries Cc5 sur l’état de glycosylation de résidus spécifiques de la fétuine est mesurépar LC-MS, après digestion trypsique.
Finalement, pour certains glycopeptides, soumettre la protéine intacte à la spectrométrie de masse peut fournir des informations sur l’identité de la protéine et son état de glycosylation. Cependant, cette méthode dépend des propriétés biochimiques du glycopeptide, et produit souvent un niveau de résolution plus faible que les deux méthodes décrites ci-dessus.
- Vitek O. Getting started in computational mass spectrometry-based proteomics. PLoS Comput Biol. 2009;5:e1000366 pubmed
- Hazzalin C, Mahadevan L. Dynamic acetylation of all lysine 4-methylated histone H3 in the mouse nucleus: analysis at c-fos and c-jun. PLoS Biol. 2005;3:e393 pubmed
- Mann M, Hendrickson R, Pandey A. Analysis of proteins and proteomes by mass spectrometry. Annu Rev Biochem. 2001;70:437-73 pubmed
- Domon B, Aebersold R. Mass spectrometry and protein analysis. Science. 2006;312:212-7 pubmed
- Korfmacher W. Principles and applications of LC-MS in new drug discovery. Drug Discov Today. 2005;10:1357-67 pubmed
- Verbeck G, Ruotolo B, Sawyer H, Gillig K, Russell D. A fundamental introduction to ion mobility mass spectrometry applied to the analysis of biomolecules. J Biomol Tech. 2002;13:56-61 pubmed
- Lim Y. Mining the tumor phosphoproteome for cancer markers. Clin Cancer Res. 2005;11:3163-9 pubmed
- Cohen P. The regulation of protein function by multisite phosphorylation--a 25 year update. Trends Biochem Sci. 2000;25:596-601 pubmed
- Peck S. Analysis of protein phosphorylation: methods and strategies for studying kinases and substrates. Plant J. 2006;45:512-22 pubmed
- Zhang H, Zha X, Tan Y, Hornbeck P, Mastrangelo A, Alessi D, et al. Phosphoprotein analysis using antibodies broadly reactive against phosphorylated motifs. J Biol Chem. 2002;277:39379-87 pubmed
- Blaydes J, Vojtesek B, Bloomberg G, Hupp T. The development and use of phospho-specific antibodies to study protein phosphorylation. Methods Mol Biol. 2000;99:177-89 pubmed
- Tyers M, Jorgensen P. Proteolysis and the cell cycle: with this RING I do thee destroy. Curr Opin Genet Dev. 2000;10:54-64 pubmed
- Tomlinson E, Palaniyappan N, Tooth D, Layfield R. Methods for the purification of ubiquitinated proteins. Proteomics. 2007;7:1016-22 pubmed
- Grant P. A tale of histone modifications. Genome Biol. 2001;2:REVIEWS0003 pubmed
- Spencer V, Sun J, Li L, Davie J. Chromatin immunoprecipitation: a tool for studying histone acetylation and transcription factor binding. Methods. 2003;31:67-75 pubmed
- Buck M, Lieb J. ChIP-chip: considerations for the design, analysis, and application of genome-wide chromatin immunoprecipitation experiments. Genomics. 2004;83:349-60 pubmed
- Wuhrer M, Deelder A, Hokke C. Protein glycosylation analysis by liquid chromatography-mass spectrometry. J Chromatogr B Analyt Technol Biomed Life Sci. 2005;825:124-33 pubmed