Salut,
J'ai du mal à voir ce qu'il y a vraiment de nouveau dans cet article. L'idée de l'intervention catalytique des métaux est fort ancienne (même plus ancienne que l'intervention des sources hydrothermales).
Ce n'est pas du tout clair dans l'article de radio canada.
il faudrait peut-être lire l'article en détail https://www.science.org/doi/10.1126/sciadv.abj3984
en tout cas la partie conclusion ("Summarizing the findings") n'est pas très éclairante.... pour moi.
Quelqu'un se sent le courage de décrypter ?
"Il ne suffit pas d'être persécuté pour être Galilée, encore faut-il avoir raison." (Gould)
Il s’agit d’un article de vulgarisation assez bas de gamme qui annonce des résultats révolutionnaires mais ne les donne jamais :
C’est toujours l’hypothèse du potage.La structure de protéines qui serait à l'origine de l’apparition de la vie dans la « soupe primordiale » de la Terre aurait été identifiée par des scientifiques américains.
En effet “toute forme de vie primaire a dû collecter et utiliser de l'énergie“ car si on veut synthétiser des molécules il faut un apport d’énergie sauf que :Son équipe a d’abord voulu définir quelles sont les propriétés qui définissent la vie telle que nous la connaissons. Elle a conclu que provenant de sources telles que le soleil ou les cheminées hydrothermales.
Sur le plan moléculaire, cela signifierait que la capacité à mélanger les électrons est essentielle à la vie, explique le communiqué.
- L’énergie solaire utilisée par la photosynthèse n’a certainement pas été mise œuvre par les premiers organismes vivants. C’est beaucoup trop sophistiqué. Ça a dû être développé nettement plus tard. Si elle a connu un tel succès évolutif c’est parce qu’elle super efficace.
- Les cheminées hydrothermales ne sont pas un apport d’énergie, ce sont les composés chimiques qu’elles contiennent qui ont été utilisés par les premiers organismes.
Nico
Travailler dur n'a jamais tué personne, mais je préfère ne pas prendre de risques.
Salut,
Problème bien connu des actus ! Et l'article original que j'ai donné, tu as jeté un oeil ?
(bon je dois dire que "des résultats révolutionnaires mais ne les donne jamais" j'ai eut aussi cette impression en lisant "Summarizing the findings" mais faudrait creuser le reste)
"Il ne suffit pas d'être persécuté pour être Galilée, encore faut-il avoir raison." (Gould)
Bonjour,
Je viens de jeter un rapide coup d’œil à la publication originale indiquée par Deedee81 (Bromberg et al., 2022).
D’abord, j’ai remarqué qu’il y avait quelques grands noms que l’on avait déjà évoqué parmi les auteurs des publications dans leurs références bibliographiques. Il y a les pionniers (Oparin, Haldane, Urey & Miller, Oró), il y a les classiques (Joyce, Lazcano, Bada). Ça fait quand même beaucoup d’amateurs des solutions de type soupe, comme le signalait Nicolas. L’un des co-auteurs de la publication, Paul G. Falkowski, ne m’est pas inconnu non plus, mais je n’ai pas pris le temps d’essayer de retrouver si et où je l’avais cité sur le forum.
Enfin, j’observe que la publication est plutôt centrée bio-informatique, et qu’elle compte dans ses références bibliographiques des grands noms du domaine, dont j’avais moi-même analysé les travaux ailleurs sur ce forum (Gustavo Caetano-Anollés, Daniel Segrè, Edward N. Trifonov, Andrei N. Lupas), ainsi que d’autres chercheurs dont j’avais eu le plaisir de relayer les travaux ici en chimie bio-inorganique (dont les fascinants travaux du célébrissime et regretté R. J. P. Williams), et sur la classification des métallo-enzymes (Claudia Andreini et coll. en réf. 27).
Donc, comme ça, à vue de nez, j’imagine qu’il n’y a pas que du vent dans cette publication. Par contre, on insiste très fort sur les travaux de type "soupe" entre les références 41 et 47, donc il se pourrait que je décroche à un moment donné…
Je vais essayer de lire ça calmement et de résumer ce que j’ai cru comprendre de l’intention des chercheurs (même si je me suis dit que je ne le ferais plus après ce qui est arrivé à la discussion dans laquelle je prenais véritablement du plaisir à le faire).
Cordialement.
Dernière modification par Geb ; 23/01/2022 à 16h23.
Re-bonjour,
Si j’ai bien compris, ils se proposent d’identifier les structures protéiques les plus proches de l’origine de la vie susceptibles d’agir comme ligands pour des ions ou des clusters métalliques.
Pour ça, ils se sont limités à identifier ce qu’ils appellent des "sphères" d’acides aminés autour des ions métalliques, lesdites "sphères" n’excédant pas 15 ångströms autour de l’ion métallique (ou de la "grappe" d’ions métalliques) analysé.
Se faisant, ils ont pu identifié 21 sphères qui selon leur analyse pourraient correspondre aux ligands les plus anciens. Parmi ces 21 sphères, il y en a 17 qui se lient à des ions métalliques (Fe, Co, Mn et Ni) dont les propriétés auraient pu être mise à profit tôt par la chimie du vivant. Il y a également trois sphères qui sont associées au cuivre (le cuivre n’étant pas considéré comme un ion utilisé tôt par le vivant). L’hypothèse est que ces trois sphères correspondent bien à des repliements structurellement anciens, mais qu’auparavant ils se liaient à un autre métal et qu’aujourd’hui ils ont été conservés, réutilisés et optimisés pour se lier au Cu.
Parmi ces 21 sphères, 14 des protéines contenant ces sphères correspondant aux ligands les plus anciens étaient soit des oxidoréductases ou étaient impliqués dans le transport d’électrons.By far, the most central 1% (21 spheres) were thus deemed to be structurally closest to the most ancient folds (Fig. 6). The ligands bound by these spheres were diverse (including a heme and various ions), but putatively older metal ions/ion-containing ligands were more common, i.e., 17 Fe/Co/Mn/Ni-binding spheres. There were also three Cu-binding spheres, suggesting later optimization and reuse of existing folds.
De là, ils infèrent que :Notably, 14 of the annotated proteins housing the central sphere set were either oxidoreductases or otherwise involved in electron transport, a 1.6-fold enrichment compared to the expectation for the network
Donc, que les repliements anciens qui servaient à l’origine aux transports d’électrons sont ceux qui ont servi de base pour développer la variété de repliements se liants à tous les métaux utilisés par le vivant aujourd’hui.Our findings thus suggest that metal-binding folds used for electron transfer may indeed have given rise to the variety of metal-binding fold uses observed today.
En deuxième partie de la publication, ils recherchent des "motifs répétifs" qui figurent dans les ligands les plus anciens. Ils expliquent brièvement la méthode, mais ça reste évidemment assez obscur pour l’amateur que je suis :
L’analyse ci-dessus les a conduit à dégager 31 motifs structurels (voir Figure 8A), de 7 à 68 acides aminés de long, susceptibles de remonter au plus près de l’époque de l’origine de la vie, qu’ils ont classés en 6 clusters/catégories différentes (voir Figure 8B) :We looked for repetitive motifs in the central spheres to identify those most likely found at the origin of life. […] Briefly, a protein is broken down into every possible continuous fragment of various lengths, and each fragment is structurally aligned to the whole protein. The best set of suboptimal alignments is constructed and scored to find the size and the phase of the repetitions.
[À suivre]We applied this approach to the protein structures of our central spheres and identified 31 representative structural motifs (Fig. 8A and Materials and Methods). These were 7 to 68 amino acids in length and encompassed a diversity of folds (fig. S7). We further loosely clustered these motifs into six clusters (Fig. 8B).
Partie 2 :
En recherchant ces motifs ailleurs avec une autre méthode, ils ont remarqué qu’ils étaient structurellement similaires à des structures se liant aux même métaux que leur supposée "sphère d’origine" (ce qui paraît cohérent d’un point de vue évolutif), mais aussi que les motifs correspondaient à un grand nombre de protéines qui ne se lient pas à des métaux. Ils font donc l’hypothèse que ces motifs ont été réutilisés sur le modèle du bricolage pour accomplir d’autres fonctions.
Ensuite, ils ont essayé de voir s’il y avait des différences dans les 6 clusters/catégories dans lesquel(le)s ils ont regroupé ces 31 motifs :Motifs aligned better, i.e., with higher TopMatch scores, to structures binding the same metal as the sphere of that motif’s origin (fig. S8). However, the motif alignments also covered a large number of non–metal-binding proteins, suggesting that these motifs may have been repurposed for other functions.
Donc, les motifs des clusters n°3 et 6 ne semblent finalement pas si anciens, ceux du cluster 1 étaient assez peu répandus. Ils font donc l’hypothèse que ce sont dans les clusters 2, 4 et 5, qui sont eux bien répandus au sein des structures protéiques actuelles, que figurent les motifs structurels apparus les premiers.For clusters 3 and 6, motifs aligned to central structures more frequently than to other structure subsets—an observation unlikely for truly ancient motifs. Alignments for clusters 1, 2, 4, and 5 were similar across all analyzed structure subsets, but cluster 1 motifs were infrequent across all protein sets. The fact that our cluster 2, 4, and 5 small structural motifs are equally well distributed throughout the vast majority of protein structures can be interpreted as evidence of their early appearance, predating protein diversification.
Ils vont un peu plus loin dans leurs spéculations :
Ils estiment donc que les motifs structurels du cluster n° 3 pourraient représenter des cas de duplication des motifs du cluster 2 qui sont plus court. Quoi qu’il en soit, il ne reste plus que les clusters n° 2 et 5 pour représenter les structures se liant à des métaux probablement anciennes :At random, shorter motifs are expected align to a larger number of structures, but each of the cluster 4 motifs (average length of 8 residues) aligned to fewer structures than clusters 2 and 5 (average length of 16 to 24 residues). Note that cluster 3 had matched the largest number of structures with positive sahle scores, but its motifs are too long and preferentially more common in the central spheres to be considered ancient. They may, instead, represent a result of duplication of the shorter cluster 2 motifs, particularly in light of nearly three-quarters of shared structural matches between the two clusters.
Ils voient des raisons de croire en leur analyse dans certains travaux d’ingénierie de métalloprotéines synthétiques :Thus, motifs of clusters 2 and 5 appear to represent the most basic, and likely ancient, metal-binding structures.
Les auteurs de l’étude sont aussi conscient qu’elle comporte certaines limites :In a bottom-up engineering of synthetic metalloproteins that mimic natural enzymes, clusters may be thought of as building blocks. Cluster 3 motifs are found in the ribonucleotide reductases, methane monooxygenases, ferritins, and hemerythrins (12). The Due Ferri series of design shows that much of the structure and chemistry of natural proteins is recapitulated from minimal metalloproteins composed of just two cluster 3–like elements (56, 57). Duplicating cluster 2 produces a simple rubredoxin mimetic (58). Combinations of clusters 2 and 5 can produce P-loops and bacterial ferredoxin folds (59) that recapitulate both chemical and biological functions (60, 61). Our clusters thus represent robust building blocks for natural metalloenzymes, so it is not unexpected that they have been so useful in the design of synthetic ones.
[À suivre]While there is evidence that prebiotic metal-binding motifs could be even shorter (15), sequence-based attempts to find them are limited by difficulties of establishing statistical significance of short alignments.
Partie 3 :
Ensuite, ils ont comparé leurs trouvailles aux résultats d’Alva et al. (2015) :
Il s'agit là, en particulier, des travaux de Diego Ferreiro, l'un des co-auteurs des deux études (le seul qui ne travaillaient pas dans le New Jersey au moment de l'écriture de l'article Bromberg et al.). Cela semble coller selon eux :To exhaust sequence space evidence for prebiotic origins of our motifs, we considered the Alva et al. work (19) reporting a collection of ancient sequence- and structure-similar metal-binding protein repeats (six groups of metal-binding fragments; data S1: AlvaToMotif). We evaluated the correspondence of our motifs to these fragments in structure space.
Pareil pour les résultats de Wang et al. (2011) :While cluster 5 motifs were not matched by any of the fragments, cluster 2 motifs had matched two of the three mid-length fragment groups. This observation reaffirms the ancient origins of both fragments and motifs. The match to two fragment groups further suggests that the appearance of cluster 2 structures might have predated the divergence of these fragments in sequence.
Ils en concluent que l’étude de Wang et collaborateurs basée sur les repliements dans SCOP ont probablement évolué à partir de l’alphabet de motifs plus anciens qu’ils ont réussi à identifier :Specifically, only 4 (of 31) motifs were missing in the putatively oldest fold (c.37: P-loop containing nucleoside triphosphate hydrolase). […] This finding is in line with an earlier observation that these two fold families were responsible for introducing at least a third of the known biocatalytic mechanisms into life’s repertoire (14). […] One of the four motifs missing from c.37 (1knk chain A residues 1 to 30) appeared almost immediately in the second oldest fold (c.1: TIM beta/alpha barrel). […] Another missing motif appeared somewhat later (1gyc chain A residues 210 to 256 appears in b.6: Cupredoxin-like folds). […] These three folds together (c.1, c.37, and a.25) contained 30 of 31 motifs in our set.
Dans la partie "Summarizing the findings", ils reprennent donc trois conclusions principales évoquées jusqu’ici :This suggests that the alphabet of motifs evolved before the first SCOP fold in the Wang et al. list, i.e., more than 3.8 billion years ago (66), and then consistently reused in a diversity of arrangements in evolution of life.
First, the peptides at the origins of life were likely used for facilitating electron transfer.Second, the interchangeability of metals used in the biological activity reflects the likely contemporaneous availability of these metals on geological time scales, with folds binding these metals possibly adapted from a common ancestor.Ils raccrochent à d’autres étapes (comme le monde à ARN) l’état initial qu’ils suggèrent dans la diversité des motifs capables de se lier à des métaux de transition :Last, we find that the earliest biologically functional peptides were likely available before the assembly of fully functional protein folds over 3.8 billion years ago.
Ensuite, comme l’a noté Nicolas, ils plongent la tête la première dans l’hypothèse de la soupe prébiotique. En effet, sur la base que :These may have been used as cofactors for RNA-driven catalytic activity together with the available metal ligands, as evidenced by both their nucleotide and metal binding abilities. This scaffolding could then have allowed for more complicated protein fold assembly facilitated by bound metals and led to the structural diversity we observe today.
Ils ne citent que des travaux de synthèse prébiotique inspirés de la soupe "à la Miller". Je me permets de faire l’impasse sur cette partie rébarbative.[…] the likely ancient folds are still enriched in amino acids that must have been prebiotically available.
[À suivre]
Dernière modification par Geb ; 23/01/2022 à 17h50.
[mode invité, on] je crois que je reprendre de la soupe, ça à l'air de bien faire grandir [mode invité /off]
Partie 4 :
Après, ils s’intéressent à une liste de 151 ligands qui contiennent 8 métaux de transition différents : cobalt (Co), cuivre (Cu), fer (Fe), manganèse (Mn), molybdène (Mo), nickel (Ni), vanadium (V) et tungstène (W). Plus particulièrement, ils visent l'analyse des structures protéiques qui se lient à ces ligands.
À partir de cet ensemble, ils ont déterminé la structure de toutes les chaînes d’acides aminés de plus de 35 résidus dans un rayon, là encore, de 15 Å autour du centre géométrique du ligand.We extracted from the RCSB Ligand Expo (4) a list of 151 ligands containing transition metals Co, Cu, Fe, Mn, Mo, Ni, V, and W. We then collected from the PDB […] the protein structures (resolution ≤ 3 Å) that bind these ligands.
Ensuite, ils ont essayé de réduire l’échantillon. Ils se sont tout de même retrouvés avec 4672 sphères :We further extracted from these the metal-binding spheres, defined as all residues within a 15-Å radius from the geometric center of the metal ligand and containing more than 35 amino acids (residues).
Là encore, en combinant deux des méthodes utilisées ci-dessus, ils réduisent leur échantillon à 1551 clusters de protéines, avec cela dit un biais expérimental manifeste (difficile de dire ce que ça raconte sur la qualité de nos bases de données, sur la qualité des méthodes utilisées, ou même, pourquoi pas, sur la "situation prébiologique supposée" que ça pourrait permettre d'entrevoir).We removed all spheres from the same protein structure (same PDB ID) that shared any residues. This set was further reduced for redundancy, by choosing one representative for every subset of 100% sequence-identical spheres, binding the same ligand, and sharing the same number of chains. […] The resulting collection contained 4672 spheres […].
L’idée de cette section de la publication, c’est d’essayer d’explorer l’évolution des repliements au sein de leur réseau de motifs supposés anciens.We further structurally aligned all pairs of the 4672 spheres in our PDB set, regardless of their ligand identity, using TopMatch. For every alignment of one sphere to another, we computed the sahle distance and the Euclidean distances between metal ligand centers. […] By the end of this process, each cluster contained very similar spheres, binding only one ligand. […] This process retained 1551 clusters of proteins (including 774 singletons). Notably, heme-binding proteins formed the biggest clusters (fig. S10), indicating an experimental bias in the PDB.
Là encore, un biais expérimental s’est fait jour :By selecting a single protein from each cluster, we reduced the network size while increasing diversity. As the goal of this study was to explore the evolution of the folds in our network, we retained representatives for each cluster on the basis of their connectivity to other nodes, which may indicate their evolutionary trajectory.
[À suivre]When reduced to only one representative node per cluster (1551 nodes total), the network was decomposed into 34 components. However, the largest component contained 97% (1509) of the nodes
Partie 5 (dernière partie) :
Dorénavant, les auteurs vont s’intéresser à ce qu’ils appellent des "tuiles", par une méthode de "tuilage de l’espace structurelle protéique" proposée par Parra et al. (2013).
Et là, la boucle est bouclée en quelque sorte, puisqu’ils obtiennent 223 tuiles liées à 20 des sphères du début de l’étude. À partir de ces dernières, ils en ont encore sélectionné 71 qui recouvraient aux mieux ces sphères (quoi que cela veuille vraiment dire), qu’ils ont là aussi séparé en six groupes de structures similaires (voir Fig. S11).Proteins often contain recurrent structural motifs that can be considered repetitions and variations of a basic, possibly ancient, structural unit. To characterize repetitions and identify motifs in the 20 central spheres, we used an approach similar to the method described in Parra et al. (52). To detect repeats, we decomposed the structure into smaller units (tiles) with the constraint that these tiles be structurally similar to each other. In a protein, the possible tiles are not necessarily unique (i.e., nonoverlapping), nor are they required to cover a chain completely (i.e., be present repeatedly across the entire chain sequence). However, it is possible to identify those tiles that, when repeated in a nonoverlapping fashion, cover a maximum fraction of the structure.
Pour chacun des six clusters/groupes, ils ont choisi un motif structurel représentatif, c’est-à-dire la "tuile" qui recouvrait la plus grande part de la sphère.This approach produced 223 tiles, representing the 20 spheres in our set. For each sphere, we further selected all nonoverlapping tiles that best covered that sphere; a total of 71 tiles. We further aligned all tiles within a sphere and hierarchically clustered them [using the silhouette coefficient (76) as the guide for the number of clusters] on the basis of the TopMatch alignment scores. For each cluster, we chose a representative structural motif as the one tile that covered the largest fraction of the sphere (31 motifs total; data S1: MotifList); these were further clustered into six structurally similar groups (fig. S11).
Cela leur a permis d’attirer l’attention sur le lien évolutif probable entre ces motifs anciens et les structures en hélice les plus simples et les structures dite en épingle à cheveux :For each cluster, we chose a representative structural motif as the one tile that covered the largest fraction of the sphere (31 motifs total; data S1: MotifList); these were further clustered into six structurally similar groups (fig. S11).
Voilà, je n’ai pas envie d’y consacrer davantage de temps pour l’instant, surtout en ce qui concerne la qualité des différentes méthodes utilisées (largement basée sur une précédente étude du même groupe).We selected fragments that did not match (TopMatch < 80) any of our motifs but were similar in length and secondary structure to cluster 2 and 5 motifs (cluster 2–like fragments: 30 to 70% helix residues and a loop residue at the start and/or end of the fragment; cluster 5–like fragments: 25 to 70% β sheet residues and at least two loop residues)
[…]
The number of reliable matches for these eight fragments similar to cluster 2 and the four fragments similar to cluster 5 was higher than that of random fragments, confirming the importance of the simplest helix and the hairpin structures with a network of hydrogen bonds (median = 2193 and 2390 for clusters 2 and 5, respectively).
Cependant, j’espère sincèrement que ce "petit" résumé sera utile à ceux qui voudraient discuter plus en détails (sinon à quoi bon ? ).
Cordialement.