Nombre total estimé d’espèces chez les procaryotes
Répondre à la discussion
Affichage des résultats 1 à 17 sur 17

Nombre total estimé d’espèces chez les procaryotes



  1. #1
    Geb

    Nombre total estimé d’espèces chez les procaryotes


    ------

    Bonjour,

    Je suis donc en train de faire un topo sur deux sujets en parallèle :

    - les différentes définitions utilisées pour qualifier des espèces différentes de procaryotes,
    - les différentes estimations disponibles du nombre total d'espèces de procaryotes.

    Jusqu'ici, les différentes publications auxquelles j'ai pu avoir accès couvrent la période qui va, en gros, depuis la fin des années 1980 jusqu'à 2019.

    Or, l'estimation chiffrée et argumentée la plus récente que j'ai pu trouver jusqu'ici (Louca et al., 2019) me laisse perplexe.

    En effet, en parcourant la publication, on voit que les chercheurs semblent proposer trois estimations successives différentes du nombre "d’unités taxonomiques opérationnelles au niveau de l’espèce" chez les procaryotes :

    1) entre 0,8 et 1,6 million,
    2) entre 2,2 et 4,3 millions,
    3) entre 3 et 9 millions.

    J'ai du mal à comprendre les différentes définitions qui expliquent chacune de ces trois options.

    Quelqu'un de plus qualifié que moi aurait-il l'amabilité de m'aider à comprendre à quelle estimation correspond telle ou telle définition ?

    Cordialement.

    -----

  2. #2
    MissJenny

    Re : Nombre total estimé d’espèces chez les procaryotes

    bonjour,

    le concept d'OTU a été introduit par les bioinformaticiens dans le but de classifier les séquences issues du séquençage à haut débit, on est là un peu loin de la biologie.

    certains biologistes pensent qu'on devrait abandonner le concept d'espèce pour décrire les bactéries. Les bactéries seraient simplement des assemblages de gènes plus ou moins stables. Prends l'exemple d'E coli. Si tu séquences une souche tu vas trouver environ 5000 gènes. Si tu séquences une autre souche, il y aura aussi 5000 gènes mais peut-être seulement 3000 communs avec la première souche. Je ne parle pas d'allèles identiques, mais bien de gènes. En tout on connaît un peu moins de 20000 gènes présents dans uns souche ou une autre d'E coli. Environ 1000 sont présents dans toutes les souches et forment le "noyau" du génome d'E coli, les autres se promènent de ci de là. Ils codent des protéines différentes avec des fonctions différentes. C'est ce qui fait qu'on a des E coli commensales et d'autres pathogènes. C'est vrai des autres bactéries (peut-être pas toutes quand-même).

  3. #3
    Flyingbike
    Modérateur*

    Re : Nombre total estimé d’espèces chez les procaryotes

    Je partage cet avis. La notion d'espèce chez les procaryotes est vraiment conceptuel.
    D'ailleurs, entre microbiologistes, la dénomination binomiale Genre espèce est rarement suffisante pour voir de quoi on cause. L'exemple de MissJenny est très bien. E. coli, ça peut être O157H:H7 qui est enterohémorragique, ou Nissle 1917 qui est probiotique... E. coli dans les deux cas....

    Personnellement, je vois plutôt cela comme un contiuum, même si pour les raisons expliquées par MissJenny on peut avoir besoin de discrétiser la chose, par exemple pour parler écologie. Pour comparer des microbiotes, par exemple, on compare le nombre d'OTUs, ou d'ASV.
    La vie trouve toujours un chemin

  4. #4
    Geb

    Re : Nombre total estimé d’espèces chez les procaryotes

    Bonjour,

    Merci pour ton commentaire (le premier est toujours le plus difficile).

    Citation Envoyé par MissJenny Voir le message
    Le concept d'OTU a été introduit par les bioinformaticiens dans le but de classifier les séquences issues du séquençage à haut débit, on est là un peu loin de la biologie.
    Un peu loin de la biologie dis-tu ? Vraiment ? De ce que j'ai pu en lire jusqu'ici, c'est surtout une querelle de systématiciens (certains sont pour, certains sont contre). Du peu que j'en sache, certains spécialistes estiment que les critères requis par l'International Code of Nomenclature of Prokaryotes pour qu'une espèce soit reconnue dans la List of Prokaryotic names with Standing in Nomenclature sont complètement dépassés depuis très longtemps et que si l'on veut enfin s'occuper sérieusement des "bactéries non-cultivables", les méthodes passant par la métagénomique sont les seules à l'heure actuelle susceptibles de nous sortir de l'impasse.

    Voir par exemple un débat représentatif dans les trois publications ci-dessous :

    - Uncultivated microbes in need of their own taxonomy (Konstantinidis et al., 2017)

    - Uncultivated microbes—in need of their own nomenclature? (Oren & Garrity, 2017)

    - Reply to the commentary “Uncultivated microbes—in need of their own nomenclature?” (Konstantinidis et al., 2018)

    Il me semble que la situation est assez bien résumée dans les premières phrases de la 3e publication en lien ci-dessus :

    [...] Oren and Garrity, two highly experienced taxonomists acting as nomenclature reviewers and senior editors for the International Journal of Systematic and Evolutionary Microbiology (IJSEM), expressed concerns on our proposal for the creation of a parallel classification for yet uncultured Bacteria and Archaea (Konstantinidis et al. 2017). We recognize that it might appear an unorthodox approach to solve the longstanding and pressing problem of a standardized and supervised taxonomy for yet uncultured Bacteria and Archaea with a parallel system. In fact, the goal of our proposal is to speed up the process of recognizing the uncultivated within the framework of the International Code of Nomenclature of Prokaryotes (ICNP) [2], which clearly represents the preferred way forward by Oren and Garrity as well as by us. However, if this cannot be realized in a timely fashion, we are convinced that the temporal generation of a parallel, yet congruent system of classification is a much better option than no action.
    Comme tu le sais, je ne suis pas spécialiste. Ce que j'en pense, c'est qu'il faut laisser les systématiciens travailler tranquillement, peu importe le temps que ça prendra, jusqu'à ce qu'il nous trouve une ou des solutions qui tiennent plus ou moins bien la route si bien qu'elle se révèle (on peut l'espérer) à l'épreuve du temps.

    En tout cas, les trois auteurs susmentionnés (Rosseló-Móra, Konstantinidis & Amann) mettent clairement en pratique la mise en place de ce qu'il espère être une alternative viable avec SeqCode :

    - How Systematic and Applied Microbiology will deal with two nomenclature codes (ICNP and SeqCode) for prokaryotes, and which classification standards are recommended for new taxa descriptions (Rosseló-Móra et al., 2022)

    Citation Envoyé par MissJenny Voir le message
    certains biologistes pensent qu'on devrait abandonner le concept d'espèce pour décrire les bactéries. Les bactéries seraient simplement des assemblages de gènes plus ou moins stables.
    Oui, c'est en effet un débat que j'ai pu lire jusqu'ici dans certaines publications, notamment celles qui introduisent les concepts d'hologénome et de pangénome. Ce n'est pas à moi de me prononcer sur la validité ou la pérennité future de ces idées.

    Citation Envoyé par MissJenny Voir le message
    Prends l'exemple d'E coli. Si tu séquences une souche tu vas trouver environ 5000 gènes. Si tu séquences une autre souche, il y aura aussi 5000 gènes mais peut-être seulement 3000 communs avec la première souche. Je ne parle pas d'allèles identiques, mais bien de gènes. En tout on connaît un peu moins de 20000 gènes présents dans uns souche ou une autre d'E coli. Environ 1000 sont présents dans toutes les souches et forment le "noyau" du génome d'E coli, les autres se promènent de ci de là. Ils codent des protéines différentes avec des fonctions différentes. C'est ce qui fait qu'on a des E coli commensales et d'autres pathogènes. C'est vrai des autres bactéries (peut-être pas toutes quand-même).
    C’est une info fascinante que j’avais lue pour la première fois dans le compte-rendu d’un symposium international Beilstein sur la chimie des systèmes conférence (International Beilstein Symposium on Systems Chemistry) qui s’est tenu à Bozen, en Italie, du 26 au 30 mai 2008 :

    - Frustration: Physico-chemical Prerequisites for the Construction of a Synthetic Cell (Danchin & Sekowska, 2009)

    As a matter of fact, for a given bacterial species (with the caveat that ‘‘species’’ is difficult to define in the case of bacteria), the number of genes that can be horizontally transferred greatly outnumbers the average number of genes present in a given strain. For Escherichia coli, for example, taking into account the sequences of published strains, the number of genes that differ from strain to strain is already larger than 20,000, and this number keeps increasing as new strains’ genomes are sequenced, while the average number of genes in any strain of this organism is slightly higher than 4,000.
    Sans surprise, Antoine Danchin attribue naturellement ce fait aux transferts horizontaux de gènes, phénomène qu’il a d’ailleurs contribué à découvrir en 1991 :

    - Evidence for horizontal gene transfer in Escherichia coli speciation (Médigue et al., 1991)

    Bon, pour en revenir un peu à la question initiale de ce fil, je crois comprendre que Louca et collaborateurs tirent leur 3e estimation de "3 à 9 millions" du tableau S1, mais j'ignore à quoi il correspond exactement (notamment la signification des acronymes dans la première colonne du tableau).

    Quelqu'un aurait-il certaines clés de compréhension à me fournir à ce sujet ?

    Cordialement.
    Dernière modification par Geb ; 08/11/2022 à 15h48.

  5. A voir en vidéo sur Futura
  6. #5
    MissJenny

    Re : Nombre total estimé d’espèces chez les procaryotes

    Citation Envoyé par Geb Voir le message
    Bon, pour en revenir un peu à la question initiale de ce fil, je crois comprendre que Louca et collaborateurs tirent leur 3e estimation de "3 à 9 millions" du tableau S1, mais j'ignore à quoi il correspond exactement (notamment la signification des acronymes dans la première colonne du tableau).
    tu ne veux pas comprendre. Les OTUs construites à partir du 16S comme dans l'article de Louca ne reflètent pas la diversité des souches bactériennes. C'est juste la diversité du 16S... pour ce qui est des acronymes, ils sont expliqués dans l'article.

  7. #6
    Geb

    Re : Nombre total estimé d’espèces chez les procaryotes

    Bonjour,

    Citation Envoyé par MissJenny Voir le message
    tu ne veux pas comprendre.
    Dis comme ça, tu avoueras que c'est un peu fort, non ? Mon incapacité à comprendre (pour l'instant) est peut-être simplement liée au fait que je n'ai lu que moins de vingt publications sur la question et principalement des publications qui, pour n'évoquer que les plus récentes, soit proposent d'estimer la diversité grâce à des "lois d'échelle" (scaling laws ; voir par exemple Dykhuizen, 2005 ; Locey & Lennon, 2016 ; Larsen et al., 2017), soit avec de la métagénomique (c'est le cas de Louca et al., 2019; voir aussi Schloss et al., 2016 ; Amann & Rosselló-Móra, 2016), soit en extrapolant à partir de ce qui était connu de la List of Prokaryotic names with Standing in Nomenclature (LPSN).

    Dans ce dernier cas, du propre aveu des chercheurs, la méthode d'extrapolation à partir de la seule LPSN (Mora et al., 2011) a été un échec total pour estimer la diversité des procaryotes (ça n'enlève rien au succès de la méthode dans la presse grand public et d'ailleurs, ça n'a pas empêcher ce papier d'être cité des milliers de fois par la communauté scientifique).

    Force est de constater que rien qu'avec le peu de données dont je dispose, en terme d'estimation de la diversité globale au niveau de l'espèce, les lois d'échelles donnent de 1 milliard à 1000 milliards d'espèces de procaryotes, la métagénomique propose 1 à 10 millions d'espèces de procaryotes et la 3e méthode a tout simplement failli.

    Je sais que toutes les méthodes ont leur défaut et que tout est une question de définition, mais ça ne m'a jamais empêché de me renseigner sur l'état de l'art de la question. Or, sur ce point, au doigt mouillé je trouve que la métagénomique fournit les résultats les plus crédibles. D'autant que les plus gros défauts de la métagénomique sont connus et identifiés et qu'il me semble qu'il y a déjà quelques initiatives pour améliorer les méthodes. Mais là encore, je n'ai lu que le sommet de l'iceberg et j'ai bien conscience que cela fait l'objet d'un vaste débat entre spécialistes. Ce genre de choses ne m'empêche pas de continuer à réfléchir.

    Citation Envoyé par MissJenny Voir le message
    Les OTUs construites à partir du 16S comme dans l'article de Louca ne reflètent pas la diversité des souches bactériennes. C'est juste la diversité du 16S...
    Sans vouloir t'offenser, je trouve que ta manière de répondre dans ton message précédent un peu cryptique et péremptoire. Dire : "Les OTUs construites à partir du 16S ne reflètent pas la diversité des souches bactériennes", ça ne m'avance pas beaucoup. La question que j'aurais envie de te poser c'est : "Quel(le)s critères/méthodes reflèteraient mieux la diversité bactérienne selon toi ?" Après, j'ignore de combien de temps tu disposais pour écrire ce message (on est tous très occupés après tout).

    Tu ne rechignes pas à partager tes connaissances (et je t'en remercie), mais tu ne me sembles pas vraiment attachée à ce que je les comprennes dans le détail. Cela dit, c'est sans doute courant chez les spécialistes pour qui des notions qu'ils utilisent tous les jours sont forcément faciles à comprendre. Les gens ont tendance à oublier à quel point les choses aujourd'hui simples ont pu être compliquées au début (je pense par exemple à l'apprentissage de la conduite automobile, ou certaines notions courantes de microbiologie pour un étudiant qui sort du lycée ).

    Mais étant donné que je n'y connais rien et que je continue mes lectures de toute façon, j'ai essayé de trouver dans la littérature l'une ou l'autre publication qui pourrait expliquer ton point de vue avec des mots plus explicites pour moi. Tu me dirais si je suis à côté de la plaque :

    - Growing Unculturable Bacteria (Stewart, 2012)

    [...] At all levels of bacterial phylogeny, uncultured clades that do not grow on standard media are playing critical roles in cycling carbon, nitrogen, and other elements, synthesizing novel natural products, and impacting the surrounding organisms and environment. While molecular techniques, such as metagenomic sequencing, can provide some information independent of our ability to culture these organisms, it is essentially impossible to learn new gene and pathway functions from pure sequence data. A true understanding of the physiology of these bacteria and their roles in ecology, host health, and natural product production requires their cultivation in the laboratory. Recent advances in growing these species include coculture with other bacteria, recreating the environment in the laboratory, and combining these approaches with microcultivation technology to increase throughput and access rare species. [...]
    Là c'est le point de vue d'un microbiologiste. Auparavant je connaissais surtout le point de vue des systématiciens, dont les objectifs en terme de compréhension de la diversité du vivant ne sont manifestement pas les mêmes.

    Voir aussi certains des papiers que le microbiologiste Howard Gest (1921-2012) a écrit à la fin de sa vie (Gest, 2008a, 2008b, 2008c, 2009, 2010).

    Citation Envoyé par MissJenny Voir le message
    pour ce qui est des acronymes, ils sont expliqués dans l'article.
    Bon, là c'est moi qui ne suis peut-être pas suffisamment explicite. J'y reviendrai aujourd'hui si je trouve le temps.

    Cordialement.

  8. #7
    JPL
    Responsable des forums

    Re : Nombre total estimé d’espèces chez les procaryotes

    Les OTUs construites à partir du 16S ne reflète en rien la diversité génétique existant dans les diverses souches et provenant de transferts horizontaux. Intuitivement je pense qu’ils font partie de la part la plus stable du génome. Autant ce critère me semble pertinent pour les eucaryotes en général, et plus encore pour les métazoaires, autant il me paraît restreint pour les procaryotes.

    Ceci étant dit cela reste de ma part une intuition fondée sur la logique du doigt mouillé.
    Rien ne sert de penser, il faut réfléchir avant - Pierre Dac

  9. #8
    Geb

    Re : Nombre total estimé d’espèces chez les procaryotes

    Bonjour,

    Citation Envoyé par JPL Voir le message
    Les OTUs construites à partir du 16S ne reflète en rien la diversité génétique existant dans les diverses souches et provenant de transferts horizontaux. Intuitivement je pense qu’ils font partie de la part la plus stable du génome. Autant ce critère me semble pertinent pour les eucaryotes en général, et plus encore pour les métazoaires, autant il me paraît restreint pour les procaryotes.
    Je ne vous apprends rien si je vous dit que le fait que deux souches appartiennent à la même espèce si elles présentent un taux d'hybridation ADN-ADN supérieur à 70% est utilisé depuis très longtemps par les taxonomistes.

    J’ignore quand ça été officialisé (j’ai trouvé Wayne, 1987 ; ça m’a l’air trop récent pour être la 1re "officialisation"), mais j’ai trouvé une publication de juillet 1967 qui le proposait déjà comme critère génétique discriminant :

    - Deoxyribonucleic Acid Homology and Taxonomy of Agrobacterium, Rhizobium, and Chromobacterium (Heberlein et al., 1967)

    The DNA hybridization technique, because it takes into account the entire genome, offers a sensitive and quantitative approach to the classification of organisms. It seems feasible, therefore, that it should be used to clarify the presently ill-defined concept of bacterial genus and species. It can be seen from the present study that authentic strains for the same nomen-species (see A. tumefaciens, Table 1 and Fig. 1) display at least a 70% DNA homology. In view of the results with the A. radiobacter and A. rubi strains, it seems that this degree of homology would be a suitable boundary for a genetic species.
    Raina et al. (2019) évoquent le rôle d’un comité ad hoc de systématique dans l’adoption de ce standard de 70% en 1970 :

    DDH is a technique based on comparative analysis between total DNA of two bacterial species. This DNA-based method is used for species delineation and was evaluated by an ad hoc committee on systematics (Colwell, 1970; Johnson et al., 1970) and is considered as the gold standard for classification of bacterial species.
    Quoi qu’il en soit, ce seuil qui j’en conviens est complètement arbitraire, reste toujours le principal critère pour distinguer des espèces génétiquement différentes de procaryotes, non ? Beaucoup d’autres critères utilisés couramment aujourd’hui semblent même, à ma connaissance, avoir été développés à partir de ce seuil de 70%.

    En novembre 2006, Erko Stackebrandt a d’ailleurs admis que lorsqu’il a proposé en 1994, avec Brett Goebel, le seuil de 97% de similarité de la séquence des gènes pour l’ARN 16S (Stackebrandt & Goebel, 1994), ils ont été trop prudents et qu’il serait en fait mieux d’utiliser un seuil de 98,7 à 99% (Stackebrandt & Ebers, 2006).

    Est-ce que vous sous-entendez tous les trois qu'en terme de diversité génétique, on serait plus avisé de compter les souches de bactéries et d'archées plutôt que de tenter de mettre au point des critères génétiques pour distinguer les espèces de bactéries ? Et ça existe ça, une base de données pour les souches type de procaryotes ?

    Cordialement.
    Dernière modification par Geb ; 10/11/2022 à 16h16.

  10. #9
    Geb

    Re : Nombre total estimé d’espèces chez les procaryotes

    Tiens, je viens de lire une publication, une "mini revue" de la littérature de Ramon Rosselló-Móra (encore lui) avec quelques passages intéressants, à propos de la difficulté de formuler une définition du terme espèce qui satisfasse tous ceux qui étudient les procaryotes :

    - Towards a taxonomy of Bacteria and Archaea based on interactive and cumulative data repositories (Rosselló-Móra, 2012)

    […] On the other hand, how to pragmatically circumscribe species is really causing lots of headaches among microbiologists. Species definition is the way, the set of parameters that we use to circumscribe the category (Rosselló-Móra, 2006). The formulation has been mutating and will mutate in parallel with technological developments. Actually, the way we recognize the basic unit for taxonomy of prokaryotes depends on the resolution power of the observational methods that we have at any given moment. The definition is what has brought severe confrontations especially between taxonomists, ecologists and evolutionary microbiologists. And the problem is that the definition that accommodates one discipline is too narrow or too wide for others (Fig. 1). Currently, the general consensus for the definition of species for taxonomic purposes is that monophyly is recognized by analyses of 16S rRNA gene sequences.
    […] Ever since, it seems that microbial taxonomists, microbial ecologists and evolutionary microbiologists cannot find a way to understand that their basic units are essentially different despite the fact that they use the same denomination, i.e. species, a term that is probably the property of taxonomists for historical reasons. The main problem is semantic as each of them designs different units with the same name, a clear case of homonymy (Reydon, 2004). This has brought about heated debates trying to find the real essence of what a species should be, even comparing monkeys and prokaryotes (Staley, 1997) in order to claim that microbial taxonomists are wrong in their statements.
    […] Actually, it seems that what taxonomists really fail to do is transmit to classification end-users that the ‘fundamental mission’, which has been thoroughly explained in the many papers published that some may have even ignored, is the construction of an operative and predictive system of universal use. As stated before, universality will probably not be fully satisfactory for any user, and one has to deal with it. The basic unit in taxonomy is defined by an interdisciplinary approach using different methods of different resolution, and the final product (i.e. the protologue) summarizes the information. A reconciliation of these divorces may be possible in the future with the new high-throughput technologies. However, effort from all disciplines to reach the best consensus will be necessary.
    Autrement dit, il y aurait trois définitions différentes, utilisées par les taxonomistes microbiens, les écologistes microbiens et les microbiologistes de l’évolution (vous me direz si je traduis tout ça correctement). Ce sont trois définitions différentes, qui sont utiles dans leurs contextes respectifs, mais dans les trois cas, le terme utilisé est "espèce".

    Un peu plus loin dans la même publication, il y a un autre commentaire sur la LPSN :

    […] in the last 3 years, it seems that we have reached a plateau of descriptions that range among 600–700 yearly. Taking a conservative putative number of 107 species to describe (Pedrós-Alió, 2006), at the current classification speed it would take about 16 000 years to describe the whole prokaryotic diversity. Discouraging! The reasons for stabilization of the new descriptions are not only due to the limited number of taxonomists in the scientific biosphere, the lack of sufficient financial resources to do taxonomy, or the limited printing space in specialized journals. Other reasons for this are also more practical as characterization requires significant work in using tedious techniques to describe the organisms, and the generalized need to perform tests on new strains simultaneously with the reference material that must be acquired in international strain collections. However, the use of authentic reference strains (type strains) is an essential prerequisite for comparative taxonomic work as pointed out in detail by Tindall and colleagues (2010).
    En gros, s’il faut plus de 10.000 ans pour faire le bilan de la diversité des procaryotes, c’est qu’il faudrait peut-être adapter la façon dont on les classe pour accélérer le processus.

    Désolé pour le double post.

  11. #10
    MissJenny

    Re : Nombre total estimé d’espèces chez les procaryotes

    Citation Envoyé par Geb Voir le message
    Je ne vous apprends rien si je vous dit que le fait que deux souches appartiennent à la même espèce si elles présentent un taux d'hybridation ADN-ADN supérieur à 70% est utilisé depuis très longtemps par les taxonomistes.
    Le problème de cette définition (et d'autres du même genre) c'est que la relation "être à distance moindre que x" où x est un seuil donné, n'est pas une relation d'équivalence (de mon temps on apprenait cette notion au collège). En d'autres termes tu peux avoir d(A,B)<x, d(B,c)<x mais d(A,c)>x (où d est une distance quelconque entre paires de séquences, ou paires de génomes si l'on veut). Et donc A et B sont de la même espèce, B et C aussi mais pas A et C. Ca fait désordre...

  12. #11
    Geb

    Re : Nombre total estimé d’espèces chez les procaryotes

    Bonjour,

    Citation Envoyé par MissJenny Voir le message
    Citation Envoyé par Geb Voir le message
    Je ne vous apprends rien si je vous dit que le fait que deux souches appartiennent à la même espèce si elles présentent un taux d'hybridation ADN-ADN supérieur à 70% est utilisé depuis très longtemps par les taxonomistes.
    Le problème de cette définition (et d'autres du même genre) c'est que la relation "être à distance moindre que x" où x est un seuil donné, n'est pas une relation d'équivalence (de mon temps on apprenait cette notion au collège). En d'autres termes tu peux avoir d(A,B)<x, d(B,c)<x mais d(A,c)>x (où d est une distance quelconque entre paires de séquences, ou paires de génomes si l'on veut). Et donc A et B sont de la même espèce, B et C aussi mais pas A et C. Ca fait désordre...
    Pour moi ce n’est pas incompatible avec une définition relativement fonctionnelle, pour autant qu’on soit conscient de ses faiblesses. Il faut juste faire usage de la logique floue, que le mathématicien Lotfi Zadeh (1921-2017) a beaucoup contribué à développer à partir de juin 1965.

    Bon, évidemment je n’y connais rien mais comme le présentait le chimiste belge Jacques Reisse en octobre 2011 lors d’une conférence au Collège de France :

    - Les premières formes de la vie

    Citation Envoyé par Jacques Reisse (2011)
    A n'est pas nécessairement "X" ou "non X" mais peut être caractérisé par un nombre compris entre 1 (ensemble "X") et 0 (ensemble "non X").
    Ça me paraît tout à fait cohérent avec la prise en compte du défi que représentent les transferts horizontaux de gènes par exemple, en particulier chez les procaryotes.

    Lorsque je tape "fuzzy logic" et "definition of species", dans Google scholar, je tombe assez facilement sur des travaux récents, en particulier ceux d’Igor Yakovlevitch Pavlinov (Pavlinov, 2021, 2022), un zoologue russe et systématicien qui travaille comme curateur au musée zoologique de l'université d’État de Moscou.

    Pavlinov fait d’ailleurs référence à William Hanage comme ayant travaillé sur la même ligne, avec son concept d’espèce floue (Hanage et al., 2005 ; Hanage, 2013), qu'il a d'ailleurs appliqué d'abord aux procaryotes.

    Bon, ce débat tout passionnant qu’il soit ne m’aide pas vraiment à comprendre les méthodes de calcul de ceux qui essayent d’estimer le nombre d’espèces de procaryotes avec les bases de données concernant l’ARN 16S.

    Cordialement.
    Dernière modification par Geb ; 11/11/2022 à 13h58.

  13. #12
    Geb

    Re : Nombre total estimé d’espèces chez les procaryotes

    Bonsoir,

    Je pense avoir plus ou moins compris.

    Pour la première estimation (800.000 à 1,6 million), c’est basée sur leur étude préliminaire qui arrive à 739.880 OTUs procaryotes (690.474 de bactéries et 49.406 d’archées) et sur le fait qu’il ne "recapture" qu’environ 96*% du contenu de la base de données SILVA (à 97% de similarité de la région V4 de l’ARN 16S). En corrigeant, ils arrivent à un minimum de 771.234 OTUs, qu’ils arrondissent à 800.000.

    Pour la limite haute de la première estimation, c’est ce qu’ils appellent l’estimation de type breakaway, un calcul lui-même basé sur deux publications (Rocchetti et al., 2011 ; Bunge et al., 2012). Je suis incapable de refaire le calcul et donc de comprendre véritablement comment ils sont arrivés à l’estimation finale de 1.574.468 (omettant l’incertitude qui est à ±204.133), qu’ils arrondissent à 1,6 million.

    Pour la deuxième estimation, ils notent que la diversité de l’ARN 16S sur toute sa longueur est en moyenne supérieure d’un facteur 2,7 (avec un seuil à 97% de similitude) par rapport à la diversité de la seule région V4 :

    The sequence length considered may also affect global richness measures. For example, full-length 16S diversity (currently much harder to census) is expected to be greater than partial-length (V4) 16S diversity [4] because short gene regions may cluster as one OTU due to the stochasticity of mutations even if the full genes differ by more than 3%. For example, when restricted to the V4 region or when considering the full 16S gene, at 97% similarity, 16S sequences in SILVA cluster into 102,416 or 270,788 OTUs, respectively, suggesting that the number of extant full-length OTUs may exceed the number of V4 OTUs by a factor of approximately 2.7. When combined with our V4-based richness estimates, this suggests that there exist 2.2–4.3 million full-length OTUs worldwide.
    Le calcul est donc respectivement 0,8 x 2,7 = 2,16 millions (qu’ils arrondissent à 2,2 millions) et 1,6 x 2,7 = 4,32 millions (qu’ils arrondissent à 4,3 millions).

    Ensuite, ils précisent que si on prenait un seuil, non plus de 97%, mais plutôt de 99% de similitude, alors les limites basse et haute deviendraient entre 2,5 et 9,7 millions (voir tableau S1), qu’ils arrondissent à entre 3 et 9 millions.

    Après, si on reprend les données brutes de l’étude, on peut proposer les limites suivantes :

    1) Entre 771.234 et (1588567 + 204133) = 179.2700 (soit 800.000 à 1,8 million)

    2)

    771.234 x (270.788 / 102.416) = 2.039.143
    (1.588.567 + 204.133) x (270.788 / 102.416) = 4.739.900

    Soit, entre 2,0 et 4,7 millions

    3) Entre 2462942 et (9686211 + 44323) = 9.730.534

    Soit, entre 2,5 et 9,7 millions.

    On retrouve là l'ordre de grandeur privilégié par Amann & Rosselló-Móra (2016) de 1 à 10 millions d'espèces de procaryotes avec l'ARN 16S.

    Cordialement.
    Dernière modification par Geb ; 11/11/2022 à 22h37.

  14. #13
    Geb

    Re : Nombre total estimé d’espèces chez les procaryotes

    Je me suis demandé combien il y avait effectivement d’espèces représentées à l’heure actuelle, au sens que lui donne la base de données SILVA.

    À ce sujet, j’ai trouvé une thèse de doctorat publiée récemment (Milanese, 2021), dans laquelle on peut lire ceci :

    In Silva’s latest release, sequences of the small subunit of the rRNA gene (SSU 138) represent more than 500,000 “species” (Ref NR 99, high quality OTUs clustered at 99% identity).
    Du coup je suis allez voir sur le site de la dernière mouture de SILVA publié en août 2020 (release 138.1) le nombre de species-level OTUs est de 510.508 (avec un seuil à 99% de similitude).

    Cela dit, si on regarde un peu plus dans le détail, on a le tableau intitulé Basic statistics for the SILVA databases, où pour la version 138.1, on a les infos suivantes :

    Bactéries (Bacteria) : 431.329
    Archées (Archaea) : 20.389
    Eucaryotes (Eukaryota) : 58.790
    Total : 510.508
    Cultivées (Cultured) : 39.312
    Souches type (Typestrains) : 24.437

    En définitive, il n’y a "que" 451.718 ARN 16S "différents" (peu importe le sens que les chercheurs donnent à ce mot) chez les procaryotes uniquement, dans cette seule base de données.

    Sur la page du site de la base de données SILVA qui donne davantage de détails sur les données non-redondantes, on peut même lire qu’il pourrait encore y avoir moins d’ "espèces" que ça dans les prochaines mises à jour :

    By applying a 99% identity criterion to remove highly similar sequences using the Opens external link in new windowvsearch tool with a custom sequence order first based on presence in the last release's Ref NR 99 and second based on combination of sequence length (weighted twofold) and quality. For the sorting, the quality of a sequence is determind by ambiguties (50%), overall alignment quality (45%), and homopolymers (5%). The overall alignment quality of the sequence is calculated from its alignment score, alignment identity, and alignment percentage (all equally weighted). Sequences from cultivated species have been preserved in all cases. The final number of sequences within the SSU Ref NR 138.1 dataset was reduced to 510,508 just about 23% of the database entries compared to the starting point. Please note that due to this preservation and additional technical limitations (clustering of large datasets) there can still be sequences in the dataset with an identity of >99%.
    Est-ce qu’on a raison de dire qu’en combinant le contenu de SILVA et les estimations de Louca et collaborateurs comprises entre 2,5 et 10 millions, on connaît entre 5% et 18% de la diversité de l’ARN 16S (pour reprendre l’expression de MissJenny) ?

    Aussi, je me demande dans quelle mesure la découverte du Candidate Phyla Radiation (Brown et al., 2015 ; Eloe-Fadrosh et al., 2016) qui essaye justement de dépasser les limites inhérentes à la méthode de l’ARN 16S est de nature à nuancer ces propos ? On rajoute juste 15% à la limite haute et basse de nos estimations ?

    Cordialement.

  15. #14
    MissJenny

    Re : Nombre total estimé d’espèces chez les procaryotes

    Ce que j'ai essayé de te dire c'est que c'est que pour les bactéries, ce qui est considéré comme une espèce est en fait un ensemble d'organismes, qui partagent un certain nombre de gènes (dont le 16S) mais qui ont une grande diversité génétique. La diversité de la seule espèce E coli est supérieure à celle de la totalité des 6000 espèces de mammifères. Donc compter les espèces reconnues de bactéries n'a de sens que si tu t'intéresses par exemple à son évolution dans le temps, comme un indicateur de l'état de la recherche en microbiologie. Mais ça n'a pas de sens de le comparer au nombre d'espèces de plantes ou de vertébrés, etc.

  16. #15
    Geb

    Re : Nombre total estimé d’espèces chez les procaryotes

    Bonjour,

    Citation Envoyé par MissJenny Voir le message
    Ce que j'ai essayé de te dire c'est que pour les bactéries, ce qui est considéré comme une espèce est en fait un ensemble d'organismes, qui partagent un certain nombre de gènes (dont le 16S) mais qui ont une grande diversité génétique.
    Je pense que ce serait d'ailleurs utile, si je devais présenter ça a un public non averti, de rappeler (comme tu l'avais fait) que le "core-genome" de E. coli, ça représente seulement 40% de ses ~4000 gènes, et que la longueur du génome peut aussi varier significativement. Ce qui signifie que (comme l'avait précisé Flyingbike) entre deux souches d'E. coli, la diversité génétique peut être absolument gigantesque, comparée à la situation chez les vertébrés.

    Citation Envoyé par MissJenny Voir le message
    La diversité de la seule espèce E coli est supérieure à celle de la totalité des 6000 espèces de mammifères.
    Je ne suis pas certains qu'on parle vraiment de la même chose, entre le seuil à 70% en terme d'hybridation ADN-ADN, ou les "similitudes" entre le génome humain et celui d'autres organismes, mais j'ai trouvé les données suivantes dans différentes publications :

    - Chimpanzé par rapport à l'humain : 98,8%
    - Bonobo par rapport à l'humain : 98,7%
    - Gorille par rapport à l'humain : 97,7%
    - Orang-outan par rapport à l'humain : 97%
    - Macaque rhésus par rapport à l'humain : 93%
    - Chat domestique par rapport à l'humain : 90%
    - Chien par rapport à l'humain : 80%
    - Poisson-zèbre par rapport à l'humain : 70%
    - Drosophile par rapport à l'humain : 60 ou 61%
    - Banane par rapport à l'humain : 40 ou 50%
    - Laitue par rapport à l'humain : 25%

    Donc, en terme de diversité génétique, pour le seuil à 70%, on pourrait dire (c'est une question de ma part), que ce qu'on classe aujourd'hui comme faisant partie de la même espèce de E. coli, c'est l'équivalent de la différence qu'il y a entre un poisson-zèbre et un être humain ?

    Citation Envoyé par MissJenny Voir le message
    Donc compter les espèces reconnues de bactéries n'a de sens que si tu t'intéresses par exemple à son évolution dans le temps, comme un indicateur de l'état de la recherche en microbiologie.
    Ce qui m'intéressait, c'était surtout les estimations de ce qu'il nous reste à découvrir en terme de diversité. En gros, c'est quelques dizaines de milliers si on utilise la classification classique (la LPSN), 1 à 10 millions si on utilise l'ARN 16S comme critère discriminant (à 97 ou 99% de similitude), ou de 1 à 1000 milliards si on utilise des lois d'échelles. Je pense que c'est une manière honnête de présenter les choses, non ?

    Citation Envoyé par MissJenny Voir le message
    Mais ça n'a pas de sens de le comparer au nombre d'espèces de plantes ou de vertébrés, etc.
    Pourtant, je pense qu'on peut le faire d'une manière tout a fait honnête. Mais on doit absolument préciser que le terme "espèce" ne veut pas dire la même chose si l'on parle de procaryotes ou des organismes auxquelles on est davantage "habitué" à notre échelle macroscopique (pour faire court : les plantes, les animaux et les champignons).

    Cordialement.
    Dernière modification par Flyingbike ; 15/11/2022 à 13h14.

  17. #16
    MissJenny

    Re : Nombre total estimé d’espèces chez les procaryotes

    Citation Envoyé par Geb Voir le message
    j'ai trouvé les données suivantes dans différentes publications :

    - Chimpanzé par rapport à l'humain : 98,8%
    - Bonobo par rapport à l'humain : 98,7%
    - Gorille par rapport à l'humain : 97,7%
    - Orang-outan par rapport à l'humain : 97%
    - Macaque rhésus par rapport à l'humain : 93%
    - Chat domestique par rapport à l'humain : 90%
    - Chien par rapport à l'humain : 80%
    - Poisson-zèbre par rapport à l'humain : 70%
    - Drosophile par rapport à l'humain : 60 ou 61%
    - Banane par rapport à l'humain : 40 ou 50%
    - Laitue par rapport à l'humain : 25%
    ça ce sont des pourcentages d'identité de séquences homologues. C'est-à-dire qu'on considère deux séquences homologues, on les aligne et on note la proportion de nucléotides identiques. On moyenne ensuite sur l'ensemble du génome (ou sur un échantillonnage des génomes). Plus on s'éloigne dans l'arbre du vivant et moins on trouve de séquences homologues, mais il y en a toujours entre organismes eucaryotes, par exemple les gènes qui codent les ribosomes. Entre métazoaires il y en a beaucoup plus, etc. Entre un humain et un chimpanzé la quasi totalité des 23000 gènes doivent avoir un homologue dans l'autre espèce.

    Dans le cas des bactéries, ce qui se passe c'est que dans la même espèce tu as des gènes non homologues, c'est un degré supérieur de diversité génétique.

  18. #17
    Geb

    Re : Nombre total estimé d’espèces chez les procaryotes

    Citation Envoyé par MissJenny Voir le message
    ça ce sont des pourcentages d'identité de séquences homologues. C'est-à-dire qu'on considère deux séquences homologues, on les aligne et on note la proportion de nucléotides identiques. On moyenne ensuite sur l'ensemble du génome (ou sur un échantillonnage des génomes). Plus on s'éloigne dans l'arbre du vivant et moins on trouve de séquences homologues, mais il y en a toujours entre organismes eucaryotes, par exemple les gènes qui codent les ribosomes. Entre métazoaires il y en a beaucoup plus, etc. Entre un humain et un chimpanzé la quasi totalité des 23000 gènes doivent avoir un homologue dans l'autre espèce.
    Effectivement, la première fois que je vois un degré de similitude de "plus de 99%" dans la littérature (King & Wilson, 1975), c’est basé à l’époque sur trois méthodes différentes, en ce compris l’analyse d’un petit nombre de protéines homologues.

    J’ai trouvé une citation plus précise basée sur la première version du génome d'un chimpanzé publiée en septembre 2005 :

    - Human Evolution: The Three Grand Challenges of Human Biology (Ayala, 2007)

    In the genome regions shared by humans and chimpanzees, the two species are 99 percent identical. […] Of the enzymes and other proteins encoded by the genes, 29 percent are identical in both species. Out of the one hundred to several hundred amino acids that make up each protein, the 71 percent of nonidentical proteins differ by only two amino acids, on the average. The two genomes are about 96 percent identical if one takes into account DNA stretches found in one species but not the other. That is, a large amount of genetic material, about 3 percent or some 90 million DNA letters, has been inserted or deleted since humans and chimps initiated their separate evolutionary ways, 7 or 8 million years ago. Most of this DNA does not seem to contain genes coding for proteins.
    Les infos distillées dans ce court passage sont au moins en partie basées sur la publication suivante :

    - Comparing the human and chimpanzee genomes: Searching for needles in a haystack (Varki & Altheide, 2005)

    On y trouve en effet le passage suivant :

    While insertion-deletion (indel) events were fewer, they represented 40–45 Mb in each species, i.e., ∼90 Mb difference between the two, giving an ∼3% divergence in this category. Thus, the overall divergence between the genomes is closer to 4%, in keeping with two recent studies (Britten 2002; Watanabe et al. 2004), but far greater than most previous estimates, which were made using shorter alignable sequence fragments. Fortunately, orthologous proteins are still extremely similar, with almost a third being identical, and the typical protein differing only by two amino acids between human and chimpanzees. Thus, the oft-repeated “<1% difference” still applies to amino acid sequences (The Chimpanzee Sequencing and Analysis Consortium 2005). However, a substantial proportion of the differences will likely be neutral with respect to understanding the human condition. The search for functionally important differences is further complicated because many of the important ones may not be within known coding sequences.
    Donc, si on s'intéresse aux génomes entiers, on a plutôt un degré de similitude plus proche de 96% que de 99%. On y apprend aussi, entre autres infos intéressantes, que la version du génome était plus ou moins complète (à 94%) et qu'il s'agissait du génome d’un chimpanzé mâle né en captivité de la sous-espèce Pan troglodytes verus. Je me demande si des versions plus complètes du génome, ou la comparaison avec d'autres sous-espèces de chimpanzé a donné des résultats plus précis encore.

    Dans le cas des bactéries, ce qui se passe c'est que dans la même espèce tu as des gènes non homologues, c'est un degré supérieur de diversité génétique.
    Donc, si je reprends l'idée de "core-genome" de E. coli représentant environ 40% des gènes, on devrait plutôt dire qu'entre deux souches de E. coli, la similitude peut être de l'ordre de la similitude entre le génome d'un être humain et celui d'une banane ?

    Cordialement.

Discussions similaires

  1. [Microbiologie] Histones chez les procaryotes
    Par invite397c92ff dans le forum Biologie
    Réponses: 3
    Dernier message: 20/01/2013, 11h23
  2. [Biochimie] la réplication de l'ADN chez les procaryotes
    Par invite7897ed72 dans le forum Biologie
    Réponses: 3
    Dernier message: 26/03/2010, 00h32
  3. [Biologie Moléculaire] replication chez les procaryotes
    Par invitee2207d9d dans le forum Biologie
    Réponses: 3
    Dernier message: 27/05/2009, 04h04
  4. [Génétique] Traduction chez les procaryotes
    Par inviteec1705dd dans le forum Biologie
    Réponses: 1
    Dernier message: 14/01/2008, 22h08
  5. queue poly A chez les procaryotes
    Par invitec154d855 dans le forum Biologie
    Réponses: 7
    Dernier message: 20/08/2004, 20h50
Dans la rubrique Santé de Futura, découvrez nos comparatifs produits sur le sport et la santé : thermomètre médical, soins personnels...