Bard est lancé en Europe et les articles vont fuser pour le comparer à Bing-conversation ou chatGPT.
Le but du jeu proposé ici est de trouver ce qui est pertinent à comparer et surtout de chercher une méthode d'évaluation.
Le côté pertinent implique de laisser de côté ce que l'on sais déjà comme n'étant pas fiable pour un agent conversationnel.
La difficulté réside à mon avis dans le caractère qualitatif de ce qui va être évalué.
Capacité à résumer un texte, à formuler ou reformuler une idée etc..
J'ai cherché des outils sur le web dans ce sens mais j'ai pas trouvé grand-chose pour l'instant, peut-être regarder comment font les profs de français pour évaluer ?
-----