l'opinion ambigüe:
https://www.futura-sciences.com/tech...maines-118724/De quelles 'données synthétiques' s'agit-il?le titre:
Elon Musk a évoqué le problème de la pénurie des données pour l’entraînement des intelligences artificielles. La solution résiderait dans des données synthétiques, ce qui n’est pas sans risque…
faire la 'synthèse' de multiples documents traitant +- bien d'un sujet défini... pour le documentaliste, c'est la 'compilation' de l'existant.... On demande ça aussi à des étudiants.... ils résument et mettent bout à bout des propositions pas trop contradictoires.... et monsieur Chat-gpt ou mr O3 ou autres LLM savent faire.....
résumés de textes, reproduisant plus ou moins les idées (originales, éventuellement) des auteurs.....
Alors, est-ce l'idée du gourou, de prendre ces résumés comme données d'apprentissage initial, ou de les refiler ensuite quand l'apprentissage a déjà tout parcouru sur le NET?
ça ajoute quoi de nouveau? simple économie de ressources pour remplacer la compilation massive de tout le NET.... ce que dit d'ailleurs l'article cité....
Mais il y a aussi des données synthétiques d'autres espèces......
la première:
Une nouvelle théorie scientifique.... construite par la ré-organisation et des déductions bien choisies , sur un chemin nouveau et très improbable, jamais explicitement exploré......
donc impossible à extraire du corpus existant.... puisque jusque là le travail n'avait jamais été conduit.........
évènements rares, bien sûr..... et qui vont demander ensuite une validation (à la charge de l'IA).... Bôf.....
ce ne doit pas être l'idée d'Elon....
les autres synthèses....
dans les livres d'école, du petit enfant aux classes prépa..... dans les bibliothèques, les enseignements universitaires....
les présentations des connaissances fondamentales de chaque science, organisées pour l'enseignement à des humains 'naïfs'*
Serait-ce à ces informations structurées dans une logique constructive propre aux 'maîtres' du savoir, que Elon voudrait faire ingérer à ses IA?
Au début de l'apprentissage, avant le désordre apparent du Net? Exclusivement?
Ou en supplément de la masse peu structurée initiale? rapport possible avec le CoT ? pour structurer 'rationnellement' la démarche??
....
Qui pourrait nous éclairer un peu mieux là-dessus?
*naifs, comme la souris des experiences comportementales.... qui ne sait pas encore où on va la mener.....
-----