Un chercheur a estimé la consommation de o3 en mode intensif pour ces tests à 11.2 Megawatt-heure (MWh), de quoi alimenter un foyer pendant 4 ans.
https://www.linkedin.com/pulse/megaw...shroush-ovvsc/
Perso ce n'est pas du tout l'aspect écologique qui me préoccupe - on est là pour parler technique pour repousser une frontière de l'IA, ce n'est pas rien - mais le fait que ça peut dénoter que ce n'est pas peut-être pas la bonne approche pour l'AGI, s'agissant ici de simples puzzle 2D (et le jeu de tests n'a pas été saturé je le rappelle, sans limite de puissance ni de temps).
Je ne suis pas François Chollet quand il dit que les problèmes dont il est pourtant l'auteur ne nécessitent pas la vision, la preuve qu'il en donne me semble fallacieuse:
Source: https://x.com/fchollet/status/1871759791703630189If ARC-AGI required visual perception, you'd see VLMs outperform strict LLMs -- by a lot. Everyone tried VLMs during the 2024 competition -- no one got better results. Every single top entry used a strict LLM.
La vraie preuve de son assertion serait que des non-voyants excellent autant que les voyants.
Je suis persuadé quant à moi qu'il FAUT la vision MAIS AUSSI une certaine logique 2D que les VLMs n'ont pas encore.
-----