L'article de blog de Zoubin Ghahramani (Vice Président, Google DeepMind) qui présente la nouveauté:
"Introducing PaLM 2"
https://blog.google/technology/ai/go...anguage-model/
Le papier technique:
"PaLM 2 Technical Report"
https://ai.google/static/documents/palm2techreport.pdf
Traduction par DeepL de l'abstract (légèrement retouchée):
Nous présentons PaLM 2, un nouveau modèle de langage de pointe qui possède de meilleures capacités multilingues et de raisonnement, et qui est plus efficace que PaLM. PaLM 2 est un modèle basé sur les Transformers, entrainé à l'aide d'un mélange d'objectifs similaire à UL2.
Sur UL2: https://openreview.net/forum?id=6ruVLB727MC
Grâce à des évaluations approfondies sur l'anglais et multi-langues, et sur des tâches de raisonnement, nous démontrons que PaLM 2 a significativement amélioré la qualité sur les tâches à travers différentes tailles de modèles, tout en améliorant les performances de l'algorithme, tout en montrant simultanément une inférence plus rapide et plus efficace par rapport à PaLM.
Cette efficacité accrue permet un déploiement plus large tout en permettant au modèle de répondre plus rapidement, pour un rythme d'interaction plus naturel. PaLM 2 démontre de solides capacités de raisonnement, illustrées par d'importantes améliorations par rapport à PaLM sur BIG-Bench et d'autres tâches de raisonnement.
PaLM 2 présente des performances stables sur une série d'évaluations de l'IA responsable. et permet un contrôle de la toxicité au moment de l'inférence sans surcharge supplémentaire ni impact sur les autres capacités. Dans l'ensemble, PaLM 2 atteint des performances de pointe sur un ensemble varié de tâches et de capacités.
-----