Flux RSS du Blog des Développeurs Google

Gemma a expliqué : architecture PaliGemma

PaliGemma, un modèle de langage-vision (MLV) léger et ouvert, est capable de prendre à la fois des entrées d'images et de textes et de produire une réponse textuelle, en ajoutant un modèle de vision supplémentaire au modèle BaseGemma.
developers.googleblog.com
Gemma explained: PaliGemma architecture