Meta dévoile Llama 3.2, capable de gérer des contenus visuels et textuels

meta-llama-3-2-version

Meta n’arrête pas le progrès. Quelques mois seulement après le lancement de Llama 3, le géant américain a annoncé lors de son événement Meta Connect, le 25 septembre dernier, la nouvelle version de sa famille, Llama 3.2. Cette dernière version comprend deux grandes catégories de modèles : 11B et 90B, capables de traiter des images, ainsi que 1B et 3B, uniquement textuels.

Cette dernière innovation s’ajoute à celle d’Orion, des lunettes de réalité augmentée également présentées lors du Meta Connect, conférence durant laquelle Meta affirme tous les ans son ambition d’être l’entreprise leader sur le marché de l’IA.

 

De nouvelles capacités significatives

Les modèles 11B et 90B

Avec 11 et 90 milliards de paramètres, ces deux modèles sont capables de traiter à la fois du texte et des images, grâce à une nouvelle structure disposant d’un encodeur d’image, en plus du modèle de langage. Ces fonctionnalités permettent notamment d’analyser une image contenant des graphiques et d’en extraire les chiffres clés, ainsi que de générer des légendes sous des images sélectionnées.

Les modèles 1B et 3B

Plus compacts, ces deux modèles sont conçus pour les smartphones et outils périphériques et sont en somme des outils de traitement de texte, destinés à générer des résumés ou à réécrire des contenus. Bien que leurs usages soient disponibles sur smartphones et tablettes, ils n’en perdent pas moins leurs performances élevées.

Llama 3.2 est aussi ouvert à la discussion puisqu’il est désormais possible de converser naturellement avec son IA. Tout comme Gemini de Google, Llama peut adopter différents tons de voix et s’adapter à son interlocuteur. Meta propose également de traduire directement les voix des créateurs de contenu pour faciliter leur compréhension sur les réseaux sociaux.

meta-llama-3-2-version
Crédit photo : Meta

 

Des innovations disponibles partout… sauf chez nous !

Si les modèles 1B et 3B sont accessibles en Europe, il n’en est pas de même pour les deux plus grands, 11B et 90B. En effet, les législations de l’Union Européenne en matière d’IA ne permettent pas encore le déploiement de ces fonctionnalités sur le Vieux Continent (à moins d’avoir un VPN).


Événement



Téléchargeables dans la plupart des autres pays sur des plateformes cloud telles que Hugging Face ou Google Cloud, les modèles multimodaux de Llama doivent encore se conformer aux réglementations locales avant d’espérer passer les frontières européennes. Également désactivées pour les utilisateurs européens, les nouvelles capacités de Meta AI permettent aux usagers des plateformes du groupe (Facebook, WhatsApp, Instagram et Messenger) de discuter avec l’assistant et de voir leurs images analysées en un rien de temps.

Si ces innovations permettent d’emmener la création de contenus et la productivité personnelle et professionnelle encore plus loin, reste à attendre cependant que Meta trouve le moyen de s’accorder avec l’UE pour que Llama devienne un outil de notre quotidien.

Tag :

emoji-email Ne manquez aucune actualité, abonnez-vous !

Chaque semaine, le meilleur de la communication et du digital directement dans votre inbox...