Décidément, on n’arrête plus le progrès en matière d’intelligence artificielle ! Et ce n’est pas OpenAI qui dira le contraire… Cette entreprise derrière ChatGPT, a récemment doté celui-ci de nouvelles fonctionnalités pour le rendre« surpuissant ». Il peut désormais voir, entendre et parler !
Les deux nouveautés qui font trembler la toile
Il y a quelques mois, OpenAI nous présentait sa collaboration avec Canva, permettant de faciliter la vie des graphistes et des entreprises dans la création de visuels. Aujourd’hui, la société américaine nous présente deux mises à jour importantes pour l’IA ChatGPT. Jusqu’ici, il était un chatbot avec lequel nous pouvions converser. Désormais, il est un véritable assistant personnel, capable de générer des textes… mais aussi de voir, de parler et de décrypter des images !
Dans un communiqué publié le 25 septembre dernier, OpenAI annonçait, en effet, l’arrivée de ces deux nouvelles fonctionnalités vocales et image dans le chatbot ChatGPT. L’objectif étant de rendre l’outil plus intuitif et performant. Mais attention : seuls les utilisateurs payants (via l’abonnement ChatGPT Plus) pourront en profiter !
La nouvelle capacité vocale
« La nouvelle capacité vocale est alimentée par un nouveau modèle de synthèse vocale, capable de générer un son de type humain à partir du texte et de quelques secondes d’échantillons de parole. Nous avons collaboré avec des comédiens professionnels pour créer chacune des voix. Nous utilisons également Whisper, notre système de reconnaissance vocale open source, pour transcrire vos paroles en texte. » – OpenAI
Pour pouvoir en profiter et converser avec ChatGPT, rendez-vous dans les Paramètres, puis dans « Nouvelles fonctionnalités » sur l’application mobile et activer les conversations vocales. Une fois que c’est fait, il suffit de cliquer sur le bouton « casque » situé en haut à droite de l’écran d’accueil et de choisir la voix que vous souhaitez parmi les cinq proposées.
Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.
Sound on 🔊 pic.twitter.com/3tuWzX0wtS
— OpenAI (@OpenAI) September 25, 2023
Le décryptage d’images
Mais en plus de pouvoir parler avec nous, ChatGPT peut désormais voir et décrypter des images qu’on lui partage. Autrement dit, si l’utilisateur lui transmet la photo d’une voiture et qu’on lui demande de changer la roue, le chatbot pourra demander une photo des outils que l’on a à disposition pour pouvoir nous expliquer la procédure.
« La compréhension des images est alimentée par GPT-3.5 et GPT-4 multimodaux. Ces modèles appliquent leurs capacités de raisonnement linguistique à un large éventail d’images, telles que des photographies, des captures d’écran et des documents contenant à la fois du texte et des images. » – OpenAI
Deux nouvelles fonctionnalités qui devraient donc plaire à un bon nombre d’utilisateurs…