Après Microsoft, Google, ou encore OpenAI, c’est sans surprise que le groupe Meta mise sur l’intelligence artificielle. En quoi cette nouvelle IA se différencie-t-elle des autres ? Nommée Massively Multilingual Speech (MMS), elle est capable de « parler » plus de 1000 langues différentes ! On vous en dit plus.
Le projet MMS de Meta
Le nouveau modèle conversationnel de Meta paraît plutôt révolutionnaire en la matière. L’intelligence artificielle employée dans le projet Massively Multilingual Speech est capable, non seulement, de parler plus de 1 000 langues, mais aussi d’en identifier plus de 4 000 différentes !
L’objectif pour Meta est de rendre accessible cette technologie dans le monde entier. Le logiciel sera d’ailleurs disponible en open source. De même, cette intelligence artificielle peut être utilisée dans n’importe quel projet ou domaine d’action. Que ce soit pour des services de messageries, de la réalité virtuelle ou de la programmation, le projet MMS offre des possibilités infinies !
Enfin, notons qu’en termes de conservation, il est également intéressant puisqu’il permet de faire vivre certaines langues, qui risquent de disparaître si l’on ne fait rien pour entretenir leur usage.
Un support d’apprentissage singulier
Pour développer le projet MMS, l’IA a dû ingérer une multitude d’informations, dans des milliers de langues. Si certaines entreprises privilégient une méthode plutôt pédagogique, Meta a choisi la porte du non-conventionnel. En effet, pour collecter toutes les données audio nécessaires au développement de l’outil, les équipes ont décidé d’utiliser des textes religieux.
« Nous nous sommes tournés vers les textes religieux, comme la Bible qui a été traduite dans tellement de langues différentes et dont les traductions ont été grandement étudiées pour des recherches de traduction. […] Ces traductions ont des enregistrements audio de personnes qui lisent ces textes dans différentes langues accessibles publiquement », explique Meta.
« Bien que le contenu des enregistrements audio soit religieux, notre analyse montre que le modèle n’est pas biaisé pour produire davantage de langues religieuses. […] Nous pensons que c’est parce que nous utilisons une approche Connectionist Temporal Classification (CTC), qui est bien plus contraignante que les grands modèles de langage (LLM) ou modèle séquence-vers-séquence pour la reconnaissance du langage. »
À l’avenir, la société Meta souhaite donc ouvrir l’IA à plus de langues vivantes, et met un point d’honneur à la faire évoluer au fur et à mesure. Elle rappelle d’ailleurs que cette technologie demande beaucoup de rigueur et d’attention, puisqu’elle n’est pas (encore) parfaite.
« Par exemple, il y a des risques que le modèle voix-vers-texte retranscrive de manière incorrecte certains mots ou phrases. […] Le résultat pourrait être offensant et/ou imprécis. Nous continuons de croire qu’une collaboration avec la communauté IA est vitale pour un développement responsable des technologies d’intelligence artificielle », partage Meta.