Intel présente un modèle d’IA qui génère des images 3D à partir d’un texte

intel-IA-generative

Le géant de l’informatique Intel vient de dévoiler LDM3D, le premier modèle d’IA générative de l’industrie à fournir une cartographie de profondeur. Il a le potentiel de révolutionner la création de contenu, le metaverse et les expériences numériques.

 

Cap sur le contenu visuel 3D

Intel Labs, en collaboration avec Blockade Labs, a introduit le modèle de diffusion latente pour la 3D (LDM3D), un nouveau modèle de diffusion qui utilise l’IA générative pour créer un contenu visuel 3D réaliste. LDM3D est le premier modèle de l’industrie à générer une carte de profondeur en utilisant le processus de diffusion pour créer des images 3D avec des vues à 360 degrés vives et immersives.

intel-IA-generative-images-3D
Crédit photo : Intel

LDM3D a le potentiel de révolutionner la création de contenu, les applications métavers et les expériences numériques, transformant un large éventail d’industries, du divertissement et des jeux à l’architecture et au design.

Podcast


L’IA au service de la créativité

« La technologie d’IA générative vise à augmenter et à améliorer davantage la créativité humaine et à gagner du temps. Cependant, la plupart des modèles d’IA générative d’aujourd’hui se limitent à générer des images 2D et très peu peuvent générer des images 3D à partir d’invites de texte. Contrairement aux modèles de diffusion stable latente existants, LDM3D permet aux utilisateurs de générer une image et une carte de profondeur à partir d’une invite de texte donnée en utilisant presque le même nombre de paramètres. Il fournit une profondeur relative plus précise pour chaque pixel d’une image par rapport aux méthodes de post-traitement standard pour l’estimation de la profondeur et permet aux développeurs de gagner un temps considérable pour développer des scènes » a ainsi déclaré Vasudev Lal, chercheur IA chez Intel Labs.

IA-generative-intel
Crédit photo : Intel

 

Un avantage concurrentiel fort

L’engagement d’Intel en faveur d’une véritable démocratisation de l’IA permettra un accès plus large à ses avantages via un écosystème ouvert. En effet, de nombreux modèles d’IA générative contemporains se limitent à générer uniquement des images 2D. Contrairement aux modèles de diffusion existants, qui ne génèrent généralement que des images RVB 2D à partir d’invites de texte, LDM3D permet aux utilisateurs de générer à la fois une image et une carte de profondeur à partir d’une invite de texte donnée.

image-technologies
Crédit photo : Intel

Cette recherche pourrait révolutionner la façon dont nous interagissons avec le contenu numérique en permettant aux utilisateurs de faire l’expérience de leurs invites textuelles de manière auparavant inconcevable. Cette capacité à capturer des informations de profondeur peut instantanément améliorer le réalisme et l’immersion globale, permettant des applications innovantes pour des industries allant du divertissement et des jeux à la décoration d’intérieur et aux annonces immobilières, ainsi que des musées virtuels et des expériences immersives de réalité virtuelle (VR).

intel-IA-generative
Crédit photo : Intel
Tag :

emoji-email Ne manquez aucune actualité, abonnez-vous !

Chaque semaine, le meilleur de la communication et du digital directement dans votre inbox...