DimensionX : Créez des scènes 3D/4D à partir d’une seule image

DimensionX

3.5 | 78 | 0
Type:
Site Web
Dernière mise à jour:
2025/10/08
Description:
DimensionX crée des scènes 3D et 4D à partir d’une seule image à l’aide d’une diffusion vidéo contrôlable, permettant ainsi la génération de vidéos avec vue originale et le contrôle fusionné spatio-temporel.
Partager:
Génération de scènes 3D
génération de scènes 4D
diffusion vidéo

Vue d'ensemble de DimensionX

DimensionX : Créez des scènes 3D et 4D à partir d’une seule image avec une diffusion vidéo contrôlable

DimensionX est un nouveau cadre qui permet la création de scènes 3D et 4D à partir d’une seule image d’entrée. Il exploite les techniques de diffusion vidéo contrôlable pour générer des scènes dynamiques, offrant un contrôle sur les aspects spatiaux et temporels. Cette technologie est particulièrement utile pour générer de nouvelles vidéos de vues et fusionner des commandes spatio-temporelles.

Qu’est-ce que DimensionX ?

DimensionX est un cadre conçu pour produire des scènes 3D et 4D à partir d’une seule image. Il se distingue par sa capacité à créer une diffusion vidéo contrôlable, permettant aux utilisateurs de manipuler les éléments spatiaux et temporels de la scène générée.

Comment fonctionne DimensionX ?

Le pipeline DimensionX est divisé en trois parties principales :

  1. ST-Director pour la génération de vidéos contrôlables: Ce composant décompose les paramètres spatiaux et temporels dans les modèles de diffusion vidéo. Il apprend LoRA (Low-Rank Adaptation) sensible à la dimension sur des ensembles de données à variance dimensionnelle pour réaliser une génération de vidéos contrôlables.
  2. Génération de scènes 3D avec S-Director: Étant donné une seule vue, une scène 3D de haute qualité est récupérée à partir des images vidéo générées par S-Director.
  3. Génération de scènes 4D avec ST-Director: En commençant par une seule image, une vidéo à variance temporelle est produite par T-Director. Une image clé est sélectionnée dans cette vidéo pour générer une vidéo de référence à variance spatiale. Guidé par la vidéo de référence, des vidéos à variance spatiale par image sont générées par S-Director, qui sont ensuite combinées en vidéos multi-vues. Le raffinement multi-boucles de T-Director garantit des vidéos multi-vues cohérentes, qui sont ensuite utilisées pour optimiser la scène 4D.

Principales caractéristiques et principaux composants:

  • ST-Director: Décompose les paramètres spatiaux et temporels à l’aide de LoRA sensible à la dimension.
  • S-Director: Génère des scènes 3D de haute qualité à partir d’images vidéo.
  • T-Director: Produit des vidéos à variance temporelle à partir d’une seule image.

Exemples de cas d’utilisation:

  • Toute génération de vidéos de contrôle de caméra: Démontre la capacité de contrôler la caméra dans la vidéo générée, y compris les mouvements statiques, d’orbite vers la droite, d’orbite vers la gauche et de zoom avant.
  • Génération de vidéos contrôlables fusionnées spatio-temporellement: Montre la capacité de la structure à fusionner des commandes spatiales et temporelles pour la génération de vidéos.
  • Génération 3D à vue unique: Génère des scènes 3D à partir d’une seule vue d’entrée, permettant des orbites à 360 degrés.
  • Génération de scènes 3D à vue éparse: Crée des scènes 3D à partir de deux vues d’entrée.
  • Génération de scènes 4D: Génère des scènes 4D dynamiques avec de nouvelles vidéos de vues.

Pourquoi choisir DimensionX ?

DimensionX offre une approche unique de la génération de scènes 3D et 4D en fournissant :

  • Contrôlabilité: Les utilisateurs ont un contrôle précis sur les aspects spatiaux et temporels des scènes générées.
  • Haute qualité: La structure génère des scènes 3D et 4D de haute qualité à partir d’une seule image.
  • Polyvalence: Elle prend en charge diverses applications, notamment le contrôle de la caméra, la fusion spatio-temporelle et la génération de nouvelles vues.

À qui s’adresse DimensionX ?

DimensionX convient aux :

  • Chercheurs en vision artificielle et en infographie.
  • Créateurs de contenu qui cherchent à générer des scènes 3D et 4D dynamiques.
  • Développeurs travaillant sur des applications qui nécessitent une génération de vidéos contrôlables.

DimensionX s’appuie sur Clarity Template, améliorant encore ses capacités. Le projet DimensionX présente également la « X Family », qui comprend ReconX pour la reconstruction de scènes à partir de vues éparses, avec d’autres ajouts prévus pour l’avenir.

Citation

@article{sun2024dimensionx,
    title={DimensionX: Create Any 3D and 4D Scenes from a Single Image with Controllable Video Diffusion},
    author={Sun, Wenqiang and Chen, Shuo and Liu, Fangfu and Chen, Zilong and Duan, Yueqi and Zhang, Jun and Wang, Yikai},
    journal={arXiv preprint arXiv:2411.04928},
    year={2024}
}

DimensionX permet aux utilisateurs de créer de superbes scènes 3D et 4D à partir d’une seule image, ce qui en fait un outil précieux pour diverses applications dans la recherche et la création de contenu. Il utilise des techniques novatrices et offre un contrôle précis sur le contenu généré, permettant ainsi d’obtenir des résultats hautement personnalisés et visuellement attrayants.

Meilleurs outils alternatifs à "DimensionX"

Blimey
Image non disponible
78 0

Blimey est un générateur d'images IA qui vous donne un contrôle total sur la composition, les couleurs et le style. Créez de superbes images IA à partir de vos idées en quelques minutes.

Génération d'images IA
Brain Pod AI
Image non disponible
221 0

Brain Pod AI combine l'IA générative et agentique pour faire évoluer votre entreprise. Tableau de bord tout-en-un pour la rédaction IA, la génération d'images et l'optimisation SEO. Démarrez votre essai gratuit dès aujourd'hui !

Génération de contenu IA
CodePal
Image non disponible
177 0

CodePal est un compagnon de codage alimenté par l'IA qui fournit des outils pour la génération et la complétion de code. Explorez les projets communautaires et gagnez des heures grâce aux outils d'IA pour les développeurs.

Génération de code IA
Eserto
Image non disponible
222 0

Eserto est une plateforme de génération de leads basée sur l'IA/ML conçue pour les entreprises technologiques et les startups, les aidant à vendre efficacement leurs produits et services en trouvant les prospects appropriés.

génération de leads B2B
Flux LoRA Model Library
Image non disponible
186 0

Parcourez et comparez les derniers modèles Flux LoRA dans la bibliothèque de modèles Flux LoRA. Trouvez le Flux LoRA parfait pour améliorer votre expérience de génération de modèles Flux pour la création d'images AI.

Génération d'images IA
LoRA
Flux AI
AINSYS
Image non disponible
241 0

Améliorez l'efficacité de votre entreprise avec AINSYS, une plateforme basée sur l'IA qui automatise la génération de prospects, personnalise la communication et rationalise les processus. Parfait pour les PME qui visent la croissance.

Génération de prospects IA
Ai Pakistani
Image non disponible
183 0

Ai Pakistani est la première plateforme d'IA générative pour le Pakistan, offrant une génération de contenu et d'images basée sur l'IA pour augmenter les conversions et les ventes. Générez du contenu, des documents et des médias uniques grâce à des modèles flexibles et une prise en charge multilingue.

Génération de contenu IA
Kie AI
Image non disponible
246 0

Kie.ai propose des API d'IA abordables et stables pour la génération de texte, de musique et de vidéo. Intégrez des fonctionnalités d'IA avancées dans vos projets grâce à une prise en charge élevée de la concurrence, une sortie de diffusion en temps réel et une documentation complète de l'API.

Génération de musique IA
Flux Pro AI
Image non disponible
317 0

Créez de superbes images et vidéos IA avec Flux Pro AI. Découvrez la génération avancée d'IA à l'aide des modèles Flux Kontext AI et Flux AI. Essai gratuit disponible !

Génération d'images IA
AutoCodeWizard
Image non disponible
371 0

AutoCodeWizard est un assistant de codage alimenté par l'IA qui aide les développeurs et les apprenants à écrire, optimiser et comprendre le code. Automatisez vos tâches de codage avec la génération de scripts d'IA dans plusieurs langues.

Génération de code IA
AI Magicx
Image non disponible
268 0

AI Magicx fournit des outils basés sur l'IA pour la création de contenu, la conception de logos, la génération d'images et la génération de code. Boostez votre créativité et automatisez vos flux de travail.

Génération de contenu IA
genval.ai
Image non disponible
312 0

genval.ai révolutionne le développement logiciel avec des outils de génération et de refactorisation de code basés sur l'IA. Intégrez-vous à GitHub pour rationaliser votre flux de travail et moderniser les bases de code.

génération de code
OpalAI
Image non disponible
308 0

OpalAI transforme les données spatiales en informations exploitables. Modèles de langage de vision (VLM), intelligence des feux de forêt alimentée par l'IA et solutions de numérisation vers BIM pour des décisions plus intelligentes.

intelligence spatiale
Folderer
Image non disponible
325 0

Folderer permet une génération de code assistée par l'IA directement dans vos référentiels GitHub, organisant automatiquement les fichiers pour un développement plus efficace.

Génération de code IA