Sora est un modèle de génération de vidéos développé par OpenAI. Il est capable de créer des vidéos à partir de textes, d'images ou de vidéos existantes, en utilisant le recaptioning de DALL·E 3 pour suivre fidèlement les instructions textuelles. Basé sur une architecture de diffusion transformer, il permet de générer des vidéos entières ou de prolonger des vidéos générées, en garantissant la cohérence des sujets même lorsqu'ils disparaissent temporairement. Sora représente les vidéos comme des collections de petits éléments appelés « visual patches », similaires aux tokens utilisés dans les modèles textuels, ce qui permet un traitement plus large de divers types de données visuelles.
Création de vidéos en fonction de prompts textuels.
Animation des contenus d'une image statique.
Prolongement ou complétion de vidéos existantes.
Jeu de rythme musical avec Kizuna AI sur Nintendo Switch.
Plateforme de doublage vidéo multilingue utilisant l'IA et des traducteurs experts pour un contenu localisé de haute qualité.
Stable Diffusion 3 est un modèle de génération d'images avancé qui offre des images de haute qualité, plus rapides et plus personnalisables.