Skip to main content

4 Jan, 2024

Midjourney se lance dans la création vidéo IA

Midjourney se lance dans la création vidéo IA

Le générateur d’images IA MidJourney commencera à entraîner son modèle vidéo dans les prochains jours et prévoit de sortir un produit final « dans quelques mois ».

Midjourney, l’outil de création d’images génératives peut-être mieux connu pour fonctionner sur un serveur Discord, déploie ses ailes en matière d’IA. Les créateurs de Midjourney ont annoncé mardi qu’ils prévoyaient d’introduire un modèle « texte en vidéo » dans les prochains mois.

La société commencera à former ses modèles vidéo à partir de janvier, a déclaré le PDG David Holz lors d’une session Discord « Office Hour ». Cette décision représente une progression naturelle pour la plateforme, s’appuyant sur un modèle d’image mature pour stimuler la dynamique concurrentielle de l’industrie de la vidéo générative.

Les notes de la session Discord comprenaient des ajustements prévus pour V6 Niji – le modèle de générateur de manga/anime de Midjourney – et des correctifs de cohérence pour la prochaine sortie officielle de Midjourney V6 . La société a également écrit que sa liste de choses à faire prévoit le début de « la formation pour les nouveaux modèles vidéo », qui pourrait potentiellement être prête « dans quelques mois ».

Aucune autre information sur le modèle n’a été partagée ni par David Holz ni par l’équipe Midjourney.

Midjourney est connu pour mettre l’accent sur la qualité et l’expérience utilisateur plutôt que sur la vitesse brute, même si cela signifiait être à la traîne de ses concurrents. La société a déployé des améliorations telles que l’inpainting et l’outpainting des mois après que les fonctionnalités soient devenues de facto sur d’autres plates-formes comme Stable Diffusion , et sa récente incursion dans la génération de texte rudimentaire est intervenue après que cette fonctionnalité soit devenue courante dans d’autres modèles comme Dall-E 3 , SDXL ou même certains générateurs moins populaires comme Ideogram ou IF.

Cette aventure dans la vidéo fait également suite aux sorties de la concurrence. Stability AI a récemment annoncé Stable Video Diffusion ; Meta vient de présenter son générateur vidéo EMU, et les modèles existants comme Pika et Runway ML marquent leur territoire, laissant l’entrée de Midjourney émerger dans un paysage concurrentiel robuste. De plus, d’autres générateurs d’images comme Leonardo AI ont déjà mis en œuvre des capacités de génération vidéo, intensifiant encore la course.

La récente mise à jour v6 de Midjourney, offrant un suivi d’invite amélioré et des images plus réalistes, constitue l’effort le plus récent de l’entreprise pour rester pertinente et compétitive. Si ses modèles font preuve d’une certaine cohésion, ils pourraient gagner du terrain dans un domaine aussi naissant, même avec des modèles qui sont encore loin d’être parfaits.

Les implications de ces évolutions vont bien au-delà d’une course à la suprématie des entreprises. Alors que Midjourney et d’autres innovent et affinent leurs offres, les industries de la création et des médias sont à l’aube d’une ère de transformation. La possibilité de générer, de manipuler et d’interagir avec du contenu vidéo grâce à l’IA ouvre de nombreuses possibilités, depuis la simplification des choses pour les artistes et les annonceurs jusqu’à la possibilité de remodeler la façon dont nous percevons la réalité.

https://decrypt.co/211583/midjourney-leaps-into-ai-video-creation

https://decrypt.co/210637/midjourney-v6-base-model-upgrade-text-generation