Skip to main content

16 Fév, 2024

OpenAI révèle une IA impressionnante qui génère une vidéo photoréaliste

OpenAI révèle une IA impressionnante qui génère une vidéo photoréaliste

Cela va encore changer le jeu de l’IA.

OpenAI dévoile les capacités de son nouveau générateur vidéo – et honnêtement, cela semble assez impressionnant.

Dans un article sur X-anciennement-Twitter , le PDG Sam Altman a présenté le modèle texte-vidéo, qui, selon lui, peut « créer des vidéos d’une durée maximale de 60 secondes présentant des scènes très détaillées, des mouvements de caméra complexes et plusieurs personnages aux émotions vibrantes. « 

On ne sait pas exactement quelles émotions sont censées afficher dans la première des vidéos générées par Altman, étant donné qu’il s’agit d’un couple dos à la « caméra » marchant dans une rue enneigée de Tokyo. Néanmoins, la vidéo est très réaliste et reflète efficacement son invite détaillée.

Présentation de Sora, notre modèle texte-vidéo.

Sora peut créer des vidéos d’une durée maximale de 60 secondes présentant des scènes très détaillées, des mouvements de caméra complexes et plusieurs personnages aux émotions vibrantes. https://t.co/7j2JN27M3W

Invite : « Magnifique, enneigé… pic.twitter.com/ruTEWn87vf

– OpenAI (@OpenAI) 15 février 2024

Les tentatives précédentes de génération de vidéo IA ont eu un bilan mitigé . Le mois dernier, Google a publié des vidéos de  » Lumiere « , un modèle de conversion texte-vidéo meilleur que celui qui l’a précédé, mais toujours clairement limité .

On ne peut pas en dire autant de ce que nous avons vu jusqu’à présent de Sora, qui a clairement des kilomètres d’avance sur Lumière.

Dans le fil de discussion d’Altman et sur le site Web d’OpenAI , les vidéos générées par Sora affichent plusieurs scènes avec des détails éclatants, depuis des mammouths laineux photoréalistes et une bande-annonce de film de science-fiction jusqu’à un monstre pelucheux animé et un  » monde en papier magnifiquement rendu d’un récif de corail « . Bien qu’il ne soit pas clair si les vidéos du fil de discussion du PDG ont été modifiées, celles du site Web, qui présentent la ruée vers l’or en Californie et une visite d’une galerie d’art parmi plusieurs autres scènes, selon OpenAI, « ont été générées directement par Sora sans modification ».

Il y a bien sûr des questions ouvertes. Combien de vidéos OpenAI a-t-il générées, en sélectionnant uniquement les meilleures pour la révélation ? Et combien de puissance de calcul, de temps et d’électricité ont-ils fallu pour créer ces échantillons ?

OpenAI admet également que Sora, dans son état actuel, « a des faiblesses ».

« Il peut avoir du mal à simuler avec précision la physique d’une scène complexe et peut ne pas comprendre des cas spécifiques de cause à effet », peut-on lire sur le site Web. « Par exemple, une personne peut mordre dans un cookie, mais par la suite, le cookie peut ne pas avoir de marque de morsure. »

Ces mises en garde à l’esprit, Sora n’est actuellement pas accessible au public pour une raison différente. Comme l’a noté Altman , les experts en désinformation et en extrémisme de l’entreprise sont toujours en train de « tester de manière contradictoire » – ce qui est l’argot de l’industrie pour désigner une tentative intentionnelle de jailbreaker – le générateur de texte en vidéo.

« Nous prendrons plusieurs mesures de sécurité importantes avant de rendre Sora disponible dans les produits OpenAI », indique le site Web de la société. « Nous développons également des outils pour aider à détecter les contenus trompeurs, tels qu’un classificateur de détection capable de déterminer quand une vidéo a été générée par Sora. »

En lisant entre les lignes, il semble que la firme cherche à éviter ses propres erreurs passées  et celles de ses concurrents qui ont sorti leurs modèles avant de s’assurer qu’ils ne cracheront pas, vous savez, un tas de mensonges haineux .

« Nous mobiliserons les décideurs politiques, les éducateurs et les artistes du monde entier pour comprendre leurs préoccupations et identifier des cas d’utilisation positifs de cette nouvelle technologie », peut-on lire sur le site Internet. « Malgré des recherches et des tests approfondis, nous ne pouvons pas prédire toutes les manières bénéfiques dont les gens utiliseront notre technologie, ni toutes les manières dont ils en abuseront. »

Après le massacre de Thanksgiving , il semble qu’OpenAI pourrait bien entamer un nouveau chapitre – et si ces exemples sont une indication, il va devenir plus puissant que jamais.

https://futurism.com/openai-sora-video-generator