Caractéristiques de Phenaki
Phenaki est un modèle d'IA permettant de générer des vidéos de plusieurs minutes à partir d'un texte. Il est également possible de générer une vidéo à partir d'une image fixe et d'une invite. Le codeur-décodeur vidéo proposé surpasse toutes les lignes de base par image actuellement utilisées dans la littérature en termes de qualité spatio-temporelle et de nombre de jetons par vidéo. Pour générer des jetons vidéo à partir du texte, ils utilisent un transformateur masqué bidirectionnel conditionné par des jetons textuels précalculés. Les jetons vidéo générés sont ensuite dé-tokénisés pour créer la vidéo réelle.
Catégories
Parcourir 116 outils de génération de vidéos par l'IA.
Parcourir 26 outils de conversion de texte en vidéo.
Voir toutes les catégories