Το Stability AI αποκαλύπτει το Stable Video Diffusion: Ένα μοντέλο τεχνητής νοημοσύνης που μετατρέπει κείμενο σε ζωντανές εικόνες.
![Stability AI Stable Video Diffusion](https://www.secnews.gr/wp-content/uploads/cwv-webp-images/2023/11/Stability-AI-Stable-Video-Diffusion-1024x576.png.webp)
Το Stable Video Diffusion είναι διαθέσιμο σε δύο παραλλαγές, το SVD και το SVD-XT, το καθένα προσφέροντας μοναδικές δυνατότητες για διαφορετικές εφαρμογές. Το SVD μετατρέπει εικόνες σε βίντεο με ανάλυση 576×1024 με 14 καρέ, ενώ το SVD-XT αυξάνει τον αριθμό των καρέ σε 24. Λειτουργώντας μεταξύ τριών έως 30 καρέ ανά δευτερόλεπτο, αυτά τα μοντέλα προσφέρουν ευέλικτες επιλογές για τις ανάγκες δημιουργίας βίντεο.
Δείτε ακόμα: Adobe: Παρουσιάζει το Project Sound Lift τεχνητής νοημοσύνης
Με σκοπό τη συνεργατική ανάπτυξη, η Stability AI έχει δημοσιεύσει τον πηγαίο κώδικα του Stable Video Diffusion στο GitHub. Επιπλέον, η πλατφόρμα Hugging Face διαθέτει τους απαραίτητους πόρους για την τοπική ανάπτυξη.
Παρά τις εντυπωσιακές δυνατότητές του, η τρέχουσα υλοποίηση του Stable Video Diffusion παρουσιάζει ορισμένους περιορισμούς. Δεν είναι σε θέση να δημιουργήσει βίντεο χωρίς κίνηση ή με αργή λήψη της κάμερας, να αποδίδει ευανάγνωστο κείμενο, να παράγει με συνέπεια ρεαλιστικά πρόσωπα ή να ελέγχεται πλήρως μέσω εισαγωγής κειμένου.
Στο άμεσο μέλλον, οι χρήστες μπορούν να αναμένουν τη δυνατότητα δημιουργίας βίντεο με βάση μια περιγραφή κειμένου.
Η σημαντική πτυχή είναι ότι το έργο βρίσκεται στα αρχικά του στάδια. Το υπάρχον μοντέλο, στην τρέχουσα μορφή του, δεν προορίζεται για τη δημιουργία πλήρως λειτουργικών ή εμπορικών εφαρμογών. Αντιθέτως, αποτελεί μια επιστημονική προσπάθεια με στόχο τη συλλογή πολύτιμων σχολίων από τους χρήστες.
Δείτε σχετικά: Humane Ai Pin: Ένα Πρωτοποριακό Wearable με Τεχνητή Νοημοσύνη
Πηγή: news9live.com