Η ερευνητική ομάδα της Nvidia έχει μόλις αναπτύξει ένα νέο AI που μπορεί να χρησιμοποιήσει ένα υπάρχον βίντεο και μία μόνο εικόνα για να κάνει το άτομο στην εικόνα να μιμείται κινήσεις από το βίντεο.
Τεχνικά, η μέθοδος που είναι γνωστή ως video-to-video σύνθεση λαμβάνει ένα input βίντεο για να το μετατρέψει σε φωτορεαλιστικό βίντεο χρησιμοποιώντας μια εικόνα.
Η ερευνητική ομάδα της Nvidia είπε ότι υπάρχουν δύο μεγάλα προβλήματα με την τρέχουσα σειρά μοντέλων AI που προσπαθούν να επιτύχουν το ίδιο: Πρώτον, αυτά τα μοντέλα χρειάζονται μια σειρά από εικόνες στόχους για να τις μετατρέψουν σε βίντεο. Δεύτερον, η ικανότητα αυτών των μοντέλων να γενικεύουν την παραγωγή είναι περιορισμένη.
Ηλιακή καταιγίδα ίσως επηρεάσει την ανάκαμψη από τον τυφώνα
Αποκαλύφθηκαν τα Cybercab robotaxi και Tesla Robovan
Πώς τα εργαλεία της OpenAI επηρεάζουν τις εκλογές;
Για να ξεπεραστούν αυτά τα εμπόδια, οι ερευνητές δημιούργησαν ένα νέο μοντέλο που μαθαίνει να παράγει βίντεο από ανθρώπους που δεν υπήρχαν στο σύνολο δεδομένων κατάρτισης – χρησιμοποιώντας μερικές μόνο εικόνες τους. Η ομάδα, στη συνέχεια, δοκίμασε διάφορα σενάρια, όπως χορευτικές κινήσεις και συνομιλίες. Μπορείτε να δείτε το AI σε δράση στο παρακάτω βίντεο:
Το μοντέλο μπορεί επίσης να χρησιμοποιηθεί σε πίνακες ή σε δρόμους για τη δημιουργία ζωντανών αναπαραστάσεων. Αυτό μπορεί να είναι πραγματικά βολικό για τη δημιουργία ταινιών και παιχνιδιών.
Το AI δεν είναι τελείως τέλειο και είναι δύσκολο να χρησιμοποιεί σωστά όλα τα στοιχεία σε αυτά τα βίντεο χαμηλής ανάλυσης. Ωστόσο, είναι χρήσιμη και ενδιαφέρουσα η δημιουργία τέτοιου είδους βίντεο.