Η OpenAI εργάζεται πάνω σε ένα νέο εργαλείο τεχνητής νοημοσύνης, με το όνομα Voice Engine, που μπορεί να μιμηθεί ανθρώπινες φωνές με εξαιρετική ακρίβεια.
Η εταιρεία μοιράστηκε κάποια αποτελέσματα από πρώιμες δοκιμές του εργαλείου, το οποίο χρησιμοποιεί ένα δείγμα 15 δευτερολέπτων κατά τη διάρκεια των οποίων μιλά ένα άτομο. Χρησιμοποιώντας αυτό το μικρό δείγμα, το Voice Engine μπορεί να δημιουργήσει ένα πειστικό αντίγραφο της φωνής. Οι χρήστες μπορούν στη συνέχεια να παρέχουν μια παράγραφο κειμένου και το εργαλείο θα τη διαβάσει με τη φωνή που έχει δημιουργήσει.
Το Voice Engine μπορεί να χρησιμοποιήσει ένα δείγμα φωνής σε μία γλώσσα για να δημιουργήσει ένα αντίγραφο που μπορεί να μιλήσει σε πολλές άλλες γλώσσες.
Δείτε επίσης: Το Μοντέλο AI “Sora” της OpenAI Διαθέσιμο Δημόσια Φέτος
Ηλιακή καταιγίδα ίσως επηρεάσει την ανάκαμψη από τον τυφώνα
Αποκαλύφθηκαν τα Cybercab robotaxi και Tesla Robovan
Πώς τα εργαλεία της OpenAI επηρεάζουν τις εκλογές;
Υπάρχουν ήδη αρκετές υπηρεσίες που μιμούνται ανθρώπινες φωνές, χρησιμοποιώντας την τεχνητή νοημοσύνη, αλλά η OpenAI φαίνεται πως κάνει εξαιρετική δουλειά.
Η OpenAI λέει ότι το Voice Engine χρησιμοποιείται επί του παρόντος μόνο από μια “μικρή ομάδα αξιόπιστων συνεργατών” και γίνονται δοκιμές που θα καθορίσουν εάν και πώς θα επιτραπεί μια πιο ευρεία χρήση της τεχνολογίας. Οι συνεργάτες, που κάνουν τις δοκιμές, συμφώνησαν να μην αναδημιουργήσουν τις φωνές ανθρώπων χωρίς τη ρητή συγκατάθεσή τους. Επίσης, θα ξεκαθαρίσουν στους ακροατές ότι αυτό που ακούνε είναι δημιουργημένο από AI.
“Αναγνωρίζουμε ότι η παραγωγή ομιλίας που μοιάζει με τις φωνές ανθρώπων έχει σοβαρούς κινδύνους, οι οποίοι είναι ιδιαίτερα σημαντικοί σε μια εκλογική χρονιά“, ανέφερε η OpenAI σε μια ανάρτηση. Η εταιρεία αναγνώρισε την ανάγκη για σημαντικές αλλαγές, καθώς ο ήχος που δημιουργείται από AI γίνεται ευρύτερα διαθέσιμος. Ωστόσο, δεν σκοπεύει να κυκλοφορήσει το OpenAI Voice Engine στο κοινό αμέσως. Για παράδειγμα, η εταιρεία πρότεινε τη σταδιακή κατάργηση του φωνητικού ελέγχου ταυτότητας για τραπεζικούς λογαριασμούς.
Δείτε επίσης: ChatGPT Read Aloud: Η OpenAI Προσφέρει Φωνητική Ανάγνωση
“Οποιαδήποτε ευρεία ανάπτυξη της τεχνολογίας συνθετικής φωνής θα πρέπει να συνοδεύεται από εμπειρίες φωνητικού ελέγχου ταυτότητας που επαληθεύουν ότι ο αρχικός ομιλητής προσθέτει εν γνώσει του τη φωνή του στην υπηρεσία. Επίσης, θα πρέπει να υπάρχει μια λίστα απαγόρευσης φωνής που εντοπίζει και αποτρέπει τη δημιουργία φωνών που είναι πολύ παρόμοιες με αυτές γνωστών προσώπων“, είπε η OpenAI σχετικά με το Voice Engine.
Η ανάρτηση της εταιρείας περιλαμβάνει ένα παράδειγμα ενός ηχητικού κλιπ ενός ανθρώπου που διαβάζει ένα απόσπασμα. Στη συνέχεια, παρουσιάζεται το ηχητικό κλιπ που έχει δημιουργηθεί από το AI. Ακούγεται σαν το ίδιο άτομο να διαβάζει το ίδιο απόσπασμα στα Ισπανικά, τα Μανδαρινικά, τα Γερμανικά, τα Γαλλικά και τα Ιαπωνικά. Σε καθένα από τα δείγματα που δημιουργούνται από την τεχνητή νοημοσύνη, διατηρείται ο τόνος και η προφορά του αρχικού ομιλητή.
Η τεχνολογία Voice Engine μπορεί να έχει πολλές εφαρμογές και οφέλη. Υπηρεσίες που μετατρέπουν κείμενο σε φωνή θα μπορούσαν να βοηθήσουν με τη μετάφραση, την παροχή βοήθειας ανάγνωσης για παιδιά ή την παροχή βοήθειας σε άτομα που έχουν χάσει την ικανότητα ομιλίας, λέει η εταιρεία.
Επιπλέον, η τεχνολογία αυτή μπορεί να χρησιμοποιηθεί στην παραγωγή ψηφιακών βοηθών, όπως η Siri ή η Alexa και στη δημιουργία πιο ρεαλιστικών φωνών για χαρακτήρες σε βιντεοπαιχνίδια ή ταινίες. Αυτό θα μπορούσε να βελτιώσει την εμπειρία του χρήστη και να κάνει τα παιχνίδια και τις ταινίες πιο εντυπωσιακές.
Τέλος, η τεχνολογία θα είναι χρήσιμη στην εκπαίδευση. Μπορεί να χρησιμοποιηθεί για τη δημιουργία εκπαιδευτικού υλικού που είναι πιο ευχάριστο και ενδιαφέρον για τους μαθητές, καθώς μπορεί να προσαρμοστεί στις ατομικές ανάγκες τους.
Δείτε επίσης: Apple Podcasts: Μετατρέψτε τα σε απομαγνητοφωνημένα κείμενα
Ωστόσο, ορισμένοι ανησυχούν ότι η χρήση του OpenAI Voice Engine και άλλων αντίστοιχων υπηρεσιών θα μπορούσε να οδηγήσει σε παραβίαση της ιδιωτικότητας. Η χρήση AI για την αναπαραγωγή ανθρώπινων φωνών μπορεί να οδηγήσει σε καταχρήσεις, όπως η παραποίηση της φωνής κάποιου για να δημιουργηθεί ψεύτικο περιεχόμενο ή για να πραγματοποιηθούν απάτες.
Επιπλέον, υπάρχει το ζήτημα της συναινετικής χρήσης. Είναι δύσκολο να ελεγχθεί εάν ένα άτομο έχει δώσει τη συγκατάθεσή του για τη χρήση της φωνής του από ένα AI, ιδιαίτερα εάν αυτό το AI είναι σε θέση να αναπαράγει τη φωνή με ακρίβεια.
Τέλος, η χρήση του AI για την αναπαραγωγή ανθρώπινων φωνών μπορεί να οδηγήσει σε απώλεια εμπιστοσύνης στην επικοινωνία. Αν οι άνθρωποι δεν μπορούν να είναι βέβαιοι ότι η φωνή που ακούνε είναι πραγματικά από το άτομο που υποστηρίζει ότι είναι, αυτό μπορεί να έχει σοβαρές επιπτώσεις στην επικοινωνία και την εμπιστοσύνη.
Πηγή: edition.cnn.com