Η Microsoft δημιούργησε ένα bot τεχνητής νοημοσύνης, το οποίο έχει τη δυνατότητα μέσα σε μόλις τρία δευτερόλεπτα να αντιγράψει τόσο τα συναισθήματα, όσο και τον τόνο της φωνής ενός ατόμου.
Όπως αναφέρει το techmonitor.ai, η εταιρεία ανακοίνωσε τη δημιουργία του «VALL-E» το οποίο μοιάζει με τα chatbots στην ιστοσελίδα Character.AI, όμως έχει περισσότερες δυνατότητες. Μέχρι στιγμής, δεν έχει ανακοινώσει επίσημα όλα τα πράγματα που μπορεί να προσφέρει, αφού υπάρχει ο φόβος ότι μπορεί να χρησιμοποιηθεί για τη διάδοση ψευδών ειδήσεων.
«Δεδομένου ότι το VALL-E θα μπορούσε να συνθέσει ομιλία από συγκεκριμένο ομιλητή μπορεί να ενέχει πιθανούς κινδύνους στην κακή χρήση του μοντέλου, όπως η πλαστοπροσωπία ενός συγκεκριμένου ομιλητή», ανέφερε χαρακτηριστικά ένας ερευνητής της Microsoft.
Surprised there isn’t more chatter around VALL-E
This new model by @Microsoft can generate speech in any voice after only hearing a 3s sample of that voice 🤯
Demo → https://t.co/GgFO6kWKha pic.twitter.com/JY88vf4lYc— Steven Tey (@steventey) January 9, 2023
Το συγκεκριμένο bot λοιπόν, εκπαιδεύτηκε σε 60.000 ώρες αγγλικής ομιλίας από το LibriLight, μια βιβλιοθήκη ήχου που έχει δημιουργήσει η Meta και μεταξύ άλλων, μπορεί να χρησιμοποιήσει λέξεις στο τόνο και το συναίσθημα που μιλάει ο αρχικός ομιλητής, χωρίς όμως να τις έχει χρησιμοποιήσει.