Ένας δημοσιογράφος του ραδιοφώνου στις ΗΠΑ, ο οποίος έχασε πριν από δύο χρόνια τη φωνή του, θα επιστρέψει ξανά στον αέρα, χάρη στην τεχνητή νοημοσύνη.
Ο Τζέιμι Ντιπρέ, 54 ετών, είναι δημοσιογράφος του πολιτικού ρεπορτάζ στο Cox Media Group, και έχασε τη φωνή του εξαιτίας ενός σπάνιου νευρολογικού προβλήματος. Ωστόσο, η σκοτσέζικη εταιρεία CereProc του δημιούργησε μια νέα φωνή, εκπαιδεύοντας ένα νευρωνικό δίκτυο να προβλέπει πώς θα μιλούσε ο Ντιπρέ μέσω δειγμάτων από παλιές καταγραφές της φωνής του.
«Έσωσε τη ζωή μου και την οικογένειά μου από ένα τρομακτικό άγνωστο οικονομικό μέλλον» είπε στο BBC o Ντιπρέ. «Δεν υπάρχει μεγάλη αγορά για δημοσιογράφους του ραδιοφώνου που δεν μπορούν να μιλήσουν».
Κανονικά για τη δημιουργία μιας φωνής χρειάζεται κάποιος να διαβάσει κείμενο συνολικής διάρκειας 30 ωρών για να συγκεντρωθούν τα απαραίτητα δεδομένα. Μετά χρησιμοποιείται τεχνητή νοημοσύνη, είτε για περικοπή λέξεων και ανασυνδυασμό τους κατά βούληση, είτε η τεχνολογία χρησιμοποιείται για την πρόβλεψη και μίμηση των μοτίβων ομιλίας του. Ωστόσο, οι μέθοδοι αυτές είναι πανάκριβες, και χρειάζεται ένας μήνας για τη δημιουργία μιας και μόνο φωνής.
Για να επιταχύνει τη διαδικασία αυτή και να την κάνει πιο οικονομική, η CereProc άρχισε να αναπτύσσει τα δικά της νευρωνικά δίκτυα το 2006. Σήμερα το σύστημα τεχνητής νοημοσύνης της είναι σε θέση να παράγει μια φωνή μέσα σε λίγες ημέρες για 500 λίρες, εφόσον ο χρήστης παρέχει καταγραφές της φωνής του διαβάζοντας το κείμενο στην ιστοσελίδα του.
Τα νευρωνικά δίκτυα, τα οποία περιλαμβάνουν 6-10 στρώματα το καθένα, λειτουργούν κατακερματίζοντας ηχογραφήσεις λέξεων σε επίπεδο φωνημάτων. Το σύστημα τεχνητής νοημοσύνης κομματιάζει κάθε λέξη που διαβάζει ο χρήστης σε 100 μικρά κομμάτια και το κάνει αυτό με πολλές κοινές λέξεις, μέχρι που κατανοεί πώς λειτουργούν τα βασικά φωνήματα στη φωνή του χρήστη. Μετά, δημιουργεί τους δικούς του ήχους και προβλέπει πώς θα ακουγόταν εάν έλεγε μια σειρά από λέξεις σε μια συζήτηση.
Ο Ντιπρέ κάλυπτε το πολιτικό ρεπορτάζ στο Κογκρέσο στην Ουάσινγκτον εδώ και 35 χρόνια. Άρχισε να χάνει τη φωνή του το 2016, λόγω ενός σπάνιου νευρολογικού προβλήματος, όπου η γλώσσα πιέζεται έξω από το στόμα και ο λαιμός του σφίγγεται όταν είναι να μιλήσει, κάτι που καθιστά αδύνατον για αυτόν να λέει πάνω από δύο με τρεις λέξεις τη φορά. Αν και συνέχισε να εργάζεται, γράφοντας ρεπορτάζ, βρέθηκε εντελώς εκτός ραδιοφωνικού αέρα λόγω του προβλήματος αυτού. Ωστόσο τον Δεκέμβριο μίλησε εκ μέρους του ένα μέλος του Κογκρέσου στη Βουλή των Αντιπροσώπων, προκαλώντας ενδιαφέρον για την περίπτωσή του. Εν τέλει, ο Ντιπρέ θα ακουστεί ξανά στο ραδιόφωνο στις 25 Ιουνίου, χάρη στη συνθετική φωνή της CereProc- με τον ίδιο να γράφει το κείμενο και μετά να χρησιμοποιεί ένα πρόγραμμα μετατροπής κειμένου σε ήχο για να το μετατρέψει σε αρχείο ήχου.
«Είναι η δική μου φωνή, δεν υπάρχει αμφιβολία. Ναι, είναι κάπως ρομποτική, αλλά κανείς δεν μου υποσχέθηκε ότι θα ήταν τέλεια» είπε ο ίδιος.
Ο Τζέιμι Ντιπρέ, 54 ετών, είναι δημοσιογράφος του πολιτικού ρεπορτάζ στο Cox Media Group, και έχασε τη φωνή του εξαιτίας ενός σπάνιου νευρολογικού προβλήματος. Ωστόσο, η σκοτσέζικη εταιρεία CereProc του δημιούργησε μια νέα φωνή, εκπαιδεύοντας ένα νευρωνικό δίκτυο να προβλέπει πώς θα μιλούσε ο Ντιπρέ μέσω δειγμάτων από παλιές καταγραφές της φωνής του.
«Έσωσε τη ζωή μου και την οικογένειά μου από ένα τρομακτικό άγνωστο οικονομικό μέλλον» είπε στο BBC o Ντιπρέ. «Δεν υπάρχει μεγάλη αγορά για δημοσιογράφους του ραδιοφώνου που δεν μπορούν να μιλήσουν».
Κανονικά για τη δημιουργία μιας φωνής χρειάζεται κάποιος να διαβάσει κείμενο συνολικής διάρκειας 30 ωρών για να συγκεντρωθούν τα απαραίτητα δεδομένα. Μετά χρησιμοποιείται τεχνητή νοημοσύνη, είτε για περικοπή λέξεων και ανασυνδυασμό τους κατά βούληση, είτε η τεχνολογία χρησιμοποιείται για την πρόβλεψη και μίμηση των μοτίβων ομιλίας του. Ωστόσο, οι μέθοδοι αυτές είναι πανάκριβες, και χρειάζεται ένας μήνας για τη δημιουργία μιας και μόνο φωνής.
Για να επιταχύνει τη διαδικασία αυτή και να την κάνει πιο οικονομική, η CereProc άρχισε να αναπτύσσει τα δικά της νευρωνικά δίκτυα το 2006. Σήμερα το σύστημα τεχνητής νοημοσύνης της είναι σε θέση να παράγει μια φωνή μέσα σε λίγες ημέρες για 500 λίρες, εφόσον ο χρήστης παρέχει καταγραφές της φωνής του διαβάζοντας το κείμενο στην ιστοσελίδα του.
Τα νευρωνικά δίκτυα, τα οποία περιλαμβάνουν 6-10 στρώματα το καθένα, λειτουργούν κατακερματίζοντας ηχογραφήσεις λέξεων σε επίπεδο φωνημάτων. Το σύστημα τεχνητής νοημοσύνης κομματιάζει κάθε λέξη που διαβάζει ο χρήστης σε 100 μικρά κομμάτια και το κάνει αυτό με πολλές κοινές λέξεις, μέχρι που κατανοεί πώς λειτουργούν τα βασικά φωνήματα στη φωνή του χρήστη. Μετά, δημιουργεί τους δικούς του ήχους και προβλέπει πώς θα ακουγόταν εάν έλεγε μια σειρά από λέξεις σε μια συζήτηση.
Ο Ντιπρέ κάλυπτε το πολιτικό ρεπορτάζ στο Κογκρέσο στην Ουάσινγκτον εδώ και 35 χρόνια. Άρχισε να χάνει τη φωνή του το 2016, λόγω ενός σπάνιου νευρολογικού προβλήματος, όπου η γλώσσα πιέζεται έξω από το στόμα και ο λαιμός του σφίγγεται όταν είναι να μιλήσει, κάτι που καθιστά αδύνατον για αυτόν να λέει πάνω από δύο με τρεις λέξεις τη φορά. Αν και συνέχισε να εργάζεται, γράφοντας ρεπορτάζ, βρέθηκε εντελώς εκτός ραδιοφωνικού αέρα λόγω του προβλήματος αυτού. Ωστόσο τον Δεκέμβριο μίλησε εκ μέρους του ένα μέλος του Κογκρέσου στη Βουλή των Αντιπροσώπων, προκαλώντας ενδιαφέρον για την περίπτωσή του. Εν τέλει, ο Ντιπρέ θα ακουστεί ξανά στο ραδιόφωνο στις 25 Ιουνίου, χάρη στη συνθετική φωνή της CereProc- με τον ίδιο να γράφει το κείμενο και μετά να χρησιμοποιεί ένα πρόγραμμα μετατροπής κειμένου σε ήχο για να το μετατρέψει σε αρχείο ήχου.
«Είναι η δική μου φωνή, δεν υπάρχει αμφιβολία. Ναι, είναι κάπως ρομποτική, αλλά κανείς δεν μου υποσχέθηκε ότι θα ήταν τέλεια» είπε ο ίδιος.