Bonjour,
Je ne sais pas si je suis au bon endroit pour poser cette question mais je me demandais comment sont créées les voix synthétiques ?
J’ai vu sur internet que sur ordinateur pour obtenir un lecteur vocal synthétique en ligne il suffisait d’enregistrer quelques mots prononcés par une voix humaine et ensuite l’ordinateur pourrait générer automatiquement de nouveaux mots basés sur les premiers.
Seulement, ça me parait vraiment simple c’est vraiment le cas ?
Et je ne comprends pas, par exemple dans le cas d’une liste de mots pré-enregistrés pour s’entraîner à écouter des sons comme en orthophonie ou pour des tests vocaux en audiologie on dit que ce sont des tests émis en «*voix enregistrée*», dans ce cas il me semble que c’est une simple voix humaine posée et enregistrée de sorte que le test soit répétable. Mais alors quel est l’interêt d’utiliser une voix recréée artificiellement plutôt qu’une voix humaine ?? La seule utilisation notable que je vois est celle des assistants vocaux type Google et Amazon Écho, et encore je me dis qu’ils auraient pu pré enregistrer toutes ces phrases avec une voix humaine directement ... non ? Plutôt que de s’embêter à retoucher les composantes vocales artificiellement !
Ou quelque chose m’échappe...!
-----