Les narrateurs de livres audio affirment que l’IA les prive déjà de leur activité
Les narrateurs de livres audio affirment que l’IA les prive déjà de leur activité

Alors que les gens se préparent à l’impact perturbateur de l’intelligence artificielle sur l’emploi et la vie quotidienne, les acteurs du monde des livres audio affirment que leur domaine est déjà en train d’être transformé.
L’IA a la capacité de créer des enregistrements à consonance humaine – à la vitesse d’une chaîne de montage – tout en contournant au moins une partie des services des professionnels humains qui, depuis des années, gagnent leur vie grâce à leur voix.
Nombre d’entre eux constatent déjà une forte baisse de leur activité. Tanya Eby est comédienne vocale à plein temps et narratrice professionnelle depuis 20 ans. Elle possède un studio d’enregistrement à son domicile.
Mais au cours des six derniers mois, elle a vu sa charge de travail diminuer de moitié. Ses réservations ne courent plus que jusqu’en juin, alors que, dans une année normale, elles s’étendraient jusqu’en août. Nombre de ses collègues font état de baisses similaires.
Bien que d’autres facteurs puissent être en jeu, elle a déclaré à l’AFP : « Il semble logique que l’IA nous affecte tous. »
Il n’existe pas de label identifiant les enregistrements assistés par l’IA en tant que tels, mais les professionnels affirment que des milliers de livres audio actuellement en circulation utilisent des « voix » générées à partir d’une banque de données.
Parmi les plus avant-gardistes, DeepZen propose des tarifs qui peuvent réduire le coût de production d’un livre audio à un quart, voire moins, de celui d’un projet traditionnel. La petite société londonienne puise dans une base de données qu’elle a créée en enregistrant les voix de plusieurs acteurs à qui l’on a demandé de s’exprimer dans des registres émotionnels variés.
« Pour chaque voix que nous utilisons, nous signons un accord de licence et nous payons pour les enregistrements », explique Kamis Taylan, PDG de DeepZen. Pour chaque projet, ajoute-t-il, « nous payons des redevances en fonction du travail que nous effectuons ».
Tout le monde ne respecte pas cette norme, a déclaré Tanya Eby.
« Toutes ces nouvelles entreprises qui apparaissent ne sont pas aussi éthiques », dit-elle, et certaines utilisent des voix trouvées dans des bases de données sans les payer.
« Il y a une zone grise exploitée par plusieurs plateformes, a reconnu Kamis Taylan.
« Ils prennent votre voix, ma voix, cinq voix d’autres personnes combinées, ce qui crée une voix distincte… Ils disent qu’elle n’appartient pas à la plateforme. Ils disent que cela n’appartient à personne ».
Toutes les sociétés de livres audio contactées par l’AFP ont nié avoir recours à de telles pratiques.
Speechki, une start-up basée au Texas, utilise à la fois ses propres enregistrements et des voix provenant de banques de données existantes, a déclaré son PDG Dima Abramov.
Mais cela ne se fait qu’après la signature d’un contrat couvrant les droits d’utilisation, a-t-il précisé.

L’avenir de la coexistence ?
Les cinq plus grandes maisons d’édition américaines n’ont pas répondu aux demandes de commentaires.
Mais des professionnels contactés par l’AFP ont indiqué que plusieurs éditeurs traditionnels utilisaient déjà l’IA dite générative, qui peut créer des textes, des images, des vidéos et des voix à partir de contenus existants -sans intervention humaine.
« La narration professionnelle a toujours été, et restera, au cœur de l’expérience d’écoute d’Audible », a déclaré un porte-parole de cette filiale d’Amazon, géant du secteur américain du livre audio. « Toutefois, à mesure que la technologie de la synthèse vocale s’améliore, nous envisageons un avenir dans lequel les performances humaines et le contenu généré par la synthèse vocale pourront coexister.
Les géants de la technologie américaine, profondément impliqués dans le domaine de l’IA qui connaît un développement explosif, poursuivent tous l’activité prometteuse des livres audio narrés numériquement.
Accessible à tous
Au début de l’année, Apple a annoncé qu’elle se lançait dans la production de livres audio narrés par l’IA, une initiative qui, selon elle, rendrait « la création de livres audio plus accessible à tous », notamment aux auteurs indépendants et aux petites maisons d’édition.
Google propose un service similaire, qu’il qualifie d' »auto-narration ».
« Nous devons démocratiser l’industrie de l’édition, car seuls les plus célèbres et les grands noms sont convertis en livres audio », a déclaré Kamis Taylan.
« La narration synthétique vient d’ouvrir la porte aux livres anciens qui n’ont jamais été enregistrés et à tous les livres du futur qui ne le seront jamais pour des raisons économiques », a ajouté Dima Abramov, de Speechki.
Compte tenu des coûts de l’enregistrement humain, ajoute-t-il, seuls cinq pour cent environ de tous les livres sont transformés en livres audio.
Mais M. Abramov a insisté sur le fait que la croissance du marché profiterait également aux acteurs vocaux.
« Ils gagneront plus d’argent et feront plus d’enregistrements », a-t-il déclaré.
L’élément humain
« L’essence même de la narration est d’apprendre à l’humanité à être humaine. Et nous sommes convaincus que cela ne devrait jamais être confié à une machine pour nous apprendre à être humain », a déclaré Emily Ellet, actrice et narratrice de livres audio, cofondatrice de la Professional Audiobook Narrators Association (PANA).
« La narration, a-t-elle ajouté, doit rester entièrement humaine.
Mme Eby a souligné une critique fréquente à l’encontre des enregistrements numériques.
Comparé à un enregistrement humain, un produit d’IA « manque de connectivité émotionnelle ».
Mme Eby craint toutefois que les gens ne s’habituent à la version générée par la machine, « et je pense que c’est tranquillement ce qui est en train de se passer ».
Elle souhaite simplement « que les entreprises fassent savoir aux auditeurs qu’ils écoutent un morceau généré par l’IA… Je voudrais simplement que les gens soient honnêtes à ce sujet ».
https://techxplore.com/news/2023-05-audio-narrators-ai-business.html