Skip to main content

29 Nov, 2023

La plateforme de transcription d’AWS est désormais alimentée par l’IA générative

La plateforme de transcription d’AWS est désormais alimentée par l’IA générative

Il reconnaît 100 langues parlées grâce à l’IA.

AWS a ajouté de nouvelles langues à son produit Amazon Transcribe, offrant une transcription basée sur un modèle de base vocale pour 100 langues et une multitude de nouvelles fonctionnalités d’IA pour les clients.

Annoncé lors de l’événement AWS re: Invent , Amazon Transcribe peut désormais reconnaître davantage de langues parlées et lancer une transcription d’appel. Les clients AWS utilisent Transcribe pour ajouter des fonctionnalités de synthèse vocale à leurs applications sur le cloud AWS.

La société a déclaré dans un article de blog que Transcribe s’est entraîné sur « des millions d’heures de données audio non étiquetées provenant de plus de 100 langues » et utilise des algorithmes auto-supervisés pour apprendre les modèles de parole humaine dans différentes langues et accents. AWS a déclaré avoir veillé à ce que certaines langues ne soient pas surreprésentées dans les données de formation afin de garantir que les langues les moins utilisées puissent être aussi précises que les langues plus fréquemment parlées.

Fin 2023, Amazon Transcribe prenait en charge 39 langues.

Amazon Transcribe améliore la précision de 20 à 50 % par rapport à sa version précédente dans de nombreuses langues, selon AWS. Il propose également une ponctuation automatique, un vocabulaire personnalisé, une identification automatique de la langue et des filtres de vocabulaire personnalisés. Il peut reconnaître la parole dans les formats audio et vidéo et dans les environnements bruyants.

Avec une meilleure reconnaissance linguistique, AWS a déclaré que les progrès d’Amazon Transcribe se traduisent également par une meilleure précision avec sa plate-forme Call Analytics, que ses clients de centres de contact utilisent souvent. Amazon Transcribe Call Analytics, désormais également alimenté par des modèles d’IA génératifs, résume les interactions entre un agent et un client. AWS a déclaré que cela réduisait le travail de création de rapports après appel et que les responsables pouvaient lire rapidement les informations sans avoir à parcourir l’intégralité de la transcription.

Bien entendu, AWS n’est pas la seule entreprise à proposer des services de transcription basés sur l’IA. Otter fournit depuis un certain temps des transcriptions d’IA aux consommateurs et aux entreprises et a publié un outil de synthèse en juin. Bien que ce ne soit pas exactement la même chose, Meta a annoncé qu’elle travaillait sur un modèle de traduction génératif alimenté par l’IA qui reconnaît près de 100 langues parlées.

AWS a également annoncé des fonctionnalités supplémentaires pour son produit Amazon Personalized, qui permettent aux clients de proposer des produits ou de montrer des recommandations aux clients, comme la manière dont les services de streaming peuvent suggérer de nouvelles émissions en fonction de l’activité précédente. AWS a ajouté la génération de contenu, qui écrira des titres ou des lignes d’objet d’e-mail pour connecter thématiquement les listes de recommandations.

https://www.theverge.com/2023/11/27/23978822/aws-transcription-amazon-generative-ai

https://aws.amazon.com/blogs/machine-learning/aws-ai-services-enhanced-with-fm-powered-capabilities/

https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/