Comment créer une voix off à l’aide de Google Cloud Text to Speech

Si vous ne pouvez pas utiliser votre propre voix, comment pouvez-vous ajouter une narration à vos vidéos ? Grâce à l’utilisation du traitement du son IA, l’outil Cloud Text de Google vous permet de créer des voix off au son naturel en quelques clics seulement.

Qu’il s’agisse d’une grande entreprise ou d’un auteur indépendant, votre objectif lors de l’écriture est d’ajouter de la valeur et de développer des relations avec vos lecteurs. Pour cela, l’audio est un outil précieux. Considérez la popularité des podcasts comme preuve.

Si vous préférez le contenu visuel au mot, nous avons inclus une vidéo avec une démonstration complète et simple du contenu de cet article.

Google Cloud Text-to-Speech et WaveNet : qu’est-ce que c’est ?

Les développeurs peuvent créer un discours au son naturel avec plus de 40 voix, accessibles dans 200 langues et dialectes, à l’aide de Google Cloud Text-to-Speech. Pour offrir un son haute fidélité, il combine les puissants réseaux de neurones de Google avec la recherche révolutionnaire WaveNet de DeepMind.

Contrairement à d’autres systèmes de synthèse vocale, un WaveNet produit une parole qui semble plus naturelle. Il crée une synthèse vocale qui accentue et infléchit les syllabes, les phonèmes et les mots d’une manière plus humaine. La plupart du temps, les utilisateurs préfèrent l’audio vocal de WaveNet à celui des systèmes de synthèse vocale concurrents. Un modèle WaveNet construit les formes d’onde audio brutes à partir de zéro, contrairement à la majorité des systèmes de synthèse vocale existants.

Maintenant que nous avons couvert les bases de ce système de synthèse vocale basé sur l’IA, examinons le processus de configuration.

Première méthode

Créer un compte basé sur Google Cloud

Google Cloud, la plate-forme de développement de Google, inclut Google Text-to-Speech. Il s’agit d’un ensemble de services comparables à ceux fournis par Microsoft Azure et Amazon Web Services. Pour utiliser le service de synthèse vocale, vous devez avoir accès à La plateforme de développement de Google.

Créer un compte basé sur Google Cloud

Pour créer un compte, cliquez sur le lien fourni ci-dessus. Une fois que vous arrivez à la page des informations de base et des conditions, vous pouvez la remplir selon vos besoins spécifiques. Le processus est très simple et ne comprend que 3 étapes avant de pouvoir accéder au tableau de bord principal.

Étape 1 : Informations sur le compte

Vous pouvez choisir l’option qui définit le plus précisément votre organisation et le pays dans lequel elle est basée dans cette section. Après avoir effectué vos sélections, acceptez les termes et conditions pour continuer.

Vérification de compte

Étape 2 : Vérification de l’identité et informations de contact

Cette section est très explicite. Vous pouvez entrer les coordonnées de votre entreprise et continuer.

Vérification d'identité et de contact

Étape 3 : Vérification des informations de paiement

La dernière étape du processus de signature comprend la vérification des informations de votre carte de crédit. Vous pouvez fournir ces informations sans aucun souci, car elles ne débitent pas automatiquement la carte. Si cela ne semble pas assez réconfortant, ils offrent également un crédit gratuit de 300 $.

vérification de paiement

Une fois que vous avez terminé ce processus, vous pouvez passer à l’accès et à l’utilisation du tableau de bord Google Cloud.

Services cloud Google

Une fois que vous avez terminé le processus de connexion, vous serez dirigé vers la page d’accueil de vos comptes Google Cloud. La page d’accueil comprend une très large gamme d’outils et de services qui vous aident à gérer votre entreprise. Par souci de simplicité dans l’article, nous nous en tiendrons au service Google Text-to-Speech.

Tableau de bord Google Cloud

Pour ce faire, allez dans la barre de recherche en haut de l’écran et entrez « Text-to-Speech ». Parmi les résultats affichés, sélectionnez API Cloud de synthèse vocale.

Recherche de l'API Cloud Text-to-Speech

Sur la page de l’API Cloud Text-to-Speech, cliquez sur Activer afin de faire fonctionner le service. Gardez à l’esprit que la version gratuite autorise jusqu’à un million de caractères pour WaveNet. Si vous souhaitez augmenter cette limite, vous devrez acheter la version payante pour 16 $.

Activer l'API Cloud Text-to-Speech

Une fois les étapes ci-dessus terminées, vous pouvez accéder au Identifiants onglet en allant dans la barre latérale et en le trouvant sous API et services.

Paramètres des API et des services

Vous pourrez vérifier les informations d’identification en cliquant sur Ajouter des informations d’identification et en saisissant la clé API qui vous a été fournie dans le champ désigné. Une fois terminé, cliquez sur Restreindre la clécar cela préserve la possibilité de toute menace à la sécurité de votre compte.

Créer des identifiants sur Google Cloud

WaveNet pour Chrome

Comme nous l’avons mentionné ci-dessus, WaveNet fait partie intégrante de l’utilisation du service Text-to-Speech. Pour utiliser cet outil, vous devrez l’installer et l’activer pour votre navigateur Chrome en vous rendant sur le Chrome Web Store et en saisissant WaveNet dans la barre de recherche, ou vous pouvez cliquer sur le lien pour accéder directement à la page d’extension.

WaveNet pour Chrome

Une fois que vous avez installé et ajouté l’extension à Chrome, vous pouvez y accéder en cliquant sur l’icône d’extension dans la barre des tâches de Google Chrome sur le côté droit de la page.

Vous pouvez maintenant entrer la clé API fournie au début du processus.

Maintenant que l’outil WaveNet est prêt et actif, vous pouvez commencer par copier votre texte et le coller dans un Compteur de mots pour ne pas franchir le cap des 1 million de caractères. Ce compteur de caractères particulier a une limite de 5000 caractères à la fois.

Site Web du compteur de mots

Sélectionnez le texte requis et cliquez avec le bouton droit. Dans les différentes options du menu contextuel, sélectionnez WaveNet pour Chrome, puis sélectionnez Télécharger en MP3. Vous pouvez également écouter l’audio pour vérifier avant de télécharger en cliquant sur Commencez à parler après avoir sélectionné le texte.

Comme vous pouvez le voir, vous venez de convertir le texte en un fichier audio avec la voix et la vitesse de l’IA de votre choix.

Passons à la méthode numéro 2.

Deuxième méthode

Cette méthode est tout aussi simple, sinon plus. Vous pouvez commencer par accéder au Chrome Web Store comme nous l’avons fait dans la méthode précédente et entrer Capture audio chromée dans la barre de recherche ou en cliquant sur le lien.

Une fois l’extension active, vous devez accéder au site Web de Google Cloud et sélectionner le Des produits languette.

Paramètres de démonstration de synthèse vocale

Sous cet onglet, vous trouverez le champ « Mettre la synthèse vocale en action ». Allez-y et collez le texte que vous souhaitez convertir dans le champ fourni. Vous pouvez ensuite sélectionner la langue, le type de voix et personnaliser la vitesse et la hauteur.

Avant de cliquer sur le Dis le ouvrez l’extension de capture audio que nous avons installée de la même manière qu’avant et démarrez la capture audio.

Mettre la synthèse vocale dans les paramètres d'action

Une fois que l’audio est complètement enregistré, vous pouvez continuer et terminer l’enregistrement et le télécharger.

Maintenant que la procédure de configuration est terminée, consultez cette liste de certains des meilleurs services de synthèse vocale en ligne en dehors de celui dont il est question dans cet article.

Outils alternatifs de synthèse vocale

Murf

Plug-in murfComment

Murf crée des voix off à l’aide de texte. L’application transforme votre écriture en voix d’IA incroyablement réalistes, que vous la tapiez ou téléchargiez un clip vocal. Les voix offertes par Murf sont celles de doubleurs professionnels qualifiés. Il fait un certain nombre de tests sur les voix. Murf peut être utilisé pour symboliser une marque, un article, une entreprise, une présentation, etc.

Traits:

  • Vous pouvez créer des voix off à partir du texte en utilisant Murf. De plus, il vous permet de transformer votre discours en texte modifiable que vous pourrez ensuite modifier ou transformer en une voix IA.
  • Il est possible de faire correspondre le timing de la voix off avec les images à l’aide de Murf Studio.
  • Murf fournit plus de 100 voix crédibles dans 19 langues différentes.
  • De plus, il contient des options pour faire une pause, modifier le tempo du narrateur, souligner certains points, etc.
  • Les fonctionnalités supplémentaires incluent l’ajout de musique de fond gratuite, l’édition de vidéos et de musique, la vérification du script à l’aide d’un vérificateur grammatical, et bien d’autres.
  • Murf offre des capacités de collaboration d’équipe sophistiquées, un contrôle d’accès, une bibliothèque de prononciation et un SLA pour les entreprises souhaitant produire des voix off à grande échelle.

Prix: Murf propose quatre niveaux de tarification pour sa solution, à savoir Free, Basic à 13 $/mois, Pro à 26 $/mois, Enterprise à 69 $/mois, et plus encore.

Synthèse

Plug-in de synthèse

Vous pouvez extraire un discours qui semble naturel à partir de textes à l’aide de Synthesys. Avec Synthesis, vous pouvez choisir parmi une grande variété de tons, de langues, de voix masculines et féminines, de langues et de taux de lecture. La création d’un discours artificiel qui semble réaliste et peut être utilisé pour une variété de raisons commerciales ne nécessite que trois étapes.

Traits:

  • Logiciel basé sur le cloud.
  • Une énorme collection de voix expérimentées et réalistes. 30 voix masculines et plus de 35 voix féminines.
  • Créez et commercialisez d’innombrables voix.
  • Interface utilisateur incroyablement conviviale.

Prix: 29 $/mois pour Audio Synthesys, 39 $/mois pour Human Studio Synthesys et 59 $/mois pour Audio et Human Studio Synthesys.

Amazon Polly

Plugin Amazon Polly

Bien qu’il soit intéressant d’ajouter des capacités de synthèse vocale à votre application, créer des sons réalistes avec une IA avancée est quelque chose de spécial. Vous pouvez y avoir accès en utilisant Amazon Polly.

Vous pouvez concevoir des catégories inexplorées d’éléments à reconnaissance vocale et développer des applications qui parlent. Vous êtes capable de parler avec un niveau de naturel inégalé grâce au deep learning et à une IA de pointe.

Fonctionnalités

  • Des voix qui semblent naturelles.
  • Stockage et distribution de la parole.
  • Diffusion en temps réel.
  • Créer et gérer la sortie vocale.
  • Bas prix.

Prix: Pendant les 12 premiers mois, les 5 premiers millions de caractères sont gratuits. Après cela, les demandes de parole ou de Speech Marks coûtent 4,00 $ pour 1 million de caractères.

Conclusion

Presque tous les appareils numériques personnels, tels que les PC, les smartphones et les tablettes, sont compatibles avec les services de synthèse vocale. Tout fichier texte, y compris les documents Word et Pages, peut être lu à haute voix. Vous pouvez également lire à haute voix des pages Web en ligne.

Nous espérons que vous avez trouvé ces informations utiles.

Lectures complémentaires

Partagez cet article

Newsletter

Inscrivez-vous à notre newsletter pour profiter de toutes nos astuces !

Laissez une réponse

Votre adresse e-mail ne sera pas publiée.