NetEase Youdao open-source EmotiVoice un potentissimo motore di sintesi vocale moderno.

NetEase Youdao lancia EmotiVoice, un potente motore di sintesi vocale open-source di ultima generazione.

NetEase Youdao ha annunciato il rilascio ufficiale di “Yi Mo Sheng”: un motore di sintesi vocale open-source (TTS). È disponibile su GitHub. Le interfacce web e script che offre rendono possibile generare risultati in batch, rendendolo ideale per applicazioni che richiedono sintesi emotiva di timbri.

Youdao ha creato questo motore di sintesi vocale. Al momento ha più di 2.000 timbri e supporta sia il cinese che l’inglese. Contiene anche una funzione unica di sintesi emotiva che può creare sensazioni di gioia, eccitazione, tristezza o rabbia. E una moltitudine di vocalizzazioni espressive.

Riguardo ai motori di sintesi vocale open-source, EmotiVoice è al top del gioco. EmotiVoice ha oltre 2000 voci uniche e può conversare in inglese e cinese. La funzione più evidente è la sintesi emotiva, che ti consente di generare discorsi con un’ampia gamma di emozioni, tra cui felicità, entusiasmo, tristezza, rabbia e altre ancora.

È disponibile un’interfaccia online facile da usare. I risultati possono essere generati in batch tramite un’interfaccia di scripting. Le immagini Docker semplificano il test di EmotiVoice. È richiesto un computer con una unità di elaborazione grafica NVidia. Se non l’hai ancora fatto, installa il toolkit del contenitore NVidia su Linux o Windows WSL2.

Nel sistema attuale, le indicazioni gestiscono come si sente o agisce un utente. Si trascura il genere a favore dell’enfasi sul tono, il tempo, l’intensità e la passione. È possibile aggiungere facilmente un controller di stile/timbri, come nel design chiuso originale.

Il post NetEase Youdao Open-Sources EmotiVoice: A Powerful and Modern Text-to-Speech Engine è apparso prima su MarkTechPost.