Après avoir fait deux articles sur la reconnaissance vocale sous Android et la synthèse vocale sous Android, passons à la reconnaissance vocale sous Linux.
J’ai trouvé un logiciel sur Flatpak qui s’appelle Speech Note, qui permet d’utiliser simplement divers modèles de reconnaissance et synthèse vocale.
Je vais écrire cet article avec le logiciel et ne pas corriger les fautes afin que vous vous rendiez compte de la qualité de celui-ci.
Je vais enfin utiliser la synthèse vocale du logiciel pour vous faire écouter comment celui-ci prononce le texte.
Au niveau de la performance, ça fonctionne plutôt bien sur mon laptop, qui est à base de GPU intégré Intel.
Le modèle de reconnaissance vocale fait 230Mb et ceci de synthèse vocale 60Mb.
C’est très raisonnable.
On peut choisir parmi beaucoup de modèles. J’ai utilisé les modèles Whisper CPP Small et Mimic 3 Tom Low.
Il y a également un modèle de traduction c’est-à-dire traduire le français vers l’anglais par exemple, qui fonctionne très bien.
Addendum: J’ai oublié le plus important. Le logiciel est libre et tout le traitement se fait localement. Donc ni votre voix ni votre texte ne fuitent ailleurs.
C est top