Après la synthèse vocale sur Android, passons à la reconnaissance vocale (speech to text ou STT).
Toujours à la recherche d’une solution libre et respectueuse de l’intimité, on m’a conseillé Futo. Après quelques jours d’essai il m’a convaincu. Il s’agit d’un clavier virtuel, remplaçant celui par défaut d’AOSP.
Comme celui privateur de Google il intègre un bouton dictaphone pour transcrire la voix en texte depuis n’importe quelle application faisant appel au clavier. La grosse différence est qu’ici la reconnaissance vocale se fait localement, le clavier n’ayant pas accès à Internet. Aucun risque donc de voir fuiter votre voix ou votre texte.
Il me semble que la technologie utilisée est le modèle Whisper d’OpenAI tournant en local. La qualité est bonne en Français, même si il y a toujours des coquilles notamment en grammaire.
Le clavier est également fortement personnalisable (affichage permanent des chiffres, flèches pour déplacer plus facilement le curseur dans le texte pour ceux qui ont de gros doigts)
Hello,
J’imagine que le speech to text directement sur le téléphone, ça doit pas mal consommer. Savez-vous si c’est possible d’autohéberger un service qui s’occuperait des calculs?
Il y a pas mal de logiciels pour faire tourner sous linux la reconnaissance vocale. Mais là tu demandes quelques chose connecté à Android. Ça je ne sais.
Je ne sais pas si ça consomme vraiment beaucoup. Pour le peu que je m’en sers, je ne vois pas de différence.
Salut,
C’est toujours intéressant de découvrir ce genre de solution. Mais désolé de faire la rabat-joie, ce n’est pas libre :
https://gitlab.futo.org/keyboard/latinime/-/blob/master/LICENSE.md
You may modify the software only for non-commercial purpose…