Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Reconnaissance vocale : la meilleure API ?

7 réponses
Avatar
charline.blondeau
Bonjour,

J'=E9tudie aujourd'hui la reconnaissance vocale, et dans le but
d'=E9tablir un logiciel performant et propre =E0 mes besoins, je cherche
une API efficace.

Le cahier des charges est le suivant :
- l'API doit supporter la reconnaissance vocale du fran=E7ais (si
possible avec quelques mots en anglais sans que =E7a lui pose probl=E8me,
apr=E8s je peux toujours essayer d'adapter dans l'application)
- elle devra traiter correctement le bruit de fond et les accents de
prononciation
- les machines destin=E9es =E0 recevoir l'application tourneront sous XP
et Vista
- elle doit minimiser le temps d'apprentissage de l'user (temps pour
lequel elle s'approprie les caract=E9ristiques de sa voix : ton,
vitesse, volume, accent ... )

Quelques Speech API sont disponibles, comme :


* SAPI 5.3 (Speech API) de Windows, manipulable via des objets COM
ou directement en passant par la biblioth=E8que System.Speech du
framework .NET 3.0 . Seule la version 5.3 m'int=E9resse car c'est la
seule =E0 prendre en charge le fran=E7ais. Je sais que cette version est
native sous Vista, et incluse dans le Windows SDK (utilisable sous
XP).


* SMAPI (Speech Managed API) fournie par IBM ViaVoice. Elle traite
uniquement la reconnaissance vocale (pas la synth=E8se, contrairement =E0
la pr=E9c=E9dente), et prend en charge le fran=E7ais. Elle est compos=E9e d=
e
deux APIs en r=E9alit=E9 : la premi=E8re comportant le moteur de
reconnaissance vocale, la deuxi=E8me qui compile les grammaires.


* JSAPI (Java Speech API) fournie =E9galement par IBM. Elle est
utilisable seulement pour des applications en Java. Pour l'instant, il
me reste quelques recherches =E0 faire pour une documentation plus
compl=E8te...



Mon probl=E8me est le suivant : j'ai trouv=E9 pas mal de caract=E9ristiques
sur ces API, la seule chose qui me manque, ce sont des points de vue,
des avis.

Quelqu'un a-t-il d=E9ja rencontr=E9 et mis en oeuvre ces API ? Qu'en
pensez-vous ? Lesquelles se valent ?
Ont-elles de bons taux de reconnaissance ? Une marge d'erreur
signifiante ? Un d=E9faut particulier ?

Il est inutile de me coller des liens sur les logiciels existants sur
le march=E9, exploitant ou non les API cit=E9es : ce n'est pas ce que je
cherche. En revanche, s'il existe d'autres API non cit=E9es, =E7a
m'int=E9resse.

7 réponses

Avatar
Alex
a écrit dans le message de news:


Mon problème est le suivant : j'ai trouvé pas mal de caractéristiques
sur ces API, la seule chose qui me manque, ce sont des points de vue,
des avis.



Quelqu'un a-t-il déja rencontré et mis en oeuvre ces API ? Qu'en
pensez-vous ? Lesquelles se valent ?
Ont-elles de bons taux de reconnaissance ? Une marge d'erreur
signifiante ? Un défaut particulier ?



Tu peux tester SAPI à partir du SDK Windows et des exemples fournis
(..SamplesCpp en C++)
J'ai testé la 5.1, donc en anglais.
Mais avec un vieux micro, ce qui doit être pénalisant pour l'entrée audio
(volume très faible, même en mettant au max par le panneau de config),
ce qui fait qu'il a du mal à reconnaitre les mots, ce qui n'est pas
exploitable dans ce cas (confond : "me" avec "made", "house" avec "how was
it" par exemple...)
Donc à tester avec un bon hardware.
Avatar
charline.blondeau
On 23 avr, 12:16, "Alex" wrote:
a écrit dans le message de news:


>Mon problème est le suivant : j'ai trouvé pas mal de caractéristiq ues
>sur ces API, la seule chose qui me manque, ce sont des points de vue,
>des avis.
>Quelqu'un a-t-il déja rencontré et mis en oeuvre ces API ? Qu'en
>pensez-vous ? Lesquelles se valent ?
>Ont-elles de bons taux de reconnaissance ? Une marge d'erreur
>signifiante ? Un défaut particulier ?

Tu peux tester SAPI à partir du SDK Windows et des exemples fournis
(..SamplesCpp en C++)
J'ai testé la 5.1, donc en anglais.
Mais avec un vieux micro, ce qui doit être pénalisant pour l'entrée audio
(volume très faible, même en mettant au max par le panneau de config) ,
ce qui fait qu'il a du mal à reconnaitre les mots, ce qui n'est pas
exploitable dans ce cas (confond : "me" avec "made", "house" avec "how wa s
it" par exemple...)
Donc à tester avec un bon hardware.



Nouveau problème : je teste avec le SDK Windows (contenant SAPI 5.3).
Impossible de lier la SAPI à mon projet (qui est en fait un sample
fourni par windows).

Au moment de charger la grammaire (LoadGrammar()) ou d'attacher le
micro au speechRecognitionEngine ( SetInputToDefaultAudioDevice() ),
il me retourne l'exception de plateforme non prise en charge
(PlatformNotSupportedException), c'est-à-dire qu'il ne trouve pas le
moteur SAPI.

Pourtant, la synthèse vocale est fonctionnelle dans le même morceau de
code ...

J'ai pourtant bien ajouté la référence vers System.Speech ... Y a-t-i l
autre chose à faire ?
Avatar
Alex
a écrit dans le message de news:


Au moment de charger la grammaire (LoadGrammar()) ou d'attacher le
micro au speechRecognitionEngine ( SetInputToDefaultAudioDevice() ),
il me retourne l'exception de plateforme non prise en charge
(PlatformNotSupportedException), c'est-à-dire qu'il ne trouve pas le
moteur SAPI.
Pourtant, la synthèse vocale est fonctionnelle dans le même morceau de
code ...
J'ai pourtant bien ajouté la référence vers System.Speech ... Y a-t-il
autre chose à faire ?



Il y a marqué ça :

" Certain functionality within the System.Speech.* namespaces depend on SAPI
5.3, but Microsoft has no plans to redistribute SAPI 5.3 binaries down-level
to Windows XP or Windows Server 2003. If a managed application that depends
upon this advanced functionality is run on one of these older operating
systems, a PlatformNotSupportedException will be thrown. "

sur http://msdn.microsoft.com/en-us/library/bb756992.aspx
Avatar
charline.blondeau
On 24 avr, 13:43, "Alex" wrote:
a écrit dans le message de news:


>Au moment de charger la grammaire (LoadGrammar()) ou d'attacher le
>micro au speechRecognitionEngine ( SetInputToDefaultAudioDevice() ),
>il me retourne l'exception de plateforme non prise en charge
>(PlatformNotSupportedException), c'est-à-dire qu'il ne trouve pas le
>moteur SAPI.
>Pourtant, la synthèse vocale est fonctionnelle dans le même morceau de
>code ...
>J'ai pourtant bien ajouté la référence vers System.Speech ... Y a- t-il
>autre chose à faire ?

Il y a marqué ça :

" Certain functionality within the System.Speech.* namespaces depend on S API
5.3, but Microsoft has no plans to redistribute SAPI 5.3 binaries down-le vel
to Windows XP or Windows Server 2003. If a managed application that depen ds
upon this advanced functionality is run on one of these older operating
systems, a PlatformNotSupportedException will be thrown. "

surhttp://msdn.microsoft.com/en-us/library/bb756992.aspx



Ah !... Merci.
Grmbl.

Et d'après vous, si je développe une telle application sous Vista, il
risque d'y avoir des erreurs à l'exécution sur un XP ?
Avatar
Alex
a écrit dans le message de news:


Et d'après vous, si je développe une telle application sous Vista, il
risque d'y avoir des erreurs à l'exécution sur un XP ?



Oui, d'après ce qu'il est dit sur MSDN et les gens de MS, si on utilise les
spécifités de la 5.3 non-implémentées en 5.1
et du fait que MS n'a pas (pour l'instant ?) prévu de redistribuable pour la
5.3
ce thread par exemple : http://minilien.com/?Id8kXnXqlq
Avatar
charline.blondeau
On 24 avr, 14:16, "Alex" wrote:
a écrit dans le message de news:


>Et d'après vous, si je développe une telle application sous Vista, i l
>risque d'y avoir des erreurs à l'exécution sur un XP ?

Oui, d'après ce qu'il est dit sur MSDN et les gens de MS, si on utilise les
spécifités de la 5.3 non-implémentées en 5.1
et du fait que MS n'a pas (pour l'instant ?) prévu de redistribuable po ur la
5.3
ce thread par exemple :  http://minilien.com/?Id8kXnXqlq



Bien ...
Connaissez-vous une autre API que celle-ci, et pour laquelle il me
serait possible de développer une appli avec reconnaissance vocale en
français ?
Avatar
Alex
a écrit dans le message de news:


Bien ...
Connaissez-vous une autre API que celle-ci, et pour laquelle il me
serait possible de développer une appli avec reconnaissance vocale en
français ?



En Freeware, je ne pense pas qu'il y en ait d'autres aussi avancées que
celles que tu as citées..
(pas testé les projets Open Source listés sur sur
http://en.wikipedia.org/wiki/Speech_recognition)