Reconnaissance vocale : IBM bat le record de Microsoft

Le par  |  8 commentaire(s)
IBM-Watson

IBM fait mieux que Microsoft Research en matière de reconnaissance vocale. Pourtant, IBM ne revendique pas faire aussi bien qu'une personne humaine comme l'a fait Microsoft.

Fin 2016, Microsoft Research a mis en avant une percée en matière de reconnaissance vocale avec une technologie capable de reconnaître des mots dans une conversation aussi bien que le ferait une personne. Un taux d'erreurs de 5,9 %.

IBM trouve à redire à ce record. En exploitant également des technologies de deep learning, IBM indique avoir obtenu un taux d'erreurs de 5,5 %. Pour autant, c'est un taux de 5,1 % qui est visé à l'avenir. IBM estime que c'est ce seuil qui détermine réellement une parité avec l'être humain.

La mesure a impliqué une collection de conversations téléphoniques entre deux adultes qui ne se connaissent pas. Le corpus Switchboard. IBM explique avoir associé une architecture de réseaux de neurones récurrents et une technologie permettant de générer une voix artificielle avec trois modèles acoustiques dits forts.

Avec un autre corpus de conversations connu en tant que CallHome, le taux d'erreurs est par contre monté à 10,3 %. Cela reste un record mais la performance humaine dans des conditions similaires est évaluée à 6,8 %.

CallHome repose sur des conversations entre des membres d'une famille sur des sujets qui ne sont pas fixés à l'avance.

Complément d'information

Vos commentaires

Gagnez chaque mois un abonnement Premium avec GNT : Inscrivez-vous !
Trier par : date / pertinence
Le #1956679
"Pourtant, IBM ne revendique pas faire aussi qu'une personne humaine"

Il manque un mot il me semble

5,5 mot non compris sur 100 en moyenne, la machine dépassera vite l'humain. Je suppose qu'il faut aussi parler distinctement pour qu'elle comprenne.
Le #1956680
Constatation amusante : A chaque fois qu'on a activé la reconnaissance vocale sur une appli ou un logiciel, l'utilisateur ne met pas 10 min pour commencer à lui dire des grossièretés ou des conneries (idem pour les chatterbots). J'ai encore vécu ça, il y a peu, après l'installation d'un Dragon Naturally Speaking

Par contre si la voix est masculine, l'utilisateur en plus enclin à garder son sérieux. cybersexisme ?
Le #1956682
Yoshisaur a écrit :

"Pourtant, IBM ne revendique pas faire aussi qu'une personne humaine"

Il manque un mot il me semble

5,5 mot non compris sur 100 en moyenne, la machine dépassera vite l'humain. Je suppose qu'il faut aussi parler distinctement pour qu'elle comprenne.


Il y a un petit triangle noir avec un point d'exclamation en fin de news pour les erreurs de frappe
Le #1956687
Ulysse2K a écrit :

Yoshisaur a écrit :

"Pourtant, IBM ne revendique pas faire aussi qu'une personne humaine"

Il manque un mot il me semble

5,5 mot non compris sur 100 en moyenne, la machine dépassera vite l'humain. Je suppose qu'il faut aussi parler distinctement pour qu'elle comprenne.


Il y a un petit triangle noir avec un point d'exclamation en fin de news pour les erreurs de frappe


Merci

Je pensais que les erreurs de contenu concernaient la véracité des informations contenu dans l'article.
Le #1956698
Ulysse2K a écrit :

Constatation amusante : A chaque fois qu'on a activé la reconnaissance vocale sur une appli ou un logiciel, l'utilisateur ne met pas 10 min pour commencer à lui dire des grossièretés ou des conneries (idem pour les chatterbots). J'ai encore vécu ça, il y a peu, après l'installation d'un Dragon Naturally Speaking

Par contre si la voix est masculine, l'utilisateur en plus enclin à garder son sérieux. cybersexisme ?


Quand c'est une voix masculine, les "remontrances" sont plus "musclées"

J'ai eu travaillé avec des handicapés : on s'est payé de franches rigolades avec la reconnaissance vocale !!!
Le #1956719
lebonga a écrit :

Ulysse2K a écrit :

Constatation amusante : A chaque fois qu'on a activé la reconnaissance vocale sur une appli ou un logiciel, l'utilisateur ne met pas 10 min pour commencer à lui dire des grossièretés ou des conneries (idem pour les chatterbots). J'ai encore vécu ça, il y a peu, après l'installation d'un Dragon Naturally Speaking

Par contre si la voix est masculine, l'utilisateur en plus enclin à garder son sérieux. cybersexisme ?


Quand c'est une voix masculine, les "remontrances" sont plus "musclées"

J'ai eu travaillé avec des handicapés : on s'est payé de franches rigolades avec la reconnaissance vocale !!!


Je vois ce que tu veux dire : http://wl.static.fotolia.com/jpg/00/45/13/59/400_F_45135988_thX3eqzAFD8w2alZHROBqGrZ2bchaanK.jpg
Le #1956759
IBM trouve à redire à ce record. En exploitant également des technologies de deep learning, IBM indique avoir obtenu un taux d'erreurs de 5,5 %. Pour autant, c'est un taux de 5,1 % qui est visé à l'avenir. IBM estime que c'est ce seuil qui détermine réellement une parité avec l'être humain.

J'ai du mal a tout comprendre en effet, je vois pas comment en faisant des erreurs de compréhension on peut affirmer qu'il y a parité
Parité par définition c'est Égalité http://www.larousse.fr/dictionnaires/francais/parit%C3%A9/58219 a moins que chez Larousse on utilise déjà leurs logiciels, ceci expliquerait cela.
Le #1956776
smalldick a écrit :

IBM trouve à redire à ce record. En exploitant également des technologies de deep learning, IBM indique avoir obtenu un taux d'erreurs de 5,5 %. Pour autant, c'est un taux de 5,1 % qui est visé à l'avenir. IBM estime que c'est ce seuil qui détermine réellement une parité avec l'être humain.

J'ai du mal a tout comprendre en effet, je vois pas comment en faisant des erreurs de compréhension on peut affirmer qu'il y a parité
Parité par définition c'est Égalité http://www.larousse.fr/dictionnaires/francais/parit%C3%A9/58219 a moins que chez Larousse on utilise déjà leurs logiciels, ceci expliquerait cela.


Parité, ça veut dire que l'humain et la machine ont exactement le même taux d'erreur dans la compréhension, et pas qu'il n'y a aucune erreur.
Même un être humain ne comprends pas à 100% ce qu'il entend.
Suivre les commentaires
Poster un commentaire
Anonyme
:) ;) :D ^^ 8) :| :lol: :p :-/ :o :w00t: :roll: :( :cry: :facepalm:
:andy: :annoyed: :bandit: :alien: :ninja: :agent: :doh: :@ :sick: :kiss: :love: :sleep: :whistle: =]