Qu'il s'agisse d'épier des conversations secrètes depuis l'extérieur d'une chambre sécurisée ou de percevoir certains sons à de longues distances simplement depuis un dispositif optique, la technologie du MIT a de quoi étonner.

MIT son  Les ingénieurs ont présenté leur système basé sur l'utilisation d'une caméra vidéo qui enregistre un paquet de chips situé dans une pièce isolée. Aucun bruit direct n'est enregistré. Et pourtant, en étudiant les vibrations émises par les sons dans la pièce sur le paquet de chips, un puissant algorithme est désormais capable de reproduire une bande sonore et de retranscrire les conversations tenues dans la pièce.

Lorsque le son se disperse dans une pièce, l'onde fait vibrer, ne serait-ce qu'infiniment, le moindre élément qu'elle rencontre. Cela peut être un objet quelconque, une plante, une feuille de papier... Le MIT a ainsi développé un " microphone visuel" qui repère ces vibrations et les décode pour transformer ces fluctuations visuelles en onde sonore.

Techniquement, le MIT est désormais capable de partiellement récupérer la bande audio de n'importe quelle vidéo sur le Net, et pourquoi pas même des premières images du cinéma muet.

  

La vidéo présentée explique rapidement le fonctionnement du système et propose quelques exemples assez bluffants de ce qu'il est possible de récupérer depuis une simple vidéo.

Actuellement, le système fonctionne de façon optimale jusqu'à une distance de 5 mètres, principalement parce que la caméra haute vitesse utilisée doit être capable de repérer les micros vibrations d'un élément susceptible de subir une altération visuelle de l'environnement sonore auquel il est soumis.

Parce que la voix humaine correspond environ à une fréquence de 300 Hz, il faut utiliser une caméra capable de filmer au moins à 300 images secondes. Un premier algorithme repère ensuite les vibrations en analysant chaque pixel et en tentant de repérer les changements de couleur, qui notifient d'un déplacement ou d'une vibration. Selon l'amplitude du déplacement, il est ensuite possible de faire correspondre une fréquence et une amplitude, puis de reconvertir le tout en son.

Si la technique est particulièrement bluffante avec une caméra haute définition à grande vitesse, le MIT indique que la plupart des appareils photo DSLR sont capables de capturer des vidéos suffisamment précises pour être exploités dans ce sens.

Le système devrait trouver des applications dans le domaine de la défense, de la sécurité et la collecte de renseignements. Une analyse poussée d'une vidéo enregistrée sans le son pourrait ainsi apporter de nouveaux éléments lors d'une enquête ou se présenter à charge contre un accusé.

Source : ExtremeTech