Comment fonctionne Shazam

Ce matin, en écoutant la radio, je me suis dit que sincèrement je rêverais qu'il existe une solution type adblock pour virer toutes ces publicités insupportables.
Quitte à ce que le programme éteigne l'autoradio pendant 2/3 minutes  ^^

Cela étant dit, nous avons aujourd'hui les moyens technologiques pour faire de la reconnaissance de publicité audio ^^ la solution pourrais s'appuyer sur le fonctionnement de Shazam ^^

 

Alors comment ce super outils qu'est Shazam fonctionne t'il ?

 

Que l'on soit dans la rue, dans la voiture, loin ou près de la source musicale, Shazam réussi malgré tout à faire une reconnaissance.

 

En réalité il s'appuie sur de l’échantillonnage, il prend des échantillons de ce que vous lui envoyez (le son qui monte, qui descend, rythme, ...)

 

Pour ceux d'entre vous qui sont plus à l'aise avec les images voici une représentation de comment graphiquement interpréter un son et ses variations.

 

 

fig2

 

 

Il y a des hauts et des bas à intervalle plus ou moins régulier. On pourrait dire que c'est une sorte de signature de la musique ^^

 

 

Du coup qu'on soit loin ou près de la musique que l'on écoute, avec du bruit autour, le schéma de la musique sera plus ou moins atténué, mais ressemblera malgré tout à l'original :

 

 

fig2

 

Le principe de l’échantillonnage, c'est de prendre des petits morceaux de la musique que vous écoutez (morceaux qui viennent par exemple de graphique comme ci-dessus)  et de les mettre tous à la même échelle, en se basant sur le "trait le plus haut", et ensuite de comparer à la base de donnée l'échantillon "corrigé".

 

fig2

 

Bien sur, je caricature, le fonctionnement par des images, les données à comparer ne sont pas des images, mais surement un autre format de stockage, binaire, texte, ...

Partagez ce contenu

Laisser une réponse

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *