Corrélation entre deux nuages de points
Posté le 17/03/2017 21:12
points
Bonjour à tous,
J'ai besoin de vos conseils !!
Voici la situation :
Je dispose d'une liste de couples (couples temps/frequence de maxima d'intensité sonore) qui représente une chanson de 30 secondes.
Je dispose également d'une deuxième liste de couples qui correspond à un échantillon de 5 secondes pris au hasard dans le morceau précédent.
Or dans cet échantillon de 5 secondes, un bruit de discussion à été placé en arrière fond (ajouté volontairement avec Audacity).
La seconde liste a donc été perturbée à cause du bruit (plus ou moins en fonction de son amplitude).
Je voudrais établir une correspondance entre les deux listes (je dispose d'une base de données de morceaux et d'échantillons).
Pour cela je voudrais établir une sorte de "corrélation entre nuages de points" (l'échantillon et le morceau dont il est tiré auraient une bonne corrélation et l'échantillon aurait une mauvaise corrélation avec les autres morceau de la base).
Malheureusement je ne trouve pas de méthode allant dans ce sens... J'ai uniquement trouvé des méthodes utilisant des barycentres et des axes d'inertie dans le nuage.
Auriez vous une idée ?
Merci par avance,
Alextoche
Citer : Posté le 17/03/2017 21:32 | #
Salut !
Le calcul d'un coefficient de corrélation entre deux séries statistiques est pas mal documenté normalement il me semble.
Je ne sais pas si tu fais directement référence à la mise en œuvre sur Casio d'une telle chose, mais une première approche “classique” passe par des calculs d'écart type et de covariance des séries. Cela ne permettrait pas d'avoir quelque chose pour commencer ?
Ensuite, je ne visualise pas totalement quelles sont les données à disposition, mais il me semble qu'il y aura un “problème” au moment où tu vas comparer ton échantillon à ta référence, vu que l'échantillon correspond à 5 secondes parmi les 30 que dure le morceau c'est ça ? Sur le coup, je ne vois pas de moyen simple pour comparer directement ton échantillon à l'ensemble du morceau, c'est à dire sans passer par des découpages successifs en espérant tomber à moment donné sur le bon passage, c'est à dire quelque chose de potentiellement long si tu dois en plus comparer à divers morceaux…
Enfin, peut-être quelqu'un aura-t-il plus de choses en tête que moi ici.