Méthodes d'identification pour le contrôle de l'utilisation de documents audio
Institution:
CaenDisciplines:
Directors:
Abstract EN:
This thesis aims at defining a reliable and robust identification method for audio documents and more particularly for musical ones. Our method has to satisfy many constraints : It must be able to discriminate between close signals and to identify an audio document during its reading by a player. It must also require low computational and storage costs and must finaly be robust against some common signal’s alterations. We have based our identification method of audio signals on the computation of a small hash of the signal called its fingerprint. This fingerprint captures essential properties of the signal. It characterizes it and allows to identify a signal among a set. The originality of our method comes from the fact that most of existing methods are based on an analysis of the signal’s frequencies while our fingerprint is solely based on a temporal analysis of the signal and on the detection of particular positions (called onsets) along it. The similarity measures that we propose between fingerprints use the specific properties of our fingerprints to identify precisely a document while keeping low computational time. This thesis describes the two steps leading to the identification of an audio file : The computation of the fingerprint and the comparison of an unknown fingerprint with a database of fingerprints corresponding to known audio files. The efficiency of each of these steps is evaluated by experiments and compared with the most known methods in this field. We conclude this thesis by the insight of our work and the perspectives that it opens.
Abstract FR:
L’objectif de ces travaux de recherche est de proposer une méthode fiable et robuste d’identification de documents audio et plus particulièrement musicaux. Les contraintes de cette méthode sont nombreuses puisque nous désirons une méthode avec un fort pouvoir discriminant qui soit capable d’identifier un document audio parallèlement à sa lecture, qui requière de faibles capacités de stockage et soit robuste vis à vis de certaines altérations du signal. Nous avons donc conçu une méthode d’identification de signaux audio basée sur l’extraction d’une empreinte. Cette empreinte permet de reconnaître un signal parmi un ensemble de signaux caractérisés par leurs empreintes. Pour cela, l’empreinte est calculée à partir de certaines propriétés du signal. L’originalité de notre méthode vient du fait que la plupart des méthodes existantes se basent sur une analyse des fréquences. Or notre méthode se base uniquement sur une analyse temporelle du signal et l’extraction de positions remarquables (onsets) à l’intérieur de celui-ci. Les mesures de similarité que nous proposons utilisent les spécificités de nos empreintes pour identifier de façon précise des documents tout en conservant de faibles temps de calculs malgré la taille et le nombre de nos empreintes. Ce mémoire décrira les deux étapes conduisant `a l’identification d’un extrait audio inconnu, `a savoir une première phase de calcul d’empreinte et une seconde de comparaison avec un ensemble d’empreintes pré-calculées afin d’identifier l’extrait. L’efficacité de chacune de ces étapes sera démontrée à travers différents essais et comparée avec la référence en matière d’empreintes audio. Nous conclurons sur l’intérêt de nos travaux et les perspectives ouvertes par ceux-ci.