Tâche 5 : MODELISATION MATHEMATIQUE DES SIGNAUX SONORES


Responsable : B. Torrésani (LATP) - Participants : LATP, LMA

Sous-tâche 5.2 : Modélisation de transformations par multiplicateurs temps-fréquence et réallocations.

Il a été récemment montré [DKT07,ODKT09] que la théorie des multiplicateurs temps-fréquence [DT10] permet de décrire des différences fines entre signaux d'une même famille. Un multiplicateur temps-fréquence est défini comme la composition d'une transformation temps-fréquence, d'une multiplication point par point par un masque, et d'une transformation temps-fréquence inverse. On démontre que de tels multiplicateurs fournissent de bonnes approximations pour de larges classes d'opérateurs linéaires, pour peu que certains paramètres de la transformation temps-fréquence soient bien ajustés. A un niveau pratique, des algorithmes d'estimation de multiplicateurs de Gabor décrivant les différences entre deux signaux donnés ont été développés, et utilisés à des fins de catégorisation. Ces algorithmes résultent d'une formulation variationnelle du problème d'estimation, et font intervenir un terme de régularisation traduisant une information a priori à exploiter dans l'algorithme. Différents choix produisent des solutions de caractéristiques différentes (régulières, parcimonieuses, ...) ; de plus, là encore se pose la question de l'optimisation d'un paramètre de régularisation.
Nous proposons d'approfondir l'influence du terme de régularisation (et des paramètres correspondants), et ce dans différents contextes applicatifs. Plus précisément, on sait que des régularisations non différentiables conduisent des solutions (les masques) parcimonieuses. Ceci dit, même dans ce cadre plus restreint, il existe encore de nombreux choix possibles. On s'astreindra dans ce projet à une étude systématique de l'influence de ce choix sur la solution obtenue, et inversement, à déterminer les choix les plus adéquats pour une application donnée (catégorisation, morphing, ...), en termes de résultats pour la tâche donnée et de la complexité des algorithmes correspondants.
Les aspects algorithmiques constitueront un jalon important du projet, dans la mesure où les approches actuelles, bien qu'elles se soient considérablement améliorées, sont toujours assez couteuses en temps de calcul, ce qui constitue un frein significatif en vue d'applications sur des problèmes réels. Nous projetons d'exploiter les développements récents en optimisation convexe [BT09,Wei08] afin d'améliorer les vitesses de convergence des algorithmes d'estimation. Plus spécifiquement, une approche du second ordre (dans l'esprit des travaux de Nesterov et de Beck&Teboulle) sera développée pour rempla cer l'algorithme de Landweber actuellement utilisé. Par ailleurs, si nécessaire, on aura recours à des versions approchées plus facilement calculables. Enfin, une attention particulière sera apportée à l'implémentation pratique de ces approches afin de proposer des algorithmes de représentation et d’estimation efficaces pour la Tâche 4.
Un second volet du projet concerne les généralisations des multiplicateurs temps-fréquence. Autant ces derniers sont capables de décrire des transformations agissant sur les signaux de telle sorte que leur énergie conserve pour l'essentiel la même localisation dans le plan temps- fréquence, autant ils perdent en précision dès que tel n'est plus le cas. Il est alors nécessaire de recourir à des variantes, comme les multiplicateurs multiples [Mal09], ou les multiplicateurs réalloués. C'est sur cette dernière approche que se focalisera ce projet. Un multiplicateur réalloué est défini comme la composition d'un multiplicateur temps-fréquence et d'une déformation (ou réallocation) du plan temps-fréquence, définie par un champ de vecteurs de déformation. Nous projetons de développer une théorie des multiplicateurs réalloués, en étudiant systématiquement l'effet de déformations locales du plan temps- fréquence sur les signaux. Nous nous intéresserons également au problème d'estimation d'une déformation temps-fréquence à partir d'un signal source et un signal cible, en transposant des approches provenant des techniques de recalage d'images et de flot optique (notamment des approches par équations aux dérivées partielles [HS81]). Dans le cas de la représentation de Gabor, nous étudierons plus spécifiquement le rôle de la phase de celle-ci dans ce cadre. La phase est en effet particulièrement importante pour des applications à l'audio, et son contrôle mathématique par des techniques d'analyse fonctionnelle est particulièrement ardu.