Soutenance de thèse de Ama KREME

Ecole Doctorale
Mathématiques et Informatique de Marseille
Spécialité
Mathématiques
établissement
Aix-Marseille Université
Mots Clés
temps-fréquence,inpainting audio,optimisation SDP,multiplicateur de Gabor,réduction de dimension.,fading temps-fréquence
Keywords
time-frequency,audio inpainting,SDP optimization,Gabor multiplier,dimension reduction,time-frequency fading
Titre de thèse
Modification locale et consistance globale dans le plan temps-fréquence
Local modification and global consistency in the time-frequency plane
Date
Mercredi 21 Juillet 2021
Adresse
Campus Saint Charles , Aix-Marseille Université 3 Place Victor Hugo, 13003 Marseille
Amphi Sciences Nat
Jury
Directeur de these M. Bruno TORRéSANI Aix-Marseille Université
Rapporteur Mme Nadine MARTIN Université Grenoble Alpes
Rapporteur M. Pierre CHAINAIS Ecole Centrale de Lille
Examinateur Mme Monika DöRFLER Université de Vienne
Examinateur M. Rémi GRIBONVAL INRIA
Examinateur M. Laurent OUDRE ENS de Paris-Saclay
CoDirecteur de these Mme Caroline CHAUX Aix-Marseille Université
M. Valentin EMIYA Aix-Marseille Université

Résumé de la thèse

De nos jours, il est devenu facile de retoucher des images, par exemple de flouter une région, ou de la modifier pour faire disparaître ou apparaître un objet, une personne, etc. La retouche d'images fait partie des outils de base de la plupart des logiciels d'édition d'images. Dans le cadre des signaux audio, il est souvent plus naturel d'effectuer de telles retouches dans un domaine transformé, en particulier le domaine temps-fréquence. Là encore, c'est une pratique assez courante, mais qui ne repose pas nécessairement sur des arguments théoriques solides. Des cas d'applications incluent la restauration de régions du plan temps-fréquence où une information a été perdue (par exemple l'information de phase), la reconstruction d'un signal dégradé par une perturbation additive bien localisée dans le plan temps-fréquence, ou encore la séparation de signaux localisés dans différentes régions du plan temps-fréquence. Dans cette thèse, nous proposons et développons des méthodes théoriques et algorithmiques pour résoudre ce type de problème. Nous les abordons dans un premier temps comme un problème de reconstruction de données manquantes dans lequel il manque certaines phases des coefficients temps-fréquence. Nous formulons mathématiquement le problème, puis nous proposons trois méthodes pour le résoudre. Dans un second temps, nous proposons une approche qui consiste à atténuer une source de dégradation avec l'hypothèse que celle-ci est bien localisée dans une région spécifique du plan temps-fréquence. Nous considérons le cas où le signal d'intérêt est perturbé par un signal additif et a une énergie qui est répartie plus largement dans le plan temps-fréquence. Nous le formulons comme un problème d'optimisation qui permet d'atténuer la perturbation avec un contrôle précis du niveau d'atténuation. Nous obtenons la solution exacte du problème qui fait intervenir des opérateurs appelés multiplicateurs de Gabor. Nous étudions le comportement des valeurs propres ainsi que les propriétés de localisation temps-fréquence des vecteurs propres dominants de ces opérateurs avec une attention particulière portée au cas où la région spécifique est une union disjointe de plusieurs sous-régions. Compte tenu du coût calculatoire de la décomposition spectrale, nous exploitons des algorithmes de projections aléatoires pour accélérer les décompositions en valeurs propres.

Thesis resume

Nowadays, it has become easy to edit images, such as blurring an area, or changing it to hide or add an object, a person, etc. Image editing is one of the basic tools of most image processing software. In the context of audio signals, it is often more natural to perform such an editing in a transformed domain, in particular the time-frequency domain. Again, this is a fairly common practice, but not necessarily based on sound theoretical arguments. Application cases include the restoration of regions of the time-frequency plane where information has been lost (e.g. phase information), the reconstruction of a degraded signal by an additive perturbation well localized in the time-frequency plane, or the separation of signals localized in different regions of the time-frequency plane. In this thesis, we propose and develop theoretical and algorithmic methods to solve this issue. We first formulate the problem as a missing data reconstruction problem in which the missing data are only the phases of the time-frequency coefficients. We formulate it mathematically, then we propose three methods to solve it. Secondly, we propose an approach which consists in attenuating a source of degradation with the assumption that it is localized in a specific region of the time-frequency plane. We consider the case where the signal of interest is perturbed by an additive signal and has an energy that is more widely spread in the time-frequency plane. We formulate it as an optimization problem designed to attenuate the perturbation with precise control of the level of attenuation. We obtain the exact solution of the problem which involves operators called Gabor multipliers. We study the behavior of the eigenvalues as well as the time-frequency localization properties of the dominant eigenvectors of these operators, with particular attention to the case where the specific region is a disjoint union of several sub-regions. Taking into account the computational cost of the spectral decomposition, we exploit algorithms with random projection to accelerate the decompositions into eigenvalues.