Philippe Carré, ondelettes

 

 

Dans l’introduction de son mémoire pour l’obtention de l’habilitation à diriger des recherches, présenté à l’Université de Poitiers, Philippe Carré, coordonnateur du projet ICONES fait le point de ses recherches qui exploitent les méthodes de Fourier adaptées au traitement de l’image. Le texte complet du mémoire de Philippe Carré est disponible en ligne.

Construction et analyse de transformées discrètes en ondelettes :

spécificité de l’image et de la couleur

par Philippe Carré

La problématique centrale de mes travaux est l’étude de méthodes de décomposition discrète Temps-échelle. Ils s’inscrivent pleinement dans l’équipe projet ICONES, en connexion avec les autres outils fondamentaux développés dans le premier axe de l’équipe (approche variationnelle et stochastique) et intègrent les modélisations physiques et psychovisuelles.

Je me suis concentré, dès mon intégration dans le laboratoire sur les décompositions atomiques discrètes reconstructibles définies dans le domaine général des ondelettes : discrètes car la conception de décomposition directement dans un espace discret permet d’obtenir un espace de représentation numérique qui possède de bonnes propriétés (orthogonalité si possible, stabilité, rapidité de calcul, etc) ; atomiques car la décomposition d’un signal numérique sous la forme d’une somme d’éléments de base autorise une reconstruction partielle d’une des composantes du signal et permet une description simple du contenu de l’information ; reconstructibles car la possibilité « d’inverser » la transformation ouvre le champ des applications possibles.

Toutes ces méthodes possèdent maintenant un cadre général et notamment la transformée en ondelettes standard (FWT) qui a connu un véritable succès ces vingt dernières années car elle offre une représentation fine des images naturelles pour un coût de calcul dérisoire. Cependant, il existe encore certaines limites. Tout d’abord les performances de la méthode 2-D sont limitées par la directionalité spatiale naïve des fonctions de bases, conséquence d’une construction séparable suivant l’horizontale et la verticale, ce qui ne permet pas une analyse directionnelle. Ensuite la transformée FWT 2-D standard échoue dans la construction d’une représentation efficace d’éléments géométriques 2-D (comme les contours) de l’image.

Afin d’obtenir une représentation efficace des informations présentes dans l’image, il faut que les fonctions de base soient directionnelles et/ou prennent en compte l’aspect géométrique des structures. De plus la généralisation de ces transformées à des signaux à valeurs vectorielles, extension autre que par une simple stratégie marginale, reste une question ouverte. Les approches variationnelles ont depuis longtemps montré les défauts d’une stratégie marginale dans le cadre de la couleur avec la création de fausses couleurs, la suppression de détails « colorés » ou tout simplement une représentation incomplète de l’information. Cette question va au-delà de la décomposition en ondelettes puisque très peu d’outils classiques du signal sont définis avec précision pour les images couleur.

C’est à toutes ces questions que j’ai tenté d’apporter des éléments de réponse durant mes dix années de recherche en tant que Maître de Conférences à travers les thèses que j’ai co-encadrées et les projets que j’ai animés ou auxquels j’ai participé. L’objectif recherché est une représentation liée à une structure de données sous forme de primitives (si possible non redondantes), facilement calculable par un algorithme, telle que l’ensemble de ces primitives permettent la reconstruction de la donnée d’origine. Il faut par ailleurs que l’on puisse ordonner ces primitives (notion de reconstruction partielle) et que l’on puisse donner un sens à ces primitives (étape de compréhension de la donnée). Dans ce cadre, mon travail va se découper suivant trois axes de recherche et un axe applicatif fort. Je les décris succinctement ci-dessous.

Approche géométrique. Dans un premier temps, nous avons étudié un outil qui permet la représentation d’images d’une manière optimale (au sens des ruptures linéaires) : la transformée Ridgelet. Cette transformée construit une représentation qui code efficacement les discontinuités linéaires 2-D comme par exemple les contours. A ce titre, elle s’inscrit bien dans la classe des analyses multirésolution géométriques. Cette nouvelle transformée s’est développée ces dernières années à travers la restauration des images. Grâce à une collaboration avec les chercheurs en géométrie discrète du département XLIM-SIC nous avons proposé une transformée Ridgelet/Curvelets paramétrable, rapide et inversible, obtenant des résultats en termes de restauration de données 2-D très satisfaisant, notamment en vidéo. De plus, la simplicité et la rigueur dans la définition apportée par la géométrie discrète nous a permis d’étendre ce travail à toute dimension en collaboration avec un jeune collègue D. Helbert. Au delà de la transformée Ridgelet, ce processus de représentation nous permet de manipuler l’image à travers des projections 1-D et comme nous le verrons, nous trouvons différentes intersections avec d’autres approches, notamment la transformée de Riesz.

Suivant ce même but, à savoir capter la géométrie pour adapter la transformée, nous avons proposé dans le cadre d’un partenariat avec France Telecom R&D (maintenant OrangeLab) (S. Pateux) une représentation en ondelettes géodésiques qui se propose d’introduire une modélisation de la topologie dans un schéma numérique de calcul du type Lifting Scheme. Comme nous le verrons, ce schéma original très souple nous permet d’intégrer de nombreuses informations complémentaires. Il s’appuie sur la construction d’un graphe qui doit capter l’organisation structurelle de l’image à traiter. De ce graphe, une distance entre chaque pixel de l’image est estimée et introduite dans l’algorithme de décomposition.

Ces deux points ont notamment été traités à travers une thèse que j’ai co-encadrée, ayant pour objectif une représentation optimisée des images (G. Lebrun 2009). La géométrie détectée a aussi permis de contrôler les processus de diffusion liés aux approches par Equations aux Dérivés Partielles. Ceci a fait l’objet de la thèse de A. Maalouf (200Smilie: 8), et a été le fruit d’une collaboration avec un collègue de XLIM-SIC, B. Augereau.

Couleur et MultiCanaux. Comme nous l’avons mentionné, l’intégration de la « dimension » couleur est peu prise en compte actuellement dans les algorithmes modernes d’analyse Espace-Echelle (si ce n’est par une approche marginale). Mais plus généralement cette prise en compte de la dimension vectorielle des données est absente de tous les outils élémentaires issus du signal : la définition d’une transformée de Fourier couleur reste par exemple un sujet ouvert. L’objet de ce second axe a été d’examiner des approches plus globales pour l’extension des briques élémentaires issus du signal dans le cadre des images couleur.

Suivant cette idée, j’ai débuté dès 2001 une étude concernant l’utilisation des quaternions. Cette recherche a concerné la redéfinition des traitements classiques couleur en termes quaternionique, comme le filtrage, la modification des caractéristiques couleur … . Ceci a fait l’objet de la thèse de P. Denis (2007), notamment à travers la redéfinition des manipulations couleur avec un formalisme lié à l’algèbre géométrique. Notons que l’utilisation des quaternions/ondelettes complexes en imagerie couleur constitue actuellement un sujet de recherche très ouvert qui répond aussi aux questions de directionalités.

Approche orientée et notion de phase. Un dernier aspect absent de l’approche classique de la transformée en ondelettes est l’adéquation entre le système visuel humain (SVH) et l’espace transformée. Le simple découpage horizontal, vertical et selon les deux diagonales, lié à l’approche classique, n’est pas suffisant à la fois en termes de description du signal mais aussi par rapport à ce que l’on connaît du système visuel humain. L’objectif serait de définir une représentation associée à des directions d’analyse plus adaptatives, invariante soit à la translation soit à la rotation. Dans le cadre des analyses directionnelles, la transformée en ondelettes complexes suivant l’arbre dual constitue une réponse possible. A partir de ces travaux, nous étudions une approche alternative reposant sur les travaux de Bulow et al. et Choi et al. sur le signal analytique 2-D à partir des nombres quaternioniques. Ce travail permet de mettre en place une transformée en ondelettes quaternioniques pour la compression et la classification plus en accord avec l’aspect SVH et introduisant une nouvelle information : une notion de phase. La généralisation de ce travail nous mène à la définition d’une ondelette monogénique qui peut être considérée comme l’une des décompositions les plus abouties en termes d’information signal. Nous décrirons les nombreuses questions qui restent ouvertes, et la première d’entre-elles concerne l’interprétation des informations et l’intégration de la couleur. L’objectif est de construire une information traduisant la notion de phase, si importante dans l’analyse de signaux 1-D. Ce travail est aussi un élément important de la proposition du nouveau codeur dans le cadre de l’ANR CAIMAN en collaboration avec Thalès et le sujet de thèse de R. Soulard (thèse en cours, débutée en 2009).

Les algorithmes numériques temps-échelle offrent de nombreuses solutions dans différentes problématiques. De ce fait, des collaborations ou des transferts de technologie ont été initiés et je privilégie la mise en place ou le renforcement de collaborations transversales avec des chercheurs d’autres domaines. Je me suis aussi efforcé de mener une activité contractuelle importante à travers le montage et la gestion de contrats important de recherche. Ces activités me permettent d’éprouver ma recherche dans le cadre de problématique à forte contrainte mais aussi de la valoriser à travers des brevets. Enfin cette activité contractuelle m’a permis d’obtenir le financement de nombreuses thèses (3 sur la période évaluée). L’un des exemples les plus significatifs concerne le tatouage et plus généralement la sécurité. Ceci constitue mon dernier axe de recherche.

Sécurité Depuis plusieurs années maintenant, j’ai développé un travail sur la protection électronique des images et vidéos, qui a donné lieu à deux brevets sur le tatouage basé ondelettes, et intégrant des données psychovisuelles de perception des couleurs. Cette étude a nécessité une réflexion sur la meilleure stratégie possible pour modifier des coefficients d’ondelettes mais aussi le moyen de rendre le schéma robuste aux transformations géométriques de type rotation ou changement d’échelle. Nous avons pour cela étudié les descripteurs SIFT et notamment leur robustesse face aux transformations numériques. L’objectif visé est l’intégration de différentes familles de code correcteur d’erreur afin d’améliorer la robustesse de notre stratégie de tatouage.

Au final, tous ces travaux ont le même objectif : la définition d’une représentation numérique performante en ondelettes pour l’analyse d’images couleur.

Le plan de ce mémoire se structure selon les axes décrits ci-dessus. Nous profiterons du premier chapitre pour rappeler certaines transformées X-LET afin d’illustrer différentes recherches actuelles sur la représentation adaptée d’images. Ensuite ce chapitre se focalisera sur nos apports en ce qui concerne la prise en compte de la géométrie des images. Nous décrirons notre transformée Ridgelet construite à partir de la géométrie discrète et nous analyserons en détail ses différences et avantages par rapport à l’approche de référence de Stanford. Puis nous décrirons notre proposition de modélisation des données sous forme de graphes pour intégrer la topologie et la couleur dans la transformée. Nous verrons que cette approche, à travers sa souplesse, ouvre de nombreuses perspectives.

Le second chapitre présentera en détail l’apport des formalismes que sont les quaternions et les algèbres de Clifford dans la manipulation des images couleur. Ce mode de codage, qui n’a été étudié que très récemment, permet de manipuler les couleurs en utilisant des opérations algèbriques. Dans ce cadre nous décrirons tout d’abord l’utilisation du formalisme des quaternions associé aux images couleur introduit par Sangwine il y a une dizaine d’années. Ensuite, nous détaillerons comment poursuivre cette approche dans le cadre plus général des algèbres de Clifford (dites aussi algèbres géométriques). Ce formalisme est illustré à travers la description d’une nouvelle approche spatiale de détection de ruptures couleur généralisant celle définie avec les quaternions. Enfin, dans la dernière partie de ce chapitre, nous discuterons de nouvelles définitions de la transformée de Fourier, adaptées aux images couleur.

Dans le troisième chapitre, nous aborderons nos travaux de recherche et d’encadrement les plus récents concernant les décompositions multiéchelles. Ils se situent à l’intersection des deux chapitres précédents. L’objectif est à nouveau de définir de nouvelles transformée en ondelettes qui vont s’efforcer de capter au mieux l’information 2-D cette fois, non pas à travers une lecture géométrique mais plutôt à travers l’extension rigoureuse 2-D d’outils venant du signal, notamment le signal analytique et le concept de phase. A travers nos travaux concernant la transformée en ondelettes quaternionique (QWT), nous montrerons que ces outils, qui restent confinés dans une petite communauté, peuvent fournir des réponses applicatives grâce à la qualité de la représentation, par exemple dans le cas d’un codeur QWT.

Pour finir ce mémoire, je propose de décrire mes travaux menés dans le cadre de la sécurité des données Multimédia. L’objectif initial était d’étudier les possibilités offertes en termes de Tatouage d’image par l’utilisation des décompositions en ondelettes et la prise en compte de la dimension Couleur. Ensuite nous montrerons comment ce travail s’est poursuivi à travers différentes évolutions. Tout d’abord nous décrirons nos propositions afin de rendre l’algorithme robuste à certaines attaques géométriques, puis nous étudierons l’intégration de différentes familles de codes afin d’augmenter la robustesse de notre schéma.

Enfin, je conclurai ce mémoire en reprenant les différentes propositions de recherche faites pour les années à venir.

Une idée des contenus

Prise en compte de la géométrie dans les transformées en ondelettes

La transformée de Fourier :

La transformée en ondelettes, Analyse multirésolution 2D, Ondelettes et bancs de filtres, Singularités et ondelettes

X-lets et autres, Transformée géométrique à fonctions d’analyses fixes, Transformées adaptatives

Transformée géométrique :

Principe, Définition de la transformée Ridgelet, La transformée de Radon,

-L’aspect discret de la transformée Ridgelet, Principe, La transformée de Radon discrète, Inversion de la transformée Radon discrète, Transformée de Radon dans le cadre de la Fast Slant Stack, La reconstruction dans le cadre de la Fast Slant Stack

-La stratégie de Poitiers : la transformée Ridgelet analytique ou ou DART, Définitions des droites discrètes 2-D, Stratégie de calcul de la transformée de Radon discrète, Inversion de la transformée de Radon analytique discrète, Illustration de la transformée de Radon analytique discrète

-Transformée Ridgelet et applications ; Calcul de la transformée DART, Applications de la transformée Ridgelet 2-D dans la restauration d’images

Evolution de la DART ; Transformée locale, Vers une transformée Curvelet, DART 3-D

Une transformée en ondelettes géodésiques

Filtrage bilatéral et extension à travers la distance géodésique ; Présentation du filtrage bilatéral, Introduction de la notion de variété, Généralisation du filtrage bilatéral

Notion de distance géodésique en traitement d’images

Extraction de la topologie ; Principe, Graphe des k plus proches voisins, Construction du graphe non orienté, Recherche du plus court chemin et extraction de la distance géodésique

Filtrage bilatéral géodésique

Transformée en ondelettes 2-D géodésiques ; Lifting scheme, Décimation par treillis quinconces, Introduction de la distance géodésique

Analyse de la transformée géodésique

Application à la restauration d’image ; Introduction de redondance, Application de la transformée géodésique au débruitage

Intégration de la couleur

Prise en compte de la couleur dans les outils issus du traitement du signal

Définitions, éléments de base et premières manipulations couleur

L’algèbre des quaternions

Manipuler des couleurs à l’aide des Quaternions, Transformations de R3, Quaternions et images couleur, La forme de Cayley-Dickson, Modification couleur à partir des quaternions

Les algèbres de Clifford ; Définition et construction, Un contexte calculatoire

Algèbres géométriques pour les images couleur ; Teinte, saturation et intensité à partir d’un vecteur couleur, Opérations sur les caractéristiques couleur

Filtrage quaternionique et cliffordien : application à la détection de contours couleur

Convolution

Les filtres quaternioniques et leurs extensions pour la détection de contours couleur

Extension de l’opérateur de Sangwine par des opérations géométriques

Les transformées de Fourier couleur

Analyse spatio-chromatique d’images couleur, La transformée de Fourier spatio-chromatique, Notion de chemin couleur

Transformées de Fourier quaternioniques ; Définition numérique de l’espace de Fourier quaternionique, Interprétation du spectre quaternionique, Applications de Fourier quaternionique

Approche fréquentielle par algèbres de Clifford pour les images couleur ; G2 et images couleur, G3 et images couleur, Une transformée de Fourier couleur utilisant G4

Ondelettes analytiques

Signal analytique et ses extensions

Rappel sur le signal analytique 1-D ; Lien avec l’analyse de fonction, Interprétation géométrique du signal analytique

Extension de la notion de signal analytique aux images en niveaux de gris

Extension de la notion de signal analytique par transformée de Fourier quaternionique ; Transformée de Fourier Quaternionique pour les images niveaux de gris, Le signal analytique quaternionique 2D

ondelettes Complexes

Principe

Déploiement numérique des ondelettes complexes

Extension 2D : Dual-Tree 2D

Ondelettes quaternioniques

Principe

Expression numérique de la QWT

Information associée à la QWT

Estimation de flot optique par QWT

L’analyse de textures par QWT

Existant sur la discrimination quaternionique

Utilisation des mesures de norme et de phase de la QWT

Utilisation de la QWT pour la classification de textures : mesures

Codage d’image par QWT

Principe général du codeur

Quantification

Organisation du flux en fonction du canal

Discussion sur la transformée QWT

Les perspectives : Ondelettes monogéniques couleur

Transformée de Riesz

Le signal monogène

Ondelettes Monogéniques

Introduction de la dimension couleur

Monogénique, Radon et Ridgelet

Sécurité

Tatouage vectoriel ; Introduction au tatouage d’images, Définition générale de l’algorithme vectoriel basé ondelettes, Insertion de la marque, Détection

Détection non-décimée

Définition du seuil d’acceptation, Calcul de la probabilité de fausse alarme, Mise en place du seuil en fonction de Pf ., Évolution avec la détection non-décimée

Mesures de robustesse de l’algorithme vectoriel basé ondelettes ; Mesure de fausse détection, Robustesse aux différentes attaques

Résistance aux attaques géométriques

Attaques géométriques provoquant une translation, Solution de la littérature contre les attaques par rotation et changement d’échelle, Evolution de la méthode de tatouage vectorielle,

Les détecteurs de points d’intérêt ; Différents détecteurs mono-échelle, Détections des points d’intérêt multi-échelles

Description du voisinage des points d’intérêt, Le Jet Local, Le descripteur SIFT

Intégration de la mesure SIFT dans le cadre du tatouage

Augmentation de la robustesse par utilisation des codes correcteurs

Construction de la marque à partir de la signature : introduction des codes

Mesure de la robustesse du tatouage avec les codes correcteurs ; Compression JPEG, Bruit blanc Gaussien additif, Attaque par filtrage passe-bas, Attaque par modification de la teinte, Attaque par modification de la Saturation, Attaque par modification de l’intensité

Perspective : la stéga-analyse par métriques de qualité

Conclusion et perspectives

Annexes :

Annexe : bancs de filtres quaternioniques

L’existant sur les ondelettes quaternioniques

Opération de filtrage : produit de convolution

Définition du sous-échantillonnage

Définition du sur-échantillonnage

Banc de filtres quaternionique à reconstruction parfaite

Un exemple : le banc de filtres quaternioniques de Shannon

Annexe : Image de Test pour les techniques de tatouage

 

 

 

About cm1

R. Timon, né en 1944 a été instituteur, maître formateur, auteur de manuels pédagogiques avant d’écrire pour le Webpédagogique des articles traitant de mathématiques et destinés aux élèves de CM1, CM2 et sixième.

Category(s): actualité de la recherche, travaux

Laisser un commentaire