> Tech > Décomposition d’un document XML en données relationnelles

Décomposition d’un document XML en données relationnelles

Tech - Par Renaud ROSSET - Publié le 04 avril 2013

Vous aviez compris que quand on veut stocker des documents XML dans DB2, il existe différentes façons.

a.    dans une arborescence sous forme de fichier (dans l’IFS) en les référençant dans DB2 avec des DataLink
b.    dans une base de données relationnelle sous la forme de LOB
c.    dans une base de données XML native
d.    dans une base de données relationnelle sous la forme de tables : Cette technique est appelée « le Schredding ». Voir figure 10.

C’est de ce dernier point que nous allons traiter, c’est-à-dire la possibilité de décomposer un document XML en colonnes dans une ou plusieurs tables de façon à préserver la fidélité des données au niveau relationnel (bien que l’ordre des éléments soit ignoré).

Dans quel but ? Par exemple, le désir d’accéder aux données avec des ordres de lecture natifs (STELL/READ, CHAIN etc..) permettant ainsi à vos applications existantes d’accéder à des données XML. Voir tableau 1.

Le concept de « Shredding » est illustré en figure 11. Dans cet exemple, le document XML possède un nom de client, son adresse et des numéros de téléphone. Etant donné la multiplicité des numéros de téléphone, il faudra décomposer ce flux dans deux tables distinctes de type Entête/Détail, avec une table pour les clients et une table pour les numéros de téléphone.

On comprend tout de suite la complexité et la limite du « Shredding » dans ce genre d’exercice surtout si le client possède, tels les numéros de téléphone, de multiples e-mails, plusieurs commandes, plusieurs articles par commande, chaque article possédant plusieurs libellés etc… Le nombre de tables cibles dans la base de donnée relationnelle pourrait croître exponentiellement et malheureusement ce genre de structure, telle que je viens de vous citer, n’est pas rare en XML.

Pour réaliser ce « mapping », le XML Schéma, qui sera encapsulé dans un XSR, doit être annoté d’informations supplémentaires. Puis il faudra appeler la procédure XDBDECOMPXML afin de procéder à la décomposition du document XML dans les différentes tables cibles.

Prenons l’exemple d’une ligne de notre XSD :

<xs:element name= »street » type= »xs:string » minOccurs= »1″/>

On peut lire ici que l’élément « street » est type type « xs :string » et cet élément doit être renseigné au moins une fois. On peut ajouter une annotation à la définition de cet élément afin qu’il soit mappé dans la colonne STREET de la table ADDRESS. Cette annotation consiste à rajouter deux attributs supplémentaires comme dans l’exemple du listing 1.

Il est aussi possible de faire ce mapping avec des éléments plutôt que des attributs. En figure 10, un XSD annoté pour une décomposition du flux dans nos deux tables et
un exemple plus complet de mapping entre notre document XML et nos deux tables en figure 12.

Si vous décidez de faire du « Shredding » entre un document XML et une ou plusieurs tables, gardez bien à l’esprit que les modèles de données entre ces deux entités sont fondamentalement différentes, modèle hiérarchique pour le premier et relationnel pour le second. Tenter de faire le lien entre ces deux modèles relève d’une gymnastique complexe voire parfois impossible.

Téléchargez cette ressource

État des lieux de la réponse à incident de cybersécurité

Les experts de Palo Alto Networks, Unit 42 et Forrester Research livrent dans ce webinaire exclusif leurs éclairages et stratégies en matière de réponses aux incidents. Bénéficiez d'un panorama complet du paysage actuel de la réponse aux incidents et de sa relation avec la continuité de l'activité, des défis auxquels font face les entreprises et des tendances majeures qui modèlent ce domaine. Un état des lieux précieux pour les décideurs et professionnels IT.

Tech - Par Renaud ROSSET - Publié le 04 avril 2013

Découvrir tous les articles de la chaîne Tech

Les articles les plus consultés

A travers cette chaîne

A travers ITPro

Les plus consultés sur iTPro.fr

A lire aussi sur le site

Fraude & IA : Dr Jekyll vs. Mr Hyde, qui l’emporte ?

Le Dr Jekyll aurait sûrement apprécié le potentiel de l’Intelligence Artificielle pour ses recherches. Mais Mr Hyde lui aurait aussi rappelé malgré lui sa face cachée, le côté obscur de sa force. L’IA est un formidable outil pour lutter contre la fraude, bancaire et/ou e-commerce. Mais elle est aussi utilisée par les fraudeurs pour automatiser, perfectionner et étendre la portée de leurs arnaques. Explications par Laure Littler, PDG d'Oneytrust.