Manipuler des données XML avec Java et JDOM
Par
Nicolas CYNOBER
Vous apprendrez dans cet article à manipuler des donnés XML avec le langage Java et l'API JDOM.
Nous étudierons les possibilités de cette api grâce à des exemples simples.
Nous apprendrons ainsi à créer un simple fichier XML, à parcourir son arborescence et à modifier son contenu.
Version HTML/ZIP
Version PDF
Introduction
1. Les origines de JDOM
1.1. Description de SAX
1.2. Description de DOM
1.3. Pourquoi JDOM ?
2. Crée un fichier XML avec JDOM
2.1. Téléchargement et installation l'API JDOM
2.2. Créer une arborescence simple
2.3. Afficher et enregistrer son fichier XML
3. Parcourir un fichier XML
3.1. Parser un fichier XML
3.2. Parcourir une arborescence
3.3. Filtrer les éléments
4. Modifier une arborescence JDOM
4.1. Modifier des Elements
4.2. Passer de DOM à JDOM et l'inverse
4.3. JDOM et XSLT
Conclusion
Introduction
JDOM est une API du langage Java développée indépendamment de Sun Microsystems.
Elle permet de manipuler des donnés XML plus simplement qu'avec les API classiques.
Son utilisation est pratique pour tout développeur Java et repose sur les API XML de Sun.
 |
Sun Microsystems (Comment on the JSR-102 Approval Ballot)
In general we tend to prefer to avoid adding new APIs to the Java platform which replicate the functionality of existing APIs.
However JDOM does appear to be significantly easier to use than the earlier APIs, so we believe it will be a useful addition to the platform.
|
Vous pouvez télécharger les binaires ici.
La documentation officielle (javadoc) est disponible ici.
Au 23/02/2004 JDOM est disponible en version 1.0 Beta 10 et est compatible avec les versions 1.1 et supérieures du JDK.
Objectif de cet article
Vous apprendrez dans cet article à manipuler des donnés XML avec le langage Java et l'API JDOM.
Nous étudierons les possibilités de cette API grâce à des exemples simples.
Nous apprendrons ainsi à créer un simple fichier XML, à parcourir son arborescence, à modifier son contenu.
1. Les origines de JDOM
1.1. Description de SAX
SAX est l'acronyme de Simple API for XML.
Ce type de parseur utilise des événements pour piloter le traitement d'un fichier XML. Un objet (nommé handler en anglais) doit implémenter des méthodes particulières définies dans une interface de l'API pour fournir les traitements à réaliser : selon les événements, le parseur appelle ces méthodes.
Pour en savoir plus sur SAX, visitez le site officiel.
JDOM utilise des collections SAX pour parser les fichiers XML.
1.2. Description de DOM
DOM est l'acronyme de Document Object Model. C'est une spécification du W3C pour proposer une API qui permet de modéliser, de parcourir et de manipuler un document XML. Le principal rôle de DOM est de fournir une représentation mémoire d'un document XML sous la forme d'un arbre d'objets et d'en permettre la manipulation (parcours, recherche et mise à jour).
A partir de cette représentation (le modèle), DOM propose de parcourir le document mais aussi de pouvoir le modifier. Ce dernier aspect est l'un des aspect les plus intéressant de DOM.
DOM est défini pour être indépendant du langage dans lequel il sera implémenté. DOM n'est qu'une spécification qui, pour être utilisée, doit être implémentée par un éditeur tiers. DOM n'est donc pas spécifique à Java.
Le parseur DOM pour JAVA le plus répandu est Xerces que vous pouvez trouver ici.
JDOM utilise DOM pour manipuler les éléments d'un Document Object Model spécifique (créé grâce à un constructeur basé sur SAX).
JDOM permet donc de construire des documents, de naviguer dans leur structure, s'ajouter, de modifier, ou de supprimer leur contenu.
1.3. Pourquoi JDOM ?
Une question logique que l'on peut se poser à ce stade de l'article : Mais qu'est-ce que JDOM nous apporte de plus ?
La simplicité ! Il est en vérité très laborieux de développer des applications complexes autour de XML avec DOM, qui rappelons le, n'a pas été développé spécifiquement pour Java.
Voyons maintenant toutes les possibilités de JDOM à travers des exemples simples.
2. Crée un fichier XML avec JDOM
2.1. Téléchargement et installation l'API JDOM
Il vous faut dans un premier temps télécharger la dernière version de JDOM disponible à cette adresse : http://www.jdom.org/dist/binary/.
Il suffit ensuite de rendre accessible le fichier /build/jdom.jar, en le placant dans votre classpath.
2.2. Créer une arborescence simple
La création d'un fichier XML en partant de zéro est des plus simple. Il suffit de construire chaque élément puis de les ajouter les uns aux autres de façon logique. Un noeud est une instance de org.jdom.Element.
Nous commençons donc par créer une classe JDOM1 qui va se charger de créer l'arborescence suivante :
Fichier XML <personnes>
<etudiant classe="P2">
<nom>CynO</nom>
<etudiant>
<personnes>
JDOM1.java import java.io.*;
import org.jdom.*;
import org.jdom.output.*;
public class JDOM1
{
static Element racine = new Element("personnes");
static org.jdom.Document document = new Document(racine);
public static void main(String[] args)
{
Element etudiant = new Element("etudiant");
racine.addContent(etudiant);
Attribute classe = new Attribute("classe","P2");
etudiant.setAttribute(classe);
Element nom = new Element("nom");
nom.setText("CynO");
etudiant.addContent(nom);
affiche();
enregistre("Exercice1.xml");
}
}
2.3. Afficher et enregistrer son fichier XML
Nous allons afficher puis enregistrer notre arborescence.
Nous allons utiliser une unique classe pour ces deux flux de sortie : org.jdom.output.XMLOutputter, qui prends en argument un org.jdom.output.Format.
En plus des trois formats par défaut (PrettyFormat, CompactFormat et RawFormat), la classe Format contient une panoplie de méthodes pour affiner votre sérialisation.
Vous pouvez trouver une description de ces méthodes dans la javadoc.
JDOM1.java
static void affiche()
{
try
{
XMLOutputter sortie = new XMLOutputter(Format.getPrettyFormat());
sortie.output(document, System.out);
}
catch (java.io.IOException e){}
}
static void enregistre(String fichier)
{
try
{
XMLOutputter sortie = new XMLOutputter(Format.getPrettyFormat());
sortie.output(document, new FileOutputStream(fichier));
}
catch (java.io.IOException e){}
}
Après exécution voici le résultat obtenu (affichage sur la sortie standard et contenu du fichier "Exercice1.xml").
Exercice1.xml <?xml version="1.0" encoding="UTF-8"?>
<personnes>
<etudiant classe="P2">
<nom>CynO</nom>
</etudiant>
</personnes>
Nous verrons dans la troisième partie comment travailler sur un document existant, parcourir son arborescence et filtrer ses éléments.
3. Parcourir un fichier XML
3.1. Parser un fichier XML
Parser un fichier XML revient à transformer un fichier XML en une arborescence JDOM.
Nous utiliserons pour cela le constructeur SAXBuilder, basé, comme son nom l'indique, sur l'API SAX.
Créez tout d'abord le fichier suivant dans le répertoire contenant votre future classe JDOM2 :
Exercice2.xml <?xml version="1.0" encoding="UTF-8"?>
<personnes>
<etudiant classe="P2">
<nom>CynO</nom>
<prenoms>
<prenom>Nicolas</prenom>
<prenom>Laurent</prenom>
</prenoms>
</etudiant>
<etudiant classe="P1">
<nom>Superwoman</nom>
</etudiant>
<etudiant classe="P1">
<nom>Don Corleone</nom>
</etudiant>
</personnes>
Notre objectif ici est d'afficher dans un premier temps le nom de tous les élèves.
Nous allons créer pour cela une nouvelle classe: JDOM2.
JDOM2.java import java.io.*;
import org.jdom.*;
import org.jdom.input.*;
import org.jdom.filter.*;
import java.util.List;
import java.util.Iterator;
public class JDOM2
{
static org.jdom.Document document;
static Element racine;
public static void main(String[] args)
{
SAXBuilder sxb = new SAXBuilder();
try
{
document = sxb.build(new File("Exercice2.xml"));
}
catch(Exception e){}
racine = document.getRootElement();
afficheALL();
}
}
3.2. Parcourir une arborescence
Nous utiliserons dans cette méthode deux classes apartenant au framework Collection (package java.util) :
java.util.List
java.util.Iterator
Nous allons créer une liste basée sur les noeuds étudiants de notre arborescence puis nous allons la parcourir grâce à un iterator.
JDOM2.java
static void afficheALL()
{
List listEtudiants = racine.getChildren("etudiant");
Iterator i = listEtudiants.iterator();
while(i.hasNext())
{
Element courant = (Element)i.next();
System.out.println(courant.getChild("nom").getText());
}
}
A l'exécution vous devriez voir s'afficher CynO, Superwoman et Don Corleone.
3.3. Filtrer les éléments
Notre nouvel objectif est d'afficher la classe des étudiants dont le prénom est Laurent et le nom est CynO.
Les seuls filtres que nous ayons fait pour le moment étaient directement implementés dans les méthodes que nous utilisions.
List listEtudiants = racine.getChildren("etudiant") nous a permis de filtrer les sous éléments de racine selon leur nom.
Vous aurez remarqué que de toute façon nous n'avions que des etudiants, le problème ne se posait donc pas ;)
Les filtres permettent des sélections d'éléments selon plusieurs critères.
Nous allons donc créer un filtre qui permettra de ne prendre en compte que les Elements qui possèdent :
- Un sous élément nom qui doit avoir pour valeur "CynO".
- Un sous élément prenoms qui doit posséder au moins un sous élément prenom dont la valeur est "Laurent".
Une fois le filtre créé nous pourrons récupérer une liste contenant les éléments répondant à ces critères.
JDOM2.java
static void afficheFiltre()
{
Filter filtre = new Filter()
{
public boolean matches(Object ob)
{
if(!(ob instanceof Element)){return false;}
Element element = (Element)ob;
int verifNom = 0;
int verifPrenom = 0;
if(element.getChild("nom").getTextTrim().equals("CynO"))
{
verifNom = 1;
}
Element prenoms = element.getChild("prenoms");
if(prenoms == null){return false;}
List listprenom = prenoms.getChildren("prenom");
Iterator i = listprenom.iterator();
while(i.hasNext())
{
Element courant = (Element)i.next();
if(courant.getText().equals("Laurent"))
{
verifPrenom = 1;
}
}
if(verifNom == 1 && verifPrenom == 1)
{
return true;
}
return false;
}
}
List resultat = racine.getContent(filtre);
Iterator i = resultat.iterator();
while(i.hasNext())
{
Element courant = (Element)i.next();
System.out.println(courant.getAttributeValue("classe"));
}
}
A l'exécution vous devriez voir s'afficher P2 à votre écran.
La puissance de cet outil réside dans sa capacité à être utilisé à tout moment par n'importe quel Element de votre arborescence.
Dans notre exemple, nous nous sommes servi de notre filtre JDOM comme d'un moteur de recherche.
Et il est tout à fait envisageable de créer des filtres dynamiques selon vos besoins.
Pour en savoir plus sur la classe Filter je vous invite à vous rendre ici.
4. Modifier une arborescence JDOM
4.1. Modifier des Elements
| Nom |
Arguments des surcharges |
Description |
| addContent |
Collection, String ou Content, c'est à dire un Element ou quoi que se soit qui peut être contenu par un noeud. |
Ajoute le contenu de l'argument à la fin du contenu d'un Element. On peut spécifier un index pour l'inserer à la position voulu. |
| clone |
|
Retourne un clone parfait de l'Element. |
| cloneContent |
|
Comme son nom l'indique on ne copie que le contenu. |
| removeAttribute |
Attribut ou nom de l'attribut (String) |
Supprime un attribut d'un Element |
| removeChild |
nom du noeud enfant (String) |
Supprime le premier enfant portant ce nom. |
| removeChildren |
nom des noeuds enfants (String) |
Supprime tous les enfants ayant ce nom. |
| removeContent |
Content, Index ou Filtre |
Supprime l'intégralité d'un noeud donné en argument ou par sa position. removeContent accept aussi les filtres, tout comme getContent vu précédement. |
| setAttribute |
Attribut ou nom de l'attribut et sa valeur (String, String) |
Cette méthode permet à la fois de créer un attribut et d'en modifier sa valeur. |
| setContent |
Content |
Remplace le contenu d'un Element. On peut spécifier un index si l'on ne veut pas tout remplacer. |
| setName |
Nouveau nom de l'Element (String) |
Change le nom de l'Element. |
| setText |
Nouveau Text à inserer (String) |
Change le text contenu par l'Element. <element>TEXT</element> |
| toString |
|
Retourne une représentation de l'Element sous forme de chaine. |
Pour plus de détails, je vous invite à lire la documentation de la classe Element.
Maintenant voyons un petit exemple de modification d'arborescence.
Il vous paraîtra simpliste à coté de ce que nous avons fait jusqu'a présent mais c'est justement le but:
Je tiens à vous montrer que JDOM c'est la simplicité avant tout !
Nous allons modifier le contenu de notre fichier Exemple2.xml en supprimant tous les Element prenoms de notre arborescence.
JDOM3.java
import java.io.*;
import org.jdom.*;
import org.jdom.input.*;
import org.jdom.output.*;
import java.util.List;
import java.util.Iterator;
public class JDom
{
static org.jdom.Document document;
static Element racine;
public static void main(String[] args)
{
try
{
lireFichier("Exercice 2.xml");
supprElement("prenoms");
enregistreFichier("Exercice 2.xml");
}
catch(Exception e){}
}
static void lireFichier(String fichier) throws Exception
{
SAXBuilder sxb = new SAXBuilder();
document = sxb.build(new File(fichier));
racine = document.getRootElement();
}
static void supprElement(String element)
{
List listEtudiant = racine.getChildren("etudiant");
Iterator i = listEtudiant.iterator();
while(i.hasNext())
{
Element courant = (Element)i.next();
if(courant.getChild(element)!=null)
{
courant.removeChild(element);
courant.setName("etudiant_modifie");
}
}
}
static void enregistreFichier(String fichier) throws Exception
{
XMLOutputter sortie = new XMLOutputter(Format.getPrettyFormat());
sortie.output(document, new FileOutputStream(fichier));
}
}
Voici le contenu du fichier "Exemple2.xml" après exécution.
Exemple2.xml <?xml version="1.0" encoding="UTF-8"?>
<personnes>
<etudiant_modifie classe="P2">
<nom>CynO</nom>
</etudiant_modifie>
<etudiant classe="P1">
<nom>Superwoman</nom>
</etudiant>
<etudiant classe="P1">
<nom>Don Corleone</nom>
</etudiant>
</personnes>
4.2. Passer de DOM à JDOM et l'inverse
Il vous arrivera parfois de devoir travailler sur un document DOM.
Nous allons voir comment transformer un document DOM en un document JDOM et vis versa.
Voici une petite méthode qui reçoit en argument un document DOM et retourne un document JDOM.
import org.jdom.input.*;
org.jdom.Document DOMtoJDOM(org.w3c.dom.Document documentDOM) throws Exception
{
DOMBuilder builder = new DOMBuilder();
org.jdom.Document documentJDOM = builder.build(documentDOM);
return documentJDOM;
}
Et maintenant, voici la fonction inverse qui reçoit en argument un document JDOM et qui retourne un document DOM.
Vous remarquerez la similitude avec la fonction précédente.
import org.jdom.output.*;
org.w3c.dom.Document DOMtoJDOM(org.jdom.Document documentJDOM) throws Exception
{
DOMOutputter domOutputter = new DOMOutputter();
org.w3c.dom.Document documentDOM = domOutputter.output(documentJDOM);
return documentDOM;
}
4.3. JDOM et XSLT
Grâce à l'API JAXP et TraX il est très facile de faire des transformation XSLT sur un document JDOM.
Dans l'exemple suivant nous allons créer une méthode qui prend en entrée un document JDOM et le nom d'un fichier XSL et qui crée en sortie un fichier XML transformé.
import java.io.*;
import org.jdom.transform.*;
import org.jdom.output.*;
import javax.xml.transform.*;
import javax.xml.transform.stream.StreamSource;
void outputXSLT(org.jdom.Document documentJDOMEntree,String fichierXSL)
{
JDOMResult documentJDOMSortie = new JDOMResult();
org.jdom.Document resultat = null;
try
{
TransformerFactory factory = TransformerFactory.newInstance();
Transformer transformer = factory.newTransformer(new StreamSource(fichierXSL));
transformer.transform(new org.jdom.transform.JDOMSource(documentJDOMEntree), documentJDOMSortie);
resultat = documentJDOMSortie.getDocument();
XMLOutputter outputter = new XMLOutputter(Format.getPrettyFormat());
outputter.output(resultat, new FileOutputStream("resultat.xml"));
}
catch(Exception e){}
}
Conclusion
Vous vous êtes maintenant rendu compte de l'utilité de JDOM dans le traitement de données XML avec Java.
Cependant cette API est encore toute jeune et en voie d'amélioration.
Pour en apprendre plus sur JDOM et rester informé je vous conseille les sites suivants :
Je tiens à remercier également les forums de developpez.com pour leur aide.
|