XPath

, , , , , , , , , ,

XPath, recomanació del W3C, és un llenguatge que permet navegar a través de dades XML. Desenvolupat pels comitès de creació d'XSL i XQuery, s'ha convertit en un component essencial d'aquests.

XPath no és un llenguatge XML, cosa que permet incloure'l en altres llenguatges XML sense preocupar-se si el resultat està ben format o no.

XPath utilitza un model de dades en arbre per als documents XML. A continuació es mostra un exemple de W3C.

Per al fitxer xml:

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="dm-example.xsl"?>
<catalog xmlns="http://www.example.com/catalog"
       xmlns:html="http://www.w3.org/1999/xhtml"
       xmlns:xlink="http://www.w3.org/1999/xlink"
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
       xsi:schemaLocation="http://www.example.com/catalog
                           dm-example.xsd"
       xml:lang="en"
       version="0.1">
 <!-- This example is for data model illustration only.
   It does not demonstrate good schema design. -->
    <tshirt code="T1534017" label=" Staind : Been Awhile "
      xlink:href="http://example.com/0,,1655091,00.html"
      sizes="M L XL">
      <title> Staind: Been Awhile Tee Black (1-sided) </title>
      <description>
        <html:p>
          Lyrics from the hit song 'It's Been Awhile'
          are shown in white, beneath the large
          'Flock &amp; Weld' Staind logo.
        </html:p>
      </description>
      <price> 25.00 </price>
    </tshirt>
    <album code="A1481344" label=" Staind : Its Been A While "
     formats="CD">
      <title> It's Been A While </title>
      <description xsi:nil="true" />
      <price currency="USD"> 10.99 </price>
      <artist> Staind </artist>
    </album>
 </catalog>

la representació gràfica del model de dades és el següent:

XPath tracta els documents XML com un arbre de nodes. L'arrel, és el document i es representa amb el símbol /. Els elements, els atributs, el contingut, els comentaris, les instruccions de procés i els espais de noms també representen nodes de l'arbre.

Els atributs no són considerats nodes fills, són propietats del node que els conté. Els nodes de dades no tenen nom.

Es pot navegar pels nodes d'un arbre XPath especificant un camí de manera anàloga a com es fa en els directoris dels sistemes operatius. Es poden expressar camins XPath de dues formes:

- Camins absoluts. Sempre comencen en l'arrel de l'arbre.

 /catalog/tshirt/title  

retorna

 <title> Staind: Been Awhile Tee Black (1-sided) </title>

- Camins relatius. Parteixen des del node en el qual estem situats. Es mostren exemples d'utilització més endavant.

En XPath, una expressió és un possible camí. Si s'especifica una expressió no vàlida, és a dir, que no correspon amb un camí dins d'un arbre XPath, no es retorna cap resultat. Per exemple:

 /catalog/tshirt/size  

no retorna resultat:

En general, els exemples d'expressions inclosos en aquest text faran 
referència al document XML mostrat a l'inici de la secció. Per poder 
comprovar els exemples, es pot utilitzar Pycharm. En Pycharm es pot 
avaluar una expressió XPath per un document XML si es té el plugin 
"XPathView+XSLT" instal·lat. Per avaluar una expressió cal teclejar 
"Ctrl+Shift+A" des del document XML i seleccionar "Evaluate XPath 
Expression".

Per obtenir valors d'atributs es pot especificar el símbol @ davant del nom des de l'element que el conté.

 /catalog/tshirt/@code  

retorna code=«T1534017».

En les expressions XPath es poden fer servir comodins:

- * Indica tots els elements d'un determinat nivell.

/catalog/tshirt/* 

retorna

 <title> Staind: Been Awhile Tee Black (1-sided) </title>
   <description>
     <html:p>
       Lyrics from the hit song 'It's Been Awhile'
       are shown in white, beneath the large
       'Flock &amp; Weld' Staind logo.
     </html:p>
   </description>
<price> 25.00 </price>

- . Indica el node actual. Es veu un exemple més endavant.

- .. Indica el pare del node en el qual estem. Es veu un exemple més endavant.

- // Indica qualsevol cosa des del node en el qual estem. Pot ser un sol element o un arbre de nodes. No és recomanable utilitzar-lo sovint per motius d'eficiència.

 //price

retorna tots els elements <price> del fitxer independentment d'on pengin, és a dir:

 <price> 25.00 </price>
 <price currency="USD"> 10.99 </price>

// es pot posar en qualsevol lloc dins de l'expressió, indicant que pot haver-hi qualsevol cosa enmig a partir del lloc on apareixen. L'expressió següent seria equivalent a l'anterior.

 /catalog//price

Una expressió XPath pot retornar un o més resultats. Per indicar un resultat específic d'un conjunt es pot fer servir un nombre envoltat per [] per indicar quin és el que es vol aconseguir. Els nodes s'ordenen d'esquerra a dreta i comencen per l'índex 1.

Per exemple, si afegim un altre album al final del fitxer d'exemple:

 <album code="A1481345" label=" Rosalia : Malamente "
     formats="CD">
   <title> Malamente </title>
   <description xsi:nil="true" />
   <price currency="USD"> 10.99 </price>
   <artist> Rosalia </artist>
 </album>

l'expressió

 /catalog/album[2] 

retornaria només l'àlbum afegit.

Per obtenir el contingut de l'element, s'utilitza la funció text() des de l'element que el conté.

 /catalog/album[1]/title/text() 

retorna It's Been A While.

A una expressió XPath se li pot afegir condicions per obtenir els nodes que compleixin aquestes. La selecció de nodes es fa especificant un predicat XPath dins de []. El predicat XPath s'especifica amb camins relatius des del node amb la condició.

 //description[./html:p]

indica els elements <description> que tinguin un element <html:p> fill. Retorna:

 <description>
     <html:p>
       Lyrics from the hit song 'It's Been Awhile'
       are shown in white, beneath the large
       'Flock &amp; Weld' Staind logo.
     </html:p>
 </description>

i l'expressió

 //description[../artist]

indica els elements <description> que tinguin al mateix nivell un element <artist>. Retorna:

 <description xsi:nil="true" />
 <description xsi:nil="true" />

També es pot fer servir condicions per comprovar si un node té un valor determinat.

 /catalog/album[price=" 10.99 "]

permet obtenir els albums amb preu « 10.99 ». Retorna:

 <album code="A1481344" label=" Staind : Its Been A While "
     formats="CD">
   <title> It's Been A While </title>
   <description xsi:nil="true" />
   <price currency="USD"> 10.99 </price>
   <artist> Staind </artist>
 </album>
 <album code="A1481345" label=" Rosalia : Malamente "
     formats="CD">
   <title> Malamente </title>
   <description xsi:nil="true" />
   <price currency="USD"> 10.99 </price>
   <artist> Rosalia </artist>
 </album>

Les condicions es poden posar en qualsevol nivell del camí i pot haver-hi tantes com es vulgui.

 /catalog/tshirt[./price=" 25.00 "]/title

indica l'element <title> dels elements <tshirt> amb un fill <price> igual a « 25.00 ». Noteu que s'inclouen els espais. Retorna

 <title> Staind: Been Awhile Tee Black (1-sided) </title>

També es poden posar condicions per als atributs.

 //description[@xsi:nil="true"]

Retorna:

 <description xsi:nil="true" />
 <description xsi:nil="true" />

Les expressions amb condicions sobre atributs i sobre elements es poden barrejar especificant-les una al costat de l'altra.

 /catalog/tshirt[./price=" 25.00 "][@code="T1534017"]/title

Retorna:

 <title> Staind: Been Awhile Tee Black (1-sided) </title>

XPath proporciona *funcions* per manipular els resultats obtinguts. Aquestes permeten:

- Manipular conjunts de nodes.

 count(//description) 

compta el nombre d'elements <description> en el document. Després d'afegir un àlbum el resultat seria 3.

- Treballar amb cadenes de caràcters.

 concat("title:",/catalog/album/title[1]/text())

retorna

 "title: It's Been A While "

i

 /catalog/tshirt[starts-with(title," S")]

retorna els elements <tshirt> amb <title> que comencen per « S»:

 <tshirt code="T1534017" label=" Staind : Been Awhile "
      xlink:href="http://example.com/0,,1655091,00.html"
      sizes="M L XL">
   <title> Staind: Been Awhile Tee Black (1-sided) </title>
   <description>
     <html:p>
       Lyrics from the hit song 'It's Been Awhile'
       are shown in white, beneath the large
       'Flock &amp; Weld' Staind logo.
     </html:p>
   </description>
   <price> 25.00 </price>
 </tshirt>

- Fer operacions numèriques.

 sum(//price)

indica la suma del contingut dels elements <price>. Retorna 46.98.

- Fer operacions booleanes. La *funció not()* es fa servir per negar condicions.

 /catalog/album[not(./description=" ")]/title

indica l'element <title> dels elements <album> amb un fill <description> que no estigui buit. Retorna

 <title> It's Been A While </title>
 <title> Malamente </title>

Per veure un llistat complet de funcions que es poden fer servir consultar l'especificació XPath.