Neki osnovni aspekti XML dokumenata

U prethodnim XML prilozima, saznali smo ลกta je XML i kako se definiลกe jedan XML dokument, a sada ฤ‡emo pokuลกati da taj XML dokument pogledamo sa drugog aspekta. Kao ลกto smo pominjali, XML dokument je sastavljen od entiteta i ispravan je ukoliko odgovara standardima propisanim XML specifikacijom. Predstaviฤ‡emo vam neke od osnovnih aspekata XML dokumenata:

  • prazan karakter (white space)
    XML prazan karakter (gde se misli na space, tab i CR) tretira na isti naฤin kao i HTML. ล to znaฤi jedan ili viลกe praznih karaktera tretira se kao samo jedan.
  • karakter tagovi
    XML koristi iste oznake kao i HTML za ukazivanje na tagove i elemente, posebno <, >, i &. Takoฤ‘e, unutar XML naziva koristi se i dvotaฤka (:).
  • drugi razliฤiti karakteri
    Drugi ASCII i Unicode karakteri tretiraju se kao slova, sve dok ih DTD ili neki drugi element dokumenta ne redefiniลกe.
  • komentari
    XML za indikaciju komentara u dokumentima koristi iste oznake kao i HTML <!– –>.
  • procesne instrukcije
    Ovo su specijalni tagovi kreirani za ฤuvanje instrukcija namenjenih aplikacijama. Indikacija se vrลกi sa <? i ?&gt tagovima.
  • CDATA
    Kada imate velike blokove XML koda, trebala bi vam moguฤ‡nost da iskomentariลกete neki deo koda ili da markirate neki deo. U tom sluฤaju moลพete koristiti tag <![CDATA[, a na kraju sekcije navodi se ]]>.
Kada startujete sa nekim XML dokumentom, trebalo bi da ga zapoฤnete sa XML deklaracijom koja ukazuje na verziju XML-a, kojom je ispisan dokument. Da biste kreirali validan XML dokument, potrebno je i da referencirate odreฤ‘eni dokument za definiciju strukture (DTD), i to pre prvog elementa u dokumentu. Evo i primera jednog kratkog validnog XML dokumenta:


<?xml version="1.0"?>
<!DOCTYPE prvixml SYSTEM "prvi.dtd">
<prvixml>
<poruka>Puno pozdrava!</poruka>
</prvixml>

Prva linija (<?xml version="1.0"?>) definiลกe verziju XML-a koja se koristi. Ukoliko vaลก XML dokument ne odgovara specificiranoj verziji, dogodiฤ‡e se greลกka u parsiranju. Druga linija (<!DOCTYPE prvixml SYSTEM "prvi.dtd">) predstavlja referencu ka spoljnom dokumentu za definisanje strukture (DTD). Ova linija ukazuje na DTD dokumenta „prvixml“ (ลกto je takoฤ‘e i naziv root elementa XML dokumenta) i identifikuje link (URL) datog DTD dokumenta („prvi.dtd“ – nalazi se u istom folderu kao i sam dokument). Treฤ‡a linija dokumenta (<prvixml>) predstavlja root element XML dokumenta. ฤŒetvrta linija (<poruka>Puno pozdrava!</poruka>) je zapravo sam XML. Tag (<poruka>) mora biti definisan u DTD fajlu („prvi.dtd“). I konaฤno, poslednjom linijom dokumenta zatvaramo root tag (</prvixml>)

Na osnovu iznetog, moลพemo i da napravimo mali rezime:

  • Svaki XML dokument treba da startuje sa vezijom XML-a, navodeฤ‡i <?xml version="1.0"?>.
  • Druga linija svog dokumenta trebalo bi da sadrลพi definiciju DTD-a, ukljuฤujuฤ‡i naziv i URL. Ukoliko vaลกem dokumentu nije potreban DTD, moลพete izostaviti ovu liniju.
  • Elementi XML dokumenta su definisani sa < i >. XML je osetljiv na upotrebu malih/velikih karaktera (case sensitive), pa zato nije isto napisati <poruka> ili <PORUKA>, jer su ovo dva razliฤita entiteta.
  • Za komentarisanje XML dokumenata, koristite CDATA tag, kao u sledeฤ‡em primeru:


    <poruka>Puno pozdrava</poruka>
    <![CDATA[
    Ova informacija predstavlja za XML dokument podatak, ali je ignorisan kada
    se vrsi parsiranje. <cdata_tag> </cdata_tag> – cak se i prethodni tag
    ignorise. Ali tag koji sledi oznacava kraj komentara i najavljuje pocetak XML-a.
    ]]>
    <zatvaranje>Do vidjenja!</zatvaranje>

Jednom kada razumete i prihvatite osnovne aspekte XML dokumenata, spremni ste za kreiranje sopstvenih validnih dokumenata.

Pratite Krstaricu na www.krstarica.com