XML failo konvertavimas turi būti gerai formuojamas

Sužinokite, kaip parašyti gerai formuotą ir tinkamą XML

Kartais lengviau suprasti, kaip parašyti gerai suformuotą XML, rodydamas pavyzdį. "Web Writer" informacinis biuletenis yra parašytas naudojant XML formą - aš vadinu jį "AML" arba "About Markup Language" (eik į skaičių!). Nors tai yra darbo dokumentas, tai iš tikrųjų nėra gerai suformuotas arba galiojantis XML dokumentas.

Gerai formuojamas

Yra keletas specialių taisyklių, kuriomis galima sukurti gerai formuotą XML dokumentą:

Su dokumentu susiduriama tik dvi problemos, dėl kurių ji nėra gerai suformuota:

Pirmas dalykas, kurio reikalauja AML dokumentas, yra XML deklaracijos pareiškimas.

Kita problema yra ta, kad nėra vieno elemento, kuris visiškai apims visus kitus elementus. Norėdami tai išspręsti, pridėsiu išorinį konteinerio elementą:

Sukūrus šiuos du paprastus pakeitimus (ir užtikrinant, kad visi elementai yra tik CDATA), nesudėtingas dokumentas bus paverstas gerai suformatuotu dokumentu.

Galiojantis XML dokumentas yra patvirtintas pagal dokumento tipo apibrėžimą (DTD) arba XML schemą. Tai yra taisyklių rinkinys, kurį sukūrė kūrėjas arba standartų organizacija, apibrėžiantys XML dokumento semantiką. Jie pasakoja kompiuteriui, ką daryti su žymėjimu.

Kalbant apie žymėjimo kalbą, nes tai nėra standartinė XML kalba, pvz., XHTML ar SMIL, kūrėjas sukuria DTD. Šis DTD, greičiausiai, bus toje pačioje serveryje, kaip ir XML dokumentas, ir yra nurodytas dokumento viršuje.

Prieš pradėdami kurti DTD ar schemą savo dokumentams, turėtumėte suvokti, kad paprasčiausiai gerai formuojant, XML dokumentas savaime apibūdina ir todėl nereikia DTD.

Pavyzdžiui, su mūsų gerai formatu AML dokumentu yra šios žymos:

Jei esate susipažinę su "Web Writer" naujienlaiškiu, galite susipažinti su skirtingais naujienų biuleteniais. Dėl to labai lengva kurti naujus XML dokumentus naudojant tą patį standartinį formatą. Aš žinau, kad visada pridėsu visą ilgą pavadinimą žyme ir pirmoje sekos URL žymėje.

DTDs

Jei jums reikia parašyti galiojančią XML dokumentą, kad galėtumėte naudoti duomenis arba juos apdoroti, įtrauktumėte jį į savo dokumentą su žyma. Šiame žyme jūs nustatote pagrindinę XML žymę dokumente ir DTD (dažniausiai žiniatinklio URI) vietą. Pavyzdžiui:

Vienas gražus dalykas, susijęs su DTD deklaracijomis, yra tai, kad galite deklaruoti, kad DTD yra vietos sistemoje, kurioje XML dokumentas yra su "SYSTEM". Taip pat galite nurodyti viešą DTD, pvz., Dokumentą HTML 4.0:

Kai naudojate abu, jūs sakote, kad dokumentas naudoja tam tikrą DTD (viešąjį identifikatorių) ir kur jį rasti (sistemos identifikatorius).

Galiausiai galite įtraukti vidinį DTD dokumentą tiesiai į DOCTYPE žymę. Pavyzdžiui (tai nėra pilnas DTD, skirtas AML dokumentui):

]>

XML schema

Kad galėtumėte sukurti galiojantį XML dokumentą, XML galite apibrėžti XML schemos dokumentą. XML Schema yra XML dokumentas, kuriame aprašomi XML dokumentai. Sužinokite, kaip parašyti schemą.

Pastaba

Tiesiog nukreipti į DTD arba XML schemą nepakanka. Dokumente esantis XML turi atitikti DTD arba Schema taisykles. Naudojant patvirtinimo analizatorių yra paprastas būdas patikrinti, ar jūsų XML laikosi DTD taisyklių. Daug tokių parserių galite rasti internete.