Stækkanlegt merkingarmál
Stækkanlegt merkingarmál | |
---|---|
![]() | |
Skrá eftirnafn : | .xml |
MIME gerð : | forrit / xml, texti / xml |
Töfra númer : | 3C 3F 78 6D 6C hex <? xml |
Þróað af: | World Wide Web Consortium |
Gerð: | Markup tungumál |
Framlengt með: | SGML |
Stækkað í: | XHTML , RSS , Atom |
Vefsíða : | 1.0 (fimmta útgáfan) 1.1 (önnur útgáfa) |
The Extensible Markup Language (dt. Extensible Markup Language), XML skammstafað, er merkingarmál til að tákna stigveldilega skipulögð gögn á sniði textaskrár sem bæði mannleg og vélræn læsileg eru.
XML er einnig notað fyrir vettvang og framkvæmd -sjálfstætt gagnaskipti milli tölvukerfa , einkum í gegnum internetið , og var gefið út af World Wide Web Consortium (W3C) 10. febrúar 1998. [1] Núverandi útgáfa er fimmta útgáfan frá 26. nóvember 2008. [2] XML er málmtunga , á grundvelli þess sem forritssértæk tungumál eru skilgreind með uppbyggingu og innihaldstengdum takmörkunum. Þessar takmarkanir eru ýmist settar fram með Document Type Definition (DTD) eða með XML stefi . Dæmi um XML tungumál eru: RSS , MathML , GraphML ,XHTML , XAML , Scalable Vector Graphics (SVG), GPX , en einnig XML stefið sjálft.
Staðlaður stafakóðun XML skjals er UTF-8 . Kerfi sem vinna XML verða að geta notað UTF-8 og UTF-16 kóðunina. [3] XML skjöl sem nota UTF-8 eða UTF-16 er hægt að skoða og breyta í öllum textaritlum sem styðja þessar kóðanir.
Ef XML skjalið á að innihalda tvöfald gögn verða þessi gögn að vera umrituð sem texti. Í þessu skyni z. B. Hægt er að nota Base64 kóðun.
Tæknileg hugtök
þáttur
Mikilvægasta uppbyggingareining XML skjals er þátturinn . Hlutir geta innihaldið texta sem og aðra þætti sem innihald. Þættir mynda hnúta uppbyggingartrés XML skjals. Hægt er að velja nafn XML -frumefnis frjálst í XML -skjölum án skilgreiningar á gerð skjals (DTD) . Í XML skjölum með DTD verður að lýsa heiti frumefnis í DTD og frumefnið verður að vera í leyfilegri stöðu innan uppbyggingartrésins samkvæmt DTD . Í DTD, meðal annars, er mögulegt innihald hvers þáttar skilgreint. Frumefni eru burðarefni upplýsinga í XML skjali.
Dagur
Merki eru notuð til að merkja þætti:
- upphafsdagur fyrir upphaf frumefnis:
<Elementname>
-
</Elementname>
fyrir lok frumefnis:</Elementname>
- autt merki fyrir frumefni án innihalds:
<Leer/>
Vel mótað
XML skjal er „vel myndað“ (eða enska vel mótað) ef það er í samræmi við allar reglur XML. Eftirfarandi eru dæmi:
- Skjalið hefur nákvæmlega einn rótarþátt. Ysti þátturinn í hverju tilfelli er nefndur rótarþátturinn, t.d. B.
<html>
íXHTML . - Allir þættir með innihaldi hafa upphafs- og lokamerki (t.d.
<eintrag>Eintrag 1</eintrag>
). Hægt er að merkja þætti án efnis með auðu (t.d.<eintrag />
). - Upphafs- og lokamerkin eru hreiður í pörum. Þetta þýðir að allir þættir verða að loka áður en lokamerki samsvarandi foreldraþáttar eða upphafsmerki systkinaþáttar birtast.
- Frumefni getur ekki haft marga eiginleika með sama nafni.
- Gildi eiginda verða að vera innan gæsalappa (
"..."
eða'...'
). - Upphafs- og lokamerkin eru hástafastærð (t.d.
<eintrag></Eintrag>
er ekki gild).
Gildistími
Ef nota á XML til gagnaskipta er það hagkvæmt ef sniðið er skilgreint með málfræði (t.d. skilgreiningu á gerð skjals eða XML stefi ). Staðallinn skilgreinir XML skjal sem gilt (eða ensku gilt) ef það er vel mótað, inniheldur tilvísun í málfræði og er í samræmi við sniðið sem málfræðin lýsir.
Parser
Forrit eða forritahlutir sem lesa upp, túlka og, ef nauðsyn krefur, athuga hvort gögn XML séu rétt, kallast XML -flokkar . Ef greiningartækið athugar réttmæti er það staðfestingargreining .
Uppbygging XML skjals
Dæmi um XML skrá
<? xml version = "1.0" encoding = "UTF-8" standalone = "yes"?>
<skrá>
<titel> Borgarskrá Wikipedia </titel>
<inngangur>
<lykilorð> Genf </keyword>
<eintragstext> Genf er aðsetur ... </eintragstext>
</entry>
<inngangur>
<stichwort> Köln </stichwort>
<eintragstext> Köln er borg sem ... </eintragstext>
</entry>
</directory>
XML skjöl hafa líkamlega og rökrétt uppbyggingu.
Líkamleg uppbygging
- Skjalseiningin inniheldur aðalskjalið.
- Aðrar mögulegar aðilar eru um
- Einingartilvísanir (
&name;
fyrir skjalið eða%name;
fyrir skilgreiningu á gerð skjals) innfelldar stafstrengir, hugsanlega einnig heilar skrár, svo og tilvísanir í stafareiningar fyrir samþættingu einstakra stafi sem vísað er til með fjölda þeirra (&# Dezimalzahl ;
eða&#x Hexadezimalzahl ;
).
- Einingartilvísanir (
- XML yfirlýsing er notuð til að tilgreina XML útgáfu, stafakóðun og mögulega vinnslu án DTD .
- Gerð skilgreiningar skjals er notuð til að tilgreina einingar og leyfilega rökrétta uppbyggingu. Hægt er að afvelja notkun DTD í XML -yfirlýsingunni .
Rökrétt uppbygging
Rökrétt uppbygging samsvarar tréuppbyggingu og er þannig skipulögð stigveldi. Tréhnútarnir eru:
- Þættir sem hafa líkamlega auðkenningu með því að
- viðeigandi par af
< Tagname >
</ Tagname >
merki< Tagname >
og endamerki</ Tagname >
eða - tómt
< Tagname />
hægt að gera,
- viðeigandi par af
- Eiginleikar sem viðbótareiginleikar þáttanna sem eru skrifaðir þegar um upphafsdag eða tóman dag er að ræða í setningafræðilegum
Attributname =" Attributwert "
, -
<? Zielname Daten?>
vinnslu<? Zielname Daten?>
(Vinnsluleiðbeiningar), - Athugasemdir
<!-- Kommentar-Text -->
og - Texti sem getur birst sem venjuleg stafgögn eða í formi CDATA hluta
<![CDATA[ beliebiger Text ]]>
.
XML skjal verður að innihalda nákvæmlega einn efsta þætti. Frekari þætti og texta er hægt að verpa fyrir neðan þennan skjalþátt.
DTD
Skilgreining á gerð skjals (DTD) lýsir uppbyggingu og málfræði skjala. Það er hluti af XML kerfinu og virkjað sjálfgefið.
Ef skjöl eru búin til með tilvísun í ytri skilgreiningu skjalsgerðar eða með samþættri skilgreiningu á gerð skjals, athugar þátttakandinn skjalið um leið og það er opnað (lesið). Skjal sem byggist á skilgreiningu á gerð skjals er alltaf gilt skjal. Áherslan er á samræmi skjalsins við reglur skilgreiningar á gerð skjals. Tæknileg læsileiki, þ.mt lestur ógildra skjala, skiptir miklu máli. Þetta er ætlað fyrir fulltexta skjöl ( frásagnargögn ) og er megintilgangurinn.
Skjöl án DTD henta betur fyrir öll gagnaskipti. Greinandinn athugar aðeins þessi skjöl samkvæmt reglum um vel mótaða. Tæknileg læsileiki er í fyrirrúmi hér. Raunverulegar upplýsingar eru skoðaðar og lesnar upp með því að nota ferli eftir á.
Lesanleiki XML skjala
Nánast allir vafrar eins og Apple Safari , Google Chrome , Microsoft Internet Explorer , Mozilla Firefox og Opera geta sýnt XML skjöl beint með hjálp innbyggðrar XML- greiningar .
Flokkun XML skjala
Hægt er að skipta XML skjölum í skjalamiðuð og gagnamiðuð skjöl út frá fyrirhugaðri notkun og uppbyggingu. Hins vegar eru mörkin milli þessara gerða skjala fljótleg. Mixed form er hægt að lýst sem hálf -structured.
- skjalamiðað: Skjalið er byggt á textaskjali sem er að mestu leyti skiljanlegt fyrir lesandann jafnvel án viðbótar metaupplýsinga. XML þættir eru aðallega notaðir til merkingar merkingar á köflum í skjalinu; skjalið er aðeins illa uppbyggt. Vinnsla vinnslu er erfið vegna veikrar uppbyggingar.
- gagnamiðað: Skjalið er fyrst og fremst ætlað til vinnslu í vélum. Það fylgir áætlun sem lýsir einingum gagnalíkans og skilgreinir samband milli aðila og eiginleika eininganna. Skjalið er þannig mjög uppbyggt og hentar síður til beinna manna nota.
- hálfskipulögð: Hálfskipulögð skjöl tákna eins konar blendingaform sem er meira uppbyggt en skjalamiðuð skjöl, en veikari en gagnamiðuð skjöl.
Það er dæmigert fyrir gagnamiðað XML skjöl að þættir hafa annaðhvort frumefni eða textaefni. Svokallað blandað innihald, þar sem þættir innihalda bæði texta og undirþætti, er dæmigert fyrir önnur XML skjöl.
Vinnsla á XML
Vinnsluviðmið
Í grundvallaratriðum eru þrír þættir mikilvægir þegar aðgangur er að XML skjali:
- Hvernig er aðgangur að XML skránni: í röð eða af handahófi?
- Hvernig er ferlið við aðgang að XML gögnum hannað: „Push“ eða „Pull“? (Push þýðir að greiningin stjórnar flæði forritsins. Pull þýðir að stjórnun flæðisins er útfærð í kóðanum sem kallar þáttarann.)
- Hvernig er stjórnun tréuppbyggingar XML gagna framkvæmd: stigveldi eða hreiður?
Forritaður aðgangur að XML skjölum
XML skjöl eru lesin inn á lægsta stigi með því að nota sérstakan forritahluta, XML örgjörva , einnig þekktur sem XML greiningartæki. Það veitir forritunarviðmót (API) þar sem forritið kemst í XML skjalið.
XML örgjörvarnir styðja þrjár grunnvinnslulíkön.
- DOM : DOM-API táknar XML skjal sem tréuppbyggingu og veitir handahófi aðgang að einstökum íhlutum tréuppbyggingarinnar. Auk þess að lesa XML skjöl, leyfir DOM einnig að stjórna tréuppbyggingu og skrifa tré uppbyggingu aftur í XML skjal. Vegna þessa er DOM mjög minniskennt.
- SAX : SAX API táknar XML skjal sem raðgagnastraum og kallar á afturkallunaraðgerðirnar sem tilgreindar eru í staðlinum fyrir atburði. Forrit sem notar SAX getur skráð eigin undirrásir sínar sem hringingaraðgerðir og á þann hátt metið XML gögnin.
- Pull API : XML pull API vinnur úr gögnum í röð og býður upp á bæði atburðarbundna vinnslu og endurtekningu . Það er mjög minnihagkvæmt og, ef nauðsyn krefur, auðveldara að forrita en SAX-API, þar sem ferlisstýringin er hjá forritinu en ekki hjá greiningaraðilanum.
Frekari vinnslulíkön:
- Gagnabinding : Þessi valkostur veitir XML gögn sem gagnagerð beint fyrir aðgang að forriti. XML gögnin eru ómerkt beint í z. B. Breyttir hlutir.
- Ekki útdráttur XML API : Gögnin eru unnin á mjög skilvirkan hátt á bæti stigi.
Oft kemst forritskóðinn ekki beint á greiningarforritið. Þess í stað er XML hulið frekar þannig að forritakóðinn vinnur með innfæddum hlutum / gagnagerðum sem eru byggðir á XML. Dæmi um slík aðgangslög eru JAXB í Java , gagnabindingarhjálpin í Delphi eða XML Schema Definition Toolkit í .Net . Umbreyting á hlutum í XML er venjulega tvíátta. Þessi umbreyting er þekkt sem raðgreining eða útrás .
Dæmi um XML greiningarforrit
XML -greiningarforrit eru fáanleg fyrir ýmis forritunarmál, t.d. B. Java , C , C ++ , C # , Python , Perl og PHP . Parser API dæmi:
- XML :: Parser ( Perl ): XML parser fyrir Perl. Mjög einfalt API býður t.d. B. einnig CPAN mát XML :: Einfalt.
- DOM aðgerðir (PHP5): Eining í PHP5 til að lesa XML skjöl; að öðrum kosti simpleXML; fyrir PHP4 er DOM XML.
- StAX (Java) : Mjög minni skilvirk greiningaraðgerð (pull) og á sama tíma auðvelt að forrita. Boðið er upp á bendil og endurtekningar vinnslulíkön.
- JAXB : Gagnabinding fyrir Java. Til dæmis er hægt að búa til samsvarandi Java flokk úr XML stefi og öfugt.
- Apache XMLBeans Java Data Binding Framework, er nú þegar hægt að nota með Java 1.4.2
- Xerces : Staðfestandi XML -greining fyrir C ++, Java og Perl fyrir margs konar kerfi.
- ElementTree iterparse : Parser API fyrir Python sem endurtekur sig yfir undirtré. Það sameinar geymsluhagkvæmni pull -greiningaraðila með einfaldleika DOM -greiningaraðila.
- VTD-XML : Dæmi um XML-API sem ekki er dregið út.
- MSXML : Microsoft XML Core Services, Microsoft XML hugbúnaðarsafnið fyrir XML stuðning í gegnum DOM, SAX, XSLT, XML skýringarmyndir og aðra XML-tengda tækni
- Pugixml : DOM XML parser fyrir C ++ þar sem þróunin lagði sérstaka áherslu á skilvirkan kóða.
Það eru sérstök forrit, svokölluð XML ritstjórar, til að búa til XML skjöl. Einnig eru til sérstök forrit, svokallaðir XML gagnagrunnar, til að geyma og hafa umsjón með XML skjölum.
Umbreyting og framsetning XML skjala
Hægt er að breyta XML skjali í annað skjal með því að nota viðeigandi umbreytingarmál eins og XSLT eða DSSSL . Umbreytingin er oft notuð til að flytja skjal frá einu XML tungumáli í annað XML tungumál, til dæmis til að breyta því í XHTML, til að birta skjalið í vafra.
Skemamál
Svokölluð skýringarmál eru notuð til að lýsa uppbyggingu XML tungumála .
XML stef / XSD
XML stef (eða XSD fyrir XML stef skýringu) er nútíma leið til að lýsa uppbyggingu XML skjala. XML Schema býður einnig upp á möguleika á að takmarka innihald frumefna og eiginleika, t.d. B. um tölur, dagsetningar eða texta, t.d. B. nota venjuleg orðasambönd . Skema er sjálft XML skjal sem gerir kleift að lýsa flóknari (þ.mt innihaldi) samböndum en hægt er með formlegri DTD.
Fleiri stefritunarmál
Frekari skýringarmál eru Document Structure Description , RELAX NG og Schematron .
XML fjölskylda
Innviðir
Í tengslum við XML hefur W3 samsteypan skilgreint mörg tungumál á grundvelli XML, sem bjóða upp á XML tjáningu fyrir oft nauðsynlegar almennar aðgerðir eins og að tengja XML skjöl. Fjölmörg XML -tungumál nota þessa grunnbyggingarsteina.
- Umbreyting XML skjala: XSLT , STX
- Ávarpa hluta XML -tré: XPath
- Tengir XML auðlindir: XPointer , XLink og XInclude
- Val á gögnum úr XML gagnaskrá: XQuery
- Gagnameðferð í XML gagnaskrá: XUpdate
- Gerð rafrænna eyðublaða: XForms
- Skilgreining á XML gagnauppbyggingu: XML Schema (= XSD, XML Schema Definition Language), DTD og RELAX NG
- Undirskrift og dulkóðun XML hnúta: XML undirskrift og XML dulkóðun
- Yfirlýsingar um formlegt upplýsingaefni: XML Infoset
- Sniðin framsetning XML gagna: XSL-FO
- Skilgreining á aðferðinni eða aðgerðarhringingu dreifðra kerfa: XML-RPC
- Staðlaðir eiginleikar: XML Base og ID (DTD)
- Yfirlýst forritunarmál sem byggir á XML: MXML
tungumál
Í dag nota mörg formleg setningafræði XML. XML er nauðsynlegt tæki til að búa til opið upplýsingalandslag ( merkingarfræðilegan vef ) sem er skiljanlegt fyrir menn og vélar - eins og ætlað er af W3C.
Hið þekkta HTML-skjalamál var einnig samþætt í þetta hugtak sem „Extensible HyperText Markup Language“ (XHTML ) eftir útgáfu 4.01, þannig að það er nú byggt á XML sem grundvelli skilgreiningar. Algeng ástæða fyrir því að nota XML er fjöldi þátttakenda og einföld setningafræði: skilgreining SGML samanstendur af 500 síðum, aðeins XML 26.
Eftirfarandi listar tákna nokkur af þessum XML tungumálum.
texti
- XSL-FO (textasnið)
- DocBook
- DITA
- XHTML (XML-samhæft HTML)
- TEI (Text Encoding Initiative)
- NITF (texta snið fréttaiðnaðar )
- OPML (Outline Processor Markup Language)
- OSIS (Open Scripture Information Standard)
grafík
- SVG (vektor grafík)
- X3D (3D líkan tungumál)
- Collada ( skiptisnið fyrir gögn milli mismunandi 3D forrita)
Landfræðileg gögn
- Landafræði merkingarmál (GML)
- GPS Exchange Format (GPX): XML fyrir GPS gögn
- Keyhole Markup Language (KML): Samhæfingarlýsing fyrir Google Earth
- City Landafræði merkingarmál (CityGML)
- OpenStreetMap (OSM)
- Skiptaviðmót (NAS) sem byggir á stöðlum
margmiðlun
- MEI (Music Encoding Initiative)
- MusicXML ( nótnagögn , hljóðrituð tónlist)
- SMIL (samstillt í tíma, margmiðlunarefni)
- MPEG-7 (MPEG-7 lýsigögn)
- Laszlo (LZX)
öryggi
- Language Assertion Markup Language (lýstu og sendu öryggistengdar upplýsingar)
- XML undirskrift (XML merki fyrir stafrænar undirskriftir )
- XML dulkóðun
Verkfræði
- AutomationML , snið til að geyma kerfisskipulagsgögn
- CAEX , snið til að geyma stigveldisupplýsingar
- GSDML, snið til að lýsa sjálfvirkni tæki sem geta haft samskipti við Profinet
- IODD , snið til að lýsa skynjara og stýrikerfum
- PLMXML, snið til að lýsa vörugögnum sem hluta af Siemens PLM hugbúnaðinum [4]
- LandXML, snið til að geyma landfræðilega hluti
- RTML (Remote Telescope Markup Language), snið til að lýsa stjarnfræðilegum beiðnum um athuganir [5]
Ennfremur
Að auki eru til XML tungumál fyrir vefþjónustu (t.d. SOAP , WSDL og WS- * ), fyrir samþættingu Java kóða í XML skjölum ( XSP ), til að samstilla dagatal gögn SyncML , stærðfræðileg formúlur ( MathML ), Framsetning á línuritum ( GraphML ), verklagsreglur á sviði merkingarvefsins ( RDF , OWL , Topic Maps , UOML ), þjónustuveiting ( SPML ), skipti á skilaboðum ( XMPP ) eða fjárhagsskýrslum eins og ársreikningi ( XBRL ) , á sviðum bifreiðaiðnaðar ( ODX , MSRSW , AUTOSAR sniðmát, QDX , JADM , OTX ), sjálfvirk próf t.d. B. frá hringrásum ( ATML ) í kerfislíffræði ( SBML ) og landbúnaði ( AgroXML ) til útgáfu ( ONIX ) eða efnafræði (CIDX) og margt fleira.
Samantekt á XML tungumálum fyrir Office forrit er að finna á OpenDocument skiptasniðinu ( OASIS Open Document Format fyrir Office forrit ).
Önnur snið
Fróðleikur
Linus Torvalds lýsti XML sem óhæfum sem merkingarmáli [6] (athugasemd nr. 19):
„XML er vitleysa. Í alvöru. Það eru engar afsakanir. XML er viðbjóðslegt að greina fyrir menn og það er hörmung að greina það jafnvel fyrir tölvur. Það er bara engin ástæða fyrir því að þessi hræðilega vitleysa sé til. “
bókmenntir
- Charles F. Goldfarb, Paul Prescod: XML Handbook . Markt und Technik, München [ua] 1999, ISBN 3-8272-9575-0 .
- Wiebke Möhr, Ingrid Schmidt: SGML og XML: Forrit og sjónarhorn . Springer-Verlag, Berlín / Heidelberg / New York [o.fl.] 1999, ISBN 3-540-65543-3 .
- Robert Eckstein: XML - stutt og gott . O'Reilly Verlag, Cambridge / Köln [o.fl.] 2000, ISBN 3-89721-219-6 .
- Henning Lobin: Upplýsingamódel í XML og SGML . Springer, Berlín 2000, ISBN 3-540-65356-2 .
- Michael Seeboerger-Weichselbaum: XML fyrir byrjendur . 2., endurskoðuð útgáfa. BHV hugbúnaður, Kaarst 2000, ISBN 3-8287-1018-2 .
- Elliotte Rusty Harold: XML -biblían. 2. uppfærð útgáfa. mitp, Bonn 2002, ISBN 3-8266-0821-6 .
- Stefan Mintert: XML & Co. W3C forskriftir fyrir skjal og gagna arkitektúr . Addison-Wesley, München 2002, ISBN 3-8273-1844-0 .
- Christine Kränzler: XML / XSL -... fyrir byrjendur í atvinnumennsku. fyrir bók og vef . Markt + Technik, München 2002, ISBN 3-8272-6339-5 .
- Frank Bitzer: XML í fyrirtækinu. Kynningarfundur fyrir upplýsingatæknistjórnun . Galileo Press, Bonn 2002, ISBN 3-89842-288-7 .
- Erik T. Ray: Inngangur að XML . O'Reilly, 2004, ISBN 3-89721-286-2 .
- Margit Becher: XML: DTD, XML-Schema, XPath, XQuery, XSLT, XSL-FO, SAX, DOM . W3L Verlag, Witten 2009, ISBN 978-3-937137-69-8 .
- Marco Skulschus, Marcus Wiederstein: XML: Staðlar og tækni . Comelio Medien, Berlín 2009, ISBN 978-3-939701-21-7 .
- Helmut Vonhoegen: Að byrja með XML. Núverandi staðlar: XML stef, XSL, XLink . 8. útgáfa. Rheinwerk, 2015, ISBN 978-3-8362-3798-7 .
Vefsíðutenglar
- World Wide Web Consortium í gegnum XML (ensku),
edition-w3c.de - Þýskar þýðingar fyrir XML og aðrar - Nákvæm útskýring á XML og námskeiðum fyrir ýmis XML tungumál
- Algengar spurningar um XML (algengar spurningar) - á ensku (sem stendur er engin þýsk þýðing)
- Tengillaskrá um efni XML á curlie.org (áður DMOZ )
- Upplýsingar um ýmsa XML tækni eins og XSLT, XPath, Schematron, XProc, WordML, XSL-FO
- XML greining
Einstök sönnunargögn
- ↑ Extensible Markup Language (XML) 1.0. w3.org, 10. febrúar 1998, í geymslu frá frumritinu 15. júní 2006 ; aðgangur 12. febrúar 2017 .
- ↑ Extensible Markup Language (XML) 1.0 (fimmta útgáfan). w3.org, 26. nóvember 2008, opnaður 12. febrúar 2017 .
- ↑ Characters. In: Extensible Markup Language (XML) 1.0 (Fifth Edition). 26. November 2008, abgerufen am 9. März 2019 (englisch).
- ↑ plm.automation.siemens.com
- ↑ Remote Telescope Markup Language (RTML), bibcode : 2006AN....327..751H
- ↑ Kommentar in Diskussion um XML als Markup-Sprache (06.03.2014) . ( plus.google.com [abgerufen am 10. April 2017]).