Inhaltsverzeichnis
Extensible Markup Language
Definition
Akronym: XML
- XML ist eine Sprache zur Beschreibung von strukturierten Daten und Dokumenten
- entwickelte sich zum neuen Standard für Datenaustausch, Publishing und Entwicklung von intelligenten Web-Agenten
- vielseitige Einsatzmöglichkeiten
- 1997 vom W3C als Standard verabschiedet
- Grundidee: Trennung von
- Dokumenteninhalt
- Strukturbeschreibung und
- Darstellungsinformation
Anwendungen für XML
- Datenbankinhalte lassen sich mit XML darstellen
- Verarbeitung semistrukturierter Daten
- XML sollte nicht verwendet werden, wenn Daten sehr einfach sind (z.B. Tabellen), dann sind einfachere Darstellungen meist effizienter
- Generierung und Auswertung mittels Programmen
Syntax
- 3 Bestandteile eines XML Dokuments: Prolog, DTD, Dokument-Instanz (Text)
- Jede Auszeichnung muss in spitze Klammern gesetzt werden
<Start-Tag>Elementinhalt</Ende-Tag>
<Elementname Attributname="Attributinhalt">Elementinhalt</Elementname>
- Prolog:
<?xml version="1.0" encoding="ISO-8859-1" standalone="yes|no"?> - Wohlgeformtheit – Dokument hält sich an die XML-Syntax
- Ein XML-Dokument besteht aus Prolog und mindestens einem Element
- Es gibt genau ein Wurzelelement
- Alle Elemente sind richtig verschachtelt
- Attributwerte stehen in einfachen oder doppelten Anführungszeichen
- ein Element darf nicht zwei Attribute mit gleichem Namen besitzen
- Kommentar beginnen und enden mit genau 2 Bindestrichen
<!-- Kommentar --> - Reservierte Zeichen werden über ihre Entities angegeben
- Valid – Dokument ist im Sinne einer DTD gültig (hält sich an die vorgegeben Struktur)
Sonderzeichen
Wie in HTML müssen auch in XML Sonderzeichen speziell formatiert werden. Die fünf Zeichen &, ', <, > und “ werden wie in HTML angegeben:
& & ' ' < < > > " "
Umlaute und das ß müssen aber so definiert werden:
Ä Ä Ö Ö Ü Ü ä ä ö ö ü ü ß ß