|

|
Die Hypertext Markup Language (HTML, engl. Hypertext-Auszeichnungssprache), oft auch kurz als Hypertext bezeichnet, ist eine textbasierte Auszeichnungssprache zur Darstellung von Inhalten wie Texten, Bildern und Hyperlinks in Dokumenten. HTML-Dokumente sind die Grundlage des World Wide Web und werden von einem Webbrowser dargestellt. Neben den vom Browser angezeigten Inhalten einer Webseite enthält HTML auch zusätzliche Angaben in Form von Metainformationen, die z. B. über die im Text verwendete Sprache oder den Autor Auskunft geben oder den Inhalt des Textes zusammenfassen. Die Auszeichnungssprache wurde vom World Wide Web Consortium (W3C) bis Version 4.01 weiterentwickelt und soll nun durch XHTML ersetzt werden.
Zur Adressierung anderer Dokumente im Internet werden innerhalb des Dokumentes Hyperlinks verwendet. Dies ist die Grundlage für das World Wide Web. Namen gebend sind die Hypertext-Elemente, die zum Verweis auf andere Textstellen oder auf ein anderes Dokument dienen. Die Programme, die die Struktur des Dokuments interpretieren und als formatierte Webseiten darstellen, werden Webbrowser genannt.
Dem Text wird durch Auszeichnung (engl. markup) von Textteilen mit in der Regel paarweisen (öffnenden und schließenden) Tags eine Struktur verliehen. Ein Tag beginnt immer mit dem Zeichen < (kleiner als) an. Es folgt eine entsprechende Buchstabenfolge und, wenn man keine Attribute verwendet, hört er nach einem > (größer als) wieder auf. Die jeweils zusammengehörenden Tags bilden zusammen mit dem dazwischenliegenden Text (Inhalt) ein Element. Diese Elemente lassen sich nach Regeln, die in einer Dokumenttypdefinition (DTD) angegeben sind, verschachteln: Ein Textabsatz, der ein betontes Wort enthält.
Ohne Attribute können einige Tags auch ausgelassen werden (z. B. /, /, /), bei manchen nur der schließende Tag (). Zum Vergleich: In XML muss auf alle Starttags ein schließender Endtag auf gleicher Ebene folgen. Diese Regel gilt auch in der Definition von XHTML, sodass der schließende Tag hier nicht weggelassen werden kann.
Neben Elementen mit Start- und End-Tag gibt es in HTML auch leere Elemente, wie etwa Zeilenumbrüche oder Bilder. Eine Textzeile, die hier fortgesetzt wird.
Es geht in HTML um so genannte beschreibende, nicht um verfahrens- und darstellungsorientierte Textauszeichnung, auch wenn sich HTML in früheren Versionen dafür verwenden ließ. Das heißt, HTML-Tags sind keine Angaben zur Präsentation, die dem Webbrowser mitteilen, wie er den Text (zwischen den Tags) visuell zu formatieren hat. Vielmehr sind Tags eine strukturierende Auszeichnung, mit der sich Textbereichen eine Bedeutung zuordnen lässt, z. B. … für eine Überschrift, … für einen Textabsatz und … für betonten Text. Wie diese Bedeutung letztlich dem Benutzer vermittelt wird (im Falle einer Überschrift z. B. durch vergrößerte, fette Schrift), ist zunächst dem Webbrowser überlassen und hängt von der Ausgabe-Umgebung ab. Denn obwohl HTML-Dokumente in der Regel auf Computerbildschirmen dargestellt werden, können sie auch auf anderen Medien ausgeben werden, etwa auf Papier oder mittels Sprachausgabe.
Um auf die Präsentation eines HTML-Dokuments in verschiedenen Medien Einfluss zu nehmen, eignen sich CSS-Formatvorlagen. Daher gelten Elemente und Attribute zur Präsentation wie …, … und width als veraltet und sollten nach allgemeiner Auffassung vermieden werden. Die meisten Elemente und Attribute zur Präsentation wurden in der HTML-4.01-Spezifikation als missbilligt (engl. deprecated) markiert.
Wer diesen so genannten Quelltext auf Webseiten ansehen möchte, kann dafür in den meisten Browsern die Funktion „Quelltext anzeigen“ oder „show source“ wählen. Der Browser öffnet dann ein neues Fenster und zeigt das HTML-Dokument so, wie er es vom Server empfangen hat.
HTML ist keine Seitenbeschreibungssprache wie etwa Postscript, da keine Papier-Seiten beschrieben werden, sondern Text strukturell und logisch ausgezeichnet wird. HTML ist eine Auszeichnungssprache und wird als solche auch nicht programmiert, sondern schlicht geschrieben.
Ein ähnliches Konzept (logische Beschreibung) wie hinter HTML steht hinter dem Satzsystem TeX/LaTeX, das im Unterschied zu HTML jedoch auf die Ausgabe per Drucker auf Papier zielt.
zurück
|