Viele Menschen glauben, dass eine URL nur ein Link oder eine Adresse für eine Webseite im Internet ist. Aber es steckt viel mehr dahinter. In diesem Artikel erkläre ich, was hinter dem Begriff URL steckt und wofür das Akronym steht.
Wie entstand die URL?
Hinter einer URL verbirgt sich eine Kombination aus verschiedenen Bestandteilen, bis hin zur Domain und IP-Adresse des Servers. Weil die Eingabe der IP-Adresse den Usern zu Problemen und Falscheingaben führte, suchte man Anfang der 1990er nach einer einfacheren und praktikableren Lösung.
Der Informatiker Tim Berners-Lee suchte nach einer einfacheren und benutzerfreundlicheren Methode, um den Zugriff auf Webseiten zu erleichtern, ohne lange Zahlenfolgen eintippen zu müssen. Im Dezember 1994 wurde deshalb der Standard RFC 1738 für das Schema einer URI veröffentlicht, der heute aber obsolet ist und durch andere RFC Definitionen abgelöst wurde. Da eine URL ein Subtyp einer URI ist, leitet sich dessen Schema als RFC Standard davon ab. Jede URL ist eine URI, aber nicht jede URI ist eine URL.
Was ist eine URL?
Der Begriff URL, oder „Uniform Resource Locator”, ist ein Standard, der es Internetnutzern ermöglicht, auf bestimmte Inhalte einer Webseite zuzugreifen. In der Alltagssprache sagt man oft „Link”, „Webadresse” oder „Internetadresse”, obwohl eigentlich die „URL” zu einer Seite gemeint ist. Hinter einem „Link” in einer Webseite ist dann immer ein URL zu einer anderen Seite definiert. Klicke ich also auf den Link so kann ich damit die URL zu einer anderen Seite aufrufen.
Genauso verhält es sich, wenn man in die Adresszeile eines Browsers etwas eingeben. Egal ob man http, https, ftp, mailto oder ein anderes Internetprotokoll verwendet, hier wird jedesmal eine URL eingegeben.
Woraus besteht eine URL?
Den Aufbau einer URL folgt einem klar definierten Schema und man kann dies in vier Bereiche unterteilen.
- Der erste Teil ist immer der Protokollname, gefolgt von einem Doppelpunkt (:). Er bestimmt, welches Netzwerkprotokoll für den Zugriff auf die Ressource verwendet werden soll. In den meisten Fällen wird dies das Netzwerkprotokoll http oder https sein. Möglich sind aber file, ftp oder mailto.
- Als zweiter Teil folgt nach dem Protokoll in der Regel die Domain. Sie gibt an, auf welchem Server sich die Ressource befindet. Hinter der Domain verbirgt sich immer die IP-Adresse des Servers, auf dem sich die Dateien der Webseite befinden. Normalerweise werden Webseiten vom Server über den Standard-Port 80 ausgeliefert. Sollte hier etwas anderes konfiguriert sein, befindet sich hinter dem Domainnamen (www.angelmedia.de) nach einem Doppelpunkt noch die Port-Angabe.
- Der dritte Teil ist der Pfad. Er gibt an, wo sich die Ressource auf dem Server befindet. Die Ressource kann entweder ein Verzeichnis und/oder eine Datei sein. (/pfad/dateiname.html). Sie kann auch aus mehreren Unterverzeichnissen bestehen.
- Der vierte Teil ist der Query String. Er wird verwendet, um zusätzliche Informationen an den Server zu übermitteln. (z.B. ?seite=1&kategorie=wissen)
Der dritte (Unterverzeichnisse/Dateiname) und vierte Teil (Query String) im Aufbau der URL sind optional. Eine URL kann auch nur aus Protokoll und Domain bestehen und auf die Startseite einer Webseite führen.
Was ist eine relative URL?
Eine relative URL enthält nur den Pfad zu einer Ressource. Das Protokoll und die Domain wird hier nicht angegeben. Relative URLs werden oft in HTML-Dateien verwendet. Wenn sich z. B. alle Bilddateien in einem eigenen Verzeichnis auf dem Server befinden, wäre es sehr zeitaufwändig, immer die vollständige URL eines Bildes in den HTML-Code eingeben zu müssen.
Der Vorteil von relativen URLs ist, dass derselbe HTML-Code auf verschiedenen Servern verwendet werden kann, ohne dass Änderungen vorgenommen werden müssen. Der Server bestimmt automatisch den Domänennamen und vervollständigt die URL.
Was ist eine absolute URL?
Eine absolute URL enthält sowohl den Domainnamen als auch den Pfad zu einer Ressource. Im Gegensatz zu relativen URLs sind absolute URLs immer vollständig und müssen vom Server nicht vervollständigt werden.
Absolute URLs werden oft in externen CSS- oder JavaScript-Dateien verwendet. Wenn sich diese Dateien auf einem anderen Server befinden, muss die vollständige URL angegeben werden, um die Datei korrekt zu laden.
Was ist eine sprechende URL?
Eine sprechende URL ist eine benutzerfreundliche und suchmaschinenoptimierte URL. Sie besteht nur aus kleinen Buchstaben von a-z, den Zahlen 0-9 und dem Bindestrich (-). Umlaute wie ä, ö, ü oder Zeichen wie & oder % werden in einer sprechenden URL nicht verwendet.
Die Struktur einer URL hat einen großen Einfluss darauf, wie gut eine Website von Suchmaschinen gefunden wird. Wenn die URL relevante Keywords enthält, kann sich das positiv auf das Ranking in der Suche auswirken.
Auch wenn Google in der Lage ist, mehrere Hundert Zeichen in der URL zu verstehen ist weniger hier besser und die URL sollte so kurz wie möglich gehalten werden.
Was ist eine statische URL?
Eine statische URL ist eine URL, die sich nicht ändert. Sie führt immer zum gleichen Inhalt oder Dokument im Internet, unabhängig davon, wann sie aufgerufen wird.
Statische URLs werden oft für Dateien verwendet, die sich nicht häufig ändern. Beispiele hierfür sind URLs zu einem PDF oder zu Bilder. Sie sind auch für die Suchmaschinenoptimierung vorteilhaft, da sie Schlüsselwörter enthalten, die den Inhalt der Seite beschreiben.
Was ist eine dynamische URL?
Eine dynamische URL ist eine URL, die sich jedes Mal ändert, wenn sie aufgerufen wird. Sie enthält oft Parameter, die an den Server übergeben werden und die bestimmen, welche Inhalte angezeigt werden.
Dynamische URLs werden häufig für Seiten verwendet, die je nach Nutzer unterschiedliche Inhalte anzeigen. Ein Beispiel hierfür wäre eine Suchergebnisseite. Für die Suchmaschinenoptimierung sind sie jedoch nicht so vorteilhaft, weil die Parameter es den Suchmaschinen erschweren können, die Seite zu indexieren.
Was ist eine verschlüsselte URL?
Eine verschlüsselte URL ist eine besondere Form einer absoluten URL. In diesem Fall werden bestimmte Zeichen durch sogenannte Escape-Sequenzen ersetzt. Diese Escape-Sequenzen werden verwendet, um sicherzustellen, dass bestimmte Zeichen in einer URL vom Browser immer richtig interpretiert werden.
Wenn zum Beispiel ein Leerzeichen in einer URL vorkommt, muss es durch %20 ersetzt werden. Andernfalls würde der Browser das Leerzeichen als Befehl zum Beenden der URL interpretieren. Für die Suchmaschinenoptimierung sind URLs mit solchen Zeichen aber nicht optimal und sollten vermieden werden.