Erste Schritte

Herzlich willkommen bei Dr. Link Check! Unser Online-Dienst prüft Websites schnell und zuverlässig auf kaputte und potenziell schädliche Links. Wenn ein Link Deiner Website nicht mehr funktioniert oder auf gefährliche Inhalte verweist, erfährst Du mit Dr. Link Check als Erstes davon und kannst das Problem rasch beheben.

Der Einstieg ist simpel: Ruf die Startseite auf, gib die Adresse Deiner Website ein und klicke auf Starte Check.

Check starten

Du wirst automatisch zum Überlick-Report weitergeleitet, wo Du den Fortschritt beobachten kannst, während unser Crawler sich durch die Website arbeitet und die gefundenen Links auf Funktionstauglichkeit untersucht.

Wenn Du nicht bereits eingeloggt warst, wurde im Hintergrund ein neues Konto mit dem kostenlosen Lite-Paket für Dich angelegt. Dieses Konto ist temporär und wird gelöscht, sobald Du Dich wieder abmeldest – sofern Du das Konto nicht vervollständigst, indem Du Name, E-Mail-Adresse und Passwort angibst.

Konto

Mit E-Mail-Adresse und Passwort kannst Du Dich jederzeit rechts oben über den Menüeintrag Login bei Dr. Link Check einloggen.

Solltest Du Dein Passwort vergessen, lass es über diesen Link zurücksetzen.

Um nach dem Login Deine Kontodaten zu prüfen oder anzupassen, klicke rechts oben in der Leiste auf Konto und wähle den Menüeintrag Kontoeinstellungen.

Kontomenü

Ein vollständiges Konto erfordert die Angabe von Vor- und Nachname, einer E-Mail-Adresse sowie eines Passwortes mit mindestens sechs Zeichen.

Bitte beachte, dass eine Änderung der E-Mail-Adresse nicht automatisch auch den Rechnungskontakt (siehe Vertragseinstellungen) aktualisiert.

Vertrag

Dein Vertrag legt fest, welche Funktionen Dir zur Verfügung stehen und wie viele Links pro Website gecheckt werden können.

Einen Kurzüberblick über den Umfang Deines Vertrag findest Du unten links in der Seitenleiste. Dort werden Dir das aktuell gewählte Paket und die Höchstzahl an Links angezeigt.

Vertragsdetails

Durch einen Klick auf das Schraubenschlüsselsymbol öffnet sich der Vertragseinstellungen-Dialog. Hier kannst Du Deine Vertragsleistungen anpassen, den Vertrag kündigen oder Deine Zahlungsinformationen aktualisieren.

Vertragseinstellungen

Wenn Du auf ein teureres Paket umsteigst, wird Dein Vertrag unmittelbar angepasst und Dir die Preisdifferenz in Rechnung gestellt. Der Wechsel in ein kleineres Paket oder eine Kündigung werden erst zum Ende des laufenden Abrechnungszyklus wirksam. Nach einem Klick auf Vertrag kündigen steht Dir also bis zum Ende der Vertragslaufzeit weiterhin der volle Funktionsumfang zur Verfügung.

Sämtliche Zahlungen werden von unserem Partner Paddle abgewickelt und können per Kreditkarte oder PayPal erfolgen.

Wenn Du den Rechnungskontakt für Deinen Vertrag anpassen möchtest, schick uns bitte eine kurze Nachricht. Aufgrund technischer Einschränkungen im Bestellsystem von Paddle kann eine Änderung der E-Mail-Adresse leider nicht automatisch erfolgen, sondern muss von uns manuell vorgenommen werden.

Projekt

Ein Projekt umfasst die Einstellungen und Prüfergebnisse für eine bestimmte Website.

Der Name des aktuellen Projekts wird oben in der Seitenleiste angezeigt. Durch einen Klick öffnet sich das Projektmenü, über das Du zwischen verschiedenen Projekten wechseln kannst.

Projektmenü

Um ein neues Projekt zu erstellen (und einen neuen Check zu starten), klicke auf das +-Symbol am oberen Rand der Seitenleiste.

Projekt anlegen

Projekteinstellungen

Du kannst die folgenden Einstellungen für Dein Projekt vornehmen:

Neues Projekt

  • Zu überprüfende URL: Die hier eingetragene Adresse bildet den Ausgangspunkt für den Check. Bei Bedarf kannst Du auch mehrere URLs (jeweils eine pro Zeile) angeben – die Größe des Eingabefelds passt sich automatisch an und erlaubt die Eingabe von bis zu 10.000 URLs.
  • Zu crawlende URLs: Diese Einstellung bestimmt, welche URLs als „intern“ gelten und Deiner Website zugerechnet werden. Nur interne Links werden von unserem Crawler weiterverfolgt und die verlinkten Dokumente nach neuen Links durchforstet.
    • Bei gleicher Root-Domain (*.beispiel.de/*): Eine URL wird dann gecrawlt, wenn sie die gleiche Root-Domain hat wie die Start-URL (oder eine der Start-URLs, falls es mehrere gibt). Hast Du beispielsweise https://www.beispiel.de/ als Start-URL angegeben, gilt https://subdomain.beispiel.de/ als Teil Deiner Website, da beide URLs die Root-Domain beispiel.de enthalten. Mit dieser Option liegst Du richtig, wenn Du eine komplette Website einschließlich aller Subdomains prüfen lassen möchtest.
    • Bei gleicher Domain (www.beispiel.de/*): Eine URL wird dann gecrawlt, wenn sie die gleiche Domain (bzw. den gleichen Hostnamen) hat wie die Start-URL (oder eine der Start-URLs, falls es mehrere gibt). Hast Du beispielsweise https://www.beispiel.de/ als Start-URL angegeben, gilt https://subdomain.beispiel.de/ als ausgehender Link und wird dementsprechend zwar geprüft, jedoch nicht nach weiteren Links durchforstet.
    • Bei gleichem Verzeichnis (www.beispiel.de/verzeichnis/*): Eine URL wird dann gecrawlt, wenn sie die gleiche Domain hat und denselben Verzeichnispfad aufweist wie die Start-URL (oder eine der Start-URLs, falls es mehrere gibt). Hast Du beispielsweise https://www.beispiel.de/pfad/zu/seite1.html als Start-URL angegeben, gilt https://www.beispiel.de/pfad/zu/seite2.html als intern, https://www.beispiel.de/index.html jedoch als ausgehend.
    • Bei gleicher URL (www.beispiel.de/verzeichnis/seite.html): Lediglich die angegebenen Start-URLs werden gecrawlt. Unser Crawler prüft also alle Start-URLs und alle direkt in den Startseiten gefundenen Links.
    • Keine: Es werden keine URLs gecrawlt. Unser Crawler prüft die angegebenen Start-URLs, sucht jedoch nicht nach weiterführenden Links. Diese Option ist die richtige Wahl, wenn Du eine Liste mit verschiedenen URLs hast und herausfinden möchtest, welche davon funktionieren.
    • Benutzerdefinierte Regel: Wähle diese Option, um anhand einer eigenen Regel festzulegen, welche URLs unser Crawler als „intern“ ansehen und nach weiteren Links durchsuchen soll. Beispiele und Informationen zum Aufbau einer solchen Regel findest Du weiter unten.
  • Häufigkeit des Checks: Legt fest, wie oft der Check ausgeführt bzw. wiederholt wird.
    • Einmalig: Der Check wird einmalig ausgeführt und anschließend nicht automatisch wiederholt.
    • Regelmäßig: Der Check wird direkt nach Anlegen des Projekts ausgeführt und dann monatlich, 14-tätig, wöchentlich oder täglich automatisch wiederholt.
    • Monatliche und 14-tätige Checks erfordern mindestens das Standard-Paket
    • Wöchentliche Checks erfordern mindestens das Professional-Paket
    • Tägliche Checks sind ausschließlich im Premium-Paket verfügbar

Zusätzliche Möglichkeiten zur Konfiguration des Projekts findest Du unter Erweiterte Einstellungen:

  • Projektname: Die Bezeichnung des Projekts, die in der Seitenleiste und im Überblick-Report angezeigt wird. Lässt Du dieses Feld leer, generiert Dr. Link Check den Projektnamen automatisch aus der (ersten) angegebenen Start-URL.
  • Allow/Disallow-Regeln der robots.txt-Datei befolgen?: Websites nutzen häufig eine Datei namens robots.txt, um Suchmaschinen-Bots und anderen Crawlern Anweisungen zu geben. Falls eine Website eine robots.txt-Datei besitzt, wertet unser Crawler diese aus und sucht nach Disallow- und Allow-Regeln für „Googlebot“ (der Webcrawler von Google) und „“ (Platzhalter für sonstige Crawler). Verbieten die Regeln sowohl für „Googlebot“ als auch für „“ den Zugriff auf einen bestimmten internen Link, wird dieser vom Check ausgeschlossen. Die Start-URL(s) und externe Links (die auf fremde Websites verweisen) werden jedoch immer überprüft, unabhängig vom Inhalt der robots.txt-Datei. Sonstige Anweisungen, wie beispielsweise Crawl-delay und Sitemap, unterstützt der Crawler momentan nicht. Möchtest Du eine Website ohne Berücksichtigung der robots.txt-Datei prüfen lassen, aktiviere die Option Ignoriere robots.txt.
  • Links ignorieren, wenn …: Eine Regel, die festlegt, welche Links ignoriert und somit nicht geprüft werden sollen. Wenn Du keine Regel angibst, werden alle gefundenen Links überprüft. Details zur Regelsyntax, einschließlich konkreter Beispiele, findest Du im nächsten Abschnitt.
  • Ergebnisse des regelmäßigen Checks senden an …: Diese Einstellung bezieht sich nur auf Projekte, bei denen als Häufigkeit des Checks die Option Regelmäßig ausgewählt wurde. Für jeden planmäßig ausgeführten Check schickt Dr. Link Check eine Zusammenfassung der Ergebnisse an die dort aufgelisteten E-Mail-Adressen. Soll die E-Mail an mehrere Empfänger gesendet werden, gib die Empfängeradressen durch Kommata getrennt an.
    • Wenn Du nicht über Checks informiert werden möchtest, bei denen keine problematischen Links gefunden wurden, aktiviere die Option Nur senden, wenn Probleme gefunden wurden.

Crawl- und Ignorierregeln

Eine einfache Crawl- oder Ignorierregel ist wie folgt aufgebaut:

<Eigenschaft> <Vergleichsoperator> <Wert>

Als <Eigenschaft> sind folgende Schlüsselwörter möglich:

  • Url: Die vollständige URL des Links
  • Scheme: Das Schema der URL, beispielsweise "https" oder "mailto"
  • Host: Die Host-Komponente der URL, beispielsweise "beispiel.de" oder "www.beispiel.de"
  • Port: Der Port der URL als Zahlenwert, beispielsweise 80 oder 443
  • Path: Der absolute Pfad der URL, beispielsweise "/pfad/zur/seite" oder "/"
  • Query: Der Query-String der URL, einschließlich des vorangestellten Fragezeichens, beispielsweise "?name=frettchen&farbe=lila"
  • PathAndQuery: Die Kombination aus Pfad und Query-String der URL, beispielsweise "/pfad/zur/seite?name=frettchen&farbe=lila"
  • HtmlElement: Ein CSS-ähnlicher Selektor zur Identifizierung des HTML-Tags eines Links, beispielsweise "div.sidebar > a" (weitere Informationen findest Du in diesem Blog-Post)
  • LinkDepth: Die Entfernung des Links von der Start-URL, also 0 für die Start-URL selbst, 1 für direkt auf der Startseite gefundene Links, 2 für auf von der Startseite verlinkten Seiten gefundene Links, etc.
  • LinkType: Die Art des Links (Aufzählungswert)
    • Ahref: Standard-Link, typischerweise in der Form <a href="URL">Link>/a>
    • ImgSrc: Link zu einem eingebetteten Bild, typischerweise in der Form <img src="URL">
    • LinkStylesheet: Link zu einer CSS-Datei in der Form <link href="URL" rel="stylesheet">
    • ScriptSrc: Link zu einer externen Skriptdatei in der Form <script src="URL">>/script>
    • MetaRefresh: Link, zu dem per Meta Refresh (<meta http-equiv="refresh" content="0; url=URL">) umgeleitet wurde
    • FrameSrc: Link zu einem per frame (<frame src="URL">) oder iframe (<iframe src="URL">) in die Seite eingebetteten Dokument
    • SocialMetaTag: Link, der in einem Open Graph (Facebook) oder Twitter Card Meta-Tag gefunden wurde
    • CssImport: Link zu einer CSS-Datei, die per @import von einer anderen CSS-Datei eingebunden wurde
    • CssUrl: Link zu einer Datei, die von einem CSS-Dokument mittels url(…) eingebunden wurde
    • JavaScriptLocation: JavaScript-Anweisung, die zu einer neuen Adresse umleitet
    • JavaScriptOpen: open(…) JavaScript-Anweisung, die eine URL in einem neuen Browserfenster öffnet
    • RobotsTxtSitemap: Link zur einer XML-Sitemap, der in einer robots.txt-Datei gefunden wurde
    • SitemapLoc: Link, der in einer XML-Sitemap-Datei gefunden wurde
    • Other: Der Link wurde an nicht näher spezifizierter Stelle im Code gefunden
  • NoFollow: Gibt an, ob der Link über ein rel="nofollow"-Attribut verfügt (Boolean-Wert)

Unterstützte <Vergleichsoperator>en sind:

  • =: Ist gleich
  • !=: Ist ungleich
  • CONTAINS: Enthält Zeichenkette
  • STARTSWITH: Beginnt mit Zeichenkette
  • ENDSWITH: Endet mit Zeichenkette
  • >: Ist größer als
  • <: Ist kleiner als
  • >=: Ist größer oder gleich
  • <=: Ist kleiner oder gleich

<Value> kann entweder eine in doppelte Anführungszeichen gesetzte Zeichenkette ("beispiel") oder eine Zahl (123) sein.

Damit lassen sich zum Beispiel folgende einfache Regeln konstruieren:

Scheme = "https"

Url STARTSWITH "https://www.beispiel.de/pfad/"

Path ENDSWITH ".html"

Port = 81

HtmlElement = "img"

LinkDepth > 2

Mit Hilfe von logischen Operatoren (AND, OR) und Klammern kannst Du Ausdrücke zu komplexeren Regeln zusammensetzen:

(Host = "beispiel.de" OR Host ENDSWITH ".beispiel.de") AND Path STARTSWITH "/pfad/"

Das Voranstellen von NOT negiert einen Ausdruck:

NOT (Path ENDSWITH ".png" OR Path ENDSWITH ".jpg" OR Path ENDSWITH ".gif")

Check neu starten

Wenn Du eine Website noch einmal prüfen lassen möchtest, musst Du dafür kein neues Projekt anlegen. Öffne stattdessen einfach den Überblick-Report und klicke auf Check neu starten.

Check neu starten

Projekt löschen

Dein Vertrag umfasst eine begrenzte Zahl an Projekten. Wenn Du diese Zahl erreichst, kannst Du entweder in ein höheres Paket wechseln oder eines des bestehenden Projekte löschen.

Um ein Projekt zu löschen, öffne das Projektmenü links oben in der Seitenleiste, bewege den Mauszeiger zum entsprechenden Eintrag und klicke dann auf das Papierkorbsymbol.

Projekt löschen

Reports

Über die Seitenleiste am linken Rand hast Du Zugriff auf folgende Berichte.

Überblick-Report

Der Überblick-Report liefert Dir eine Zusammenfassung der Ergebnisse des Checks.

Überblick-Report

  • Links gesamt: Die Gesamtzahl unterschiedlicher URLs, die während des Checks gefunden wurde.
  • Links mit Problemen: Die Anzahl aller nicht funktionieren, unsicheren oder auf andere Weise fehlerhaften Links. Du solltest Dir zum Ziel setzen, diese Zahl auf null zu senken.
  • Neue Links: Die Anzahl der im Vergleich zum letzten Check zusätzlich gefundenen Links. Dieser Wert ist erst dann verfügbar, wenn ein Check ein zweites Mal ausgeführt wurde.
  • Probleme: Eine Aufschlüsselung der Links nach Fehlertyp.
  • Arten von Links: Eine Aufschlüsselung anhand der Art und Weise, wie die URLs im HTML- oder CSS-Code verlinkt sind.
  • Top-Hosts: Eine Aufschlüsselung der Links anhand der Hosts (Domainnamen oder IP-Adressen).
  • URL-Schemas: Eine Aufschlüsselung der Links nach URL-Schema (dem Teil der URL vor dem Doppelpunkt, wie beispielsweise http, https oder tel).
  • Weitergeleitete Links: Eine Aufschlüsselung weitergeleiteter URLs nach Art der Weiterleitung.
    • Permanente HTTP-Weiterleitung: Weiterleitungen mit HTTP-Statuscodes 301 und 308. Im Falle einer permanenten Weiterleitung empfiehlt es sich, den Link direkt auf die neue URL zu aktualisieren. Dies reduziert die Anzahl notwendiger HTTP-Requests und mindert die Gefahr, dass ein Link später einmal nicht mehr zum gewünschten Ziel führen wird.
    • Temporäre HTTP-Weiterleitung: Weiterleitungen mit HTTP-Statuscodes 302, 303 und 307.
    • HTTP Refresh-Weiterleitung: Weiterleitungen mittels Refresh-HTTP-Header.
    • Meta Refresh-Weiterleitung: Weiterleitungen per Meta-Refresh-Tag im HTML-Code.
    • JavaScript-Weiterleitung: Per JavaScript-Code ausgelöste Weiterleitungen.
    • Frame-Weiterleitung: Weiterleitungen, bei der die Zielseite als Frame eingebettet wurde.
  • Dofollow/Nofollow: Eine Aufschlüsselung der Links danach, ob sie als nofollow gekennzeichnet sind oder nicht. Das Attribut rel="nofollow" weist Suchmaschinen an, einem Link beim Ranking keine Bedeutung beizumessen.

Durch einen Klick auf einen der Einträge gelangst Du zum Detailbericht mit den entsprechenden Links.

Link-Reports

Dr. Link Check stellt Dir verschiedene tabellarische Berichte zur Verfügung, um die gefundenen Links nach unterschiedlichen Kriterien zu filtern.

  • Alle Links: Alle auf der Website gefundenen Links.
  • Probleme
    • Alle Probleme: Alle nicht funktionierenden, unsicheren oder auf andere Weise fehlerhaften Links.
    • Nicht funktionierend: Kaputte Links, die beispielsweise auf nicht mehr existierende Seiten verweisen.
    • Unsicher: Gefährliche Links, die „geblacklistet“ sind, da sie auf Phishing- oder Malware-Seiten verweisen.
    • Soft Errors: Links, bei denen der Server zwar mit 200 OK geantwortet hat, die jedoch basierend auf dem Seiteninhalt als fehlerhaft eingeschätzt wurden.
  • Ausgehend: Links zu externen Seiten.
  • Neu: Seit dem letzten Check neu hinzugekommene Links.
  • Nicht unterstützt: Links, die nicht geprüft werden konnten, da sie ein anderes URL-Schema als http, https, data oder mailto verwenden.
  • Blockiert: Links, die nicht geprüft werden konnten, da der Zielserver die Anfrage blockiert hat.

Die Berichte setzen sich aus zwei Spalten zusammen:

  • Ergebnis: Der aktuelle Status des Links (In Warteschlage, Wird gecheckt …, etc.) oder das Ergebnis des Checks (OK, 404 Not found, etc.). Wenn Du den Mauszeiger über den Ergebnistext bewegst, wird Dir eine kurze Erläuterung in einem Tooltip angezeigt.
  • URL: Die absolute URL des Links. Diese URL ist nicht zwangsläufig in dem Format, in dem sie ursprünglich im Quellcode gefunden wurde. Relative URLs (wie beispielsweise ../seite2.html) werden in vollständige absolute URLs mit Schema (https://www.beispiel.de/seiten/seite2.html) umgewandelt. Zudem werden URL-Fragmente (#fragment) entfernt.
    • Neben der URL findest Du gegebenenfalls Kennzeichnungen wie Start-URL oder Ausgehend. Fahre mit dem Mauszeiger über eine solche Kennzeichnung, um Dir eine Erklärung in einem Tooltip anzeigen zu lassen.
    • Verlinkt von liefert Dir die Information, in welchem Dokument der Link zuerst gefunden wurde.

Link-Details

Indem Du den Mauszeiger zu einem Eintrag im Link-Report bewegst und auf Details klickst, kannst Du weitere Informationen zu dem betreffenden Link abrufen. Diese beinhalten beispielsweise die verlinkenden Seiten und sämtliche URLs der Weiterleitungskette, falls vorhanden.

Link-Details

Wurde beim Funktionscheck ein Fehler festgestellt, liefert Dir ein Klick auf die Fehlermeldung weitere Informationen, einschließlich Tipps zur Behebung des Problems.

Ein Klick auf Quelle neben einem der Einträge unter Verlinkt von zeigt Dir, wo genau Dr. Link Check den aktuellen Link im Code gefunden hat. In einem separaten Fenster werden der vom Server abgerufene Quellcode dargestellt und die Fundstellen des Links farblich hervorgehoben.

Über den kleinen Pfeil neben der Quelle-Schaltfläche gelangst Du zum Menüeintrag Quelllink anzeigen. Hierüber kannst Du Dir die Details der verlinkenden Seite anzeigen lassen. Diese Funktion ist insbesondere dann nützlich, wenn Du nachvollziehen möchtest, wie unser Crawler zu einem bestimmten Link gelangt ist – Link für Link kannst Du den Pfad durch die Website bis zur Startseite zurückverfolgen.

Filter

Um lediglich diejenigen Links anzeigen zu lassen, die für Dich von Interesse sind, kannst Du die Filterfunktion von Dr. Link Check nutzen. Diese Funktion ist äußerst vielseitig einsetzbar, beispielsweise für folgende Reports:

  • Report aller E-Mail-Adresslinks auf Deiner Website
  • Report aller internen Links, die einen 5xx-Serverfehler auslösen
  • Report aller ausgehenden Links, die permanent zu einer neuen Adresse umgeleitet werden
  • Report aller ausgehenden Links, die „Dofollow“ sind
  • Report aller URLs innerhalb eines bestimmten Pfades Deiner Website
  • Report aller von externen Servern geladenen JavaScript-Dateien

Um einen Filter zu erstellen, klicke auf Hinzufügen in der Filter-Leiste oberhalb der Ergebnistabelle und wähle eines der Filterkriterien:

  • Problem: Filtere nach Links, die nicht funktionieren, als unsicher markiert sind und/oder auf einen Soft Error hindeuten
  • URL: Filtere nach Links, deren URLs einem Suchtext entsprechen oder ihn enthalten
  • Schema: Filtere Links basierend auf ihrem URL-Schema (wie beispielsweise "https" oder "mailto")
  • Host: Filtere Links nach ihrem Hostnamen ("www.beispiel.de")
  • Pfad: Filtere Links basierend auf dem in der URL verwendeten Pfad (wie etwa "/pfad/zur/seite")
  • Link-Tiefe: Filtere Links basierend auf ihrer Entfernung von der Start-URL (0 für die Start-URL selbst, 1 für direkt auf der Startseite gefundene Links, 2 für auf von der Startseite verlinkten Seiten gefundene Links, etc.)
  • Richtung: Filtere nach internen oder ausgehenden Links
  • Neu/alt: Filtere nach Links, die der Website seit dem letzten Check neu hinzugefügt wurden
  • Geändert/unverändert: Filtere nach Links, bei denen das verlinkte Dokument seit dem letzten Check aktualisiert wurde
  • Weiterleitung: Filter nach der Art und Weise, wie Links zu einer neuen Adresse weiterleiten
  • Art des Links: Filtere Links basierend darauf, wo genau sie im Code gefunden wurden (<a href>, <img src>, etc.)
  • Dateityp: Filtere Links anhand des Typs der verlinkten Datei (HTML, Bild, CSS, etc.)
  • Nofollow/Dofollow: Filtere nach Links mit dem Attribut rel="nofollow" (welches Suchmaschinen anweist, den Link beim Ranking der Zielseite zu ignorieren)
  • robots.txt-Status: Filtere nach internen Links, die von Crawlern aufgrund der robots.txt-Datei eigentlich ignoriert werden sollten
  • Ergebnis des Funktionschecks: Filtere Links danach, ob sie als funktionierend oder nicht funktionierend erkannt wurden
  • HTTP-Statuscode: Filtere http://- und https://-Links nach dem HTTP-Statuscode, den der Zielserver generiert hat

Filter

Wenn Du mehrere Filterkriterien hinzufügst, werden nur diejenigen Links angezeigt, die sämtlichen Kriterien entsprechen. Um einen Teil des Filters zu entfernen, klicke auf das neben dem entsprechenden Eintrag dargestellte x-Icon.

Eigene Filterregeln

Anstatt einen Filter per Mausklick zu erzeugen, kannst Du die Filterregel auch in Textform angeben. Dieses Features richtet sich an fortgeschrittene Benutzer und ermöglicht die Definition von Filtern, die sich über die normale Benutzeroberfläche nicht abbilden lassen. Den Texteingabemodus aktivierst Du über einen Doppelklick auf eine freie Stelle in der Filterleiste.

Filterregel

Eine einfache Filterregel ist wie folgt aufgebaut:

<Eigenschaft> <Vergleichsoperator> <Wert>

<Eigenschaft> kann dabei eines der folgenden Schlüsselwörter sein:

  • Url: Die vollständige URL des Links (als Zeichenkette)
  • Scheme: Das Schema der URL, beispielsweise "https" oder "mailto" (Zeichenkette)
  • Host: Die Host-Komponente der URL, beispielsweise "beispiel.de" oder "www.beispiel.de" (Zeichenkette)
  • Port: Der Port der URL als Zahlenwert, beispielsweise 80 oder 443 (Zahlenwert)
  • Path: Der absolute Pfad der URL, beispielsweise "/pfad/zur/seite" oder "/" (Zeichenkette)
  • Query: Der Query-String der URL, einschließlich des vorangestellten Fragezeichens, beispielsweise "?name=frettchen&farbe=lila" (Zeichenkette)
  • Status: Der aktuelle Prüfstatus des Links (als einer der folgenden Aufzählungswerte)
    • Queued: Der Link befindet sich in der Warteschlange und wird in Kürze geprüft
    • InProgress: Der Link wird gerade geprüft
    • Checked: Die Überprüfung des Links wurde erfolgreich abgeschlossen
    • Unsupported: Der Link konnte nicht geprüft werden, da die URL ein nicht unterstütztes Schema aufweist (wie beispielsweise „tel“ in „tel:+1-555-1234567“)
    • Aborted: Die Überprüfung des Links wurde vorzeitig abgebrochen
    • Failed: Bei der Überprüfung des Links ist ein unerwarteter Fehler aufgetreten
    • Blocked: Die Überprüfung des Links konnte nicht vollständig abgeschlossen werden, da der Zielserver die Anfrage blockiert hat
  • LinkDepth: Die Entfernung des Links von der Start-Url, häufig auch als Klicktiefe bezeichnet (Zahlenwert)
  • Direction: Die Richtung, in die der Link zeigt (Aufzählungswert)
    • Internal: Der Link verweist auf ein Ziel innerhalb der geprüften Website
    • Outbound: Der Link verweist auf eine fremde Website
  • IsNew: Gibt an, ob der Link seit dem letzten Check neu hinzugekommen ist (Boolean-Wert)
  • IsChanged: Gibt an, ob sich der Inhalt des verlinkten Dokuments seit dem letzten Check wesentlich geändert hat (Boolean-Wert)
  • RedirectType: Gibt gegebenenfalls an, auf welche Weise der Link zu einer neuen Adresse weitergeleitet wurde (Aufzählungswert)
    • Http301: HTTP-Weiterleitung mit Statuscode 301 (Moved Permanently)
    • Http302: HTTP-Weiterleitung mit Statuscode 302 (Moved Temporarily)
    • Http303: HTTP-Weiterleitung mit Statuscode 303 (See Other).
    • Http307: HTTP-Weiterleitung mit Statuscode 307 (Temporary Redirect)
    • Http308: HTTP-Weiterleitung mit Statuscode 308 (Permanent Redirect)
    • HttpRefresh: Weiterleitung mittels Refresh-HTTP-Header
    • MetaRefresh: Weiterleitung per Meta-Refresh-Tag
    • JavaScript: Automatische Weiterleitung per JavaScript-Code
    • Frame: Weiterleitung, bei der die Zielseite als Frame eingebettet wird
  • RedirectUrl: Die letzte URL in der Weiterleitungskette, sofern verfügbar (Zeichenkette)
  • LinkType: Die Art des Links (Aufzählungswert)
    • AuthUrl: Link, über den sich der Crawler bei der Website angemeldet bzw. authentifiziert hat
    • StartUrl: Link, mit dem der Check begonnen hat
    • Ahref: Standard-Link, typischerweise in der Form <a href="URL">Link>/a>
    • ImgSrc: Link zu einem eingebetteten Bild, typischerweise in der Form <img src="URL">
    • LinkStylesheet: Link zu einer CSS-Datei in der Form <link href="URL" rel="stylesheet">
    • ScriptSrc: Link zu einer externen Skriptdatei in der Form <script src="URL">>/script>
    • MetaRefresh: Link, zu dem per Meta Refresh (<meta http-equiv="refresh" content="0; url=URL">) umgeleitet wurde
    • FrameSrc: Link zu einem per frame (<frame src="URL">) oder iframe (<iframe src="URL">) in die Seite eingebetteten Dokument
    • SocialMetaTag: Link, der in einem Open Graph (Facebook) oder Twitter Card Meta-Tag gefunden wurde
    • CssImport: Link zu einer CSS-Datei, die per @import von einer anderen CSS-Datei eingebunden wurde
    • CssUrl: Link zu einer Datei, die von einem CSS-Dokument mittels url(…) eingebunden wurde
    • JavaScriptLocation: JavaScript-Anweisung, die zu einer neuen Adresse umleitet
    • JavaScriptOpen: open(…) JavaScript-Anweisung, die eine URL in einem neuen Browserfenster öffnet
    • RobotsTxtSitemap: Link zur einer XML-Sitemap, der in einer robots.txt-Datei gefunden wurde
    • SitemapLoc: Link, der in einer XML-Sitemap-Datei gefunden wurde
    • Other: Der Link wurde an nicht näher spezifizierter Stelle im Code gefunden
  • MediaType: Der Typ der verlinkten Datei (Aufzählungswert)
    • Html: HTML-Dokument
    • Image: Bilddatei
    • Css: CSS-Datei
    • JavaScript: Skriptdatei
    • Json: JSON-Dokument
    • Font: Font-Datei
    • Xml: XML-Dokument
    • XmlSitemap: XML-Sitemap
    • Text: Textdokument
    • Audio: Audiodatei
    • Video: Videodatei
    • Binary: Datei in einem nicht näher spezifizierten Binärformat
    • Unknown: Datei mit unbekanntem Inhalt
  • NoFollow: Gibt an, ob der Link über ein rel="nofollow"-Attribut verfügt (Boolean-Wert)
  • NoIndex: Gibt an, ob eine noindex-Anweisung gefunden wurde, mit der Crawler angewiesen werden, die verlinkte Seite zu ignorieren und nicht zu indexieren (Boolean-Wert)
  • DisallowedByRobotsTxt: Gibt an, ob die robots.txt-Datei der betreffenden Website Google und anderen Crawlern den Zugriff auf den Link verbietet
  • BrokenCheckResult: Das Ergebnis des Funktionschecks (Aufzählungswert)
    • Ok: Der Link funktioniert problemlos
    • InvalidUrl: Der Aufbau der URL ist fehlerhaft
    • UnsupportedScheme: Die URL verwendet ein nicht unterstütztes Schema
    • HostNotFound: Der Domainname konnte nicht per DNS aufgelöst werden
    • ConnectError: Es konnte keine Verbindung zum Server hergestellt werden
    • SslHandshakeError: Der SSL/TLS-Handshake mit dem Server ist fehlgeschlagen
    • SslCertProblem: Das SSL-Zertifikat des Servers hat die Gültigkeitsprüfung nicht bestanden
    • SendReceiveError: Beim Senden der Anfrage an den Server oder dem Empfang der Antwort ist ein Fehler aufgetreten
    • Timeout: Der Server hat nicht in der vorgegebenen Zeit geantwortet
    • HttpErrorCode: Der Server hat mit einem HTTP-Statuscode geantwortet, der auf einen Fehler hinweist
    • TooManyRedirects: Der Link wurde mehr als 20-mal weitergeleitet
    • BadContentEncoding: Die Art der Komprimierung („Content-Encoding“) konnte nicht erkannt werden.
    • CrawlerTrap: Eine sogenannte „Crawler Trap“ wurde erkannt, bei der eine Website eine ungewöhnliche hohe Zahl an irrelevanten Links ohne neue Inhalte generiert
    • MxRecordNotFound: Für den Domainnamen der E-Mail-Adresse ist kein Mailserver konfiguriert
    • UnknownError: Ein Fehler unbekannten Typs ist aufgetreten
  • HttpResponseCode: Der vom Server empfangene, finale HTTP-Statuscode, sofern verfügbar (Zahlenwert)
  • BlacklistCheckResult: Das Ergebnis des Blacklist-Checks (Aufzählungswert)
    • Ok: Der Link wurde auf keiner Blacklist gefunden
    • Blacklisted: Der Link wurde auf mindestens einer Blacklist gefunden und verweist auf eine Phishing- oder Malwareseite
  • SoftErrorCheckResult: Das Ergebnis der Analyse des Seiteninhalts auf Anzeichen eines Fehlers, obwohl der Server mit einem HTTP-Statuscode 2xx keine Probleme gemeldet hat (Aufzählungswert)
    • Ok: Der Seiteninhalt deutet nicht auf einen Fehler hin
    • ForSale: Der Link führt zu einer Domain oder Website, die zum Verkauf steht
    • AdsOnly: Der Link führt zu einer geparkten Website, die ausschließlich mit Werbung gefüllt ist
    • Placeholder: Der Link führt einer Platzhalterseite ohne weitere Inhalte
    • OutOfService: Der Link führt einer Website, deren Domain abgelaufen, gesperrt oder anderweitig außer Betrieb genommen wurde
    • NoContent: Der Link führt zu einer Seite, die keine oder kaum Inhalte bereitstellt
    • DirectoryListing: Der Link führt zu einer Standardseite, die den Inhalt des aktuellen Verzeichnisses auf dem Server ausgibt
    • ErrorMessage: Der Seiteninhalt deutet auf einen 4xx- oder 5xx-Fehler hin (etwa 404 Not Found or 500 Internal Server Error)

Den <Vergleichsoperator> kannst Du aus folgender Liste wählen:

  • =: Ist gleich
  • !=: Ist ungleich
  • CONTAINS: Enthält Zeichenkette
  • STARTSWITH: Beginnt mit Zeichenkette
  • ENDSWITH: Endet mit Zeichenkette
  • >: Ist größer als
  • <: Ist kleiner als
  • >=: Ist größer oder gleich
  • <=: Ist kleiner oder gleich

Je nach gewählter Eigenschaft (siehe oben), ist <Wert> entweder eine in doppelte Anführungszeichen gesetzte Zeichenkette ("beispiel.de"), eine Zahl (404), ein Boolean-Wert (true, false) oder ein Aufzählungswert.

Mit diesem Wissen kannst Du nun einfache Filterregeln konstruieren:

Url STARTSWITH "https://www.beispiel.de/pfad/"

Direction = Internal

MediaType != Html

Logische Operatoren (AND, OR) und Klammern ermöglichen komplexere Filter:

HttpResponseCode >= 500 AND HttpResponseCode <= 599

Direction = Outbound AND (LinkType = ScriptSrc OR LinkType = LinkStylesheet)

Mit NOT lassen sich Filterausdrücke negieren:

NOT (MediaType = Image OR MediaType = Audio OR MediaType = Video)

Eigene Reports

Über die Schaltfläche Als eigenen Report speichern rechts oberhalb der Ergebnistabelle kannst Du den aktuellen Report speichern. Er erscheint anschließend als neuer Eintrag unter Eigene Reports in der Liste am linken Rand.

Als eigenen Report speichern

Um einen eigenen Report zu löschen, öffne ihn über die Seitenleiste und klicke anschließend auf die Schaltfläche Report löschen oben rechts.

Export

Wenn Du unser Professional- oder Premium-Paket einsetzt, kannst Du komplette Reports als CSV- oder PDF-Datei exportieren. Die Option Exportieren als CSV generiert eine Datei, die mit einer Tabellenkalkulation wie Microsoft Excel oder Apple Numbers geöffnet und weiterverarbeitet werden kann. Benötigst Du stattdessen einen druckreifen Bericht, wähle die Exportieren als PDF-Option.

Exportmöglichkeiten