Herzlich willkommen bei Dr. Link Check! Unser Online-Dienst prüft Websites schnell und zuverlässig auf kaputte und potenziell schädliche Links. Wenn ein Link Deiner Website nicht mehr funktioniert oder auf gefährliche Inhalte verweist, erfährst Du mit Dr. Link Check als Erstes davon und kannst das Problem rasch beheben.
Der Einstieg ist simpel: Ruf die Startseite auf, gib die Adresse Deiner Website ein und klicke auf Starte Check.
Dr. Link Check erstellt nun automatisch ein temporäres Konto, fügt diesem das kostenlose Lite-Paket hinzu und startet den Check Deiner Website. Wenn Du Dich näher mit Dr. Link Check vertraut gemacht hast und den Dienst längerfristig nutzen möchtest, solltest Du die Einrichtung des Kontos durch Angabe Deiner E-Mail-Adresse und eines Passworts abschließen.
Mit E-Mail-Adresse und Passwort kannst Du Dich jederzeit rechts oben über den Menüeintrag Login bei Dr. Link Check einloggen und Deine Projekte verwalten. (Solltest Du Dein Passwort vergessen, lass es über diesen Link zurücksetzen.)
Nach dem Einloggen gelangst Du standardmäßig zum Überblick-Report, der Dir eine grafisch aufbereitete Zusammenfassung der Ergebnisse des Checks liefert.
Weitere Berichte kannst Du aus der Liste am linken Rand wählen:
http:
https:
, data:
oder mailto:
verwendenIndem Du den Mauszeiger zu einem Eintrag in der Ergebnistabelle bewegst und auf Details klickst, kannst Du weitere Informationen zu dem betreffenden Link abrufen. Diese beinhalten beispielsweise die verlinkenden Seiten oder sämtliche URLs der Weiterleitungskette, falls vorhanden.
Ein Klick auf Quelle neben einem der Einträge unter Verlinkt von zeigt Dir, wo genau Dr. Link Check den aktuellen Link im Code gefunden hat. In einem separaten Fenster werden der vom Server abgerufene Quellcode dargestellt und die Fundstellen des Links farblich hervorgehoben.
Über den kleinen Pfeil neben der Quelle-Schaltfläche gelangst Du zum Menüeintrag Quelllink anzeigen. Hierüber kannst Du Dir die Details der verlinkenden Seite anzeigen lassen. Diese Funktion ist insbesondere dann nützlich, wenn Du nachvollziehen möchtest, wie unser Crawler zu einem bestimmten Link gelangt ist – Link für Link kannst Du den Pfad durch die Website bis zur Startseite zurückverfolgen.
Um lediglich diejenigen Links anzeigen zu lassen, die für Dich von Interesse sind, kannst Du die Filterfunktion von Dr. Link Check nutzen. Diese Funktion ist äußerst vielseitig einsetzbar, beispielsweise für folgende Reports:
Um einen Filter zu erstellen, klicke auf Hinzufügen in der Filter-Leiste oberhalb der Ergebnistabelle und wähle eines der Filterkriterien:
"https"
oder "mailto"
)"www.beispiel.de"
)"/pfad/zur/seite"
)<a href>
, <img src>
, etc.)rel="nofollow"
(welches Suchmaschinen anweist, den Link beim Ranking der Zielseite zu ignorieren)Wenn Du mehrere Filterkriterien hinzufügst, werden nur diejenigen Links angezeigt, die sämtlichen Kriterien entsprechen. Um einen Teil des Filters zu entfernen, klicke auf das neben dem entsprechenden Eintrag dargestellte x-Icon.
Über die Schaltfläche Als eigenen Report speichern rechts oberhalb der Ergebnistabelle kannst Du den aktuellen Report speichern. Er erscheint anschließend als neuer Eintrag unter Eigene Reports in der Liste am linken Rand.
Anstatt einen Filter per Mausklick zu erzeugen, kannst Du die Filterregel auch in Textform angeben. Dieses Features richtet sich an fortgeschrittene Benutzer und ermöglicht die Definition von Filtern, die sich über die normale Benutzeroberfläche nicht abbilden lassen. Den Texteingabemodus aktivierst Du über einen Doppelklick auf eine freie Stelle in der Filterleiste.
Eine einfache Filterregel ist wie folgt aufgebaut:
<Eigenschaft> <Vergleichsoperator> <Wert>
<Eigenschaft>
kann dabei eines der folgenden Schlüsselwörter sein:
Url
: Die vollständige URL des Links (als Zeichenkette)Scheme
: Das Schema der URL, beispielsweise "https"
oder "mailto"
(Zeichenkette)Host
: Die Host-Komponente der URL, beispielsweise "beispiel.de"
oder "www.beispiel.de"
(Zeichenkette)Port
: Der Port der URL als Zahlenwert, beispielsweise 80
oder 443
(Zahlenwert)Path
: Der absolute Pfad der URL, beispielsweise "/pfad/zur/seite"
oder "/"
(Zeichenkette)Query
: Der Query-String der URL, einschließlich des vorangestellten Fragezeichens, beispielsweise "?name=frettchen&farbe=lila"
(Zeichenkette)Status
: Der aktuelle Prüfstatus des Links (als einer der folgenden Aufzählungswerte)
Queued
: Der Link befindet sich in der Warteschlange und wird in Kürze geprüftInProgress
: Der Link wird gerade geprüftChecked
: Die Überprüfung des Links wurde erfolgreich abgeschlossenUnsupported
: Der Link konnte nicht geprüft werden, da die URL ein nicht unterstütztes Schema aufweist (wie beispielsweise „tel“ in „tel:+1-555-1234567“)Aborted
: Die Überprüfung des Links wurde vorzeitig abgebrochenFailed
: Bei der Überprüfung des Links ist ein unerwarteter Fehler aufgetretenBlocked
: Die Überprüfung des Links konnte nicht vollständig abgeschlossen werden, da der Zielserver die Anfrage blockiert hatDirection
: Die Richtung, in die der Link zeigt (Aufzählungswert)
Internal
: Der Link verweist auf ein Ziel innerhalb der geprüften WebsiteOutbound
: Der Link verweist auf eine fremde WebsiteIsNew
: Gibt an, ob der Link seit dem letzten Check neu hinzugekommen ist (Boolean-Wert)IsChanged
: Gibt an, ob sich der Inhalt des verlinkten Dokuments seit dem letzten Check wesentlich geändert hat (Boolean-Wert)RedirectType
: Gibt gegebenenfalls an, auf welche Weise der Link zu einer neuen Adresse weitergeleitet wurde (Aufzählungswert)
Permanent
: Die Weiterleitung ist permanent (HTTP-Statuscode 301 oder 308)Temporary
: Die Weiterleitung ist vorübergehend (HTTP-Statuscode 302 oder 307)LinkType
: Die Art des Links (Aufzählungswert)
AuthUrl
: Link, über den sich der Crawler bei der Website angemeldet bzw. authentifiziert hatStartUrl
: Link, mit dem der Check begonnen hatAhref
: Standard-Link, typischerweise in der Form <a href="URL">Link>/a>
ImgSrc
: Link zu einem eingebetteten Bild, typischerweise in der Form <img src="URL">
LinkStylesheet
: Link zu einer CSS-Datei in der Form <link href="URL" rel="stylesheet">
ScriptSrc
: Link zu einer externen Skriptdatei in der Form <script src="URL">>/script>
MetaRefresh
: Link, zu dem per Meta Refresh (<meta http-equiv="refresh" content="0; url=URL">
) umgeleitet wurdeFrameSrc
: Link zu einem per frame (<frame src="URL">
) oder iframe (<iframe src="URL">
) in die Seite eingebetteten DokumentSocialMetaTag
: Link, der in einem Open Graph (Facebook) oder Twitter Card Meta-Tag gefunden wurdeCssImport
: Link zu einer CSS-Datei, die per @import
von einer anderen CSS-Datei eingebunden wurdeCssUrl
: Link zu einer Datei, die von einem CSS-Dokument mittels url(…)
eingebunden wurdeSitemapLoc
: Link, der in einer XML-Sitemap-Datei gefunden wurdeOther
: Der Link wurde an nicht näher spezifizierter Stelle im Code gefundenMediaType
: Der Typ der verlinkten Datei (Aufzählungswert)
Html
: HTML-DokumentImage
: BilddateiCss
: CSS-DateiJavaScript
: SkriptdateiJson
: JSON-DokumentFont
: Font-DateiXml
: XML-DokumentXmlSitemap
: XML-SitemapText
: TextdokumentAudio
: AudiodateiVideo
: VideodateiBinary
: Datei in einem nicht näher spezifizierten BinärformatUnknown
: Datei mit unbekanntem InhaltNoFollow
: Gibt an, ob der Link über ein rel="nofollow"
-Attribut verfügt (Boolean-Wert)NoIndex
: Gibt an, ob eine noindex
-Anweisung gefunden wurde, mit der Crawler angewiesen werden, die verlinkte Seite zu ignorieren und nicht zu indexieren (Boolean-Wert)DisallowedByRobotsTxt
: Gibt an, ob die robots.txt-Datei der betreffenden Website Google und anderen Crawlern den Zugriff auf den Link verbietetBrokenCheckResult
: Das Ergebnis des Funktionschecks (Aufzählungswert)
Ok
: Der Link funktioniert problemlosInvalidUrl
: Der Aufbau der URL ist fehlerhaftUnsupportedScheme
: Die URL verwendet ein nicht unterstütztes SchemaHostNotFound
: Der Domainname konnte nicht per DNS aufgelöst werdenConnectError
: Es konnte keine Verbindung zum Server hergestellt werdenSslHandshakeError
: Der SSL/TLS-Handshake mit dem Server ist fehlgeschlagenSslCertProblem
: Das SSL-Zertifikat des Servers hat die Gültigkeitsprüfung nicht bestandenSendReceiveError
: Beim Senden der Anfrage an den Server oder dem Empfang der Antwort ist ein Fehler aufgetretenTimeout
: Der Server hat nicht in der vorgegebenen Zeit geantwortetHttpErrorCode
: Der Server hat mit einem HTTP-Statuscode geantwortet, der auf einen Fehler hinweistTooManyRedirects
: Der Link wurde mehr als 20-mal weitergeleitetBadContentEncoding
: Die Art der Komprimierung („Content-Encoding“) konnte nicht erkannt werden.CrawlerTrap
: Eine sogenannte „Crawler Trap“ wurde erkannt, bei der eine Website eine ungewöhnliche hohe Zahl an irrelevanten Links ohne neue Inhalte generiertMxRecordNotFound
: Für den Domainnamen der E-Mail-Adresse ist kein Mailserver konfiguriertUnknownError
: Ein Fehler unbekannten Typs ist aufgetretenHttpResponseCode
: Der vom Server empfangene, finale HTTP-Statuscode, sofern verfügbar (Zahlenwert)BlacklistCheckResult
: Das Ergebnis des Blacklist-Checks (Aufzählungswert)
Ok
: Der Link wurde auf keiner Blacklist gefundenBlacklisted
: Der Link wurde auf mindestens einer Blacklist gefunden und verweist auf eine Phishing- oder MalwareseiteParkedCheckResult
: Das Ergebnis des Parked Domain-Checks (Aufzählungswert)
Ok
: Der Link verweist nicht auf eine geparkte DomainParked
: Der Link verweist auf eine geparkte DomainDen <Vergleichsoperator>
kannst Du aus folgender Liste wählen:
=
: Ist gleich!=
: Ist ungleichCONTAINS
: Enthält ZeichenketteSTARTSWITH
: Beginnt mit ZeichenketteENDSWITH
: Endet mit Zeichenkette>
: Ist größer als<
: Ist kleiner als>=
: Ist größer oder gleich<=
: Ist kleiner oder gleichJe nach gewählter Eigenschaft (siehe oben), ist <Wert>
entweder eine in doppelte Anführungszeichen gesetzte Zeichenkette ("beispiel.de"
), eine Zahl (404
), ein Boolean-Wert (true
, false
) oder ein Aufzählungswert.
Mit diesem Wissen kannst Du nun einfache Filterregeln konstruieren:
Url STARTSWITH "https://www.beispiel.de/pfad/"
Direction = Internal
MediaType != Html
Logische Operatoren (AND
, OR
) und Klammern ermöglichen komplexere Filter:
HttpResponseCode >= 500 AND HttpResponseCode <= 599
Direction = Outbound AND (LinkType = ScriptSrc OR LinkType = LinkStylesheet)
Mit NOT
lassen sich Filterausdrücke negieren:
NOT (MediaType = Image OR MediaType = Audio OR MediaType = Video)
Wenn Du unser Professional- oder Premium-Paket einsetzt, kannst Du komplette Reports als CSV- oder PDF-Datei exportieren. Die Option Exportieren als CSV generiert eine Datei, die mit einer Tabellenkalkulation wie Microsoft Excel oder Apple Numbers geöffnet und weiterverarbeitet werden kann. Benötigst Du stattdessen einen druckreifen Bericht, wähle die Exportieren als PDF-Option.
Einen fertig abgeschlossenen oder vorzeitig abgebrochenen Check kannst Du über die Schaltfläche Check neu starten auf der Seite Überblick noch einmal wiederholen.
Ein Projekt in Dr. Link Check umfasst die Einstellungen und Prüfergebnisse für eine bestimmte Website.
Um ein neues Projekt anzulegen (und einen neuen Check zu starten), klicke auf das +-Symbol am oberen Rand der Seitenleiste.
Folgende Angaben sind erforderlich:
https://www.beispiel.de/
als Start-URL angegeben, gilt https://subdomain.beispiel.de/
als Teil Deiner Website, da beide URLs die Root-Domain beispiel.de
enthalten. Mit dieser Option liegst Du richtig, wenn Du eine komplette Website einschließlich aller Subdomains prüfen lassen möchtest.https://www.beispiel.de/
als Start-URL angegeben, gilt https://subdomain.beispiel.de/
als ausgehender Link und wird dementsprechend zwar geprüft, jedoch nicht nach weiteren Links durchforstet.https://www.beispiel.de/pfad/zu/seite1.html
als Start-URL angegeben, gilt https://www.beispiel.de/pfad/zu/seite2.html
als intern, https://www.beispiel.de/index.html
jedoch als ausgehend.Zusätzliche Möglichkeiten zur Konfiguration des Projekts findest Du unter Erweiterte Einstellungen:
Disallow
- und Allow
-Regeln für „Googlebot“ (der Webcrawler von Google) und „*“ (Platzhalter für sonstige Crawler). Verbieten die Regeln sowohl für „Googlebot“ als auch für „*“ den Zugriff auf einen bestimmten internen Link, wird dieser vom Check ausgeschlossen. Die Start-URL(s) und externe Links (die auf fremde Websites verweisen) werden jedoch immer überprüft, unabhängig vom Inhalt der robots.txt-Datei. Sonstige Anweisungen, wie beispielsweise Crawl-delay
und Sitemap
, unterstützt der Crawler momentan nicht. Möchtest Du eine Website ohne Berücksichtigung der robots.txt-Datei prüfen lassen, aktiviere die Option Ignoriere robots.txt.Eine einfache Crawl- oder Ignorierregel ist wie folgt aufgebaut:
<Eigenschaft> <Vergleichsoperator> <Wert>
Als <Eigenschaft>
sind folgende Schlüsselwörter möglich:
Url
: Die vollständige URL des LinksScheme
: Das Schema der URL, beispielsweise "https"
oder "mailto"
Host
: Die Host-Komponente der URL, beispielsweise "beispiel.de"
oder "www.beispiel.de"
Port
: Der Port der URL als Zahlenwert, beispielsweise 80
oder 443
Path
: Der absolute Pfad der URL, beispielsweise "/pfad/zur/seite"
oder "/"
Query
: Der Query-String der URL, einschließlich des vorangestellten Fragezeichens, beispielsweise "?name=frettchen&farbe=lila"
PathAndQuery
: Die Kombination aus Pfad und Query-String der URL, beispielsweise "/pfad/zur/seite?name=frettchen&farbe=lila"
HtmlElement
: Ein CSS-ähnlicher Selektor zur Identifizierung des HTML-Tags eines Links, beispielsweise "div.sidebar > a"
(weitere Informationen findest Du in diesem Blog-Post)LinkDepth
: Die Entfernung des Links von der Start-URL, also 0
für die Start-URL selbst, 1
für direkt auf der Startseite gefundene Links, 2
für auf von der Startseite verlinkten Seiten gefundene Links, etc.Unterstützte <Vergleichsoperator>
en sind:
=
: Ist gleich!=
: Ist ungleichCONTAINS
: Enthält ZeichenketteSTARTSWITH
: Beginnt mit ZeichenketteENDSWITH
: Endet mit Zeichenkette>
: Ist größer als<
: Ist kleiner als>=
: Ist größer oder gleich<=
: Ist kleiner oder gleich<Value>
kann entweder eine in doppelte Anführungszeichen gesetzte Zeichenkette ("beispiel"
) oder eine Zahl (123
) sein.
Damit lassen sich zum Beispiel folgende einfache Regeln konstruieren:
Scheme = "https"
Url STARTSWITH "https://www.beispiel.de/pfad/"
Path ENDSWITH ".html"
Port = 81
HtmlElement = "img"
LinkDepth > 2
Mit Hilfe von logischen Operatoren (AND
, OR
) und Klammern kannst Du Ausdrücke zu komplexeren Regeln zusammensetzen:
(Host = "beispiel.de" OR Host ENDSWITH ".beispiel.de") AND Path STARTSWITH "/pfad/"
Das Voranstellen von NOT
negiert einen Ausdruck:
NOT (Path ENDSWITH ".png" OR Path ENDSWITH ".jpg" OR Path ENDSWITH ".gif")
Um die Einstellungen eines Projekts zu bearbeiten, wähle den Projekteintrag aus dem Menü links oben in der Seitenleiste und klicke auf das Schraubenschlüsselsymbol.
Du kannst ein Projekt löschen, indem Du das Projektmenü links oben in der Seitenliste öffnest, den Mauszeiger zum entsprechenden Eintrag bewegst und dann auf das Papierkorbsymbol klickst.
Einen Kurzüberblick über Deinen Vertrag findest Du unten links in der Seitenleiste. Dort werden Dir das aktuell gewählte Paket und die Höchstzahl an Links angezeigt, die pro Website bzw. Projekt geprüft werden können.
Durch einen Klick auf das Schraubenschlüsselsymbol öffnet sich der Vertragseinstellungen-Dialog. Hier kannst Du Deine Vertragsleistungen anpassen, den Vertrag kündigen oder Deine Zahlungsinformationen aktualisieren.
Wenn Du auf ein teureres Paket umsteigst, wird Dein Vertrag unmittelbar angepasst und Dir die Preisdifferenz in Rechnung gestellt. Der Wechsel in ein kleineres Paket oder eine Kündigung werden erst zum Ende des laufenden Abrechnungszyklus wirksam.
Sämtliche Zahlungen werden von unserem Partner Paddle abgewickelt und können per Kreditkarte oder PayPal erfolgen.
Um Deine Kontodaten zu prüfen oder anzupassen, klicke rechts oben in der Leiste auf Konto und wähle den Menüeintrag Kontoeinstellungen.
Ein vollständiges Konto erfordert die Angabe von Vor- und Nachname, einer E-Mail-Adresse sowie eines Passwortes mit mindestens sechs Zeichen.
Dr. Link Check findet Links in HTML-Dokumenten (innerhalb von HTML-Tags wie beispielsweise <a>
, <area>
, <frame>
, <iframe>
, <img>
, <script>
, <audio>
und <video>
) und CSS-Dateien (@import
und url(...)
). Der Crawler ist nicht in der Lage, JavaScript-Code auszuführen und nach Links in Seiten zu suchen, die im Browser dynamisch per JavaScript generiert werden.
Unterstützte URL-Schemas sind „http“, „https“, „data“ und „mailto“. Links mit den Schemas „http“ und „https“ prüft der Crawler, indem er eine Verbindung zum Zielserver herstellt und das verlinkte Dokument abruft. „data“-URLs werden auf Syntaxfehler geprüft und bei „mailto“-Links erfolgt ein Test, ob die Domain der E-Mail-Adresse tatsächlich existiert und über MX-Einträge verfügt.
Manchmal sind Probleme nur vorübergehender Natur, beispielsweise weil der Zielserver kurzzeitig überlastet war oder zum Zeitpunkt des Checks eine Netzstörung vorgelegen hat. Meldet Dr. Link Check beispielsweise „Zeitüberschreitung“, „Verbindungsfehler“, „Sendefehler“, „Empfangsfehler“ oder einen HTTP 5xx-Serverfehler, ist dies nicht selten ein Problem, das sich mit der Zeit von selbst erledigt.
Zudem kann es vorkommen, dass Webserver Zugriffe von unseren Servern blockieren. Beispielsweise lehnen die Server der Plattform LinkedIn sämtliche Zugriffe aus der Amazon-Cloud (wo sich unsere Server befinden) mit der Antwort „999 Request Denied“ ab. Viele Server begrenzen zudem die Anzahl an Anfragen, die von einer IP-Adresse aus innerhalb einer festgelegten Zeitspanne erfolgen dürfen, und blockieren oder verlangsamen weitere Anfragen nach Erreichen eines bestimmten Limits. Dies spiegelt sich häufig in den HTTP-Statuscodes 429 (Too Many Requests), 403 (Forbidden) oder 503 (Service Unavailable) wider.
Dr. Link Check führt maximal zwei parallele Anfragen pro Zielserver aus. Moderne Webbrowser hingegen öffnen typischerweise sechs (Chrome, Firefox) oder sogar noch mehr (Internet Explorer) Verbindungen zu einem Host.
Du kannst uns jederzeit per E-Mail oder Kontaktformular erreichen. Wir helfen gern!