Question 1

Warum drei Hops, wenn ich nur eine URL eingegeben habe?

Accepted Answer

Webserver leiten aus vielen Gründen weiter: HTTP zu HTTPS, www zu non-www, Sprachversion, Login-Wall, Mobile-Variante, alte URL auf neue Struktur. Jede Stufe ist ein eigener HTTP-Request mit eigenen Headern und eigener Antwortzeit. trace zeigt jede einzeln. Jeder zusätzliche Hop kostet Ladezeit, Crawl-Budget und Klick-Verluste auf Mobile.

Question 2

Was ist der Unterschied zwischen 301, 302, 307 und 308?

Accepted Answer

301 ist permanent. Suchmaschinen ersetzen die alte URL. 302 ist temporär, die alte URL bleibt im Index. 307 ist wie 302, behält aber die HTTP-Methode bei. 308 ist wie 301 mit Methoden-Erhalt. Faustregel: Dauerhafter Umzug nimmt 301 oder 308. Eine 302 dort, wo 301 hingehört, kostet messbar Sichtbarkeit.

Question 3

Was kann das Tool, was curl -L -v nicht kann?

Accepted Answer

curl zeigt Kette und Header. trace zeigt zusätzlich pro Hop TLS-Issuer und Restlaufzeit, klassifiziert Header farblich, erkennt Loops, holt auf jeder besuchten Domain die robots.txt und wertet sie automatisch gegen 56 bekannte Bots aus. Du sparst dir das Parsen von Hand.

Question 4

Speichert ihr meine Anfragen?

Accepted Answer

Nein. Kein Cache, kein Logging der eingegebenen URLs, kein Account, keine Cookies. Frischer Trace pro Request, danach vergessen. Die Anfrage steht als URL-Parameter in der Adresszeile, kopierbar und teilbar.

Question 5

Warum funktioniert localhost nicht?

Accepted Answer

SSRF-Schutz. Würde das Tool private IPs aufrufen, könnte es als Proxy missbraucht werden. Geblockt sind 127.0.0.1, 10.0.0.0/8, 172.16.0.0/12, 192.168.0.0/16, IPv6-Loopback und alle reservierten Bereiche.

Question 6

Wieviele Redirects sind zu viele?

Accepted Answer

Google folgt bis 10 Hops, danach gilt die URL als nicht erreichbar. Aus User-Sicht kostet jeder Hop 50 bis 400 ms. Ab drei Stufen messbar im Lighthouse-Score. Ideal ist eine Stufe: nicht-kanonische URL leitet einmal direkt auf die Final-URL.

Question 7

Was bedeutet "blockiert" in der Bot-Matrix, wenn die robots.txt scheinbar nichts verbietet?

Accepted Answer

Drei Fälle: User-agent: *-Gruppe mit Disallow: / und keine bot-spezifische Allow-Regel. Der Bot hat eine eigene Gruppe, die ihn explizit blockt. Die Pfad-Regel matcht über Wildcards. trace zeigt in der Spalte "Regel" genau, welche Zeile das Verdict ausgelöst hat.

Question 8

HTTP/2 oder HTTP/3 unterstützt?

Accepted Answer

Ja. Das Tool nutzt curl mit Protokoll-Auto-Negotiation. Im Hop steht, welches Protokoll verwendet wurde. HTTP/3 (QUIC) wenn der Zielserver es per Alt-Svc anbietet.

Question 9

Werden Cookies gesetzt oder JavaScript ausgeführt?

Accepted Answer

Nein. Reiner HTTP-Client wie curl. Kein Cookie-Jar, kein Browser, kein JS. Set-Cookie-Header werden angezeigt, aber nicht persistiert. Für Browser-Verhalten: Schwester-Tool audit.crawlerbase.de.

Question 10

Gibt es eine API?

Accepted Answer

Aktuell nicht. GET-Parameter url rein, HTML raus. JSON-Schnittstelle ist geplant. Bei Bedarf: info@crawlerbase.de.

Jeder Hop. Jeder Header. Jeder Crawler.

Vier Sichten auf jede URL.

Redirect-Chain

Header im Klartext

robots.txt RFC 9309

Bot-Matrix

Vier Schritte, ein Request.

Eingabe

SSRF-Check

Trace

Bot-Eval

Häufige Fragen.