Was ist web-crawler?
indexiert und analysiert Inhalte von Webseiten.
Der Webrobot web-crawler indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 54.174.53.35 und unter Verwendung des User Agent Mozilla/5.0 (compatible; HubSpot Crawler; web-crawlers@hubspot.com). Mit 0% Marktanteil ist web-crawler auf Platz 275 der aktivsten Webrobots im Internet.
robots.txt – web-crawler blockieren
Füge diese Zeilen in deine robots.txt ein, um web-crawler den Zugriff auf deine Website zu verwehren:
User-agent: web-crawler
Disallow: /
Du kannst den Zugriff auch gezielt einschränken, statt ihn komplett zu blockieren:
User-agent: web-crawler
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /
IP-Adressen 2 bekannte IPs
Diese IP-Adressen wurden bisher von web-crawler verwendet:
54.174.53.35
54.174.54.158
User Agents
Mit diesen User-Agent-Strings identifiziert sich web-crawler:
Mozilla/5.0 (compatible; HubSpot Crawler; web-crawlers@hubspot.com)