mbr-web-crawler

Der Webrobot mbr-web-crawler indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 148.251.67.132 und unter Verwendung des User Agent mbr-Web-Crawler/Nutch-1.8. Mit 0% Marktanteil ist mbr-web-crawler auf Platz 366 der aktivsten Webrobots im Internet.

4Zugriffe
Feb. 2015Erstmals gesehen
09.04.2015Zuletzt aktiv

Was ist mbr-web-crawler?

indexiert und analysiert Inhalte von Webseiten.

Der Webrobot mbr-web-crawler indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 148.251.67.132 und unter Verwendung des User Agent mbr-Web-Crawler/Nutch-1.8. Mit 0% Marktanteil ist mbr-web-crawler auf Platz 366 der aktivsten Webrobots im Internet.

Basisanalyse

Technische Einordnung von mbr-web-crawler

mbr-web-crawler wurde in Webserver-Logs als Bot oder Crawler erkannt. Die wichtigsten technischen Hinweise findest du auf dieser Seite: bekannte User-Agents, beobachtete IP-Adressen, Aktivitätsdaten und passende robots.txt-Regeln.

Für eine konkrete Entscheidung solltest du zusätzlich prüfen, welche URLs mbr-web-crawler abruft, wie häufig die Zugriffe sind und ob der Bot deine robots.txt-Regeln respektiert.

Tipp: Wenn der Bot viel Traffic erzeugt oder sensible Bereiche abruft, prüfe neben robots.txt auch Firewall- oder WAF-Regeln.

Gefahreneinschätzung und Bewertung

Sollte man mbr-web-crawler blockieren?

Prüfe zuerst Zugriffshäufigkeit, aufgerufene URLs und User-Agent. Danach kannst du entscheiden, ob eine Blockierung sinnvoll ist.

Erst Logdaten prüfen

Betreiber

Organisation
Noch nicht geprüft

Auf einen Blick

Typ
Web-Crawler
Häufige IP
148.251.67.132
User-Agent-Varianten
1

robots.txt – mbr-web-crawler blockieren

Füge diese Zeilen in deine robots.txt ein, um mbr-web-crawler den Zugriff auf deine Website zu verwehren:

robots.txt
User-agent: mbr-web-crawler
Disallow: /

Du kannst den Zugriff auch gezielt einschränken, statt ihn komplett zu blockieren:

robots.txt (selektiv)
User-agent: mbr-web-crawler
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /

Häufige Fragen zu mbr-web-crawler

Ist mbr-web-crawler gut oder schlecht?

Das hängt vom Einsatzzweck ab. mbr-web-crawler ist als Web-Crawler eingeordnet. Entscheidend sind Nutzen, Serverlast, Crawl-Verhalten und ob der Bot deine robots.txt-Regeln respektiert.

Wie erkenne ich mbr-web-crawler in Server-Logs?

Suche nach dem User-Agent-Namen mbr-web-crawler. Ein beobachteter User-Agent ist mbr-Web-Crawler/Nutch-1.8. Vergleiche ausserdem IP-Adressen, Zugriffsmuster und aufgerufene URLs.

Reicht robots.txt zum Blockieren?

robots.txt ist ein Hinweis für regelkonforme Crawler. Unerwünschte oder aggressive Bots können diese Regeln ignorieren. In solchen Fällen helfen zusätzlich Firewall-Regeln, WAF-Regeln oder Blockierungen im Hosting/CDN.

Kann ein Bot seinen User-Agent fälschen?

Ja. Ein User-Agent ist leicht zu fälschen. Für wichtige Entscheidungen solltest du zusätzlich IP-Adresse, Reverse-DNS, Zugriffsmuster, Häufigkeit und aufgerufene URLs prüfen.

IP-Adressen 3 bekannte IPs

Diese IP-Adressen wurden bisher von mbr-web-crawler verwendet:

DE 148.251.67.132
US 64.95.99.250
US 64.95.99.252

User Agents

Mit diesen User-Agent-Strings identifiziert sich mbr-web-crawler:

  • mbr-Web-Crawler/Nutch-1.8

Weitere nützliche Tools