Was ist publiclibraryarchive.org?
indexiert und analysiert Inhalte von Webseiten.
Der Webrobot publiclibraryarchive.org indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 146.0.32.165 und unter Verwendung des User Agent Mozilla/5.0 (compatible; publiclibraryarchive.org/1.0; crawl@publiclibraryarchive.org). Mit 0.0794% Marktanteil ist publiclibraryarchive.org auf Platz 39 der aktivsten Webrobots im Internet.
robots.txt – publiclibraryarchive.org blockieren
Füge diese Zeilen in deine robots.txt ein, um publiclibraryarchive.org den Zugriff auf deine Website zu verwehren:
User-agent: publiclibraryarchive.org
Disallow: /
Du kannst den Zugriff auch gezielt einschränken, statt ihn komplett zu blockieren:
User-agent: publiclibraryarchive.org
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /
IP-Adressen 3 bekannte IPs
Diese IP-Adressen wurden bisher von publiclibraryarchive.org verwendet:
146.0.32.165
81.30.151.220
85.114.139.54
User Agents
Mit diesen User-Agent-Strings identifiziert sich publiclibraryarchive.org:
Mozilla/5.0 (compatible; publiclibraryarchive.org/1.0; crawl@publiclibraryarchive.org)
Hallo,
aktuell kann ich auf meiner Seite die folgenden Robots finden …
81.30.151.220 | Mozilla/5.0 (compatible; publiclibraryarchive.org/1.0; +crawl@publiclibraryarchive.org) : : GET
85.114.139.54 | Mozilla/5.0 (compatible; publiclibraryarchive.org/1.0; +crawl@publiclibraryarchive.org) : : GET
188.165.15.* | Mozilla/5.0 (compatible; AhrefsBot/5.0; +http://ahrefs.com/robot/) : : GET
37.58.100.* | Mozilla/5.0 (compatible; AhrefsBot/5.0; +http://ahrefs.com/robot/) : : GET
Andere muss ich noch analysieren.
Grüsse aus dem Rheinland
R. Ackermann
Die Domain publiclibraryarchive.org ist geparkt, steht also zum Verkauf, dennoch war der Bot auf meinen Seiten:
2015-01-05 01:36:24 91.224.67.119 GET /kirche/_sgt/mis1.png – 80 – 85.114.139.54 Mozilla/5.0+(compatible;+publiclibraryarchive.org/1.0;++crawl@publiclibraryarchive.org) 200 0 0 135
Die Domain ist derzeit von „Domains By Proxy, LLC“ reserviert. Der Bot existiert ungeachtet dessen weiter, die IP des Bots gehört der „fast IT Operations Team“, website: http://www.myloc.de
address: myLoc managed IT AG
address: Am Gatherhof 44
address: 40472 Duesseldorf
Warum die den Bot betreiben und ob die irgend eine Suchmaschine speisen, steht in den Sternen…