heritrix

Der Webrobot heritrix indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 107.20.100.44 und unter Verwendung des User Agent heritrix/2.0.2 http://www.adsafemedia.com. Mit 0.0039% Marktanteil ist heritrix auf Platz 88 der aktivsten Webrobots im Internet.

423Zugriffe
0,004%Marktanteil
Okt. 2014Erstmals gesehen
03.07.2018Zuletzt aktiv

Was ist heritrix?

indexiert und analysiert Inhalte von Webseiten.

Der Webrobot heritrix indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 107.20.100.44 und unter Verwendung des User Agent heritrix/2.0.2 http://www.adsafemedia.com. Mit 0.0039% Marktanteil ist heritrix auf Platz 88 der aktivsten Webrobots im Internet.

„??"

— Offizielle Beschreibung des Betreibers

Betreiber & Risiko

? Risiko unbekannt

robots.txt – heritrix blockieren

Füge diese Zeilen in deine robots.txt ein, um heritrix den Zugriff auf deine Website zu verwehren:

robots.txt
User-agent: heritrix
Disallow: /

Du kannst den Zugriff auch gezielt einschränken, statt ihn komplett zu blockieren:

robots.txt (selektiv)
User-agent: heritrix
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /

IP-Adressen 35 bekannte IPs

Diese IP-Adressen wurden bisher von heritrix verwendet:

US 107.20.100.44
US 107.22.71.84
CN 110.87.98.162
CN 113.240.240.130
CN 116.113.28.179
CN 117.22.254.10
CN 123.124.196.197
CN 124.129.39.14
CN 124.31.219.83
CN 124.88.36.116
FI 128.214.224.188
DK 130.226.222.201
DE 139.18.2.216
CN 171.221.208.133
US 184.72.137.36
US 184.72.159.250
US 184.72.80.248
CN 221.207.153.178
CN 221.213.73.7
CN 222.209.210.44
US 23.20.228.85
23.22.221.9
CN 42.228.3.234
US 50.17.150.183
US 54.146.228.20
54.146.247.54
US 54.147.92.203
US 54.160.2.191
US 54.167.249.94
US 54.226.243.133
US 54.237.190.108
US 54.85.203.62
CN 59.50.71.83
CN 60.13.0.180
67.202.54.164

User Agents

Mit diesen User-Agent-Strings identifiziert sich heritrix:

  • heritrix/2.0.2 http://www.adsafemedia.com
  • Mozilla/5.0 (compatible; heritrix/3.1.1 http://www.baidu.com)
  • Mozilla/5.0 (compatible; sukibot_heritrix/3.1.1 http://suki.ling.helsinki.fi/eng/webmasters.html)
  • Mozilla/5.0 (compatible; heritrix/1.14.4 http://netarkivet.dk/webcrawler)
  • Mozilla/5.0 (compatible; heritrix/3.1.1; UniLeipzigASV http://corpora.informatik.uni-leipzig.de/crawler_faq.html)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert