lcc ( http:corpora.informatik

Der Webrobot lcc ( http:corpora.informatik indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 139.18.2.126 und unter Verwendung des User Agent LCC ( http://corpora.informatik.uni-leipzig.de/crawler_faq.html). Mit 0% Marktanteil ist lcc ( http:corpora.informatik auf Platz 235 der aktivsten Webrobots im Internet.

4Zugriffe
Apr. 2015Erstmals gesehen
12.10.2018Zuletzt aktiv

Was ist lcc ( http:corpora.informatik?

indexiert und analysiert Inhalte von Webseiten.

Der Webrobot lcc ( http:corpora.informatik indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 139.18.2.126 und unter Verwendung des User Agent LCC ( http://corpora.informatik.uni-leipzig.de/crawler_faq.html). Mit 0% Marktanteil ist lcc ( http:corpora.informatik auf Platz 235 der aktivsten Webrobots im Internet.

„Back to Leipzig Corpora Collection"

— Offizielle Beschreibung des Betreibers

robots.txt – lcc ( http:corpora.informatik blockieren

Füge diese Zeilen in deine robots.txt ein, um lcc ( http:corpora.informatik den Zugriff auf deine Website zu verwehren:

robots.txt
User-agent: lcc ( http:corpora.informatik
Disallow: /

Du kannst den Zugriff auch gezielt einschränken, statt ihn komplett zu blockieren:

robots.txt (selektiv)
User-agent: lcc ( http:corpora.informatik
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /

IP-Adressen 2 bekannte IPs

Diese IP-Adressen wurden bisher von lcc ( http:corpora.informatik verwendet:

DE 139.18.2.126
DE 139.18.2.216

User Agents

Mit diesen User-Agent-Strings identifiziert sich lcc ( http:corpora.informatik:

  • LCC ( http://corpora.informatik.uni-leipzig.de/crawler_faq.html)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert