lcc ( http:corpora.informatik

Der Webrobot lcc ( http:corpora.informatik indexiert und analysiert Inhalte von Webseiten. Er zeigt sich meistens mit der IP Adresse 139.18.2.126 und unter Verwendung des User Agent LCC ( http://corpora.informatik.uni-leipzig.de/crawler_faq.html). Mit 0% Marktanteil ist lcc ( http:corpora.informatik auf Platz 235 der aktivsten Webrobots im Internet.

Raphael

22. April 2015

4Zugriffe

Apr. 2015Erstmals gesehen

12.10.2018Zuletzt aktiv

Was ist lcc ( http:corpora.informatik?

indexiert und analysiert Inhalte von Webseiten.

„Back to Leipzig Corpora Collection"
— Offizielle Beschreibung des Betreibers

Betreiber & Risiko

? Risiko unbekannt

robots.txt – lcc ( http:corpora.informatik blockieren

Füge diese Zeilen in deine robots.txt ein, um lcc ( http:corpora.informatik den Zugriff auf deine Website zu verwehren:

robots.txt

User-agent: lcc ( http:corpora.informatik
Disallow: /

Du kannst den Zugriff auch gezielt einschränken, statt ihn komplett zu blockieren:

robots.txt (selektiv)

User-agent: lcc ( http:corpora.informatik
Disallow: /wp-admin/
Disallow: /wp-includes/
Allow: /

IP-Adressen 2 bekannte IPs

Diese IP-Adressen wurden bisher von lcc ( http:corpora.informatik verwendet:

139.18.2.126

139.18.2.216

User Agents

Mit diesen User-Agent-Strings identifiziert sich lcc ( http:corpora.informatik:

LCC ( http://corpora.informatik.uni-leipzig.de/crawler_faq.html)

Schreibe einen Kommentar

lcc ( http:corpora.informatik

Was ist lcc ( http:corpora.informatik?

Betreiber & Risiko

robots.txt – lcc ( http:corpora.informatik blockieren

IP-Adressen 2 bekannte IPs

User Agents

Schreibe einen KommentarAntwort abbrechen

7 Fälle in denen hohes Keyword Suchvolumen eine Falle ist (und warum es sich dennoch lohnen kann)

Domaininhaber ermitteln mit der Whois-Abfrage: Wem gehört die Domain

Freie Domains finden und die Vorteile einer eigenen Domain für Blogs