RSS Feed abonnieren

Mag blog.de YaCy nicht?

18. August 2009

Das Crawlen von blog.de und dessen Subdomains (die einzelnen Blogs) ist mit YaCy aktuell nicht möglich. In der robots.txt ist zwar kein Eintrag zu YaCy zu finden, allerdings wird jeder User-Agent der nach YaCy aussieht recht hart (vermutlich per Rewrite-Rules) geblockt. Man bekommt dann statt der Seite einen HTTP Fehler 500 zurück.

Weiterlesen »
1 Kommentar

robots.txt direkt in WordPress pflegen

17. August 2009

Ich hatte eine neue Seite angelegt und wollte diese in die robots.txt eintragen, da sie nicht indiziert werden soll. Hat man allerdings im Moment keine direkte Zugriffsmöglichkeit auf die Maschine (ftp/ssh/..) sieht es schlecht aus. Ein einfacher, aber wirklungsvoller, Trick macht es mir für die Zukunft möglich die robots.txt direkt in WordPress zu bearbeiten.

Weiterlesen »
0 Kommentare

Code in WordPress einfügen

17. August 2009

Ich hatte für meinen Neustart mit WordPress einige alte Inhalte einzupflegen. Diese enthalten jede Menge Code-Beispiele und ich mußte mit Entsetzen feststellen WordPress macht es einem da nicht leicht. Also ran ans Werk und eine Lösung gesucht. Eine für mich akzeptable habe ich auch gefunden.

Weiterlesen »
1 Kommentar

tempo@deruwe.de jl@deruwe.de