derUwe.de ist eine private Seite |
Impressum
erzeugt mit Wordpress |
benutzt ein modifiziertes Snowblind Theme
Meinem YaCy Peer hab ich eine schöne Aufgabe zugewiesen: Das Crawlen von de.wordpress.com mit den einzelnen Blogs. Jeweils 100 Seiten je (Sub-) Domain (also Blog) werden gecrawlt, beschränkt auf *.wordpress.com und keine Beiträge vor 2009 (sofern die Archiv-Struktur dies hergibt)
Nach wenigen Minuten hatte der Crawler gut zu tun, sprang von Seite zu Seite und erfaßte diese mit einer Geschwindigkeit von bis zu 1065 PPM (pages per minute).
Unerklärlich ist mir warum dies nach ca. 20-30. Minuten einbrach und der Crawler auf unter 50 PPM fiel. Auch sonst folgte der Performance Graph plötzlich nicht mehr den von mir erwarteten Werten.
Nichts desto trotz entstand noch diese sehr schöne Grafik der Link-Topologie. Wie man sieht hat YaCy bisher nur einen kleinen Teil der Blogs besucht (die Ballung unten links) und deren Beziehung zueinander dargestellt. Ein schönes Spielzeug für solche die das Netz nach Neuem oder Interessantem durchstöbern.
Diese Grafik gibt es auch noch in besonders großer Auflösung.
Nachfolgend ein von mir spontan zusammengestellter Auszug der erfaßten Seiten (diese geben nicht unbedingt meine Meinung wieder), in unsortierter Reihenfolge, als Beispiele was man alles entdecken kann.
- zuweiss.wordpress.com
- unbedingtlesen.wordpress.com
- kopfspiele.wordpress.com
- hellsehenundkartenlegen.wordpress.com
- ostseestadion.wordpress.com
- johannesarens.wordpress.com
- hirngabel.wordpress.com
- rotegraefin.wordpress.com
- dianaschreibt.wordpress.com
- weselpower.wordpress.com
- wortman.wordpress.com
- chaosbude.wordpress.com
- nobsta.wordpress.com
- suboptimales.wordpress.com
- herrenhauser.wordpress.com
- hallojapan.wordpress.com
- kinderwunsch.wordpress.com
- seishiroa.wordpress.com
- theolounge.wordpress.com
- reiseweh.wordpress.com
- cajarore.wordpress.com
Wer sich die Mühe machen möchte alle dargestellten Domains abzutippen, ich nehm die Liste gern.
(Bildquellen: eigener YaCy Client)



