Artikel mit ‘Web’ getagged

Such doch selber!

Mittwoch, 27. Mai 2009

Moin,

ich bin schon vor einiger Zeit über Yacy gestolpert. Yacy steht für “Yet another Cyberspace”. Dahinter verbirgt sich nichts anderes als eine Open-Source-Suchmaschine. Diese basiert auf dem P2p-Prinzip. So ist das System dezentral aufgebaut und eigene Suchanfragen werden zu anderen Peers weitergeleitet und beantwortet. Dabei steht es einem frei, den eigenen Peer im Robinson-Modus laufen zu lassen. Dies bedeutet, dass der Peer isoliert wird und weder Anfragen weitergibt, noch Anfragen von außen annimmt. Theoretisch schafft man sich dadurch eine Suchmaschine, die sich dem eignem Surfverhalten anpasst (bei allen Vor- und Nachteilen). Außerdem gibt es noch einen Modus, der Yacy als Intranet-Suchmaschine laufen lässt.

Da die Kritik an der Datenkrake Google mit der Einführung von Google Books, Streetview und den ersten Google-Handys (die einen Google-Account voraussetzen) nicht gerade geringer geworden ist, habe ich Yacy mal eine Chance gegeben. Insgesamt bin ich ganz zufrieden, allerdings gibt es einige Wehmutstropfen. Doch zunächst meine subjektiven Vorteile:

  • Der integrierte Proxy-Server ist ganz gut. Dieser kann so konfiguriert werden, dass von den angesurften Seiten aus gecrawlt werden kann.
  • Einstellungen können direkt über eine Weboberfläche vorgenommen werden. Änderungen werden sofort übernommen.
  • Die Weboberfläche bietet zudem umfangreiche Statistiken und Übersichten über aktuelle Prozesse.
  • Die Suche mit anderen Peers klappt ganz gut.
  • Der Crawler leifert ganz gute Ergebnisse.
  • Es werden auch Seiten des so genannten Dark Web erfasst.
  • Es macht einfach Spaß, sich seinen eignen Suchindex aufzubauen :-D

Nachteilig finde ich dabei:

  • Teilweise sehr instabil. Besonders, wenn man den zugesicherten Arbeitsspeicher arg eingrenzt (weniger als 200MB). Dadurch stürzt das Programm öfters mal ab – zumindest nach meiner Erfahrung.
  • Recht arbeitsintensiv! Auf einem Desktop hat das Programm meiner Meinung nach eigentlich nichts verloren. Selbst auf meinem Core 2 Duo machte sich Yacy negativ bemerkbar.
  • Es gibt relaitv wenig Peers, so dass die Suchergebnisse nicht mit komerziellen Anbietern vergleichbar sind – insbesondere Google.
  • Es dauert unter Umständen > 20 Sekunden bis alle Ergebnisse geliefert wurden.

Von daher fällt das Urteil zweischneidig aus. Zunächst ist das Yacy meiner Meinung nach nur etwas für den Serverbetrieb und hat auf Desktops wenig zu suchen. Der CPU- und RAM-Hunger machte sich bei meinem Test negativ bemerkbar. Ich finde den Robinson- und Intranet-Modus (nicht getestet) recht interessant, um sich so einen eigenen Suchindex aufzubauen. Der Fairness halber sollte man seine Ergebnisse der Masse allerdings zur Verfügung stellen. ;-)

Außerdem gibt es meiner Meinung nach noch zu wenig Peers. Ich kam bei meinem Test immer auf etwa 70-80 weitere Peers, was insgesamt wohl noch zu wenig ist. Hinzu kommt, dass diese wohl überwiegend von versierten Computernutzern zur Verfügung gestellt werden. Dies hat zur Folge, dass mit hoher Wahrscheinlichkeit ein nur ganz bestimmter Teil des Internets erfasst wird.

Interessant ist dabei aber die Sciencenet Initiative des KIT. Dies zeigt eine Suchmaschine, die primär auf wissenschaftliche Quellen ausgelegt ist. Die Suchmaske befindet sich hier!

Alles in allem ein Projekt, das man durchaus im Auge behalten sollte!

So long,
Arne

Google mag nicht nach Chuck Norris suchen

Montag, 28. Januar 2008

Morgen,
gestern habe ich hier einen lustigen Easter Egg von Google gefunden. Um wie ich zu staunen und lachen, einfach folgendes machen:
- auf www.google.de gehen
- find Chuck Norris eingeben
- Auf gut Glück Button anklicken
- Stauen und Lachen!!!

 
So long,
Arne

Hierarchie der deutschen Blogosphäre

Freitag, 25. Januar 2008

Moin,
vor ein paar Tagen bin ich auf in dem Blog von Peter Kröner auf eine Hierarchie der deutschen Blogosphäre gestoßen. Genial! Ist, wie ich finde sehr gut durchdacht und … ach schaut es euch doch einfach selber an!
Weiterhin finde ich sehr positiv, dass das Werk unter die Creative Commons Lizenz gestellt wurde, so dass ich das Bild hier ganz ungeniert hochladen und einbinden kann. Viel Spaß beim Anschauen & ein schönes Wochenende!
Arne

Hierarchie 
(Zum Vergrößern bitte auf das Bild klicken)

Autorennen in Google Earth

Mittwoch, 23. Januar 2008

Moin,
dank des Spiegel Netzwelt-Tickers bin ich auf einen neuen und lustigen Zeitvertreib gekommen: Autorennen in Google Earth. Das Ganze nennt sich Real World Racer und wurde von Thomas Scott entwickelt. Ziel des Spiels ist es, bestimmte Checkpoints auf einer vorher festgelegten Strecke abzufahren. Als Grundlage dienen die Karten von Google Earth, gespielt wird aus der Vogelperspektive. Die Gegenerzahl beträgt drei, sie sind aber keine wirklich große Herausforderung. Dennoch macht das Spiel als kurzer Zeitvertreib großen Spaß. Bisher kann man sich an insgesamt acht Strecken versuchen, wobei das Spiel ständig weiter entwickelt wird.

So long,
Arne

Umfrage zum Thema Social Networks

Montag, 10. Dezember 2007

Moin,
bin gerade (Dank des Blogs von Jan Schmidt) über eine Umfrage der Forschungsgruppe Kommunikationssysteme München (CSCM) zum Thema Social Network Services gestoßen. Ein sehr interessantes Thema und "unseres Wissens die erste ihrer Art (wenn man mal von Datensammlungen einzelner grosser Plattformen absieht)". Die Umfrage dauert nur 8 Minuten, subjektiv würde ich sie bei 5 Minuten Dauer einordnen – geht also recht fix. Direkt zur Umfrage gehts hier.

Die Umfrage findet im Rahmen eines Studentenprojekts statt. Wenn es sowas auch in Kassel geben würde … *hach* …

So long,
Arne