Hallo,
mit diesem Post werde ich mein Blog an dieser Stelle schließen!
Grund dafür ist der, dass sich meine Interessen etwas verschoben haben und ich gerne mit anderen Inhalten neu anfangen möchte.
Deshalb werde ich auf http://arnehendrikschulz.de ein neues Blog starten und würde mich freuen, den einen oder anderen leser dort wieder begrüßen zu dürfen
So long (and even longer),
Arne
Veröffentlicht in Diverses | Kommentare deaktiviert
Nachdem ich nun schon einige Zeit R nutze, stellt sich gelegentlich wieder die Frage nach dem entsprechenden Frontend. R selber bringt zwar auch eine GUI mit, diese ist aber eher einfach gestrickt (siehe Bild rechts). Da die Software ja Open Source ist, stelle ich hier einige Frontends (oder auch GUIs) vor, die mir besonders zusagen. Für eine vollständige Liste, verweise ich an folgende Seite, wenn auch nicht mehr ganz aktuell: http://www.sciviews.org/_rgui/
Ich möchte daher meine aktuellen Favoriten hier kurz vorstellen:
JGR (sprich: jaguar) ist eine komplett in Java geschriebe GUI. Sie verfügt über eine Console, optionale Skript-Fenster sowie einen Objekt- und Package-Browser. Zur vereinfachten Eingabe sind die meisten Befehle als Tooltips verfügbar. Als besonderes Schmankerl kann man sich das package Deducer installieren, welches einen Databrowser und diverse Analyse- und Grafikmöglichkeiten direkt zum “Zusammenklicken” bietet.
Tinn-R ist eine Erweiterung des Notepads Tinn. Im Grunde stellt die Software einem ein Skriptfenster zur Verfügung und führt die gewünschten Befehle direkt auf der R GUI aus. Zudem sind natürlich Features wie Syntax-Highlight usw. mit inbegriffen. Wunderbar eignet sich Tinn-R auch als Ersatz des einfachen Windows Notepads, da unter anderem auch für viele weitere Sprachen Syntax-Hilighting angeboten wird. Achtung: Unbedingt immer die Versionen von Sourceforge nehmen. Die auf der Homepage angebotenen Dateien sind hoffnungslos veraltet.
StatET ist aktuell mein absoluter Favorit. Es handelt sich dabei um eine Erweiterung der bekannten Entwicklungsumgebung Eclipse. Besonders gut gefällt mir dabei, dass die Umgebung eigentlich alles mitbringt und ich im Endeffekt nur ein Fenster habe, indem alles abläuft. Das hilft vor zu vielen kleinen Fenstern, die einem den Überblick nehmen. Der einzige Nachteil ist allerdings, dass Eclipse manchmal etwas oversized ist. Aber seht selbst:
Wenn jemand noch weitere gute GUIs kennt, ich bin immer für Empfehlungen offen
Hallo,
kurzer Eintrag. Ich bin letzte Woche auf ein nettes Modul in R gestoßen, mit welchem man kinderleicht Dummies erstellen kann. Das Modul trägt dabei den einfallsreichen Namen dummies. Installieren ist kinderleicht:
install.packages(”dummies”)
Ist das Modul dann geladen (library(”dummies”)), kann man einfach durch den Befehl dummy eine Dummy-Variable erzeugen:
temp <- dummy(data$variable)
temp liegt dann als Matrix vor, so dass man diese ganz einfach zu den bestehenden Daten hinzufügen kann (hier angenommen, dass die Variable drei verschiedene Ausprägungen hat):
am Wochenende konnte der gemeine Bürger Deutschlands ja erste richtige Ausläufer des Superwahljahres erleben und/oder bestaunen. Neben den Ergebnissen machte vor allem eine Entwicklung Schlagzeilen: Per Twitter wurden bereits anderthalb Stunden vor Schließung der Wahllokale Prognosen verbreitet, die erstaunlich nah an den ersten Hochrechnungen von ARD und ZDF um 18 Uhr lagen (link). Die Ähnlichkeit ist wirklich frappierend! Nun häufen sich die Bedenken der Wahlforscher und die Beschwerden der Politiker (link). Zumal bereits bei der Wahl des Bundespräsidenten das Ergebnis bereits vorab durch Twitter veröffentlicht wurde (link). Mit dem Unterschied, dass die Wahl damals schon gelaufen war. Die Gefahr einer Beeinflussung der Wähler bei einer Wahl ist da natürlich um einiges höher. Doch woher können diese Hochrechnungen eigentlich kommen?
Die einzige logische Antwort auf diese Frage sind die sogenannten exit polls. Befragungen während der Wahl, im Englischen exit polls genannt, sind Umfragen, in denen Wähler am Abstimmungstag direkt nach Abgabe ihrer Stimme vor dem Wahllokal befragt werden – natürlich anonym. Diese Ergebnisse werden bereits am Nachmittag Politikern/Parteien zugespielt, damit diese ihre Statements vorbereiten können. Zum anderen haben ARD und ZDF dann um 18 Uhr die ersten Ergebnisse vorliegen. Wer einen Wahlabend lang schon einmal die Prognosen verfolgt hat, wird feststellen, dass die exit polls eine durchaus hohe Güte haben.
Nun scheinen Ergebnisse dieser Polls nach draußen gelangt zu sein, aber keiner will’s im Endeffekt gewesen sein:
“Die Zahlen sind vor fünf Uhr nur mir und dem ARD-Chefredakteur bekannt – und fünf Mitarbeitern bei Infratest dimap”, sagt Jörg Schönenborn, Chefredakteur des WDR und verantwortlich für die Wahlberichterstattung im Ersten. (…) Auch ZDF-Chefredakteur Nikolaus Brender bestritt, das Zahlen aus seinem Haus vorab bekannt wurden: “Wir haben unsere Zahlen gesichert.”
Im Grunde ist es ja auch egal! Die exit polls gehören bei solchen Sicherheitslücken einfach abgeschafft!
Ist es nicht egal, wenn bei einer Wahl, die über mindestens die kommenden vier Jahre unseres Landes entscheiden, erste Hochrechnungen erst gegen 19 oder 20 Uhr veröffentlicht werden?
Und warum brauchen Politiker unbedingt diese Daten, um sich ihre Statements zurechtzulegen? In den Wochen vor einer Wahl werden so viele repräsentative Umfragen getätigt, die im Endeffekt auch kaum von den Endergebnissen abweichen.
Wäre es nicht toll, abends um 20 Uhr die Tagesschau einzuschalten und dann die erste Hochrechnung anzusehen?
ich bin schon vor einiger Zeit über Yacy gestolpert. Yacy steht für “Yet another Cyberspace”. Dahinter verbirgt sich nichts anderes als eine Open-Source-Suchmaschine. Diese basiert auf dem P2p-Prinzip. So ist das System dezentral aufgebaut und eigene Suchanfragen werden zu anderen Peers weitergeleitet und beantwortet. Dabei steht es einem frei, den eigenen Peer im Robinson-Modus laufen zu lassen. Dies bedeutet, dass der Peer isoliert wird und weder Anfragen weitergibt, noch Anfragen von außen annimmt. Theoretisch schafft man sich dadurch eine Suchmaschine, die sich dem eignem Surfverhalten anpasst (bei allen Vor- und Nachteilen). Außerdem gibt es noch einen Modus, der Yacy als Intranet-Suchmaschine laufen lässt.
Da die Kritik an der Datenkrake Google mit der Einführung von Google Books, Streetview und den ersten Google-Handys (die einen Google-Account voraussetzen) nicht gerade geringer geworden ist, habe ich Yacy mal eine Chance gegeben. Insgesamt bin ich ganz zufrieden, allerdings gibt es einige Wehmutstropfen. Doch zunächst meine subjektiven Vorteile:
Der integrierte Proxy-Server ist ganz gut. Dieser kann so konfiguriert werden, dass von den angesurften Seiten aus gecrawlt werden kann.
Einstellungen können direkt über eine Weboberfläche vorgenommen werden. Änderungen werden sofort übernommen.
Die Weboberfläche bietet zudem umfangreiche Statistiken und Übersichten über aktuelle Prozesse.
Es werden auch Seiten des so genannten Dark Web erfasst.
Es macht einfach Spaß, sich seinen eignen Suchindex aufzubauen
Nachteilig finde ich dabei:
Teilweise sehr instabil. Besonders, wenn man den zugesicherten Arbeitsspeicher arg eingrenzt (weniger als 200MB). Dadurch stürzt das Programm öfters mal ab – zumindest nach meiner Erfahrung.
Recht arbeitsintensiv! Auf einem Desktop hat das Programm meiner Meinung nach eigentlich nichts verloren. Selbst auf meinem Core 2 Duo machte sich Yacy negativ bemerkbar.
Es gibt relaitv wenig Peers, so dass die Suchergebnisse nicht mit komerziellen Anbietern vergleichbar sind – insbesondere Google.
Es dauert unter Umständen > 20 Sekunden bis alle Ergebnisse geliefert wurden.
Von daher fällt das Urteil zweischneidig aus. Zunächst ist das Yacy meiner Meinung nach nur etwas für den Serverbetrieb und hat auf Desktops wenig zu suchen. Der CPU- und RAM-Hunger machte sich bei meinem Test negativ bemerkbar. Ich finde den Robinson- und Intranet-Modus (nicht getestet) recht interessant, um sich so einen eigenen Suchindex aufzubauen. Der Fairness halber sollte man seine Ergebnisse der Masse allerdings zur Verfügung stellen.
Außerdem gibt es meiner Meinung nach noch zu wenig Peers. Ich kam bei meinem Test immer auf etwa 70-80 weitere Peers, was insgesamt wohl noch zu wenig ist. Hinzu kommt, dass diese wohl überwiegend von versierten Computernutzern zur Verfügung gestellt werden. Dies hat zur Folge, dass mit hoher Wahrscheinlichkeit ein nur ganz bestimmter Teil des Internets erfasst wird.
Interessant ist dabei aber die Sciencenet Initiative des KIT. Dies zeigt eine Suchmaschine, die primär auf wissenschaftliche Quellen ausgelegt ist. Die Suchmaske befindet sich hier!
Alles in allem ein Projekt, das man durchaus im Auge behalten sollte!
Hallo,
der oben genannte Unterschied wird in diesen zwei Werbespots von Heineken deutlich gemacht. Klingt beides vollkommen identisch, das erste ist aber zum reingehen und das zweite geht selbst…