Visualisierung statistischer Daten mit R am Beispiel von Nexthink
Mit dem freien Statistikpaket R lassen sich auch unter cygwin Plots von Datensätzen erzeugen. Trotz umfangreicher Literatur sind das Gesamt-Know-How zu R als Programmiersprache für Statistik/Graphikausgabe in Fachbüchern wie Internet über viele, für den Neuling gerade im Zusammenwirken auf Anhieb kaum verständliche Textstellen verteilt, Einarbeitungszeit und Liste der Fehlermöglichkeiten entsprechend lang .
Daher sollen hier in einer rezeptartigen Synopse am Beispiel von Queryauswertungen Nexthinks fertige Lösungen der wichtigsten Diagrammtypen vorgestellt werden.
Nexthink ist eine Software, welche Betriebsdaten von Rechnern in einer zentralen Datenkbank erfasst, die wiederum mit einer proprietären, SQL-artigen Syntax (NXQL) abgefragt werden kann.
Eine Query (hier mit konfigurierbaren Ersetzungsparametern) zur Anzeige ... etwa sieht im Kern folgendermaßen aus
...
und erzeugt einen csv-Datensatz der Form
...
Nachfolgend eine Übersicht
- verschiedener (Beispiel-)Queries
- Für R-Charts werden meist Ergebnisse mehrerer Queries mit awk zu einer Gesamt-csv-Datei zusammengefügt
- derer Datensatzformate
- der jeweiligen Funktionen/Aufrufe eines R-Scripts
- Als Bibliotheken verwendet werden ggplot und dplyr
- und hieraus erzeugter Graphiken für wichtige Plotvarianten
Einfaches Balkendiagramm
R-Plot (x-Achsenbeschriftung in Darstellung abgeschnitten)
NXQL-Query-Beispiel
Datensatz (Zusammenfassung mehrerer Queries zu Gesamt-csv-Datei via awk)
R-Aufruf
mit der auch in folgenden Beispielen verwendeten Funktion, eine csv-Datei einzulesen,
und die zugehörige Diagramm erzeugende R-Funktion, welche via ggplot das Balkendiagramm erzeugt
Mehrfaches Balkendiagramm
R-Plot (x-Achsenbeschriftung in Darstellung abgeschnitten)
NXQL-Query-Beispiel
Datensatz (Zusammenfassung mehrerer Queries zu Gesamt-csv-Datei via awk)
R-Aufruf mit Faktorisierung und impliziter Definition der Ausprägungen für den zweiten Parameter gesamt_Status
und zugehörige R-Funktion
Weitere Beispiele analog erzeugter mehrfacher Balkendiagramme (x-Achsenbeschriftung abgeschnitten)
Einfaches Histogramm
R-Plot
NXQL-Query-Beispiel
Datensatz (Zusammenfassung mehrerer Queries zu Gesamt-csv-Datei via awk)
R-Aufruf
und zugehörige R-Funktion
Mehrfaches Histogramm
R-Plot
NXQL-Query-Beispiel
Datensatz (Zusammenfassung mehrerer Queries zu Gesamt-csv-Datei via awk)
R-Aufruf
und zugehörige R-Funktion
Impressum und Datenschutzerklärung