2  Einstieg

2.1 Installation von R und RStudio

Zunächst brauchen Sie die Programme R und RStudio. Beide sind für die Plattformen Windows, Mac und Linux frei verfügbar.

Wie man R und RStudio richtig installiert, wird in folgenden YouTube-Videos sehr gut beschrieben:

In der folgenden Anleitung sind jeweils nur die ersten grundlegenden Schritte beschrieben. Wer für den Rest oder auch generell eine zusätzliche Hilfestellung benötigt, kann auf die YouTube-Videos zurückgreifen.

2.1.1 Download R

  1. Klicke auf diesen Link

  2. Wähle dein Betriebssystem aus

    Für Mac-User: Download R for macOS
    Klicke auf den gelb markierten Link

    Der Rest ist relativ selbsterklärend. Wer dennoch eine genaue Anleitung braucht, kann sich das oben verlinkte Tutorial (für Mac) auf YouTube ansehen.

    Für Windows-User: Download R for Windows

    Auch hier sind die restlichen Schritte ziemlich selbsterklärend. Wer dennoch Hilfe benötigt, kann sich das oben verlinkte Tutorial (für Windows) auf YouTube ansehen.

2.1.2 Download RStudio

Die grafische Benutzeroberfläche in der Entwicklungsumgebung RStudio ist viel besser ausgebaut als die des Basisprogramms R, weswegen wir diese auch nutzen wollen. RStudio ist eine integrierte Entwicklungsumgebung (integrated development environment, IDE) für die Statistiksoftware R. Diese IDE bietet uns verschiedene Werkzeuge an, die uns den Umgang mit der grundlegenden Software erleichtern.

  1. Um RStudio zu installieren, klicke auf den folgenden Link: https://www.rstudio.com/products/rstudio/download/#download

  2. Wähle die Open Source Licence, indem du auf folgenden gelb markierten Button klickst:

  3. Wähle hier den passenden Link für dein Betriebssystem aus:

  4. Wie es danach weitergeht, ist wieder in den oben verlinkten YouTube-Tutorials gut beschrieben. :)

2.2 Grafische Benutzeroberfläche bzw. Aufbau von RStudio

Startet man RStudio zum ersten Mal, werden drei Fenster mit unterschiedlichen Reitern angezeigt:

Elemente der Benutzeroberfläche

Konsole

(Orange)

Die Konsole (manchmal auch als Kommandozeile, Befehlszeile, Terminal oder command-line interface, CLI bezeichnet), ist ein Eingabebereich (interface).

  • In die Konsole von RStudio können Variablendefinitionen, Berechnungen/Funktionen, sowie der Aufruf von Hilfefunktionen direkt eingegeben werden. In der Konsole bekommen wir manchmal auch Fehler- (error) und Warnmeldungen (warning) sowie andere Informationen zu einer Funktion (message) angezeigt.

    Der Inhalt der Konsole wird nach jedem Schließen des Programms gelöscht und kann nicht ohne weiteres gespeichert werden. Deswegen ist es wichtig, die eigene Arbeit in Skripten zu speichern (siehe S. 9).

Environment

(Violet)

Im Environment sehen wir alle Objekte, die derzeit in R geladen sind oder welche wir über die Konsole oder ein R Script definiert und ausgeführt haben (z. B. Variablen, Vektoren, Datensätze). Wenn wir (externe) Datensätze einlesen, sehen wir diese auch hier. Außerdem werden gegebenenfalls weitere Informationen zu den Objekten angezeigt.

Bsp. Environment

Die Objekte werden in zwei Kategorien aufgeteilt:

  • Unter Data finden wir Data Frames, Listen und Matrizen. Bei allen bekommen wir die Länge der einzelnen Dimensionen angezeigt (Data Frame: obs. = Zeilen, variables = Spalten; Matrix: [Zeilen, Spalten]; Liste: List of …). Data Frames werden mit einem vorangestellten markiert. Bei Matrizen bekommen wir zusätzlich die ersten Elemente angezeigt. Durch Klicken können wir uns diese Objekte im Data Viewer anschauen.

  • Unter Values finden wir Vektoren bzw. Faktoren. Bei Vektoren bekommen wir folgende Informationen: Datentyp (z. B. num = numeric, chr = character →  nähere Informationen zu Datentypen und -strukturen siehe S. 16), Länge sowie die ersten 10 Elemente. Bei Faktoren werden uns die Datenstruktur und die (diskrete) Anzahl an Ausprägungen angezeigt.

History

(Violet)

Bsp. History

In der History sehen wir den zuletzt ausgeführten Code.

Der Vorteil gegenüber der Konsole ist, dass der Inhalt der History nicht mit Beenden einer R-Session gelöscht wird, sondern wir auf den Code zugreifen und diesen wiederverwenden können bis dieser explizit gelösch wird (Löschen erfolgt mit dem ). Mit bekommen wir den markierten Code in unser Skript; mit in die Konsole.

Files

(Blau)

Unter Files sehen wir das Arbeitsverzeichnis (Working Directory), also die Ordner(struktur) auf unserem Rechner. Dieser Reiter entspricht im Wesentlichen also einem Dateimanager.

Mit dem Working Directory legen wir u.a. fest, wo unser aktuelles R-Skript gespeichert wird und wo andere Objekte, die wir aus R exportieren (z.B. Grafiken), standardmäßig (während der aktuellen Sitzung) gespeichert werden.

Das WD müssen wir (in der Regel) in jeder R-Sitzung erneut festlegen.

Plots

(Blau)

Hier werden (von uns erstellte) Grafiken ausgegeben.

Packages

(Blau)

Eine Übersicht unserer Pakete finden wir unter Packages (nähere Informationen dazu im Kapitel Installation und Laden von Paketen auf verlinken).

Help

Informationen zu R und zu Funktionen finden wir unter Help. Hier wird uns umfassende Hilfe zum Umgang mit R im Allgemeinen und zu Funktionen angeboten.

Den Namen der Funktion geben wir in das Suchfeld ein.

Somebody help!

Weißt du nicht mehr so richtig was eine Funktion macht oder wie sie einzusetzen ist? You need not worry, hierfür gibt es einen Shortcut!

Wir können die Funktionen help(funktion) oder ?funktion nutzen (für “funktion” natürlich den konkreten Namen der Funktion einsetzen). Wenn wir auf klicken, öffnet sich die Dokumentationsseite in einem neuen Fenster, was die Nutzung wesentlich übersichtlicher gestaltet.

Viewer Im Viewer werden (von uns erstellte) Tabellen angezeigt.

2.2.0.1 Wie und wofür erstellt man ein Skript?

Ein Skript ist eine einfache Textdatei, in die R-Befehle eingetragen werden können, die dann zur Ausführung an die Konsole geschickt werden.

Es wird über folgenden Pfad erstellt: File ⟼ New File ⟼ R Script
… oder indem man oben in der Leiste ganz links auf und dann auf R Script geht, das sieht so aus:

Figure 2.1: Skript Öffnen

Dann öffnet sich zusätzlich zu den drei Fenstern (siehe oben Benutzeroberfläche) ein viertes Fenster, das Skript:

Geöffnetes Skript

Hier schreiben wir also unseren Code rein, wenn wir diesen speichern wollen.

Um den Code auszuführen, markieren wir ihn und klicken auf oder stellen den Cursor in die Zeile und drücken die Tastenkombination (für mac-User siehe Keyboard Shortcuts)

2.2.1 RMarkdown und Quarto

Neben den R-Skripten haben sich in den letzten Jahren einige Formate entwickelt, bei denen R-Code mit anderen Inhalten wie Text, Bilder, Links und vieles mehr integriert werden. Dies bietet eine große Flexibilität, da man seine Anmerkungen, Interpretationen etc. gleich mit dem Code zusammen speichern und darstellen kann. Die üblichsten dieser Hybrid-Formen sind:

Die Darstellung von RMarkdown/Quarto kann in der Form einer Website/html-Dokument, aber auch in Form einer pdf- oder Word-Datei gewählt werden. Der Output kann simpel sein, wie eine einzige Seite, oder komplex, so wie dieses Buch. Dieses Buch ist nämlich auch in Quarto verfasst.

2.2.2 Zusammenfassung

  • In das Skript schreiben wir unseren Code.

  • In der Konsole wird dieser ausgeführt und die Ergebnisse angezeigt.

  • Bestehende Objekte sehen wir im Environment.

  • Eine Übersicht unserer Pakete finden wir unter Packages

  • Informationen zu R und zu Funktionen (auch Keyboard Shortcuts) finden wir unter Help.

Nun haben Sie bereits die wichtigsten Informationen für einen erfolgreichen Einstieg!

Bevor Sie aber mit Ihren eigenen Daten tüfteln, empfehlen wir stark vorher mit den folgenden Datensätzen zu üben und sich durch die kommenden Kapitel zu arbeiten.

Foto von https:/unsplash.com/de von @glenncarstenspeters

2.3 Interaktiv mit diesem Buch arbeiten

Wir ermutigen Sie sehr, dass Sie dieses Buch nicht “nur” lesen, sondern den verwendeten Code interaktiv in Ihrer eigenen Installation von RStudio benutzen. Denn das Verständnis und damit der Lernerfolg hängt deutlich von der Hands-on-Erfahrung ab. Es gibt mehrere Möglichkeiten, wie Sie den Code aus dem Buch interaktiv nutzen können.

Entweder laden Sie sich die Daten herunter und verwenden Code-Ausschnitte aus dem Buch, die Sie in Ein eigenes R-Skript (oder RMarkdown/Quarto-Dokument) einfügen oder Sie laden gleich das gesamte Buchprojekt runter und haben dann alle Skripte und Datensätze kompakt beisammen.

Wenn Sie copy&paste aus dem Buch machen, ist es nützlich zu wissen, dass wenn Sie im Buch mit der Maus über einen Code-Bereich gehen, rechts oben ein Symbol auftaucht (siehe Bild).

copy & paste Code

Wenn Sie auf das Symbol klicken, wird der Code in die Zwischenablage kopiert. Allerdings bezieht sich der meiste Code auf Daten, die Sie dann auch herunterladen müssten.

2.3.1 Daten herunterladen

Hier können Sie die Daten herunterladen. Die Daten öffnen sich in einem neuen Tab; speichern Sie sie wieder über das Kontextmenü (z.B. rechte Maustaste) mit “Ziel speichern unter…” ab.

Bitte laden Sie alle vier Datensätze herunter, da sonst Teile des Codes nicht funktionieren werden.

2.3.2 Das Gesamte Projekt herunterladen

Wenn Sie das gesamte Projekt herunterladen wollen, können Sie einfach das sogenannte Repository (das ist ein Online-Archiv) herunterladen. Dazu müssten Sie im Browser auf diese Seite gehen: https://gitlab.com/ccns/reachandtouch/rtl_RTut.

Dort können auf den Knopf “Code” klicken und das Projekt als eine zip-Datei herunterladen.

Repository herunterladen

Die heruntergeladene Datei sollte dann “rtl_RTut-main.zip” heißen. Wenn Sie diese öffnen/entpacken, haben Sie einen Ordner, der alle Quarto-Dokumente und die Daten etc. enthält. Die Kapitel sind in eigenen Dateien. Um den Überblick zu behalten, benutzen Sie am besten die Outline-Funktion in RStudio. Diese finden Sie im Skript-Fenster direkt über dem Codebereich (Icon “Outline” oder “show document outline”).