Analyse von Verhaltensdaten mit R

Author

Xaver Fuchs, Christian Seegelke, Tobias Heed

Published

February 15, 2024

1 Übersicht

1.1 Sinn & Zweck

Dieses Dokument dient als Schablone für Ablauf und Auswertung von BSc/MSc-Arbeiten sowie in Auswertungen im Rahmen eines Empirischen Seminars (ES) im Reach & Touch Lab / Kognitive Psychologie. Es enthält Hinweise zum zeitlichen Ablauf der Arbeit, zur Logik von Auswertung und Experimentaldesign, zur Wahl der statistischen Verfahren und zeigt v.a. konkrete Code-Beispiele. Viele Arbeiten werden an einzelnen Stellen von der Schablone abweichen - sie dient nur als Leitfaden. Bitte in jedem Fall mit der Betreuer*in die einzelnen Punkte durchsprechen (ggf. auch Abweichungen vom hier dargestellten Vorgehen).

1.2 Ergänzende Quellen

Es ist nicht der Anspruch dieses Dokuments, eine umfassende Einführung in R zu geben. Es soll eine Starthilfe sein. Die besprochenen Themen sind komplex und jedes Kapitel kann für sich dedizierte Bücher füllen–und tut das auch.

Gute Quellen zum Nachschlagen / zur Vertiefung
Data Tidying &
Data Wragling

Daten überhaupt erstmal in ein Format zu bringen, in dem man sie dann mit seinem statistischen Test analysieren kann, kann aufwendig sein

= oft mehr als die eigentliche Analyse (siehe https://psyarxiv.com/hq68s/).

Der Umgang mit Daten - d.h., Daten so in Tabellenform zu kriegen, dass man sie wie gewünscht analysieren und darstellen kann - ist darum sehr wichtig, wird aber in Statistik wenig gelehrt. Im online kostenfrei verfügbaren Buch/Kurs Applied Data Skills können Sie sich die entsprechenden Kenntnisse aneignen: https://psyteachr.github.io/ads-v1/index.html.

Außerdem gibt es eine sehr anschauliche Serie von Blog-Einträgen auf dieser Website: https://suzan.rbind.io/2018/01/dplyr-tutorial-1/.

Datenvisualisierung ist hervorragend in dem Buch von Hadley Wickham (Wickham 2009) beschrieben.
Tidyverse

Hierbei handelt es sich um ein ganzes Framework zur Datenaufbereitung, Analyse, Modellierung und Visualisierung, das auf R aufsetzt und in einer Reihe von Packages umgesetzt ist.

Alle Packages gemeinsam kann man als “tidyverse” installieren. Der Umgang mit diesem Framework ist in Hadley Wickhams Buch “R for data science” beschrieben, das auch kostenlos online verfügbar ist über die Website von Tidyverse: https://www.tidyverse.org/learn/.

Tabellen Ein wichtiger Aspekt bei der Analyse mit R, Rmarkdown und tidyverse ist, Daten möglichst direkt in seinen Report einzufügen und nicht lauter Werte per Hand abzuschreiben - denn dabei passieren Fehler. Sehr professionelle Tabellen kann man bspw. mit den Packages gt (Tips) und reactable erstellen.
RMarkdown

eine Möglichkeit, Fließtext mit Programmiercode zu verknüpfen, so wie man es hier auf dieser Website sieht (https://www.quarto.org). Aus ein und demselben Dokument lassen sich Webseiten, Word Docs, pdfs u.ä. erstellen.

Zu RMarkdown gibt es im oben erwähnten Buch Applied Data Skills ein Kapitel: https://psyteachr.github.io/ads-v1/reports.html. Die Webseite von Quarto hat einen großen Howto-Bereich (https://quarto.org/docs/guide/, https://quarto.org/docs/reference/). RMarkdown und Quarto sind in RStudio integriert und können sehr einfach ausprobiert/eingesetzt werden.

Auch dieses Dokument, das Sie gerade lesen, basiert auf RMarkdown. RMarkown ist eine spezielle Variante von Markdown, bei der Markdown mit R Code kombiniert wird, um reproduzierbare Reports zu erzeugen. Sie können hier mehr über RMarkdown lesen: http://rmarkdown.rstudio.com. Die wohl ausführlichste Dokumentation zu RMarkdown ist in dem Buch von Yihui Xie (Xie 2015) zu finden. Der gleiche Autor hat ebenfalls eine umfassende Bechreibung, die online verfügbar ist: https://bookdown.org/yihui/rmarkdown/

Darüber hinaus findet man über die Suchmaschinen im Internet sehr viel gutes Material.

1.3 Interaktive Verwendungsweise

Image by Racool_studio on Freepik

Sie können dieses Dokument und die dazugehörigen Daten herunterladen können. Dies empfehlen wir, denn man lernt am besten mit einem “hands-on”-Ansatz.

Wir ermuntern Sie, das Dokument nicht nur zu lesen, sondern es selbst in RStudio zu öffnen oder die Codeblöcke zu kopieren und den Code auf Ihrem eigenen Computer laufen zu lassen. Dabei können Sie den Code variieren und damit “rumspielen” und sehen, was passiert.

1.4 Rückmeldung zu der Lernerfahrung

Dieses Dokument ist dynamisch und wächst immer weiter. Sie können uns gerne rückmelden, wenn etwas nicht korrekt oder unklar ist, nicht funktioniert oder in einer anderen Weise verbessert werden kann Für solches Feedback sind wir immer dankbar. Senden Sie dieses Feedback bitte an Xaver Fuchs:

1.5 Die nächsten Schritte

Zunächst können Sie hier weiterlesen, wie Sie R und RStudio installieren.

Danach werden wir Schritt für Schritt verschiedenen Datenverarbeitungsschritte sowie das Erstellen von Abbildungen und das Durchführen statistischer Analysen bearbeiten.