Analyse von Verhaltensdaten mit R
1 Übersicht
1.1 Sinn & Zweck
Dieses Dokument dient als Schablone für Ablauf und Auswertung von BSc/MSc-Arbeiten sowie in Auswertungen im Rahmen eines Empirischen Seminars (ES) im Reach & Touch Lab / Kognitive Psychologie. Es enthält Hinweise zum zeitlichen Ablauf der Arbeit, zur Logik von Auswertung und Experimentaldesign, zur Wahl der statistischen Verfahren und zeigt v.a. konkrete Code-Beispiele. Viele Arbeiten werden an einzelnen Stellen von der Schablone abweichen - sie dient nur als Leitfaden. Bitte in jedem Fall mit der Betreuer*in die einzelnen Punkte durchsprechen (ggf. auch Abweichungen vom hier dargestellten Vorgehen).
1.2 Ergänzende Quellen
Es ist nicht der Anspruch dieses Dokuments, eine umfassende Einführung in R zu geben. Es soll eine Starthilfe sein. Die besprochenen Themen sind komplex und jedes Kapitel kann für sich dedizierte Bücher füllen–und tut das auch.
Data Tidying & Data Wragling |
Daten überhaupt erstmal in ein Format zu bringen, in dem man sie dann mit seinem statistischen Test analysieren kann, kann aufwendig sein = oft mehr als die eigentliche Analyse (siehe https://psyarxiv.com/hq68s/). Der Umgang mit Daten - d.h., Daten so in Tabellenform zu kriegen, dass man sie wie gewünscht analysieren und darstellen kann - ist darum sehr wichtig, wird aber in Statistik wenig gelehrt. Im online kostenfrei verfügbaren Buch/Kurs Applied Data Skills können Sie sich die entsprechenden Kenntnisse aneignen: https://psyteachr.github.io/ads-v1/index.html. Außerdem gibt es eine sehr anschauliche Serie von Blog-Einträgen auf dieser Website: https://suzan.rbind.io/2018/01/dplyr-tutorial-1/. |
Datenvisualisierung | ist hervorragend in dem Buch von Hadley Wickham (Wickham 2009) beschrieben. |
Tidyverse | Hierbei handelt es sich um ein ganzes Framework zur Datenaufbereitung, Analyse, Modellierung und Visualisierung, das auf R aufsetzt und in einer Reihe von Packages umgesetzt ist. Alle Packages gemeinsam kann man als “tidyverse” installieren. Der Umgang mit diesem Framework ist in Hadley Wickhams Buch “R for data science” beschrieben, das auch kostenlos online verfügbar ist über die Website von Tidyverse: https://www.tidyverse.org/learn/. |
Tabellen | Ein wichtiger Aspekt bei der Analyse mit R, Rmarkdown und tidyverse ist, Daten möglichst direkt in seinen Report einzufügen und nicht lauter Werte per Hand abzuschreiben - denn dabei passieren Fehler. Sehr professionelle Tabellen kann man bspw. mit den Packages gt (Tips) und reactable erstellen. |
RMarkdown | eine Möglichkeit, Fließtext mit Programmiercode zu verknüpfen, so wie man es hier auf dieser Website sieht (https://www.quarto.org). Aus ein und demselben Dokument lassen sich Webseiten, Word Docs, pdfs u.ä. erstellen. Zu RMarkdown gibt es im oben erwähnten Buch Applied Data Skills ein Kapitel: https://psyteachr.github.io/ads-v1/reports.html. Die Webseite von Quarto hat einen großen Howto-Bereich (https://quarto.org/docs/guide/, https://quarto.org/docs/reference/). RMarkdown und Quarto sind in RStudio integriert und können sehr einfach ausprobiert/eingesetzt werden. Auch dieses Dokument, das Sie gerade lesen, basiert auf RMarkdown. RMarkown ist eine spezielle Variante von Markdown, bei der Markdown mit R Code kombiniert wird, um reproduzierbare Reports zu erzeugen. Sie können hier mehr über RMarkdown lesen: http://rmarkdown.rstudio.com. Die wohl ausführlichste Dokumentation zu RMarkdown ist in dem Buch von Yihui Xie (Xie 2015) zu finden. Der gleiche Autor hat ebenfalls eine umfassende Bechreibung, die online verfügbar ist: https://bookdown.org/yihui/rmarkdown/ |
Darüber hinaus findet man über die Suchmaschinen im Internet sehr viel gutes Material.
1.3 Interaktive Verwendungsweise
Sie können dieses Dokument und die dazugehörigen Daten herunterladen können. Dies empfehlen wir, denn man lernt am besten mit einem “hands-on”-Ansatz.
Wir ermuntern Sie, das Dokument nicht nur zu lesen, sondern es selbst in RStudio zu öffnen oder die Codeblöcke zu kopieren und den Code auf Ihrem eigenen Computer laufen zu lassen. Dabei können Sie den Code variieren und damit “rumspielen” und sehen, was passiert.
1.4 Rückmeldung zu der Lernerfahrung
Dieses Dokument ist dynamisch und wächst immer weiter. Sie können uns gerne rückmelden, wenn etwas nicht korrekt oder unklar ist, nicht funktioniert oder in einer anderen Weise verbessert werden kann Für solches Feedback sind wir immer dankbar. Senden Sie dieses Feedback bitte an Xaver Fuchs: xaver.fuchs@plus.ac.at
1.5 Die nächsten Schritte
Zunächst können Sie hier weiterlesen, wie Sie R und RStudio installieren.
Danach werden wir Schritt für Schritt verschiedenen Datenverarbeitungsschritte sowie das Erstellen von Abbildungen und das Durchführen statistischer Analysen bearbeiten.