Lektion 1: Einführung in R

In dieser Lektion erkläre ich dir die wichtigsten Grundlagen von R.

Installation

Falls du R und R Studio noch nicht auf deinem PC oder Laptop installiert hast, findest du in folgendem Video eine Anleitung.

Unter folgenden Links, kannst du die beiden Programme herunterladen. Beachte, dass du für R Studio zwingend R installiert haben musst.

R GNU: https://stat.ethz.ch/CRAN/
R Studio: https://rstudio.com/products/rstudio/download/#download

Erste Schritte in R

In folgendem Video zeige ich dir die ersten Schritte in R und die wichtigsten Grundlagen. Unterhalb des Videos findest du eine Zusammenfassung der wichtigsten Punkte.

R Code wird in der R Konsole ausgeführt. Geschrieben wird der Code in der Regel in einem R Skript, welches mit der Endung .R gespeichert wird. Um Code aus dem Skript in der Konsole aus auszuführen, kann entweder auf «run» geklickt werden oder die Tastencombination Ctrl + Enter (Windows) resp. Cmd + Enter (Mac) gedrückt werden.

Das grundlegendste Element in R ist der Vektor. Er beinhaltet einen oder mehrere Werte des gleichen Typs. Die wichtigsten Typen sind numeric, character und logic. Ein Vektor kann in einer Variable gespeichert werden. Wird mehr als ein Wert verwendet, werden die Werte mit der Funktion c() zusammengefasst, was für «combine» (deutsch: verbinden) steht.

Einige Beispiel:

namen = c("Fritz  Frosch", "Hans Hase", "Elisabeth Ente")
alter = c(15, 31, 19)
mag_wasser = c(TRUE, FALSE, TRUE)

In der ersten Zeile erstellen wir einen character-Vektor, in der zweiten Zeile einen numeric-Vektor und in der dritten Zeile einen logic-Vektor und speichern die jeweils in einer Variable ab. In der Konsole wird uns nichts angezeigt. Geben wir aber nun aber den Variablenname in der Konsole ein, erhalten wir den Inhalt zurück. Eine wichtige Abkürzung, um alle Zahlen von Start bis Ende zu bekommen ist Start:Ende. Beispielsweise:

1:12

Ein Vektor hat eine Dimension. Eine Matrix ist hat zwei Dimensionen, wobei alle Elemente vom gleichen Typ sind. Im folgenden Beispiel generiere ich eine Matrix und gebe sie aus.

m = matrix(c(1, 4, 6, 9, 3, 7, 2, 2, 10, 2, 6, 5), 
           nrow = 4, byrow = TRUE)
m

Ein Array ist in R ein Element mit zwei oder mehr Dimensionen. Eine Matrix ist eine spezielles Array.

Eine Liste ist in R ein Element, welches beliebige Elemente enthalten kann und dadurch beliebig verschachtelbar ist. Eine Liste wird mit der Funkion list() erstellt.

meineListe = list(name = "Max Muster", alter = "7", 
                  vegetarier = FALSE, eineMatrix = m, 
                  eineListe = list(y = 7, x = 2))
meineListe 

Ein Data Frame ist eine besondere Liste, welche wie eine Matrix zwei Dimensionen hat, die Kolonnen jedoch unterschiedliche Typen haben können. Data Frames ist eines der wichtigsten Konstrukte in der Statistik, weil sie sich am besten eignen, Datensätze in Tabellenform darzustellen, also ähnlich wie in Excel. Eine Kolonne eines Data Frames ist ein Vektor, wobei alle Vektoren die gleiche Länge haben. Ein Beispiel:

df_personen = data.frame(
      namen = c("Fritz  Frosch", "Hans Hase", "Elisabeth Ente"),
      alter = c(15, 31, 19),
      mag_wasser = c(TRUE, FALSE, TRUE)
)
df_personen
df_personen$alter[3]
df_personen[2,]

In der Zeile 7 geben wir den 3. Wert der Variable alter zurück. Wir hätten auch schreiben können df_personen[3, "alter"] oder df_personen[3, 2]. In der achten Zeile geben wir die zweite Zeile des Data Frames zurück, also Hans Hase mit seinem Alter und ob er Wasser mag. Der Zugriff auf Elemente mit Hilfe der eckigen Klammern funktioniert übrigens auch bei Matrizen und Array (z.B.: myArray[2,5,] bei einem Array mit drei Dimensionen).

Fehlende Werte haben in R den Wert NA.