Articles of r

Fügen Sie einem Datenrahmen eine “Rang” -Spalte hinzu

Ich habe einen Datenrahmen mit Zählungen verschiedener Artikel in verschiedenen Jahren: df <- data.frame(item = rep(c('a','b','c'), 3), year = rep(c('2010','2011','2012'), each=3), count = c(1,4,6,3,8,3,5,7,9)) Und ich möchte eine Spalte “year.rank” hinzufügen, die den Rang eines Gegenstands innerhalb eines bestimmten Jahres angibt, wobei eine höhere Zählung zu einem höheren “Rang” führt. Mit dem oben Gesagten würde […]

Kombinieren (cbind) Vektoren unterschiedlicher Länge

Ich habe mehrere Vektoren ungleicher Länge und möchte sie zusammenfügen. Ich habe die Vektoren in eine Liste do.call(cbind, …) und ich habe versucht, die Verwendung von do.call(cbind, …) zu kombinieren: nm <- list(1:8, 3:8, 1:5) do.call(cbind, nm) # [,1] [,2] [,3] # [1,] 1 3 1 # [2,] 2 4 2 # [3,] 3 5 […]

Wie man einen Datenrahmen effizient filtert?

Ich habe einen Datenrahmen und habe versucht, nur die Beobachtungen auszuwählen, die mich interessieren: data[data[“Var1”]>10] Leider zerstört dieser Befehl die Struktur von dat.frame und gibt einen langen Vektor zurück. Was ich bekommen möchte, ist der data.frame, der durch die Beobachtungen verkürzt wird, die nicht meinen Kriterien entsprechen.

Lesen von 40 GB CSV-Datei in R mit Bigmemory

Der Titel ist hier ziemlich selbsterklärend, aber ich werde es wie folgt erläutern. Einige meiner derzeitigen Techniken zum Angriff auf dieses Problem basieren auf den in dieser Frage vorgestellten Lösungen. Ich stehe jedoch vor einigen Herausforderungen und Zwängen, also habe ich mich gefragt, ob jemand versuchen könnte, dieses Problem zu durchbrechen. Ich versuche das Problem […]

Wie überschreibe ich eine nicht sichtbare function im Paketnamespace?

Ich möchte grundsätzlich eine nicht sichtbare function eines Pakets ändern. Für sichtbare functionen, also functionen, die kein Asterix haben, wenn methods aufgerufen werden, habe ich zwei Beiträge gefunden, wie ich mein Ziel erreichen konnte: Verwenden Sie assignInNamespace : siehe Beitrag in R-Hilfe . Verwenden Sie fix : siehe Beitrag auf Stackoverflow Obwohl beide Ansätze für […]

Ändern der Linienfarbe mit ggplot ()

Ich benutze ggplot2 nicht so oft, aber heute dachte ich, ich würde es mit einigen Graphen versuchen. Aber ich kann nicht herausfinden, wie man colors in geom_line() manuell steuert Ich bin mir sicher, dass ich etwas Einfaches übersehen habe, aber hier ist mein Testcode: x <- c(1:20, 1:20) variable <- c(rep("y1", 20), rep("y2", 20) ) […]

Subset-Daten, die nur Spalten enthalten, deren Namen mit einer Bedingung übereinstimmen

Gibt es eine Möglichkeit für mich, Daten basierend auf Spaltennamen, die mit einer bestimmten Zeichenfolge beginnen, zu unterteilen? Ich habe einige Spalten, die wie ABC_1 ABC_2 ABC_3 und einige wie XYZ_1, XYZ_2,XYZ_3 sagen XYZ_1, XYZ_2,XYZ_3 mal. Wie kann ich mein df nur auf Basis von Spalten unterteilen, die die obigen Teile von Text enthalten (sagen […]

Übergeben Sie den Spaltennamen in data.table mit der Variablen

Mögliche Duplikate: Variables Auswählen / Zuweisen von Feldern in einer data.table Im folgenden Beispiel erstelle ich eine Datentabelle mit dem Spaltennamen ‘x’ und ‘v’ library(‘data.table’) DT <- data.table(x = c("b","b","b","a","a"), v = rnorm(5)) Ich kann auf Werte der Spalte ‘x’ zugreifen, indem ich: DT[ , x] # [1] “b” “b” “b” “a” “a” Aber wenn […]

Streudiagramm mit Fehlerbalken

Wie kann ich das folgende Diagramm in R erzeugen? Punkte, die in dem Diagramm dargestellt sind, sind die Mittelwerte und ihre Bereiche entsprechen minimalen und maximalen Werten. Ich habe Daten in zwei Dateien (unten ist ein Beispiel). xy 1 0.8773 1 0.8722 1 0.8816 1 0.8834 1 0.8759 1 0.8890 1 0.8727 2 0.9047 2 […]

Übergeben Sie Argumente an dplyr-functionen

Ich möchte die folgende Berechnung unter Verwendung von dplyr , das feststellt, welche Werte von Sepal.Length mit mehr als einem Wert von Sepal.Width : library(dplyr) iris %>% group_by(Sepal.Length) %>% summarise(n.uniq=n_distinct(Sepal.Width)) %>% filter(n.uniq > 1) Normalerweise würde ich so etwas schreiben: not.uniq.per.group % group_by(group.var) %>% summarise(n.uniq=n_distinct(uniq.var)) %>% filter(n.uniq > 1) } Dieser Ansatz dplyr jedoch Fehler […]