Articles of r

Was ist der Unterschied zwischen “1L” und “1”?

Ich habe oft gesehen, dass das Symbol 1L (oder 2L , 3L usw.) im R-Code erscheint. Was ist der Unterschied zwischen 1L und 1 ? 1==1L ergibt TRUE . Warum wird 1L im R-Code verwendet?

Für jede Änderung in der Spalte um 1 erhöhen

Sagen wir, ich habe den folgenden Datenrahmen set.seed(123) df 0.5)*1) var1 könnte einen beliebigen Typ / eine beliebige Anzahl von Ebenen haben, nicht speziell 0 und 1s Ich möchte ein var2 erstellen, das jedes Mal um 1 erhöht wird, wenn sich var1 ändert, ohne eine for loop Erwartetes Ergebnis in diesem Fall ist: data.frame(var1=(runif(10)>0.5)*1, var2=c(1, […]

Was ist der schnellste Weg, data.frames in R zusammenzuführen / zu verbinden?

Zum Beispiel (nicht sicher, ob das repräsentativste Beispiel ist): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) Das habe ich bis jetzt: d <- merge(d1,d2) # 7.6 sec library(plyr) d <- join(d1,d2) # 2.9 sec library(data.table) dt1 <- data.table(d1, key="x") dt2 <- data.table(d2, key="x") d <- data.frame( dt1[dt2,list(x,y1,y2=dt2$y2)] ) # 4.9 sec […]

r Knitroch-Optionen für die Höhe / Breite der Figur funktionieren nicht

Früher habe ich knitr in R , um Berichte aus dem .Rnw Format zu .Rnw . In meinen Berichten habe ich oft eine Menge Plots angelegt und ihre Größe mit Hilfe von Chunk-Optionen manipuliert, zB: \begin{figure}[h!] \centering <>= plot(mtcars) @ \caption{} \end{figure} Es war vor ein paar Monaten. Dann habe ich in eine andere Umgebung […]

Beseitigen Sie Gruppen mit unterschiedlichen Werten

Ich habe einen Datenrahmen wie unten sample <- data.frame(ID=1:9, Group=c('AA','AA','AA','BB','BB','CC','CC','BB','CC'), Value = c(1,1,1,2,2,2,3,2,3)) Jede Gruppe soll den gleichen Wert haben. ID Group Value 1 AA 1 2 AA 1 3 AA 1 4 BB 2 5 BB 2 6 CC 2 7 CC 3 8 BB 2 9 CC 3 Wenn Sie sich die Gruppe […]

Warum und wo werden \ n Newline-Zeichen in c () eingeführt?

Hoffe, dass jemand mir helfen kann zu verstehen, warum errorshafte \ n Zeichen in einem Vektor von Strings auftauchen, den ich in R erzeuge. Versuchen Sie, eine sehr große Datendatei im Format mit fester Breite zu importieren und zu bereinigen ( http://www.state.nj.us/education/schools/achievement/2012/njask6/ , ‘Textdatei für Datenläufe’). Es folgte das UCLA-Tutorial zur Verwendung von read.fwf und […]

Wie organisiert man große R-Programme?

Wenn ich ein R-Projekt von beliebiger Komplexität übernehme, werden meine Skripte schnell lang und verwirrend. Welche Praktiken kann ich anwenden, damit mein Code immer eine Freude ist? Ich denke über Dinge wie Platzierung von functionen in Quelldateien Wann sollte etwas in eine andere Quelldatei umgewandelt werden? Was sollte in der Hauptdatei sein? Verwendung von functionen […]

Was ist der Algorithmus hinter der “Split” -function von R core?

split ist eine besonders wichtige function in R Core. Viele Stack Overflow-Antworten, die R-Basis-Lösungen für die Datenmanipulation anbieten, vertrauen darauf. Es ist die Arbeitspferd Routine jeder Gruppe von Operationen. Es gibt auch viele Fragen, deren Lösung nur eine einzige Zeile mit split . Viele Leute wissen das nicht split.data.frame kann eine Matrix nach Zeilen aufteilen; […]

Suchen Sie nach allgemeinen Teilzeichenfolgen zwischen zwei Zeichenvariablen

Ich habe zwei Zeichenvariablen (Namen von Objekten) und möchte den größten gemeinsamen Teilstring extrahieren. a <- c('blahABCfoo', 'blahDEFfoo') b <- c('XXABC-123', 'XXDEF-123') Ich möchte Folgendes: [1] “ABC” “DEF” Diese Vektoren sollten als Eingabe das gleiche Ergebnis liefern: a <- c('textABCxx', 'textDEFxx') b <- c('zzABCblah', 'zzDEFblah') Diese Beispiele sind repräsentativ. Die Zeichenfolgen enthalten identifizierende Elemente, und […]

Auswerten des Spaltennamens und des Zielwerts innerhalb des `j` Ausdrucks in` data.table`

Erwägen target <- "vs" value <- 1 library(data.table) dt <- as.data.table(head(mtcars)) Also versuche ich, sowohl den Spaltennamen als auch einen Wert als Variablen in den j Ausdruck in der data.table Umgebung zu übergeben, was äquivalent wäre dt[, vs == 1] # [1] FALSE FALSE TRUE TRUE FALSE TRUE Wenn nur der Wert die Variable ist, […]