Articles of r

Suchen Sie nach allgemeinen Teilzeichenfolgen zwischen zwei Zeichenvariablen

Ich habe zwei Zeichenvariablen (Namen von Objekten) und möchte den größten gemeinsamen Teilstring extrahieren. a <- c('blahABCfoo', 'blahDEFfoo') b <- c('XXABC-123', 'XXDEF-123') Ich möchte Folgendes: [1] “ABC” “DEF” Diese Vektoren sollten als Eingabe das gleiche Ergebnis liefern: a <- c('textABCxx', 'textDEFxx') b <- c('zzABCblah', 'zzDEFblah') Diese Beispiele sind repräsentativ. Die Zeichenfolgen enthalten identifizierende Elemente, und […]

Auswerten des Spaltennamens und des Zielwerts innerhalb des `j` Ausdrucks in` data.table`

Erwägen target <- "vs" value <- 1 library(data.table) dt <- as.data.table(head(mtcars)) Also versuche ich, sowohl den Spaltennamen als auch einen Wert als Variablen in den j Ausdruck in der data.table Umgebung zu übergeben, was äquivalent wäre dt[, vs == 1] # [1] FALSE FALSE TRUE TRUE FALSE TRUE Wenn nur der Wert die Variable ist, […]

Warum wird update auf einem lm innerhalb einer gruppierten data.table verwendet, die ihre Modelldaten verliert?

Ok, das ist ein komisches. Ich vermute, das ist ein Fehler in der data.table , aber es wäre nützlich, wenn irgendjemand erklären könnte, warum das passiert – was genau macht update ? Ich verwende den list(list()) Trick in der data.table , um angepasste Modelle zu speichern. Wenn Sie für verschiedene Gruppierungen jeweils eine Folge von […]

Warum bekomme ich “Warnung, längere Objektlänge ist kein Vielfaches kürzerer Objektlänge”?

Ich habe Dataframe dih_y2. Diese zwei Zeilen geben mir eine Warnung: > memb = dih_y2$MemberID[1:10] > dih_col = which(dih_y2$MemberID == memb) Warning message: In dih_y2$MemberID == memb : longer object length is not a multiple of shorter object length Warum?

Bedeutung des ddply-Fehlers: Attribut ‘name’ muss die gleiche Länge wie der Vektor haben

Ich mache maschinelles Lernen für Hacker und stehe an dieser Stelle fest: from.weight <- ddply(priority.train, .(From.EMail), summarise, Freq = length(Subject)) Das erzeugt den folgenden Fehler: Error in attributes(out) <- attributes(col) : 'names' attribute [9] must be the same length as the vector [1] Dies ist ein traceback (): > traceback() 11: FUN(1:5[[1L]], …) 10: lapply(seq_len(n), […]

Schedule R-Skript mit Cron

Ich versuche, mein R-Skript mit Cron zu planen, aber es funktioniert nicht. Es scheint, dass R Pakete in Cron nicht finden kann. Kann mir jemand helfen? Vielen Dank. Das Folgende ist mein Bash-Skript # source my profile . /home/winie/.profile # script.R will load packages R CMD BATCH /home/script.R

Wie man numerische Listenelemente summiert

Ich wundere mich über eine elegante Möglichkeit, die numerischen Werte einer Liste zu summieren (oder einen Mittelwert zu berechnen). z.B x <- list( a = matrix(c(1,2,3,4), nc=2), b = matrix(1, nc=2, nr=2)) und will bekommen x[[1]]+x[[2]] oder ein Mittelwert: (x[[1]]+x[[2]])/2

Teilen Sie eine Spalte mit verketteten kommagetrennten Daten und recode output als Faktoren

Ich versuche, einige Daten zu bereinigen, die falsch eingegeben wurden. Die Frage für die Variable erlaubt mehrere Antworten von fünf Auswahlmöglichkeiten, nummeriert als 1 bis 5. Die Daten wurden auf folgende Weise eingegeben (dies ist nur ein Beispiel – es gibt viel mehr Variablen und viele weitere Beobachtungen in den tatsächlichen Daten Rahmen): data V1 […]

Der Punkt wird in ggplot auf der x-Achse abgeschnitten

Ich zeichne eine Zeitreihe mit Mittelwerten einer Antwortvariablen als Punkte (y-Achse) nach Monat (x-Achse). Werte auf der X-Achse (also 0 Werte) werden abgeschnitten. Ich kann die Grenzen der Y-Achse ändern, um etwas unter 0 zu paddeln, aber ich bevorzuge es nicht. Gibt es eine Möglichkeit, diese 0 Punkte vor oder auf der X-Achse zu zeichnen?

Fügen Sie den Index zu fortlaufenden Läufen mit gleichen Werten hinzu

Gibt es einen schnelleren Weg, einen Zählerindex zu erstellen als mit einer Schleife? In zusammenhängenden Läufen mit gleichen Werten sollte der Index derselbe sein. Ich finde die Schleife sehr langsam, besonders wenn die Daten so groß sind. Zur Veranschaulichung, hier ist die Eingabe und die gewünschte Ausgabe x <- c(2, 3, 9, 2, 4, 4, […]