Articles of r

Replizieren Sie jede Zeile von data.frame und geben Sie die Anzahl der Replikationen für jede Zeile an

df <- data.frame(var1=c('a', 'b', 'c'), var2=c('d', 'e', 'f'), freq=1:3) Was ist der einfachste Weg, um die ersten beiden Spalten des data.frames oben zu erweitern, so dass jede Zeile die Anzahl der Male in der Spalte “Freq” angegeben erscheint? Mit anderen Worten, geh davon aus: df var1 var2 freq 1 ad 1 2 be 2 3 […]

Alle doppelten Zeilen finden, einschließlich “Elemente mit kleineren Indizes”

R duplicated gibt einen Vektor zurück, der anzeigt, ob jedes Element eines Vektors oder Datenrahmens ein Duplikat eines Elements mit einem kleineren Index ist. Wenn also die Zeilen 3, 4 und 5 eines 5-reihigen Datenrahmens gleich sind, wird mir der Vektor duplicated FALSE, FALSE, FALSE, TRUE, TRUE Aber in diesem Fall möchte ich eigentlich bekommen […]

Jahr und Monat (Format “JJJJ-MM”) in ein Datum umwandeln?

Ich habe einen Datensatz, der so aussieht: Month count 2009-01 12 2009-02 310 2009-03 2379 2009-04 234 2009-05 14 2009-08 1 2009-09 34 2009-10 2386 Ich möchte die Daten grafisch darstellen (Monate als x Werte und zählt als y Werte). Da es Lücken in den Daten gibt, möchte ich die Informationen für den Monat in […]

Zusammenfassen nach eindeutiger Kennung und Verketten verwandter Werte in eine Zeichenfolge

Ich habe ein Bedürfnis, das ich mir vorstellen könnte, könnte durch aggregate oder reshape befriedigt werden, aber ich kann es nicht ganz verstehen. Ich habe eine Liste von Namen ( brand ) und begleitender ID-Nummer ( id ). Diese Daten haben eine lange Form, daher können Namen mehrere IDs haben. Ich möchte den Namen (die […]

Genau verstehen, wann eine data.table eine Referenz auf eine andere data.table ist

Ich habe ein kleines data.table , die Pass-by-Reference-Eigenschaften von data.table . Einige Operationen scheinen die Referenz zu “durchbrechen”, und ich würde gerne genau verstehen, was passiert. Beim Erstellen einer data.table aus einer anderen data.table (über <- , dann Aktualisieren der neuen Tabelle durch := wird auch die ursprüngliche Tabelle geändert. Dies wird erwartet, wie folgt: […]

Wie gehe ich mit Sonderzeichen wie \ ^ $.? * | + () [{In meinem Regex?

Ich möchte ein Sonderzeichen für einen regulären Ausdruck finden , \^$.?*|+()[{ . Ich habe es versucht: x <- "a[b" grepl("[", x) ## Error: invalid regular expression '[', reason 'Missing ']'' (Entsprechenderweise stringr::str_detect(x, “[“) oder stringi::stri_detect_regex(x, “[“) .) Verdoppeln Sie den Wert, um zu entkommen, funktioniert nicht: grepl(“[[“, x) ## Error: invalid regular expression ‘[[‘, reason […]

Schnelles Lesen sehr großer Tabellen als Datenrahmen

Ich habe sehr große Tabellen (30 Millionen Zeilen), die ich gerne als Datenframes in R read.table() würde. read.table() hat viele praktische functionen, aber es scheint, als würde es eine Menge Logik in der Implementierung geben, die sich verlangsamen würde Dinge runter. In meinem Fall nehme ich an, dass ich die Arten der Spalten im Voraus […]

Fehler: function konnte nicht gefunden werden … in R

Dies soll eine FAQ-Frage sein, also bitte so vollständig wie möglich. Die Antwort ist eine Community-Antwort, also kannst du sie bearbeiten, wenn du denkst, dass etwas fehlt. Diese Frage wurde auf Meta diskutiert und genehmigt. Ich benutze R und versuchte some.function aber ich bekam folgende Fehlermeldung: Error: could not find function “some.function” Diese Frage kommt […]

Importieren mehrerer CSV-Dateien in R

Angenommen, wir haben einen Ordner mit mehreren data.csv-Dateien, die jeweils die gleiche Anzahl von Variablen enthalten, aber jeweils zu unterschiedlichen Zeiten. Gibt es einen Weg in R, um alle gleichzeitig zu importieren, anstatt sie alle einzeln importieren zu müssen? Mein Problem ist, dass ich rund 2000 Datendateien importieren und einzeln importieren muss, indem ich den […]

Zeilen innerhalb von Gruppen in einem Datenrahmen nummerieren

Arbeiten mit einem ähnlichen Datenrahmen: set.seed(100) df <- data.frame(cat = c(rep("aaa", 5), rep("bbb", 5), rep("ccc", 5)), val = runif(15)) df <- df[order(df$cat, df$val), ] df cat val 1 aaa 0.05638315 2 aaa 0.25767250 3 aaa 0.30776611 4 aaa 0.46854928 5 aaa 0.55232243 6 bbb 0.17026205 7 bbb 0.37032054 8 bbb 0.48377074 9 bbb 0.54655860 10 […]