Articles of r

Fügen Sie Zeilen für fehlende Daten ein

Ich bin neu bei R, habe mich aber dazu entschlossen, ein Problem mit einem großen Datensatz zu lösen, den ich zu verarbeiten versuche. Zur Zeit habe ich eine 4 Spalten von Daten (Y-Werte) gegen Minute-Intervall-Zeitstempel (Monat / Tag / Jahr Stunde: min) (X-Werte) wie folgt gesetzt: timestamp tr tt sr st 1 9/1/01 0:00 1.018269e+02 […]

Warum ist rbindlist “besser” als rbind?

Ich gehe durch die Dokumentation von data.table und data.table auch von einigen Gesprächen hier auf SO, dass rbindlist besser sein soll als rbind . Ich würde gerne wissen, warum rbindlist besser ist als rbind und in welchen Szenarien rbindlist wirklich über rbind ? Gibt es einen Vorteil in Bezug auf die Speichernutzung?

Lesen Sie mehrere CSV-Dateien in separate Datenrahmen

Angenommen, wir haben die Dateien file1.csv , file2.csv , … und file100.csv im Verzeichnis C: \ R \ Data und möchten sie alle in separate Datenrahmen (z. B. Datei1 , Datei2 , … und Datei100 ). Der Grund dafür ist, dass sie trotz ähnlicher Namen unterschiedliche Dateistrukturen haben, so dass es nicht sinnvoll ist, sie […]

Weisen Sie mehrere Spalten mithilfe von: = in data.table nach Gruppe zu

Was ist der beste Weg, um mit data.table mehreren Spalten data.table ? Beispielsweise: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) Ich würde gerne so etwas machen (natürlich ist diese Syntax falsch): x[ , (col1, col2) := f(), by = “id] Und um das zu erweitern, habe ich vielleicht viele Spalten mit Namen […]

.EACHI in data.table?

Ich kann anscheinend keine Dokumentation darüber finden, was genau .EACHI in data.table . Ich sehe eine kurze Erwähnung in der Dokumentation: Die Aggregation für eine Untergruppe bekannter Gruppen ist besonders effizient, wenn diese Gruppen in i übergeben und by=.EACHI . Wenn i eine data.table ist, wertet DT[i,j,by=.EACHI] j für die Gruppen von DT , mit […]

Formel mit dynamischer Anzahl von Variablen

Angenommen, es gibt einige data.frame foo_data_frame und man möchte die Regression der Zielspalte Y durch einige andere Spalten finden. Zu diesem Zweck werden normalerweise einige Formeln und Modelle verwendet. Beispielsweise: linear_model <- lm(Y ~ FACTOR_NAME_1 + FACTOR_NAME_2, foo_data_frame) Das funktioniert gut, wenn die Formel statisch codiert ist. Wenn mehrere Modelle mit der konstanten Anzahl abhängiger […]

rgdal Paketinstallation

Das Problem hier ist nicht genau, wie Karten durch R geplottet werden, wie ich hier schon ein schönes Beispiel gefunden habe , sondern wie es funktioniert. In der Tat kann ich Bibliothek rgdal nicht laden: library(rgdal) Error in library(rgdal) : there is no package called ‘rgdal’ Wenn ich jedoch versuche, das obige Paket manuell zu […]

Behalten Sie für jede Faktorstufe nur den Mindestwert bei

Ich habe ein Problem, das mich für einige Zeit nervt … hoffentlich kann mir hier jemand helfen. Ich habe den folgenden Datenrahmen bekommen f <- c('a','a','b','b','b','c','d','d','d','d') v1 <- c(1.3,10,2,10,10,1.1,10,3.1,10,10) v2 <- c(1:10) df <- data.frame(f,v1,v2) f ist ein Faktor; v1 und v2 sind Werte. Für jede Ebene von f möchte ich nur eine Zeile behalten: […]

Offline-Installation von R-Paket und Abhängigkeiten

Angenommen, ich muss mehrere Pakete auf einem (Linux-) Rechner installieren, der keine Internetverbindung hat. Angenommen, ich habe eine Kopie von Crane heruntergeladen und auf einer DVD gebrannt, die ich an den Offline-Standort mitbringe: wget ftp://cran.r-project.org/pub/R/src/contrib/*.tar.gz Ich kann sogar eine PACKAGES-Datei hinzufügen, die eine Übersicht aller Quellpakete und ihrer Abhängigkeiten enthält: library(tools) write_PACKAGES() Wie kann ich […]

R verteilt mehrere Spalten mit tidyr

Nimm diese Beispielvariable df <- data.frame(month=rep(1:3,2), student=rep(c("Amy", "Bob"), each=3), A=c(9, 7, 6, 8, 6, 9), B=c(6, 7, 8, 5, 6, 7)) Ich kann spread von tidyr , um dies in Wide Format zu ändern. > df[, -4] %>% spread(student, A) month Amy Bob 1 1 9 8 2 2 7 6 3 3 6 9 […]