Articles of r

Löschen Sie “” aus CSV-Werten und ändern Sie die Spaltennamen, wenn Sie in eine CSV-Datei schreiben

Ich versuche, csv-Dateien aus einer R-Tabelle zu erstellen. Aber ich kann nicht verstehen, warum alle Werte mit “” überprüft werden, wenn ich die function write.csv () verwende. Meine Daten sehen so aus: Sample Sample_Name Sample_Group Pool_ID Sample_Plate NorTum Sentrix_ID Sentrix_Position HybNR 1 00_11242 00_24200N2 MUTYH GS0005703-OPA GS0010004-DNA N 1280307 R007_C005 1 2 00_11242 00_24200N2 MUTYH […]

Erstellen Sie eine kategoriale Variable in R basierend auf dem Bereich

Ich habe ein Datenframe mit einer Spalte von Ganzzahlen, die ich als Referenz verwenden möchte, um eine neue kategoriale Variable zu erstellen. Ich möchte die Variable in drei Gruppen aufteilen und die Bereiche selbst festlegen (zB 0-5, 6-10 usw.). Ich habe versucht, cut aber das teilt die Variable in Gruppen basierend auf einer normalen Verteilung […]

Verwenden Sie stat_summary, um das Diagramm mit der Anzahl der Beobachtungen zu versehen

Wie kann ich stat_summary , um ein Diagramm mit n = x zu beschriften, wo x eine Variable ist? Hier ist ein Beispiel für die gewünschte Ausgabe: Ich kann das obige Diagramm mit diesem ziemlich ineffizienten Code machen: nlabels <- sapply(1:length(unique(mtcars$cyl)), function(i) as.vector(t(as.data.frame(table(mtcars$cyl))[,2][[i]]))) ggplot(mtcars, aes(factor(cyl), mpg, label=rownames(mtcars))) + geom_boxplot(fill = "grey80", colour = "#3366FF") + […]

Entspricht dem Unix-Befehl “less” in der R-Konsole

Gibt es eine Entsprechung zu dem Befehl unix less , der in der R-Konsole verwendet werden kann?

Schreiben Sie viele Dateien in eine for-Schleife

Ich habe Beispieldaten wie folgt df <- data.frame(name = rep(letters[1:7], each = 24), salary = runif(24*7, 100, 200)) Ich wollte jeden Namen mit ihren Gehältern trennen lst <- tapply(df$salary, df$name, matrix, nrow = 4, byrow = TRUE) Jetzt möchte ich alle diese 7 Matrizen in 7 verschiedene Textdateien schreiben, es funktioniert nur für jeweils eine […]

Subset einen Datenrahmen zwischen 2 Daten

Ich arbeite seit 1993 mit täglichen Renditen aus einem brasilianischen Index (IBOV), ich versuche herauszufinden, wie man am besten für Zeiträume zwischen zwei Datensätzen rechnet. Der IBOV_RET ( IBOV_RET ) ist wie folgt: head(IBOV_RET) DATE 1D_RETURN 1 1993-04-28 -0.008163265 2 1993-04-29 -0.024691358 3 1993-04-30 0.016877637 4 1993-05-03 0.000000000 5 1993-05-04 0.033195021 6 1993-05-05 -0.012048193 … […]

Weisen Sie .GlobalEnv mehrere Objekte innerhalb einer function zu

Ein Beitrag hier am Tag zurück hat mich gefragt, wie man mehreren Objekten in der globalen Umgebung Werte innerhalb einer function zuweist. Dies ist mein Versuch, mit Hilfe von ” lapply ( assign kann sicherer sein als <<- aber ich habe es nie benutzt und bin damit nicht vertraut). #fake data set df <- data.frame( […]

Wie berechnet man Mittel / Median pro Gruppe in einem Datenrahmen in r

Ich habe einen Datenrahmen, der aufzeichnet, wie viel Geld ein Kunde im Detail wie folgt ausgibt: custid, value 1, 1 1, 3 1, 2 1, 5 1, 4 1, 1 2, 1 2, 10 3, 1 3, 2 3, 5 Wie berechne ich die Charakteristiken mit Mittelwert, Max, Median, Std, etc wie folgt? Verwenden Sie […]

Wie lese ich nur Zeilen, die eine Bedingung von einem CSV in R erfüllen?

Ich versuche eine große CSV-Datei in R zu lesen. Obwohl die Datei groß ist, möchte ich nur mit einigen Zeilen arbeiten, die eine bestimmte Bedingung erfüllen (zB Variable2> = 3). Dies ist ein viel kleinerer Datensatz. Ich möchte diese Zeilen direkt in einen Datenrahmen einlesen, anstatt den gesamten Datensatz in einen Datenrahmen zu laden und […]

Zeilenumbruch wenn keine Daten in ggplot2

Ich verwende R, um einige Daten zu plotten. Date <- c("07/12/2012 05:00:00", "07/12/2012 06:00:00", "07/12/2012 07:00:00", "07/12/2012 08:00:00","07/12/2012 10:00:00","07/12/2012 11:00:00") Date <- strptime(Date, "%d/%m/%Y %H:%M") Counts <- c("0","3","10","6","5","4") Counts <- as.numeric(Counts) df1 <- data.frame(Date,Counts,stringsAsFactors = FALSE) library(ggplot2) g = ggplot(df1, aes(x=Date, y=Counts)) + geom_line(aes(group = 1)) g Wie bitte ich R, Daten nicht als durchgehende […]