Articles of r

So löschen Sie Zeilen aus einem Datenrahmen, die n * NA enthalten

Ich habe eine Reihe von großen Datensätzen mit ~ 10 Spalten und ~ 200000 Zeilen. Nicht alle Spalten enthalten Werte für jede Zeile, obwohl mindestens eine Spalte einen Wert für die vorhandene Zeile enthalten muss. Ich möchte einen Schwellenwert für die NA zulässigen NAs in einer Zeile festlegen. Mein Dataframe sieht ungefähr so ​​aus: ID […]

Spread mit data.frame / tibble mit doppelten Bezeichnern

Die Dokumentation für tidyr legt nahe, dass Sammeln und Verbreiten transitiv sind, aber das folgende Beispiel mit den “iris” -Daten zeigt, dass dies nicht der Fall ist, aber es ist nicht klar, warum. Jede Klärung wird sehr geschätzt iris.df = as.data.frame(iris) long.iris.df = iris.df %>% gather(key = feature.measure, value = size, -Species) w.iris.df = long.iris.df […]

definiere $ right-Parameter mit einer Variablen in R

Ich möchte eine Variable an den binären Operator $ übergeben. Sagen wir, ich habe das > levels(diamonds$cut) [1] “Fair” “Good” “Very Good” “Premium” “Ideal” Dann möchte ich eine function machen, die als Parameter den Selektor für $ übernimmt my_helper <- function (my_param) { levels(diamonds$my_param) } Aber das funktioniert nicht > my_helper(cut) NULL > my_helper(“cut”) NULL

ggplot, facet, piechart: Platzieren von Text in der Mitte von Tortendiagrammen

Ich versuche, ein facettiertes Tortendiagramm mit ggplot zu erstellen, und stelle dabei Probleme mit der Platzierung von Text in der Mitte jedes Slices: dat = read.table(text = “Channel Volume Cnt AGENT high 8344 AGENT medium 5448 AGENT low 23823 KIOSK high 19275 KIOSK medium 13554 KIOSK low 38293”, header=TRUE) vis = ggplot(data=dat, aes(x=factor(1), y=Cnt, fill=Volume)) […]

Warum verwendet strsplit positive Lookahead- und Lookbehind-Assertion-Übereinstimmungen?

Gesunder Menschenverstand und eine gregexpr() mit gregexpr() zeigen an, dass die Look- gregexpr() und Look-Ahead-Assertion unten in testString jeweils an genau einer Stelle testString : testString <- "text XX text" BB <- "(?<= XX )" FF <- "(?= XX )" as.vector(gregexpr(BB, testString, perl=TRUE)[[1]]) # [1] 9 as.vector(gregexpr(FF, testString, perl=TRUE)[[1]][1]) # [1] 5 strsplit() verwendet diese […]

Auftrag gestapelt Balkendiagramm in ggplot

Mein Kollege und ich versuchen, ein gestapeltes Balkendiagramm basierend auf den y-Werten anstatt alphabetisch nach den x-Werten zu sortieren. Die Beispieldaten sind: samp.data <- structure(list(fullname = c("LJ", "PR", "JB", "AA", "NS", "MJ", "FT", "DA", "DR", "AB", "BA", "RJ", "BA2", "AR", "GG", "RA", "DK", "DA2", "BJ2", "BK", "HN", "WA2", "AE2", "JJ2"), I = c(2L, 1L, 3L, […]

Identifizieren Sie Gruppen von verknüpften Episoden, die miteinander verknüpft sind

Nehmen Sie diesen einfachen Datenrahmen von verknüpften IDs: test test id1 id2 1 10 1 2 10 36 3 1 24 4 1 45 5 24 300 6 8 11 Ich möchte nun alle IDs gruppieren, die verlinken. Mit “Link” meine ich die Kette von Links, so dass alle IDs in einer Gruppe zusammen gekennzeichnet […]

Wie druckt man R-Grafiken auf mehrere Seiten eines PDFs und mehrerer PDFs?

ich weiß das pdf(“myOut.pdf”) wird auf ein PDF in R gedruckt. Was, wenn ich möchte Machen Sie eine Schleife, die nachfolgende Graphiken auf neuen Seiten einer PDF-Datei druckt (bis zum Ende anhängend)? Machen Sie eine Schleife, die nachfolgende Graphen auf neue PDF-Dateien druckt (ein Graph pro Datei)?

Wie kann man sagen, was in einem Vektor ist und nicht in einem anderen?

In Matlab gibt es eine Möglichkeit, die Werte in einem Vektor zu finden, aber nicht in dem anderen. beispielsweise: x <- c(1,2,3,4) y <- c(2,3,4) Gibt es irgendeine function, die mir sagen würde, dass der Wert in x , der nicht in y ist, 1 ist?

Tiefgestellte Buchstaben in der ggplot-Achsenbeschriftung

Ein weiterer Graph zur Veröffentlichung, ein weiterer Tag, in dem Dinge in ggplot2 optimiert wurden … Werde ich gejammert? Ich bin mir nicht sicher… dat <- data.frame(x = rnorm(100), y = rnorm(100)) ggplot(dat, aes(x=x,y=y)) + geom_point() + labs(y=expression(Blah[1])) dat <- data.frame(x = rnorm(100), y = rnorm(100)) ggplot(dat, aes(x=x,y=y)) + geom_point() + labs(y=expression(Blah[1d])) Ich versuche herauszufinden, […]