Articles of r

R Zusammenfassung mehrerer Spalten mit data.table

Ich versuche, data.table zu verwenden, um die Verarbeitung eines großen data.frame (300k x 60) zu beschleunigen, das aus mehreren kleineren zusammengeführten data.frames besteht. Ich bin neu in data.table. Der Code ist wie folgt library(data.table) a = data.table(index=1:5,a=rnorm(5,10),b=rnorm(5,10),z=rnorm(5,10)) b = data.table(index=6:10,a=rnorm(5,10),b=rnorm(5,10),c=rnorm(5,10),d=rnorm(5,10)) dt = merge(a,b,by=intersect(names(a),names(b)),all=T) dt$category = sample(letters[1:3],10,replace=T) und ich fragte mich, ob es einen effizienteren Weg […]

Berechne den Bereich unter einer Kurve

Ich möchte den Bereich unter einer Kurve berechnen, um eine Integration durchzuführen, ohne eine function wie in integrate() . Meine Daten sehen folgendermaßen aus: Date Strike Volatility 2003-01-01 20 0.2 2003-01-01 30 0.3 2003-01-01 40 0.4 etc. Ich habe plot(strike, volatility) gezeichnet, um das Volatilitätslächeln zu betrachten. Gibt es eine Möglichkeit, diese geplottete “Kurve” zu […]

Ordnen Sie die Balken in geom_bar ggplot2 neu an

Ich versuche ein Bar-Plot zu machen, in dem die Handlung von der miRNA mit dem höchsten value zur miRNA mit der niedrigsten geordnet ist. Warum funktioniert mein Code nicht? > head(corr.m) miRNA variable value 1 mmu-miR-532-3p pos 7 2 mmu-miR-1983 pos 75 3 mmu-miR-301a-3p pos 70 4 mmu-miR-96-5p pos 5 5 mmu-miR-139-5p pos 10 6 […]

Erzwingen der Garbage-Collection zum Ausführen in R mit dem Befehl gc ()

Periodisch programmiere ich schlampig. Ok, ich programmiere die ganze Zeit schlampig, aber manchmal holt mich das in Form von Speichermangel-Fehlern ein. Ich fange an, etwas Disziplin beim Löschen von Objekten mit dem Befehl rm () auszuüben, und die Dinge werden besser. Ich sehe gemischte Nachrichten online darüber, ob ich nach dem Löschen großer Datenobjekte explizit […]

Gibt es eine Möglichkeit, zwei ‘…’ statementen in einer function in R zu verwenden?

Ich möchte eine function schreiben, die sowohl plot() als auch legend() aufruft, und es wäre ideal, wenn der Benutzer eine Anzahl zusätzlicher Argumente angeben könnte, die dann entweder an plot() oder an legend() . Ich weiß, dass ich dies für eine der beiden functionen erreichen kann mit … : foo.plot <- function(x,y,…) { plot(x,y,…) legend("bottomleft", […]

Ändern Sie den Variablennamen in for loop mit R

Ich habe eine for-Schleife: for (i in 1:10){ Ai=d+rnorm(3)} Was ich tun möchte, ist A1, A2,A3…A10 und ich habe die Variable i im Variablennamen. Es funktioniert nicht so, aber ich vermisse wahrscheinlich ein kleines Ding. Wie kann ich das i in der for-Schleife verwenden, um verschiedene Variablennamen zuzuordnen?

Wie installiert man die Entwicklungsversion des R-Pakets github repository

Wie kann ich ein Paket, das gerade entwickelt wird, direkt aus einem Github-Repository installieren und nach der Installation wie zwischen den Entwicklungs- und CRAN-Versionen wechseln? Das spezifische Paket, das ich von git installieren möchte, ist ggplot2.

Wie man eine Liste ohne Zwang zu einer Liste reduziert?

Ich versuche, die functionalität zu erreichen, die unlist ähnlich ist, mit der Ausnahme, dass Typen nicht zu einem Vektor gezwungen werden, aber stattdessen die Liste mit beibehaltenen Typen zurückgegeben wird. Zum Beispiel: flatten(list(NA, list(“TRUE”, list(FALSE), 0L)) sollte zurückkehren list(NA, “TRUE”, FALSE, 0L) Anstatt von c(NA, “TRUE”, “FALSE”, “0”) was von unlist(list(list(NA, list(“TRUE”, list(FALSE), 0L)) zurückgegeben […]

Zeilenfarbe und Linientyp in der ggplot-Legende steuern

Hintergrund In Deutschland gibt es 16 Bundesländer, von denen zehn zu Westdeutschland gehörten, sechs davon zu Ostdeutschland. In einigen Aspekten, zum Beispiel Sterblichkeitsraten bestimmter Krebsarten, gibt es anhaltende Unterschiede zwischen den zehn ehemaligen westlichen Staaten und den sechs ehemaligen östlichen. Es gibt auch Unterschiede zwischen den Staaten innerhalb der jeweiligen Gruppen. Um die Unterschiede zwischen […]

Wie erstelle ich einen Beispieldatensatz aus privaten Daten (Ersetzen von Variablennamen und -ebenen durch nicht-informative Platzhalter)?

Um ein reproduzierbares Beispiel für einen Ansatz zu liefern, muss oft ein Datensatz bereitgestellt werden. Anstatt einen Beispieldatensatz zu erstellen, möchte ich einige meiner eigenen Daten verwenden. Diese Daten können jedoch nicht freigegeben werden. Ich möchte variable (Spalten-) Namen und Faktorstufen durch nicht-informative Platzhalter ersetzen (zB V1 …. V5, L1 …. L5). Ist dies ein […]