Articles of r

Entfernen von HTML-Tags aus einer Zeichenfolge in R

Ich versuche, Webseiten-Quelle in R zu lesen und es als Zeichenfolgen zu verarbeiten. Ich versuche, die Absätze herauszunehmen und die HTML-Tags aus dem Absatztext zu entfernen. Ich stoße auf folgendes Problem: Ich habe versucht, eine function zu implementieren, um die HTML-Tags zu entfernen: cleanFun=function(fullStr) { #find location of tags and citations tagLoc=cbind(str_locate_all(fullStr,””)[[1]][,1]); #create storage for […]

Lineare Regressionsschleife für jede unabhängige Variable einzeln gegen abhängig

Ich möchte herausfinden, wie man eine Schleife erstellt oder eine der Anwendungsfunktionen verwendet, um individuelle 1: 1-Regressionsinformationen für jede Variable in einem Datensatz gegen die abhängige Variable zu erhalten. Sagen wir, ich benutze mtcars. Wie würde ich in R-Code schreiben, der jede Variable im Datenrahmen nimmt und sie gegen MPG zurückregelt? Noch besser wäre es, […]

Verwenden einer vordefinierten Farbpalette in ggplot

Kann jemand eine vordefinierte Farbpalette in ggplot verwenden? Ich habe einen Vektor von colors, die ich gerne benutzen würde: rhg_cols <- c("#771C19", "#AA3929", "#E25033", "#F27314", "#F8A31B", "#E2C59F", "#B6C5CC", "#8E9CA3", "#556670", "#000000") Aber wenn ich versuche, es zu nichts passiert passieren ggplot(mydata, aes(factor(phone_partner_products)), color = rhg_cols) + geom_bar()

predict.lm () mit einer unbekannten Faktorstufe in Testdaten

Ich passe ein Modell an, um Daten zu faktorisieren und zu prognostizieren. Wenn die newdata in ” predict.lm() eine einzige Faktorenebene enthalten, die dem Modell unbekannt ist, schlägt die function ” predict.lm() fehl und gibt einen Fehler zurück. Gibt es eine gute Möglichkeit, predict.lm() eine Vorhersage für jene Faktorstufen zu erhalten, die das Modell kennt, […]

R: rvest: Scraping einer dynamischen E-Commerce-Seite

Ich benutze rvest in R, um etwas zu kratzen. Ich kenne etwas HTML und CSS. Ich möchte die Preise für jedes Produkt einer URI erhalten: http://www.linio.com.co/tecnologia/celulares-telefonia-gps/ Die neuen Elemente werden geladen, wenn Sie auf der Seite nach unten gehen (während Sie scrollen). Was ich bisher gemacht habe: Linio_Celulares % html_nodes(“.product-itm-price-new”) %>% html_text() Und ich bekomme, […]

Was ist das Argument Breite in position_dodge?

Die Dokumentation erläutert nicht, was genau dieses Argument width Wessen Breite spezifiziert es? Was ist die “Einheit”? Was ist der Standardwert? Der Standardwert ist width = NULL , aber Trial and Error zeigt an, dass width = 0.9 den Standardeffekt zu erzeugen scheint (siehe Postscript). Ich konnte jedoch nicht finden, wo ein solcher Standardwert im […]

dplyr :: group_by_ mit Zeichenketteneingabe mehrerer Variablennamen

Ich schreibe eine function, bei der der Benutzer aufgefordert wird, eine oder mehrere Gruppierungsvariablen im functionsaufruf zu definieren. Die Daten werden dann mit dplyr gruppiert und funktionieren wie erwartet, wenn es nur eine Gruppierungsvariable gibt, aber ich habe nicht herausgefunden, wie es mit mehreren Gruppierungsvariablen funktioniert. Beispiel: x <- c("cyl") y <- c("cyl", "gear") dots […]

Verwenden Sie beim Zeichnen einer Weltkarte einen anderen Mittelpunkt als den Nullmeridian

Ich überlagere eine Weltkarte aus dem ggplot2 auf eine ggplot2 . Dieses Raster ist jedoch nicht auf den Nullmeridian (0 Grad) zentriert, sondern auf 180 Grad (etwa das Beringmeer und der Pazifik). Der folgende Code ruft die Karte ab und zentriert die Karte um 180 Grad: require(maps) world_map = data.frame(map(plot=FALSE)[c(“x”,”y”)]) names(world_map) = c(“lon”,”lat”) world_map = […]

Bester IDE / TextEditor für R

Mögliche Duplikate: Welche IDEs sind für R unter Linux verfügbar? Empfehlungen für Windows-Texteditor für R Mit welcher IDE oder welchem ​​TextEditor schreibst du R- Code?

Idiom für ifelse-style recoding für mehrere Kategorien

Ich stoße oft genug darauf, dass ich denke, dass es eine gute Sprache dafür geben muss. Angenommen, ich habe einen Datenrahmen mit einer Reihe von Attributen, einschließlich “Produkt”. Ich habe auch einen Schlüssel, der Produkte in Marke + Größe übersetzt. Produktcodes 1-3 sind Tylenol, 4-6 sind Advil, 7-9 sind Bayer, 10-12 sind Generic. Was ist […]