similar to: partialPlot en un Randomforest

Displaying 20 results from an estimated 1000 matches similar to: "partialPlot en un Randomforest"

2018 Jan 07
4
partialPlot en un Randomforest
Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día de reyes a la 1.20h y me contestas a las 2.45h) Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En un RF para clasificación me da valores parecidos a los de tu ejemplo, y en otro para regresión, valores de y entre 45 y 55. Para regresión, el último parámetro no puede ser una categoría, como
2016 Apr 12
3
Random Forest para clasificación
Gracias por la pronta respuesta, pero tras leer la contestación de la gente, sigo sin entender muy bien la explicación. Le responden lo siguiente: "Each point on the partial dependence plot is the average vote percentage in favor of the "Yes trees" class across all observations, given a fixed level of TRI. It's not a probability of correct classification. It has absolutely
2016 Apr 12
3
Random Forest para clasificación
No no, eso lo he sacaod, es decir, tengo la matriz de confusión para las OK/NOK, lo que no entiendo es como extraer las conclusiones sobre el modelo, de cara a como afectan las variables. He seguido dos estrategias: 1-Crear arboles de clasificacion con las variables más importantes del random Forest, pero el modelo se empobrece bastante. 2- Sacar los partialPlot, para ver la influencia de cada
2016 Apr 12
2
Random Forest para clasificación
Mi matriz de datos inicial estaba muy desbalanceada (5% de la clase minoritaria), por lo que he creado con el algoritmo SMOTE un dataset balanceado con el que he creado el modelo, y luego sobre ese modelo he creado la matriz de confusión con los datos originales. Respecto a lo que me comentas, Carlos, creo que además de todo lo que comentas, que está bien, en micaso es necesario también saber no
2016 Apr 12
2
Random Forest para clasificación
Buenas, Cuando estoy haciendo un random Forest para clasificación y hago el gráfico partialPlot, siendo mi respuesta OK/NOK, me sale en el eje X el valor de la variable, pero en el eje Y me salen valores de entre -1 y 1. ¿Qué significado tiene? Adjunto un ejemplo: https://www.dropbox.com/s/4b92lqxi3592r0d/Captura.JPG?dl=0 Gracias!!! [[alternative HTML version deleted]]
2010 Oct 04
1
Force evaluation of variable when calling partialPlot
Dear R Users, I'm using the randomForest package and would like to generate partial dependence plots, one after another, for a variety of variables: m <- randomForest( s, ... ) varnames <- c( "var1", "var2", "var3", "var4" ) # var1..4 are all in data frame s for( v in varnames ) { partialPlot( x=m, pred.data=s, x.var=v ) } ...but this
2010 Nov 16
1
Force evaluation of variable when calling partialPlot
Greg, Two thoughts: 1. It might be possible that 'vars' is a reserved word of sorts and if you change the name of your vector RF might be happier 2. A way that works for me is to call importance as follows: sel.imp <- importance(sel.rf, class=NULL, scale=TRUE, type=NULL) and then use the 'names' of the imp data frame to be absolutely clear to RF you are talking about the
2010 Sep 22
2
randomForest - partialPlot - Reg
Dear R Group I had an observation that in some cases, when I use the randomForest model to create partialPlot in R using the package "randomForest" the y-axis displays values that are more than -1! It is a classification problem that i was trying to address. Any insights as to how the y axis can display value more than -1 for some variables? Am i missing something! Thanks Regards
2019 Mar 04
2
Calcular una probabilidad asociada a una variable
Buenas tardes erreros. Tengo una variable que va de -20 a 40 y quiero crear otra, que vaya de 0 a 1, normal, que disminuya con su distancia a 20. El 0 se alcanzaría, p.e., a una distancia de 15, es decir, para valores menores de 5 y mayores de 35. Llevo más de una hora intentándolo pero no doy con la clave. Muchas gracias por vuestro tiempo, Manuel
2019 Mar 04
2
Calcular una probabilidad asociada a una variable
Buenas, Eso pensé yo en un principio, que quería normalizar, pero fíjate que dice que el 1 tiene que ser el valor 20, y a partir de allí descender en ambos lados, si normaliza tendrá la variable centrada en 1, pero aquellos valores que sean mayores que 20 en la variable original, ahora seguirán siendo mayores de 1 y no como el pide menores. Xavi Missatge de Javier Marcuzzi
2011 Sep 14
1
substitute games with randomForest::partialPlot
I'm having trouble calling randomForest::partialPlot programmatically. It tries to use name of the (R) variable as the data column name. Example: library(randomForest) iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE, proximity=TRUE) partialPlot(iris.rf, iris, Sepal.Width) # works partialPlot(iris.rf, iris, "Sepal.Width") # works (function(var.name)
2018 Feb 19
3
gbm.step para clasificación no binaria
Gracias Carlos. Hasta donde yo entiendo si las hay: El argumento family puede ser: "gaussian" (for minimizing squared error); por lo que tiene que ser numérica "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices "poisson" (count outcomes; requires the response to be a positive integer); numérica también, pues. La única podría ser
2019 Mar 04
2
Calcular una probabilidad asociada a una variable
Perdón, volviéndolo a leer creo que lo he entendido mejor. En lugar de calcular la distancia a 20, calculala a tus limites exteriores. poniendo cero directamente los que sean mayores. Asi, miramos por cada punto que limite exterior le queda mas cercano (5 o 35). Si es inferior a 5 o superior a 35 ponemos cero directamente, en cualquier otro caso la distancia al punto que de los do este más próximo
2018 Feb 19
2
Gráficas 3D
Gracias Carlos, mi idea es construir un cono, un cilindro u otros cuerpos geométrico y luego graficarlos. Alguna idea de como empezar? Muchas gracias como siempre El lun., 19 de feb. de 2018 15:06, <r-help-es-request en r-project.org> escribió: > Envíe los mensajes para la lista R-help-es a > r-help-es en r-project.org > > Para subscribirse o anular su subscripción a
2018 May 31
2
predicciones sobre el OOB de randomForest
Gracias Carlos. No uso caret, pero lo miraré. Quoting Carlos Ortega <cof en qualityexcellence.es>: > Hola, > > Creo que si utilizas "caret" y en la función "trainControl()" defines "oob" > como criterio de randomización, puedes luego recuperar del objeto del > modelo, las predicciones individuales... > > Saludos, > Carlos Ortega >
2019 Feb 19
2
crear un vector con las categorías
Bueno, creo que no contesté tu pregunta. Con training <- data[-i, ] crea una df llamada training, sin la muestra i, que después utiliza para entrenar el algoritmo. Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>: > Estimado Manuel Mendoza > > Con sus datos y a modo de curiosidad, ¿que pasa en training <- data[-i, ]? > > Javier Rubén Marcuzzi >
2019 Feb 18
3
crear un vector con las categorías
Gracias Jorge. No entiendo bien; la variable objetivo es ya factor. El árbol me la predice bien, como factor, también. Es al ir construyendo el vector que lo anota con un nº, según de cuál de las 4 categorías se trate. Quoting Jorge I Velez <jorgeivanvelez en gmail.com>: > Estimado Manuel, > > Debes definir ecsta como factor usando, por ejemplo, > > factor(ecsta,
2018 Feb 19
3
gbm.step para clasificación no binaria
Hola de nuevo. Se me olvidaba la principal razón para utilizar gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan (a diferencia de los random forest o cualquier otro bootstrap) pero gbm.step hace validación cruzada para determinar el nº óptimo de árboles y evitarlo. Es fundamental. La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces, y usar el
2018 Apr 14
2
Encontrar el más votado
Gracias Carlos J., sale bien, pero me transforma las 6 categorías en números del 1 al 6 ¿sabes cómo evitarlo? Quoting "Carlos J. Gil Bellosta" <cgb en datanalytics.com>: > apply(data, 1, function(x) which.max(table(x))) > > El sáb., 14 abr. 2018 a las 19:54, Manuel Mendoza (<mmendoza en mncn.csic.es>) > escribió: > >> >> Buenas tardes de
2018 Jun 27
2
error en un cmeans
Pues no lo sé. Es algo del código de RandomForest, supongo. Quoting Jesús Para Fernández <j.para.fernandez en hotmail.com>: > U es un dataframe? > > Obtener Outlook para Android<https://aka.ms/ghei36> > > ________________________________ > From: R-help-es <r-help-es-bounces en r-project.org> on behalf of > Manuel Mendoza <mmendoza en mncn.csic.es>