Displaying 20 results from an estimated 1000 matches similar to: "partialPlot en un Randomforest"
2018 Jan 07
4
partialPlot en un Randomforest
Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día
de reyes a la 1.20h y me contestas a las 2.45h)
Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En
un RF para clasificación me da valores parecidos a los de tu ejemplo,
y en otro para regresión, valores de y entre 45 y 55.
Para regresión, el último parámetro no puede ser una categoría, como
2010 Oct 04
1
Force evaluation of variable when calling partialPlot
Dear R Users,
I'm using the randomForest package and would like to generate partial
dependence plots, one after another, for a variety of variables:
m <- randomForest( s, ... )
varnames <- c( "var1", "var2", "var3", "var4" ) # var1..4 are all in
data frame s
for( v in varnames ) {
partialPlot( x=m, pred.data=s, x.var=v )
}
...but this
2010 Nov 16
1
Force evaluation of variable when calling partialPlot
Greg,
Two thoughts:
1. It might be possible that 'vars' is a reserved word of sorts and if you change the name of your vector RF might be happier
2. A way that works for me is to call importance as follows:
sel.imp <- importance(sel.rf, class=NULL, scale=TRUE, type=NULL)
and then use the 'names' of the imp data frame to be absolutely clear to RF you are talking about the
2016 Apr 12
3
Random Forest para clasificación
Gracias por la pronta respuesta, pero tras leer la contestación de la gente, sigo sin entender muy bien la explicación.
Le responden lo siguiente:
"Each point on the partial dependence plot is the average vote
percentage in favor of the "Yes trees" class across all observations,
given a fixed level of TRI.
It's not a probability of correct classification. It has absolutely
2010 Sep 22
2
randomForest - partialPlot - Reg
Dear R Group
I had an observation that in some cases, when I use the randomForest model
to create partialPlot in R using the package "randomForest"
the y-axis displays values that are more than -1!
It is a classification problem that i was trying to address.
Any insights as to how the y axis can display value more than -1 for some
variables?
Am i missing something!
Thanks
Regards
2019 Mar 04
2
Calcular una probabilidad asociada a una variable
Buenas tardes erreros.
Tengo una variable que va de -20 a 40 y quiero crear otra, que vaya de
0 a 1, normal, que disminuya con su distancia a 20. El 0 se
alcanzaría, p.e., a una distancia de 15, es decir, para valores
menores de 5 y mayores de 35. Llevo más de una hora intentándolo pero
no doy con la clave.
Muchas gracias por vuestro tiempo,
Manuel
2016 Apr 12
3
Random Forest para clasificación
No no, eso lo he sacaod, es decir, tengo la matriz de confusión para las OK/NOK, lo que no entiendo es como extraer las conclusiones sobre el modelo, de cara a como afectan las variables. He seguido dos estrategias:
1-Crear arboles de clasificacion con las variables más importantes del random Forest, pero el modelo se empobrece bastante.
2- Sacar los partialPlot, para ver la influencia de cada
2016 Apr 12
2
Random Forest para clasificación
Mi matriz de datos inicial estaba muy desbalanceada (5% de la clase minoritaria), por lo que he creado con el algoritmo SMOTE un dataset balanceado con el que he creado el modelo, y luego sobre ese modelo he creado la matriz de confusión con los datos originales.
Respecto a lo que me comentas, Carlos, creo que además de todo lo que comentas, que está bien, en micaso es necesario también saber no
2019 Mar 04
2
Calcular una probabilidad asociada a una variable
Buenas,
Eso pensé yo en un principio, que quería normalizar, pero fíjate que dice
que el 1 tiene que ser el valor 20, y a partir de allí descender en ambos
lados, si normaliza tendrá la variable centrada en 1, pero aquellos valores
que sean mayores que 20 en la variable original, ahora seguirán siendo
mayores de 1 y no como el pide menores.
Xavi
Missatge de Javier Marcuzzi
2016 Apr 12
2
Random Forest para clasificación
Buenas,
Cuando estoy haciendo un random Forest para clasificación y hago el gráfico partialPlot, siendo mi respuesta OK/NOK, me sale en el eje X el valor de la variable, pero en el eje Y me salen valores de entre -1 y 1. ¿Qué significado tiene?
Adjunto un ejemplo:
https://www.dropbox.com/s/4b92lqxi3592r0d/Captura.JPG?dl=0
Gracias!!!
[[alternative HTML version deleted]]
2011 Sep 14
1
substitute games with randomForest::partialPlot
I'm having trouble calling randomForest::partialPlot programmatically.
It tries to use name of the (R) variable as the data column name.
Example:
library(randomForest)
iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE, proximity=TRUE)
partialPlot(iris.rf, iris, Sepal.Width) # works
partialPlot(iris.rf, iris, "Sepal.Width") # works
(function(var.name)
2018 Feb 19
3
gbm.step para clasificación no binaria
Gracias Carlos. Hasta donde yo entiendo si las hay:
El argumento family puede ser:
"gaussian" (for minimizing squared error); por lo que tiene que ser numérica
"bernoulli" (logistic regression for 0-1 out-comes); binaria por narices
"poisson" (count outcomes; requires the response to be a positive
integer); numérica también, pues.
La única podría ser
2019 Mar 04
2
Calcular una probabilidad asociada a una variable
Perdón, volviéndolo a leer creo que lo he entendido mejor. En lugar de
calcular la distancia a 20, calculala a tus limites exteriores. poniendo
cero directamente los que sean mayores. Asi, miramos por cada punto que
limite exterior le queda mas cercano (5 o 35). Si es inferior a 5 o
superior a 35 ponemos cero directamente, en cualquier otro caso la
distancia al punto que de los do este más próximo
2018 Feb 19
2
Gráficas 3D
Gracias Carlos, mi idea es construir un cono, un cilindro u otros cuerpos
geométrico y luego graficarlos. Alguna idea de como empezar?
Muchas gracias como siempre
El lun., 19 de feb. de 2018 15:06, <r-help-es-request en r-project.org>
escribió:
> Envíe los mensajes para la lista R-help-es a
> r-help-es en r-project.org
>
> Para subscribirse o anular su subscripción a
2018 May 31
2
predicciones sobre el OOB de randomForest
Gracias Carlos. No uso caret, pero lo miraré.
Quoting Carlos Ortega <cof en qualityexcellence.es>:
> Hola,
>
> Creo que si utilizas "caret" y en la función "trainControl()" defines "oob"
> como criterio de randomización, puedes luego recuperar del objeto del
> modelo, las predicciones individuales...
>
> Saludos,
> Carlos Ortega
>
2019 Feb 19
2
crear un vector con las categorías
Bueno, creo que no contesté tu pregunta. Con training <- data[-i, ]
crea una df llamada training, sin la muestra i, que después utiliza
para entrenar el algoritmo.
Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>:
> Estimado Manuel Mendoza
>
> Con sus datos y a modo de curiosidad, ¿que pasa en training <- data[-i, ]?
>
> Javier Rubén Marcuzzi
>
2019 Feb 18
3
crear un vector con las categorías
Gracias Jorge. No entiendo bien; la variable objetivo es ya factor. El
árbol me la predice bien, como factor, también. Es al ir construyendo
el vector que lo anota con un nº, según de cuál de las 4 categorías se
trate.
Quoting Jorge I Velez <jorgeivanvelez en gmail.com>:
> Estimado Manuel,
>
> Debes definir ecsta como factor usando, por ejemplo,
>
> factor(ecsta,
2018 Feb 19
3
gbm.step para clasificación no binaria
Hola de nuevo. Se me olvidaba la principal razón para utilizar
gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan
(a diferencia de los random forest o cualquier otro bootstrap) pero
gbm.step hace validación cruzada para determinar el nº óptimo de
árboles y evitarlo. Es fundamental.
La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces,
y usar el
2018 Apr 14
2
Encontrar el más votado
Gracias Carlos J., sale bien, pero me transforma las 6 categorías en
números del 1 al 6
¿sabes cómo evitarlo?
Quoting "Carlos J. Gil Bellosta" <cgb en datanalytics.com>:
> apply(data, 1, function(x) which.max(table(x)))
>
> El sáb., 14 abr. 2018 a las 19:54, Manuel Mendoza (<mmendoza en mncn.csic.es>)
> escribió:
>
>>
>> Buenas tardes de
2018 Jun 27
2
error en un cmeans
Pues no lo sé. Es algo del código de RandomForest, supongo.
Quoting Jesús Para Fernández <j.para.fernandez en hotmail.com>:
> U es un dataframe?
>
> Obtener Outlook para Android<https://aka.ms/ghei36>
>
> ________________________________
> From: R-help-es <r-help-es-bounces en r-project.org> on behalf of
> Manuel Mendoza <mmendoza en mncn.csic.es>