thr3ads.net - similar to: "problema con ggplot2"

Displaying 20 results from an estimated 3000 matches similar to: "problema con ggplot2"

predicciones sobre el OOB de randomForest

2018 May 31

predicciones sobre el OOB de randomForest

Gracias Carlos. No uso caret, pero lo miraré. Quoting Carlos Ortega <cof en qualityexcellence.es>: > Hola, > > Creo que si utilizas "caret" y en la función "trainControl()" defines "oob" > como criterio de randomización, puedes luego recuperar del objeto del > modelo, las predicciones individuales... > > Saludos, > Carlos Ortega >

crear un vector con las categorías

2019 Feb 19

crear un vector con las categorías

Bueno, creo que no contesté tu pregunta. Con training <- data[-i, ] crea una df llamada training, sin la muestra i, que después utiliza para entrenar el algoritmo. Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>: > Estimado Manuel Mendoza > > Con sus datos y a modo de curiosidad, ¿que pasa en training <- data[-i, ]? > > Javier Rubén Marcuzzi >

crear un vector con las categorías

2019 Feb 18

crear un vector con las categorías

Gracias Jorge. No entiendo bien; la variable objetivo es ya factor. El árbol me la predice bien, como factor, también. Es al ir construyendo el vector que lo anota con un nº, según de cuál de las 4 categorías se trate. Quoting Jorge I Velez <jorgeivanvelez en gmail.com>: > Estimado Manuel, > > Debes definir ecsta como factor usando, por ejemplo, > > factor(ecsta,

gbm.step para clasificación no binaria

2018 Feb 19

gbm.step para clasificación no binaria

Hola de nuevo. Se me olvidaba la principal razón para utilizar gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan (a diferencia de los random forest o cualquier otro bootstrap) pero gbm.step hace validación cruzada para determinar el nº óptimo de árboles y evitarlo. Es fundamental. La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces, y usar el

Encontrar el más votado

2018 Apr 14

Encontrar el más votado

Gracias Carlos J., sale bien, pero me transforma las 6 categorías en números del 1 al 6 ¿sabes cómo evitarlo? Quoting "Carlos J. Gil Bellosta" <cgb en datanalytics.com>: > apply(data, 1, function(x) which.max(table(x))) > > El sáb., 14 abr. 2018 a las 19:54, Manuel Mendoza (<mmendoza en mncn.csic.es>) > escribió: > >> >> Buenas tardes de

gbm.step para clasificación no binaria

2018 Feb 19

gbm.step para clasificación no binaria

Gracias Carlos. Hasta donde yo entiendo si las hay: El argumento family puede ser: "gaussian" (for minimizing squared error); por lo que tiene que ser numérica "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices "poisson" (count outcomes; requires the response to be a positive integer); numérica también, pues. La única podría ser

error en un cmeans

2018 Jun 27

error en un cmeans

Pues no lo sé. Es algo del código de RandomForest, supongo. Quoting Jesús Para Fernández <j.para.fernandez en hotmail.com>: > U es un dataframe? > > Obtener Outlook para Android<https://aka.ms/ghei36> > > ________________________________ > From: R-help-es <r-help-es-bounces en r-project.org> on behalf of > Manuel Mendoza <mmendoza en mncn.csic.es>

loop con matriz que cambia de nombre

2018 Jun 22

loop con matriz que cambia de nombre

Funciona, me crea una matriz en cada iteración, con un nombre que incluye el nº de la iteración. Me surge ahora el problema de que, dentro del mismo bucle la quiero convertir en df y ponerle nombre a las columnas, y como el nombre de la matriz es distinto cada vez, no sé cómo hacerlo. Supongo que se hará todo al crearla, pero no sé cómo. Un problema adicional es que las variables

loop con matriz que cambia de nombre

2018 Jun 24

loop con matriz que cambia de nombre

Gracias Javier, pero creo que si no consigo que me lo haga todo de una vez con un loop, me merece más la pena hacerlo como hasta ahora, una a una. Manuel Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>: > Estimado Manuel Mendoza > > No sería lo ideal, pero de pronto podría ir guardando en json, que es una > forma no estructurada, luego toma los datos

¿cómo puedo cambiar mi email para esta lista de correo?

2019 Jun 30

¿cómo puedo cambiar mi email para esta lista de correo?

¿cómo puedo cambiar mi email para esta lista de correo? -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural Science (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain

Paquete pdp

2018 Jan 20

Paquete pdp

Buenas. El Paquete pdp es muy fácil de usar, pero cuando se lo aplico a mis datos me da: Error in eval(stats::getCall(object)$data) : object 'x.data' not found. Os copio abajo un ejemplo de aplicación a un RF. El mio es de un boosted regression trees (paquete gbm). No sé si esa puede ser la razón del error. En el paquete pdp no especifica que sea solo para RF, aunque en los

Random Forests

2018 Jan 17

Random Forests

Buenas tardes a todos. El paquete randomForest tiene la función treesize, que es el nº de nodos. Me dan valores realmente elevados (en torno a 1000), y eso me parece extraño. ¿sabéis si es así? Gracias, Manuel -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural History (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain

loop con matriz que cambia de nombre

2018 Jun 23

loop con matriz que cambia de nombre

Bien, Carlos, lo de ir metiendo las dfs en una lista parece buena idea, y después puedo fusionarlas con un cbind, tal y como hago ahora mismo, después de crear cada una de ellas independientemente. Son 9 dfs, y obtener cada una de ellas toma bastante tiempo de computación. Lo que quiero es que me haga las 9 en un loop. El problema es que si no les pone nombres distintos a las variables,

partialPlot en un Randomforest

2018 Jan 07

partialPlot en un Randomforest

Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día de reyes a la 1.20h y me contestas a las 2.45h) Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En un RF para clasificación me da valores parecidos a los de tu ejemplo, y en otro para regresión, valores de y entre 45 y 55. Para regresión, el último parámetro no puede ser una categoría, como

Gráficas 3D

2018 Feb 19

Gráficas 3D

Gracias Carlos, mi idea es construir un cono, un cilindro u otros cuerpos geométrico y luego graficarlos. Alguna idea de como empezar? Muchas gracias como siempre El lun., 19 de feb. de 2018 15:06, <r-help-es-request en r-project.org> escribió: > Envíe los mensajes para la lista R-help-es a > r-help-es en r-project.org > > Para subscribirse o anular su subscripción a

loop con matriz que cambia de nombre

2018 Jun 22

loop con matriz que cambia de nombre

Buenos días. Quiero hacer un for (j), anidado en otro for (i). En el 2º for, en cada iteración ha de crear una matriz vacía: mat <- matrix(nrow=nrow(data),ncol=19) pero llamándola de forma distinta cada vez. El nombre ha de ser: paste("D",i,colnames(Data[j]),sep=""). Llevo un rato haciendo pruebas pero no me sale. A ver si alguien pudiera ayudarme, gracias, Manuel

predicciones sobre el OOB de randomForest

2018 May 31

predicciones sobre el OOB de randomForest

Muy buenas, ¿sabe alguien cómo obtener las predicciones sobre el out of bag que hace randomForest? Manuel . -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural History (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain

Random Forests

2018 Jan 22

Random Forests

Muchas gracias Carlos, como siempre. Es raro que se me pasase. En su momento miré todos los argumentos del RF, como hago siempre, pero ese lo había olvidado. La verdad es que funcionaba estupendamente, pero me parecía extraño. Aunque dado que los RF no sobreajustan, no hay problema con que sus árboles sean todo lo grandes que quieras. Lo he testado con una base de datos externa y explica

Como cambiar el tamaño de los árboles de clasificación

2017 Dec 15

Como cambiar el tamaño de los árboles de clasificación

Muy buenas; mi primera consulta. Utilizo rpart (con as.party) y evtree, para obtener árboles de clasificación. Los represento en una windows() aparte, pero cuando el árbol es un poco grande, las hojas quedan muy estrechas y no se ven los porcentajes. ¿Sabéis como hacer que todo el árbol sea más pequeño para que las hojas no queden como simples líneas? Gracias -- Dr Manuel Mendoza

kappa

2018 Apr 26

kappa

Buenas, ¿alguien sabe qué puede ser este error? data es una df y las columnas 23 y 24 son las que quiero comparar; están bien. testK<-kappa2(data[,c(23,24)], "equal") Error in sort.list(y) : 'x' must be atomic for 'sort.list' Have you called 'sort' on a list? -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural

similar to: problema con ggplot2