Buenas tardes a todos. El paquete randomForest tiene la función treesize, que es el nº de nodos. Me dan valores realmente elevados (en torno a 1000), y eso me parece extraño. ¿sabéis si es así? Gracias, Manuel -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural History (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain
Estimado Manuel Mendoza Comprendo su preocupación, pero su pregunta tiene una respuesta en la relación datos modelo, en otras palabras, el modelo que usted escribe al procesar los datos, ¿debe dar ese número? Creo que no se puede responder a su pregunta, salvo que el algoritmo o por teoría los números deben estar entre ciertos parámetros, en ese caso yo no lo se. Javier Rubén Marcuzzi El 17 de enero de 2018, 10:29, Manuel Mendoza <mmendoza en mncn.csic.es> escribió:> Buenas tardes a todos. El paquete randomForest tiene la función treesize, > que es el nº de nodos. Me dan valores realmente elevados (en torno a 1000), > y eso me parece extraño. ¿sabéis si es así? > Gracias, > Manuel > -- > Dr Manuel Mendoza > Department of Biogeography and Global Change > National Museum of Natural History (MNCN) > Spanish Scientific Council (CSIC) > C/ Serrano 115bis, 28006 MADRID > Spain > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
Hola, A "treesize()" le tienes que pasar como parámetro el objeto randomForest de tu modelo. Y obtiene el número de nodos de cada uno de los árboles que hayas indicado en el valor del parámetros "ntrees" de "randomForest". Por defecto "ntrees" tiene un valor de 500. Mira qué valor tiene "ntrees" en tu modelo "randomForest", que seguramente le hayas indicado un valor de 1000... Saludos, Carlos Ortega www.qualityexcellence.es El 17 de enero de 2018, 14:29, Manuel Mendoza <mmendoza en mncn.csic.es> escribió:> Buenas tardes a todos. El paquete randomForest tiene la función treesize, > que es el nº de nodos. Me dan valores realmente elevados (en torno a 1000), > y eso me parece extraño. ¿sabéis si es así? > Gracias, > Manuel > -- > Dr Manuel Mendoza > Department of Biogeography and Global Change > National Museum of Natural History (MNCN) > Spanish Scientific Council (CSIC) > C/ Serrano 115bis, 28006 MADRID > Spain > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Gracias Carlos y Javier, ntrees es el nº de árboles y treesize sus respectivos tamaños (nº de nodos) ntree: Number of trees to grow. This should not be set to too small ...... treesize: Size of trees (number of nodes) in and ensemble. Puse 1000 árboles (ntree=1000), si, pero la función treesize te da el nº de nodos: treesize(RFfit, terminal=TRUE) me da un vector de 1000 elementos (uno por cada árbol), todos ellos mayores que 4000 ???? ¿tienen los 1000 árboles más de 4000 nodos cada uno? Parece extraño ¿no? Esa es mi pregunta Gracias nuevamente, Manuel Quoting Carlos Ortega <cof en qualityexcellence.es>:> Hola, > > A "treesize()" le tienes que pasar como parámetro el objeto randomForest de > tu modelo. > Y obtiene el número de nodos de cada uno de los árboles que hayas indicado > en el valor del parámetros "ntrees" de "randomForest". Por defecto "ntrees" > tiene un valor de 500. > Mira qué valor tiene "ntrees" en tu modelo "randomForest", que seguramente > le hayas indicado un valor de 1000... > > Saludos, > Carlos Ortega > www.qualityexcellence.es > > El 17 de enero de 2018, 14:29, Manuel Mendoza <mmendoza en mncn.csic.es> > escribió: > >> Buenas tardes a todos. El paquete randomForest tiene la función treesize, >> que es el nº de nodos. Me dan valores realmente elevados (en torno a 1000), >> y eso me parece extraño. ¿sabéis si es así? >> Gracias, >> Manuel >> -- >> Dr Manuel Mendoza >> Department of Biogeography and Global Change >> National Museum of Natural History (MNCN) >> Spanish Scientific Council (CSIC) >> C/ Serrano 115bis, 28006 MADRID >> Spain >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es-- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural History (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain
Buenas. El Paquete pdp es muy fácil de usar, pero cuando se lo aplico a mis datos me da: Error in eval(stats::getCall(object)$data) : object 'x.data' not found. Os copio abajo un ejemplo de aplicación a un RF. El mio es de un boosted regression trees (paquete gbm). No sé si esa puede ser la razón del error. En el paquete pdp no especifica que sea solo para RF, aunque en los ejemplos que encontré nunca eran de boosted ... Solo de RF y SVM. Gracias, Manuel library(pdp) data (boston) # load the boston housing data set.seed(101) # for reproducibility boston.rf <- randomForest(cmedv ~ ., data = boston) # Partial dependence of cmedv on lstat and rm pd <- partial(boston.rf, pred.var = c("lstat", "rm"), chull = TRUE) head(pd) # print first 6 rows #> lstat rm yhat #> 1 7.5284 3.66538 24.13683 #> 2 8.2532 3.66538 23.24916 #> 3 8.9780 3.66538 23.13119 #> 4 9.7028 3.66538 22.13531 #> 5 10.4276 3.66538 20.62331 #> 6 11.1524 3.66538 20.51258 Quoting Carlos Ortega <cof en qualityexcellence.es>:> Hola, > > A "treesize()" le tienes que pasar como parámetro el objeto randomForest de > tu modelo. > Y obtiene el número de nodos de cada uno de los árboles que hayas indicado > en el valor del parámetros "ntrees" de "randomForest". Por defecto "ntrees" > tiene un valor de 500. > Mira qué valor tiene "ntrees" en tu modelo "randomForest", que seguramente > le hayas indicado un valor de 1000... > > Saludos, > Carlos Ortega > www.qualityexcellence.es > > El 17 de enero de 2018, 14:29, Manuel Mendoza <mmendoza en mncn.csic.es> > escribió: > >> Buenas tardes a todos. El paquete randomForest tiene la función treesize, >> que es el nº de nodos. Me dan valores realmente elevados (en torno a 1000), >> y eso me parece extraño. ¿sabéis si es así? >> Gracias, >> Manuel >> -- >> Dr Manuel Mendoza >> Department of Biogeography and Global Change >> National Museum of Natural History (MNCN) >> Spanish Scientific Council (CSIC) >> C/ Serrano 115bis, 28006 MADRID >> Spain >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> > > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es-- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural History (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain