similar to: Como cambiar el tamaño de los árboles de clasificación

Displaying 20 results from an estimated 200 matches similar to: "Como cambiar el tamaño de los árboles de clasificación"

2018 Jan 22
2
Random Forests
Muchas gracias Carlos, como siempre. Es raro que se me pasase. En su momento miré todos los argumentos del RF, como hago siempre, pero ese lo había olvidado. La verdad es que funcionaba estupendamente, pero me parecía extraño. Aunque dado que los RF no sobreajustan, no hay problema con que sus árboles sean todo lo grandes que quieras. Lo he testado con una base de datos externa y explica
2018 Jan 20
2
Random Forests
Si, Carlos. Yo hago lo mismo, pero esos mismos numeritos salen enormes. > treesize(RFfit) [1] 4304 4302 4311 4319 4343 4298 4298 4311 4349 4327 4331 4317 4294 4321 4283 4362 [17] 4300 4330 4266 4331 4308 4352 4294 4315 4372 4349 4331 4347 4329 4348 4298 4335 [33] 4346 4396 4345 4313 4293 4276 4353 4272 4304 4325 4317 4336 4308 4351 4374 4324 [49] 4386 4359 4311 4346 4300
2018 Jan 20
2
Random Forests
Gracias Carlos y Javier, ntrees es el nº de árboles y treesize sus respectivos tamaños (nº de nodos) ntree: Number of trees to grow. This should not be set to too small ...... treesize: Size of trees (number of nodes) in and ensemble. Puse 1000 árboles (ntree=1000), si, pero la función treesize te da el nº de nodos: treesize(RFfit, terminal=TRUE) me da un vector de 1000 elementos (uno
2018 Feb 24
3
Regression Tree Questions
Hi All, I'm a newbie and have two questions. Please pardon me if they are very basic. 1. I'm using a regression tree to predict the selling prices of 10 new records (homes). The following code is resulting in an error message: pred <- predict(model, newdata = outOfSample[, -6]) The error message is: Error in model.frame.default(Terms, newdata, na.action = na.action, xlev =
2018 Feb 19
3
gbm.step para clasificación no binaria
Hola de nuevo. Se me olvidaba la principal razón para utilizar gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan (a diferencia de los random forest o cualquier otro bootstrap) pero gbm.step hace validación cruzada para determinar el nº óptimo de árboles y evitarlo. Es fundamental. La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces, y usar el
2017 Feb 17
2
Modelos con datos normalizaddos
Buenas, Estoy creando unos modelos donde necesito normalizar los datos antes de crear el modelo. Estoy haciendo árboles de clasifciacion, pero me surge la duda de saber como tengo que hacer, pues cuando muestro el arbol me sale con lo svalores normalizados, pero me gustaria uqe el arbol diera ya directamente las conclusiones con los datos no normalizados. Lo que hago yo ahora es desnormalizar
2017 Feb 17
2
Modelos con datos normalizaddos
OK, para arboles no, pero para otro tipo de modelos como un modelo lineal si no? O para uqe tipo de modelos tengo que normalizar los datos??? ________________________________ De: Manuel Spínola <mspinola10 en gmail.com> Enviado: viernes, 17 de febrero de 2017 19:06 Para: Jesús Para Fernández Cc: r-help-es en r-project.org Asunto: Re: [R-es] Modelos con datos normalizaddos Hola Jesús, No
2018 Jan 17
4
Random Forests
Buenas tardes a todos. El paquete randomForest tiene la función treesize, que es el nº de nodos. Me dan valores realmente elevados (en torno a 1000), y eso me parece extraño. ¿sabéis si es así? Gracias, Manuel -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural History (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain
2016 Apr 12
2
Random Forest para clasificación
Mi matriz de datos inicial estaba muy desbalanceada (5% de la clase minoritaria), por lo que he creado con el algoritmo SMOTE un dataset balanceado con el que he creado el modelo, y luego sobre ese modelo he creado la matriz de confusión con los datos originales. Respecto a lo que me comentas, Carlos, creo que además de todo lo que comentas, que está bien, en micaso es necesario también saber no
2018 Feb 19
3
gbm.step para clasificación no binaria
Gracias Carlos. Hasta donde yo entiendo si las hay: El argumento family puede ser: "gaussian" (for minimizing squared error); por lo que tiene que ser numérica "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices "poisson" (count outcomes; requires the response to be a positive integer); numérica también, pues. La única podría ser
2016 Apr 12
3
Random Forest para clasificación
Gracias por la pronta respuesta, pero tras leer la contestación de la gente, sigo sin entender muy bien la explicación. Le responden lo siguiente: "Each point on the partial dependence plot is the average vote percentage in favor of the "Yes trees" class across all observations, given a fixed level of TRI. It's not a probability of correct classification. It has absolutely
2016 Apr 12
3
Random Forest para clasificación
No no, eso lo he sacaod, es decir, tengo la matriz de confusión para las OK/NOK, lo que no entiendo es como extraer las conclusiones sobre el modelo, de cara a como afectan las variables. He seguido dos estrategias: 1-Crear arboles de clasificacion con las variables más importantes del random Forest, pero el modelo se empobrece bastante. 2- Sacar los partialPlot, para ver la influencia de cada
2013 Mar 14
1
evtree
hi I got the following error in 'evtree'. could u help pl. Error in if (var(mf[, nVariables]) <= 0) stop("variance of the denpendent variable is 0") : argument is of length zero [[alternative HTML version deleted]]
2016 Apr 12
2
Random Forest para clasificación
Buenas, Cuando estoy haciendo un random Forest para clasificación y hago el gráfico partialPlot, siendo mi respuesta OK/NOK, me sale en el eje X el valor de la variable, pero en el eje Y me salen valores de entre -1 y 1. ¿Qué significado tiene? Adjunto un ejemplo: https://www.dropbox.com/s/4b92lqxi3592r0d/Captura.JPG?dl=0 Gracias!!! [[alternative HTML version deleted]]
2018 Feb 19
2
gbm.step para clasificación no binaria
Hola erreros, ¿sabéis si gbm.step puede usarse para clasificación no binaria? Gracias -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural History (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain
2012 Nov 05
1
Grupo de Usuarios de R de Madrid - "PCA con matrices sparse para clasificación automática de contenidos (p.ej. películas)."
Hola, Ya está disponible igualmente la presentación de Pedro Concejero sobre el "PCA con matrices sparse para clasificación automática de contenidos (p.ej. películas).<http://concejero.wdfiles.com/local--files/home/PCA_movies_matrices_sparse.ppt> " Está en la página del grupo dentro de la de la Asociación (reunión del 31-octubre) http://r-es.org/tiki-index.php?page_ref_id=43 El
2011 Jun 06
2
Obtener las reglas de un árbol de decisión
Hola, Me gustaría obtener las reglas que genero con un árbol de decicisión creado con party. Algo parecido a lo que realiza esta función con rpart http://www.togaware.com/datamining/survivor/Convert_Tree.html la idea es disponer de esas reglas en un fichero de texto. En general si alguien sabe de algún paquete que permita obtener el código que genera la puntuación, el "score" para un
2012 Dec 14
2
una programación sencilla
Hola a todos, Escribo para preguntarles sobre cómo programar algo, que estoy segura es algo bastante sencillo para muchos de Uds que tienen amplia experiencia programando. Lo describo a continuación. Tengo una base de datos (file = datos) de especies (de plantas) en donde cada fila es un individuo de una especie con ciertos atributos (alrededor de 1500 filas = individuos). Quería anexar en esta
2019 Sep 04
2
Dibujar un triángulo dadas la distancias de los segmentos.
Buenas, compañeros; Quiero buscar a ver si una idea (ocurrencia?) que tuve tiene sentido, para eso nencesito ver las representaciones gráficas de unos triángulos de los que no sé (ni me importa) la posición, pero sí sé las distancias entre los tres puntos. triangulo.con.lados <- c(47, 45, 55) Encuentro cómo dibujar con la función polygon, pero eso es dada la posición, que no la tengo ni
2018 Oct 08
4
Texto en el eje de ordenadas de un gráfico
Hola a todos, Estoy usando la librería ltm, de teoría de respuesta al ítem, para crear gráficos. Resulta que añado unas líneas horizontales en los valores de 0.25, 0.50 y 0.75. Me gustaría que en el gráfico, desaparezcan las marcas de 0,.2, 0.4, 0.6 y 0.8 y aparezcan en 0.25, 0.50 y 0.75. He probado varias cosas que he visto por Googe pero no me han funcionado. ¿Alguna idea? library(ltm) # creo el