thr3ads.net - similar to: "Como cambiar el tamaño de los árboles de clasificación"

Displaying 20 results from an estimated 200 matches similar to: "Como cambiar el tamaño de los árboles de clasificación"

Random Forests

2018 Jan 22

Random Forests

Muchas gracias Carlos, como siempre. Es raro que se me pasase. En su momento miré todos los argumentos del RF, como hago siempre, pero ese lo había olvidado. La verdad es que funcionaba estupendamente, pero me parecía extraño. Aunque dado que los RF no sobreajustan, no hay problema con que sus árboles sean todo lo grandes que quieras. Lo he testado con una base de datos externa y explica

Random Forests

2018 Jan 20

Random Forests

Si, Carlos. Yo hago lo mismo, pero esos mismos numeritos salen enormes. > treesize(RFfit) [1] 4304 4302 4311 4319 4343 4298 4298 4311 4349 4327 4331 4317 4294 4321 4283 4362 [17] 4300 4330 4266 4331 4308 4352 4294 4315 4372 4349 4331 4347 4329 4348 4298 4335 [33] 4346 4396 4345 4313 4293 4276 4353 4272 4304 4325 4317 4336 4308 4351 4374 4324 [49] 4386 4359 4311 4346 4300

Random Forests

2018 Jan 20

Random Forests

Gracias Carlos y Javier, ntrees es el nº de árboles y treesize sus respectivos tamaños (nº de nodos) ntree: Number of trees to grow. This should not be set to too small ...... treesize: Size of trees (number of nodes) in and ensemble. Puse 1000 árboles (ntree=1000), si, pero la función treesize te da el nº de nodos: treesize(RFfit, terminal=TRUE) me da un vector de 1000 elementos (uno

Regression Tree Questions

2018 Feb 24

Regression Tree Questions

Hi All, I'm a newbie and have two questions. Please pardon me if they are very basic. 1. I'm using a regression tree to predict the selling prices of 10 new records (homes). The following code is resulting in an error message: pred <- predict(model, newdata = outOfSample[, -6]) The error message is: Error in model.frame.default(Terms, newdata, na.action = na.action, xlev =

gbm.step para clasificación no binaria

2018 Feb 19

gbm.step para clasificación no binaria

Hola de nuevo. Se me olvidaba la principal razón para utilizar gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan (a diferencia de los random forest o cualquier otro bootstrap) pero gbm.step hace validación cruzada para determinar el nº óptimo de árboles y evitarlo. Es fundamental. La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces, y usar el

Modelos con datos normalizaddos

2017 Feb 17

Modelos con datos normalizaddos

Buenas, Estoy creando unos modelos donde necesito normalizar los datos antes de crear el modelo. Estoy haciendo árboles de clasifciacion, pero me surge la duda de saber como tengo que hacer, pues cuando muestro el arbol me sale con lo svalores normalizados, pero me gustaria uqe el arbol diera ya directamente las conclusiones con los datos no normalizados. Lo que hago yo ahora es desnormalizar

Modelos con datos normalizaddos

2017 Feb 17

Modelos con datos normalizaddos

OK, para arboles no, pero para otro tipo de modelos como un modelo lineal si no? O para uqe tipo de modelos tengo que normalizar los datos??? ________________________________ De: Manuel Spínola <mspinola10 en gmail.com> Enviado: viernes, 17 de febrero de 2017 19:06 Para: Jesús Para Fernández Cc: r-help-es en r-project.org Asunto: Re: [R-es] Modelos con datos normalizaddos Hola Jesús, No

Random Forests

2018 Jan 17

Random Forests

Buenas tardes a todos. El paquete randomForest tiene la función treesize, que es el nº de nodos. Me dan valores realmente elevados (en torno a 1000), y eso me parece extraño. ¿sabéis si es así? Gracias, Manuel -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural History (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain

Random Forest para clasificación

2016 Apr 12

Random Forest para clasificación

Mi matriz de datos inicial estaba muy desbalanceada (5% de la clase minoritaria), por lo que he creado con el algoritmo SMOTE un dataset balanceado con el que he creado el modelo, y luego sobre ese modelo he creado la matriz de confusión con los datos originales. Respecto a lo que me comentas, Carlos, creo que además de todo lo que comentas, que está bien, en micaso es necesario también saber no

gbm.step para clasificación no binaria

2018 Feb 19

gbm.step para clasificación no binaria

Gracias Carlos. Hasta donde yo entiendo si las hay: El argumento family puede ser: "gaussian" (for minimizing squared error); por lo que tiene que ser numérica "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices "poisson" (count outcomes; requires the response to be a positive integer); numérica también, pues. La única podría ser

Random Forest para clasificación

2016 Apr 12

Random Forest para clasificación

Gracias por la pronta respuesta, pero tras leer la contestación de la gente, sigo sin entender muy bien la explicación. Le responden lo siguiente: "Each point on the partial dependence plot is the average vote percentage in favor of the "Yes trees" class across all observations, given a fixed level of TRI. It's not a probability of correct classification. It has absolutely

Random Forest para clasificación

2016 Apr 12

Random Forest para clasificación

No no, eso lo he sacaod, es decir, tengo la matriz de confusión para las OK/NOK, lo que no entiendo es como extraer las conclusiones sobre el modelo, de cara a como afectan las variables. He seguido dos estrategias: 1-Crear arboles de clasificacion con las variables más importantes del random Forest, pero el modelo se empobrece bastante. 2- Sacar los partialPlot, para ver la influencia de cada

evtree

2013 Mar 14

evtree

hi I got the following error in 'evtree'. could u help pl. Error in if (var(mf[, nVariables]) <= 0) stop("variance of the denpendent variable is 0") : argument is of length zero [[alternative HTML version deleted]]

Random Forest para clasificación

2016 Apr 12

Random Forest para clasificación

Buenas, Cuando estoy haciendo un random Forest para clasificación y hago el gráfico partialPlot, siendo mi respuesta OK/NOK, me sale en el eje X el valor de la variable, pero en el eje Y me salen valores de entre -1 y 1. ¿Qué significado tiene? Adjunto un ejemplo: https://www.dropbox.com/s/4b92lqxi3592r0d/Captura.JPG?dl=0 Gracias!!! [[alternative HTML version deleted]]

gbm.step para clasificación no binaria

2018 Feb 19

gbm.step para clasificación no binaria

Hola erreros, ¿sabéis si gbm.step puede usarse para clasificación no binaria? Gracias -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural History (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain

Grupo de Usuarios de R de Madrid - "PCA con matrices sparse para clasificación automática de contenidos (p.ej. películas)."

2012 Nov 05

Grupo de Usuarios de R de Madrid - "PCA con matrices sparse para clasificación automática de contenidos (p.ej. películas)."

Hola, Ya está disponible igualmente la presentación de Pedro Concejero sobre el "PCA con matrices sparse para clasificación automática de contenidos (p.ej. películas).<http://concejero.wdfiles.com/local--files/home/PCA_movies_matrices_sparse.ppt> " Está en la página del grupo dentro de la de la Asociación (reunión del 31-octubre) http://r-es.org/tiki-index.php?page_ref_id=43 El

Obtener las reglas de un árbol de decisión

2011 Jun 06

Obtener las reglas de un árbol de decisión

Hola, Me gustaría obtener las reglas que genero con un árbol de decicisión creado con party. Algo parecido a lo que realiza esta función con rpart http://www.togaware.com/datamining/survivor/Convert_Tree.html la idea es disponer de esas reglas en un fichero de texto. En general si alguien sabe de algún paquete que permita obtener el código que genera la puntuación, el "score" para un

una programación sencilla

2012 Dec 14

una programación sencilla

Hola a todos, Escribo para preguntarles sobre cómo programar algo, que estoy segura es algo bastante sencillo para muchos de Uds que tienen amplia experiencia programando. Lo describo a continuación. Tengo una base de datos (file = datos) de especies (de plantas) en donde cada fila es un individuo de una especie con ciertos atributos (alrededor de 1500 filas = individuos). Quería anexar en esta

Dibujar un triángulo dadas la distancias de los segmentos.

2019 Sep 04

Dibujar un triángulo dadas la distancias de los segmentos.

Buenas, compañeros; Quiero buscar a ver si una idea (ocurrencia?) que tuve tiene sentido, para eso nencesito ver las representaciones gráficas de unos triángulos de los que no sé (ni me importa) la posición, pero sí sé las distancias entre los tres puntos. triangulo.con.lados <- c(47, 45, 55) Encuentro cómo dibujar con la función polygon, pero eso es dada la posición, que no la tengo ni

Texto en el eje de ordenadas de un gráfico

2018 Oct 08

Texto en el eje de ordenadas de un gráfico

Hola a todos, Estoy usando la librería ltm, de teoría de respuesta al ítem, para crear gráficos. Resulta que añado unas líneas horizontales en los valores de 0.25, 0.50 y 0.75. Me gustaría que en el gráfico, desaparezcan las marcas de 0,.2, 0.4, 0.6 y 0.8 y aparezcan en 0.25, 0.50 y 0.75. He probado varias cosas que he visto por Googe pero no me han funcionado. ¿Alguna idea? library(ltm) # creo el

similar to: Como cambiar el tamaño de los árboles de clasificación