similar to: Encontrar el más votado

Displaying 20 results from an estimated 900 matches similar to: "Encontrar el más votado"

2018 Apr 14
2
Encontrar el más votado
Gracias Carlos J., sale bien, pero me transforma las 6 categorías en números del 1 al 6 ¿sabes cómo evitarlo? Quoting "Carlos J. Gil Bellosta" <cgb en datanalytics.com>: > apply(data, 1, function(x) which.max(table(x))) > > El sáb., 14 abr. 2018 a las 19:54, Manuel Mendoza (<mmendoza en mncn.csic.es>) > escribió: > >> >> Buenas tardes de
2019 Feb 18
3
crear un vector con las categorías
Gracias Jorge. No entiendo bien; la variable objetivo es ya factor. El árbol me la predice bien, como factor, también. Es al ir construyendo el vector que lo anota con un nº, según de cuál de las 4 categorías se trate. Quoting Jorge I Velez <jorgeivanvelez en gmail.com>: > Estimado Manuel, > > Debes definir ecsta como factor usando, por ejemplo, > > factor(ecsta,
2019 Feb 19
2
crear un vector con las categorías
Bueno, creo que no contesté tu pregunta. Con training <- data[-i, ] crea una df llamada training, sin la muestra i, que después utiliza para entrenar el algoritmo. Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>: > Estimado Manuel Mendoza > > Con sus datos y a modo de curiosidad, ¿que pasa en training <- data[-i, ]? > > Javier Rubén Marcuzzi >
2019 Feb 18
2
crear un vector con las categorías
Buenas tardes, tengo un loop que hace un árbol de clasificación cada vez y va creando un vector con una predicción que hace. Son 4 categorías (pongamos a, b, c y d), pero en vez de ir añadiendo la categoría predicha me añade al vector el nº (del 1 al 4) al que corresponde esa categoría. Supongo que se puede hacer que añada la categoría (la letra), pero no sé cómo. preds <- {} for (i
2018 Nov 08
2
ggplot con muchos colores
Buenos días, estoy haciendo unos mapas con ggplot, con 29 categorías, por lo que tengo que utilizar library(RColorBrewer) para disponer de suficientes colores. El problema es que al hacerlo acorde a dos variables distintas (color=var1 y color=var2), cuyas 29 categorías son obviamente las mismas, les da distintos colores y no puedo comparar los mapas. Muchas gracias, Manuel
2018 Jun 27
2
error en un cmeans
Pues no lo sé. Es algo del código de RandomForest, supongo. Quoting Jesús Para Fernández <j.para.fernandez en hotmail.com>: > U es un dataframe? > > Obtener Outlook para Android<https://aka.ms/ghei36> > > ________________________________ > From: R-help-es <r-help-es-bounces en r-project.org> on behalf of > Manuel Mendoza <mmendoza en mncn.csic.es>
2018 Jun 25
2
loop con matriz que cambia de nombre
Gracias Carlos, eso lo sé. El problema, probablemente una chorrada, es que para cambiarle el nombre a las variables (de acuerdo a un patrón, si, que incluye el nº de la iteración), debo indicar el nombre de la df, pero éste no es siempre el mismo. Puedo darle un nombre fijo a la df, ponerle el nombre a las variables, y al final del loop cambiarle el nombre a la df, pero tampoco sé cómo
2018 Jan 07
4
partialPlot en un Randomforest
Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día de reyes a la 1.20h y me contestas a las 2.45h) Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En un RF para clasificación me da valores parecidos a los de tu ejemplo, y en otro para regresión, valores de y entre 45 y 55. Para regresión, el último parámetro no puede ser una categoría, como
2018 Jun 22
4
loop con matriz que cambia de nombre
Funciona, me crea una matriz en cada iteración, con un nombre que incluye el nº de la iteración. Me surge ahora el problema de que, dentro del mismo bucle la quiero convertir en df y ponerle nombre a las columnas, y como el nombre de la matriz es distinto cada vez, no sé cómo hacerlo. Supongo que se hará todo al crearla, pero no sé cómo. Un problema adicional es que las variables
2017 Dec 15
3
Como cambiar el tamaño de los árboles de clasificación
Muy buenas; mi primera consulta. Utilizo rpart (con as.party) y evtree, para obtener árboles de clasificación. Los represento en una windows() aparte, pero cuando el árbol es un poco grande, las hojas quedan muy estrechas y no se ven los porcentajes. ¿Sabéis como hacer que todo el árbol sea más pequeño para que las hojas no queden como simples líneas? Gracias -- Dr Manuel Mendoza
2019 Jan 18
2
plot3d con library(rgl)
Buenas tardes. ¿Sabe alguno de vosotros cómo indicar la variable con la que identificar los puntos con plot3d? library(rgl) plot3d(Data$RTLML,Data$JD,Data$SB) Las muestras pertenecen a una de dos categorías, según la variable "Family", pero no sé cómo hacer que me las represente de diferente color. Gracias, Manuel . -- Dr Manuel
2018 Nov 10
2
Asignar distancias
Muy buenas. A ver si alguien puede echarme una mano. A partir de una matriz de distancias de 29 x 29 he obtenido una df1. Ahora tengo 841 filas con la distancia de cada combinación de esas 29 categorías. Algo así como: Var1 Var2 Dist a a 0 a b 3 a c 5 b a 3 b b 0 b c 5 c ... En otra df2, de 14563 filas, tengo las
2018 Jan 07
2
partialPlot en un Randomforest
Hola erreros. A ver si alguien podría decirme qué son los dos ejes del plot que resulta de aplicar partialPlot en un Randomforest. Encuentro que: Partial dependence plot gives a graphical depiction of the marginal effect of a variable on the class probability (classification) or response (regression) que nos indica como varía la VR en función de la variable considerada, manteniendo el
2018 May 31
2
predicciones sobre el OOB de randomForest
Gracias Carlos. No uso caret, pero lo miraré. Quoting Carlos Ortega <cof en qualityexcellence.es>: > Hola, > > Creo que si utilizas "caret" y en la función "trainControl()" defines "oob" > como criterio de randomización, puedes luego recuperar del objeto del > modelo, las predicciones individuales... > > Saludos, > Carlos Ortega >
2018 Feb 19
3
gbm.step para clasificación no binaria
Hola de nuevo. Se me olvidaba la principal razón para utilizar gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan (a diferencia de los random forest o cualquier otro bootstrap) pero gbm.step hace validación cruzada para determinar el nº óptimo de árboles y evitarlo. Es fundamental. La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces, y usar el
2018 Feb 19
3
gbm.step para clasificación no binaria
Gracias Carlos. Hasta donde yo entiendo si las hay: El argumento family puede ser: "gaussian" (for minimizing squared error); por lo que tiene que ser numérica "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices "poisson" (count outcomes; requires the response to be a positive integer); numérica también, pues. La única podría ser
2019 Jun 30
3
¿cómo puedo cambiar mi email para esta lista de correo?
¿cómo puedo cambiar mi email para esta lista de correo? -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural Science (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain
2018 Jan 17
4
Random Forests
Buenas tardes a todos. El paquete randomForest tiene la función treesize, que es el nº de nodos. Me dan valores realmente elevados (en torno a 1000), y eso me parece extraño. ¿sabéis si es así? Gracias, Manuel -- Dr Manuel Mendoza Department of Biogeography and Global Change National Museum of Natural History (MNCN) Spanish Scientific Council (CSIC) C/ Serrano 115bis, 28006 MADRID Spain
2018 Jun 24
2
loop con matriz que cambia de nombre
Gracias Javier, pero creo que si no consigo que me lo haga todo de una vez con un loop, me merece más la pena hacerlo como hasta ahora, una a una. Manuel Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>: > Estimado Manuel Mendoza > > No sería lo ideal, pero de pronto podría ir guardando en json, que es una > forma no estructurada, luego toma los datos
2018 Jan 20
2
Paquete pdp
Buenas. El Paquete pdp es muy fácil de usar, pero cuando se lo aplico a mis datos me da: Error in eval(stats::getCall(object)$data) : object 'x.data' not found. Os copio abajo un ejemplo de aplicación a un RF. El mio es de un boosted regression trees (paquete gbm). No sé si esa puede ser la razón del error. En el paquete pdp no especifica que sea solo para RF, aunque en los