thr3ads.net - similar to: "crear un vector con las categorías"

Displaying 20 results from an estimated 800 matches similar to: "crear un vector con las categorías"

2019 Feb 18

crear un vector con las categorías

Gracias Jorge. No entiendo bien; la variable objetivo es ya factor. El árbol me la predice bien, como factor, también. Es al ir construyendo el vector que lo anota con un nº, según de cuál de las 4 categorías se trate. Quoting Jorge I Velez <jorgeivanvelez en gmail.com>: > Estimado Manuel, > > Debes definir ecsta como factor usando, por ejemplo, > > factor(ecsta,

crear un vector con las categorías

2019 Feb 19

crear un vector con las categorías

Bueno, creo que no contesté tu pregunta. Con training <- data[-i, ] crea una df llamada training, sin la muestra i, que después utiliza para entrenar el algoritmo. Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>: > Estimado Manuel Mendoza > > Con sus datos y a modo de curiosidad, ¿que pasa en training <- data[-i, ]? > > Javier Rubén Marcuzzi >

Encontrar el más votado

2018 Apr 14

Encontrar el más votado

Gracias Carlos J., sale bien, pero me transforma las 6 categorías en números del 1 al 6 ¿sabes cómo evitarlo? Quoting "Carlos J. Gil Bellosta" <cgb en datanalytics.com>: > apply(data, 1, function(x) which.max(table(x))) > > El sáb., 14 abr. 2018 a las 19:54, Manuel Mendoza (<mmendoza en mncn.csic.es>) > escribió: > >> >> Buenas tardes de

Encontrar el más votado

2018 Apr 14

Encontrar el más votado

Buenas tardes de sábado. LLevo más de una hora intentando una cosa que debe ser una chorrada; a ver si alguien puede ayudarme. Tengo una matriz (data) de 1000 muestras (filas) y 6 categorías posibles. Hay 100 columnas, es decir, 100 votos para cada muestra, y necesito crear un vector con la categoría más votada de las 6. which.max(table(data[i,])) me da la más votada de la muestra i.

Como cambiar el tamaño de los árboles de clasificación

2017 Dec 15

Como cambiar el tamaño de los árboles de clasificación

Muy buenas; mi primera consulta. Utilizo rpart (con as.party) y evtree, para obtener árboles de clasificación. Los represento en una windows() aparte, pero cuando el árbol es un poco grande, las hojas quedan muy estrechas y no se ven los porcentajes. ¿Sabéis como hacer que todo el árbol sea más pequeño para que las hojas no queden como simples líneas? Gracias -- Dr Manuel Mendoza

partialPlot en un Randomforest

2018 Jan 07

partialPlot en un Randomforest

Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día de reyes a la 1.20h y me contestas a las 2.45h) Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En un RF para clasificación me da valores parecidos a los de tu ejemplo, y en otro para regresión, valores de y entre 45 y 55. Para regresión, el último parámetro no puede ser una categoría, como

líneas sobre un mapa

2020 Jun 05

líneas sobre un mapa

Gracias Emilio y Jorge. Tengo que explicarlo mejor. Mostrando a una audiencia cómo hacer un tipo de análisis, se hace un loop (abajo) que analiza un mapa por regiones longitudinales. Tal y como está el script, print(i) te indica la longitud por la que va (de 10º en 10º) pero me gustaría que en vez de eso te fuese representando una línea vertical sobre el mapa, que he representado previamente con

Red Neuronal complicada categorías

2016 Jul 07

Red Neuronal complicada categorías

Estimados Les consulto por redes neuronales, hay diversos artículos como los siguientes (el último tienen un error actualmente). Pero mi pregunta va un poco por otro lado. http://www.r-bloggers.com/build-your-own-neural-network-classifier-in-r/ http://www.r-bloggers.com/classification-using-neural-net-in-r/ Básicamente se puede calcular un valor, por ejemplo doblar 2,4 grados a la derecha, luego 1

añadir líneas verticales con ggplot

2020 Apr 01

añadir líneas verticales con ggplot

Buenos días, hago un mapa con ggplot: world<-map_data('world') windows();ggplot(legend=FALSE) + ... geom_point(data=Data,aes(x=lon,y=lat,color=Clst),size=1.25) + scale_color_manual(values=c("grey45","navy","skyblue","gold","green3","darkgreen")) + geom_path( data=world, aes(x=long, y=lat,group=group)) + labs(title =

Red Neuronal complicada categorías

2016 Jul 09

Red Neuronal complicada categorías

Hola, Esta es una forma de hacerlo... Mira que lo primero que he modificado es el fichero "x.csv" para sustituir los espacios en los nombres por "_". Y también he quitado los acentos y las eñes... He utilizado el paquete RNNS y la función "mlp()" para ajustar la red. #------------------------------------------- > x <- read.csv("x.csv",

ggplot con muchos colores

2018 Nov 08

ggplot con muchos colores

Buenos días, estoy haciendo unos mapas con ggplot, con 29 categorías, por lo que tengo que utilizar library(RColorBrewer) para disponer de suficientes colores. El problema es que al hacerlo acorde a dos variables distintas (color=var1 y color=var2), cuyas 29 categorías son obviamente las mismas, les da distintos colores y no puedo comparar los mapas. Muchas gracias, Manuel

Determinación del punto de corte óptimo

2016 Jan 26

Determinación del punto de corte óptimo

Hola a todos, en estos momentos me encuentro inmerso en laresolución del siguiente problema. Resulta que dispongo de una variable categóricadenominada Severity y que consta de tres categorías (low, medium, high). Además,tengo otra variable que se denomina ZX y que puede tomar cualquier valorcomprendido entre 0 y 10. Quiero determinar los dos puntos de corte óptimos demanera que me dividan a la

Random Forests

2018 Jan 22

Random Forests

Muchas gracias Carlos, como siempre. Es raro que se me pasase. En su momento miré todos los argumentos del RF, como hago siempre, pero ese lo había olvidado. La verdad es que funcionaba estupendamente, pero me parecía extraño. Aunque dado que los RF no sobreajustan, no hay problema con que sus árboles sean todo lo grandes que quieras. Lo he testado con una base de datos externa y explica

Sobre categorías de factores extraídos de un data.frame

2012 Jul 04

Sobre categorías de factores extraídos de un data.frame

Hola estimados miembros de la lista, Tengo una inquietud. Les cuento: tengo un conjunto de datos en un data.frame. Algunas de las variables que están en él son del tipo factor. Estos factores, naturalmente, tiene categorías: a veces demasiadas categorías y muchas de ellas con 1 individuo contemplando el data.frame más de 1 millón de individuos. Estas pequeñas cantidades creo que me están

Random Forests

2018 Jan 20

Random Forests

Si, Carlos. Yo hago lo mismo, pero esos mismos numeritos salen enormes. > treesize(RFfit) [1] 4304 4302 4311 4319 4343 4298 4298 4311 4349 4327 4331 4317 4294 4321 4283 4362 [17] 4300 4330 4266 4331 4308 4352 4294 4315 4372 4349 4331 4347 4329 4348 4298 4335 [33] 4346 4396 4345 4313 4293 4276 4353 4272 4304 4325 4317 4336 4308 4351 4374 4324 [49] 4386 4359 4311 4346 4300

partialPlot en un Randomforest

2018 Jan 07

partialPlot en un Randomforest

Hola erreros. A ver si alguien podría decirme qué son los dos ejes del plot que resulta de aplicar partialPlot en un Randomforest. Encuentro que: Partial dependence plot gives a graphical depiction of the marginal effect of a variable on the class probability (classification) or response (regression) que nos indica como varía la VR en función de la variable considerada, manteniendo el

Random Forests

2018 Jan 20

Random Forests

Gracias Carlos y Javier, ntrees es el nº de árboles y treesize sus respectivos tamaños (nº de nodos) ntree: Number of trees to grow. This should not be set to too small ...... treesize: Size of trees (number of nodes) in and ensemble. Puse 1000 árboles (ntree=1000), si, pero la función treesize te da el nº de nodos: treesize(RFfit, terminal=TRUE) me da un vector de 1000 elementos (uno

Asignar distancias

2018 Nov 10

Asignar distancias

Muy buenas. A ver si alguien puede echarme una mano. A partir de una matriz de distancias de 29 x 29 he obtenido una df1. Ahora tengo 841 filas con la distancia de cada combinación de esas 29 categorías. Algo así como: Var1 Var2 Dist a a 0 a b 3 a c 5 b a 3 b b 0 b c 5 c ... En otra df2, de 14563 filas, tengo las

plot3d con library(rgl)

2019 Jan 18

plot3d con library(rgl)

Buenas tardes. ¿Sabe alguno de vosotros cómo indicar la variable con la que identificar los puntos con plot3d? library(rgl) plot3d(Data$RTLML,Data$JD,Data$SB) Las muestras pertenecen a una de dos categorías, según la variable "Family", pero no sé cómo hacer que me las represente de diferente color. Gracias, Manuel . -- Dr Manuel

"IN" en data.table

2017 Feb 23

"IN" en data.table

Hola a todos. ¿Es posible filtrar casos en data.table por más de una categoría al mismo tiempo? Algo así como un IN o similar, dónde IN puede entenderse como "existe en": datos[Provincia IN c("CATAMARCA", "CHACO", "CORRIENTES"), FORM] O sea: una forma abreviada de hacer:

similar to: crear un vector con las categorías