Displaying 20 results from an estimated 800 matches similar to: "crear un vector con las categorías"
2019 Feb 18
3
crear un vector con las categorías
Gracias Jorge. No entiendo bien; la variable objetivo es ya factor. El
árbol me la predice bien, como factor, también. Es al ir construyendo
el vector que lo anota con un nº, según de cuál de las 4 categorías se
trate.
Quoting Jorge I Velez <jorgeivanvelez en gmail.com>:
> Estimado Manuel,
>
> Debes definir ecsta como factor usando, por ejemplo,
>
> factor(ecsta,
2019 Feb 19
2
crear un vector con las categorías
Bueno, creo que no contesté tu pregunta. Con training <- data[-i, ]
crea una df llamada training, sin la muestra i, que después utiliza
para entrenar el algoritmo.
Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>:
> Estimado Manuel Mendoza
>
> Con sus datos y a modo de curiosidad, ¿que pasa en training <- data[-i, ]?
>
> Javier Rubén Marcuzzi
>
2018 Apr 14
2
Encontrar el más votado
Gracias Carlos J., sale bien, pero me transforma las 6 categorías en
números del 1 al 6
¿sabes cómo evitarlo?
Quoting "Carlos J. Gil Bellosta" <cgb en datanalytics.com>:
> apply(data, 1, function(x) which.max(table(x)))
>
> El sáb., 14 abr. 2018 a las 19:54, Manuel Mendoza (<mmendoza en mncn.csic.es>)
> escribió:
>
>>
>> Buenas tardes de
2018 Apr 14
2
Encontrar el más votado
Buenas tardes de sábado. LLevo más de una hora intentando una cosa que
debe ser una chorrada; a ver si alguien puede ayudarme.
Tengo una matriz (data) de 1000 muestras (filas) y 6 categorías
posibles. Hay 100 columnas, es decir, 100 votos para cada muestra, y
necesito crear un vector con la categoría más votada de las 6.
which.max(table(data[i,])) me da la más votada de la muestra i.
2017 Dec 15
3
Como cambiar el tamaño de los árboles de clasificación
Muy buenas; mi primera consulta. Utilizo rpart (con as.party) y
evtree, para obtener árboles de clasificación. Los represento en una
windows() aparte, pero cuando el árbol es un poco grande, las hojas
quedan muy estrechas y no se ven los porcentajes. ¿Sabéis como hacer
que todo el árbol sea más pequeño para que las hojas no queden como
simples líneas?
Gracias
--
Dr Manuel Mendoza
2018 Jan 07
4
partialPlot en un Randomforest
Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día
de reyes a la 1.20h y me contestas a las 2.45h)
Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En
un RF para clasificación me da valores parecidos a los de tu ejemplo,
y en otro para regresión, valores de y entre 45 y 55.
Para regresión, el último parámetro no puede ser una categoría, como
2020 Jun 05
3
líneas sobre un mapa
Gracias Emilio y Jorge. Tengo que explicarlo mejor. Mostrando a una
audiencia cómo hacer un tipo de análisis, se hace un loop (abajo) que
analiza un mapa por regiones longitudinales. Tal y como está el script,
print(i) te indica la longitud por la que va (de 10º en 10º) pero me
gustaría que en vez de eso te fuese representando una línea vertical sobre
el mapa, que he representado previamente con
2016 Jul 07
2
Red Neuronal complicada categorías
Estimados
Les consulto por redes neuronales, hay diversos artículos como los siguientes (el último tienen un error actualmente). Pero mi pregunta va un poco por otro lado.
http://www.r-bloggers.com/build-your-own-neural-network-classifier-in-r/
http://www.r-bloggers.com/classification-using-neural-net-in-r/
Básicamente se puede calcular un valor, por ejemplo doblar 2,4 grados a la derecha, luego 1
2020 Apr 01
2
añadir líneas verticales con ggplot
Buenos días, hago un mapa con ggplot:
world<-map_data('world')
windows();ggplot(legend=FALSE) +
...
geom_point(data=Data,aes(x=lon,y=lat,color=Clst),size=1.25) +
scale_color_manual(values=c("grey45","navy","skyblue","gold","green3","darkgreen"))
+
geom_path( data=world, aes(x=long, y=lat,group=group)) +
labs(title =
2016 Jul 09
2
Red Neuronal complicada categorías
Hola,
Esta es una forma de hacerlo...
Mira que lo primero que he modificado es el fichero "x.csv" para sustituir
los espacios en los nombres por "_". Y también he quitado los acentos y las
eñes...
He utilizado el paquete RNNS y la función "mlp()" para ajustar la red.
#-------------------------------------------
> x <- read.csv("x.csv",
2018 Nov 08
2
ggplot con muchos colores
Buenos días, estoy haciendo unos mapas con ggplot, con 29 categorías,
por lo que tengo que utilizar library(RColorBrewer) para disponer de
suficientes colores. El problema es que al hacerlo acorde a dos
variables distintas (color=var1 y color=var2), cuyas 29 categorías son
obviamente las mismas, les da distintos colores y no puedo comparar
los mapas.
Muchas gracias,
Manuel
2016 Jan 26
2
Determinación del punto de corte óptimo
Hola a todos, en estos momentos me encuentro inmerso en laresolución del siguiente problema. Resulta que dispongo de una variable categóricadenominada Severity y que consta de tres categorías (low, medium, high). Además,tengo otra variable que se denomina ZX y que puede tomar cualquier valorcomprendido entre 0 y 10. Quiero determinar los dos puntos de corte óptimos demanera que me dividan a la
2018 Jan 22
2
Random Forests
Muchas gracias Carlos, como siempre.
Es raro que se me pasase. En su momento miré todos los argumentos del
RF, como hago siempre, pero ese lo había olvidado. La verdad es que
funcionaba estupendamente, pero me parecía extraño. Aunque dado que
los RF no sobreajustan, no hay problema con que sus árboles sean todo
lo grandes que quieras. Lo he testado con una base de datos externa y
explica
2012 Jul 04
9
Sobre categorías de factores extraídos de un data.frame
Hola estimados miembros de la lista,
Tengo una inquietud.
Les cuento: tengo un conjunto de datos en un data.frame. Algunas de las
variables que están en él son del tipo factor. Estos factores,
naturalmente, tiene categorías: a veces demasiadas categorías y muchas de
ellas con 1 individuo contemplando el data.frame más de 1 millón de
individuos.
Estas pequeñas cantidades creo que me están
2018 Jan 07
2
partialPlot en un Randomforest
Hola erreros. A ver si alguien podría decirme qué son los dos ejes del
plot que resulta de aplicar partialPlot en un Randomforest.
Encuentro que:
Partial dependence plot gives a graphical depiction of the marginal
effect of a variable on the class probability (classification) or
response (regression)
que nos indica como varía la VR en función de la variable considerada,
manteniendo el
2018 Jan 20
2
Random Forests
Si, Carlos. Yo hago lo mismo, pero esos mismos numeritos salen enormes.
> treesize(RFfit)
[1] 4304 4302 4311 4319 4343 4298 4298 4311 4349 4327 4331 4317
4294 4321 4283 4362
[17] 4300 4330 4266 4331 4308 4352 4294 4315 4372 4349 4331 4347
4329 4348 4298 4335
[33] 4346 4396 4345 4313 4293 4276 4353 4272 4304 4325 4317 4336
4308 4351 4374 4324
[49] 4386 4359 4311 4346 4300
2018 Jan 20
2
Random Forests
Gracias Carlos y Javier, ntrees es el nº de árboles y treesize sus
respectivos tamaños (nº de nodos)
ntree: Number of trees to grow. This should not be set to too small ......
treesize: Size of trees (number of nodes) in and ensemble.
Puse 1000 árboles (ntree=1000), si, pero la función treesize te da el
nº de nodos:
treesize(RFfit, terminal=TRUE) me da un vector de 1000 elementos (uno
2018 Nov 10
2
Asignar distancias
Muy buenas. A ver si alguien puede echarme una mano.
A partir de una matriz de distancias de 29 x 29 he obtenido una df1.
Ahora tengo 841 filas con la distancia de cada combinación de esas 29
categorías.
Algo así como:
Var1 Var2 Dist
a a 0
a b 3
a c 5
b a 3
b b 0
b c 5
c ...
En otra df2, de 14563 filas, tengo las
2019 Jan 18
2
plot3d con library(rgl)
Buenas tardes. ¿Sabe alguno de vosotros cómo indicar la variable con
la que identificar los puntos con plot3d?
library(rgl)
plot3d(Data$RTLML,Data$JD,Data$SB)
Las muestras pertenecen a una de dos categorías, según la variable
"Family", pero no sé cómo hacer que me las represente de diferente
color.
Gracias,
Manuel
.
--
Dr Manuel
2017 Feb 23
2
"IN" en data.table
Hola a todos.
¿Es posible filtrar casos en data.table por más de una categoría al mismo
tiempo? Algo así como un IN o similar, dónde IN puede entenderse como
"existe en":
datos[Provincia IN c("CATAMARCA", "CHACO", "CORRIENTES"), FORM]
O sea: una forma abreviada de hacer: