Displaying 20 results from an estimated 3000 matches similar to: "problema con ggplot2"
2018 May 31
2
predicciones sobre el OOB de randomForest
Gracias Carlos. No uso caret, pero lo miraré.
Quoting Carlos Ortega <cof en qualityexcellence.es>:
> Hola,
>
> Creo que si utilizas "caret" y en la función "trainControl()" defines "oob"
> como criterio de randomización, puedes luego recuperar del objeto del
> modelo, las predicciones individuales...
>
> Saludos,
> Carlos Ortega
>
2019 Feb 19
2
crear un vector con las categorías
Bueno, creo que no contesté tu pregunta. Con training <- data[-i, ]
crea una df llamada training, sin la muestra i, que después utiliza
para entrenar el algoritmo.
Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>:
> Estimado Manuel Mendoza
>
> Con sus datos y a modo de curiosidad, ¿que pasa en training <- data[-i, ]?
>
> Javier Rubén Marcuzzi
>
2019 Feb 18
3
crear un vector con las categorías
Gracias Jorge. No entiendo bien; la variable objetivo es ya factor. El
árbol me la predice bien, como factor, también. Es al ir construyendo
el vector que lo anota con un nº, según de cuál de las 4 categorías se
trate.
Quoting Jorge I Velez <jorgeivanvelez en gmail.com>:
> Estimado Manuel,
>
> Debes definir ecsta como factor usando, por ejemplo,
>
> factor(ecsta,
2018 Feb 19
3
gbm.step para clasificación no binaria
Hola de nuevo. Se me olvidaba la principal razón para utilizar
gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan
(a diferencia de los random forest o cualquier otro bootstrap) pero
gbm.step hace validación cruzada para determinar el nº óptimo de
árboles y evitarlo. Es fundamental.
La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces,
y usar el
2018 Apr 14
2
Encontrar el más votado
Gracias Carlos J., sale bien, pero me transforma las 6 categorías en
números del 1 al 6
¿sabes cómo evitarlo?
Quoting "Carlos J. Gil Bellosta" <cgb en datanalytics.com>:
> apply(data, 1, function(x) which.max(table(x)))
>
> El sáb., 14 abr. 2018 a las 19:54, Manuel Mendoza (<mmendoza en mncn.csic.es>)
> escribió:
>
>>
>> Buenas tardes de
2018 Feb 19
3
gbm.step para clasificación no binaria
Gracias Carlos. Hasta donde yo entiendo si las hay:
El argumento family puede ser:
"gaussian" (for minimizing squared error); por lo que tiene que ser numérica
"bernoulli" (logistic regression for 0-1 out-comes); binaria por narices
"poisson" (count outcomes; requires the response to be a positive
integer); numérica también, pues.
La única podría ser
2018 Jun 27
2
error en un cmeans
Pues no lo sé. Es algo del código de RandomForest, supongo.
Quoting Jesús Para Fernández <j.para.fernandez en hotmail.com>:
> U es un dataframe?
>
> Obtener Outlook para Android<https://aka.ms/ghei36>
>
> ________________________________
> From: R-help-es <r-help-es-bounces en r-project.org> on behalf of
> Manuel Mendoza <mmendoza en mncn.csic.es>
2018 Jun 22
4
loop con matriz que cambia de nombre
Funciona, me crea una matriz en cada iteración, con un nombre que
incluye el nº de la iteración. Me surge ahora el problema de que,
dentro del mismo bucle la quiero convertir en df y ponerle nombre a
las columnas, y como el nombre de la matriz es distinto cada vez, no
sé cómo hacerlo. Supongo que se hará todo al crearla, pero no sé cómo.
Un problema adicional es que las variables
2018 Jun 24
2
loop con matriz que cambia de nombre
Gracias Javier, pero creo que si no consigo que me lo haga todo de una
vez con un loop, me merece más la pena hacerlo como hasta ahora, una a
una.
Manuel
Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>:
> Estimado Manuel Mendoza
>
> No sería lo ideal, pero de pronto podría ir guardando en json, que es una
> forma no estructurada, luego toma los datos
2019 Jun 30
3
¿cómo puedo cambiar mi email para esta lista de correo?
¿cómo puedo cambiar mi email para esta lista de correo?
--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural Science (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain
2018 Jan 20
2
Paquete pdp
Buenas. El Paquete pdp es muy fácil de usar, pero cuando se lo aplico
a mis datos me da:
Error in eval(stats::getCall(object)$data) : object 'x.data' not found.
Os copio abajo un ejemplo de aplicación a un RF. El mio es de un
boosted regression trees (paquete gbm). No sé si esa puede ser la
razón del error. En el paquete pdp no especifica que sea solo para RF,
aunque en los
2018 Jan 17
4
Random Forests
Buenas tardes a todos. El paquete randomForest tiene la función
treesize, que es el nº de nodos. Me dan valores realmente elevados (en
torno a 1000), y eso me parece extraño. ¿sabéis si es así?
Gracias,
Manuel
--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain
2018 Jun 23
2
loop con matriz que cambia de nombre
Bien, Carlos, lo de ir metiendo las dfs en una lista parece buena
idea, y después puedo fusionarlas con un cbind, tal y como hago ahora
mismo, después de crear cada una de ellas independientemente. Son 9
dfs, y obtener cada una de ellas toma bastante tiempo de computación.
Lo que quiero es que me haga las 9 en un loop. El problema es que si
no les pone nombres distintos a las variables,
2018 Jan 07
4
partialPlot en un Randomforest
Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día
de reyes a la 1.20h y me contestas a las 2.45h)
Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En
un RF para clasificación me da valores parecidos a los de tu ejemplo,
y en otro para regresión, valores de y entre 45 y 55.
Para regresión, el último parámetro no puede ser una categoría, como
2018 Feb 19
2
Gráficas 3D
Gracias Carlos, mi idea es construir un cono, un cilindro u otros cuerpos
geométrico y luego graficarlos. Alguna idea de como empezar?
Muchas gracias como siempre
El lun., 19 de feb. de 2018 15:06, <r-help-es-request en r-project.org>
escribió:
> Envíe los mensajes para la lista R-help-es a
> r-help-es en r-project.org
>
> Para subscribirse o anular su subscripción a
2018 Jun 22
3
loop con matriz que cambia de nombre
Buenos días. Quiero hacer un for (j), anidado en otro for (i). En el
2º for, en cada iteración ha de crear una matriz vacía: mat <-
matrix(nrow=nrow(data),ncol=19) pero llamándola de forma distinta cada
vez. El nombre ha de ser: paste("D",i,colnames(Data[j]),sep=""). Llevo
un rato haciendo pruebas pero no me sale. A ver si alguien pudiera
ayudarme,
gracias,
Manuel
2018 May 31
2
predicciones sobre el OOB de randomForest
Muy buenas, ¿sabe alguien cómo obtener las predicciones sobre el out
of bag que hace randomForest?
Manuel
.
--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain
2018 Jan 22
2
Random Forests
Muchas gracias Carlos, como siempre.
Es raro que se me pasase. En su momento miré todos los argumentos del
RF, como hago siempre, pero ese lo había olvidado. La verdad es que
funcionaba estupendamente, pero me parecía extraño. Aunque dado que
los RF no sobreajustan, no hay problema con que sus árboles sean todo
lo grandes que quieras. Lo he testado con una base de datos externa y
explica
2017 Dec 15
3
Como cambiar el tamaño de los árboles de clasificación
Muy buenas; mi primera consulta. Utilizo rpart (con as.party) y
evtree, para obtener árboles de clasificación. Los represento en una
windows() aparte, pero cuando el árbol es un poco grande, las hojas
quedan muy estrechas y no se ven los porcentajes. ¿Sabéis como hacer
que todo el árbol sea más pequeño para que las hojas no queden como
simples líneas?
Gracias
--
Dr Manuel Mendoza
2018 Apr 26
2
kappa
Buenas, ¿alguien sabe qué puede ser este error?
data es una df y las columnas 23 y 24 son las que quiero comparar; están bien.
testK<-kappa2(data[,c(23,24)], "equal")
Error in sort.list(y) : 'x' must be atomic for 'sort.list'
Have you called 'sort' on a list?
--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural