Displaying 20 results from an estimated 600 matches similar to: "subset con los casos presentes en otra df"
2020 Jun 26
4
Quedarse con las muestras de una BD que están presentes otra, basado en dos variables
Buenas tardes, quedarme con las muestras de una BD (data) que están
presentes en otra (datax), cuando se tiene una variable que nunca se repite
(Key) es fácil: data <- subset(data,data$Key %in% datax$Key).
Mi problema es cuando la exclusividad viene dada por dos variables. P.e.,
las coordenadas de un mapa: lon y lat.
¿Como puedo quedarme con las muestras de una df cuya lon y lat son iguales
a
2010 May 08
5
contar casos en un vector
Buenas noches, tengo dos vectores con nombres. El primero es largo,
nombreL, y el segundo corto, nombreC. Quiero contar cuantas veces
aparece alguno de los nombres del vector corto en el largo.
Lo que estoy haciendo es lo siguiente:
cuenta <- 0
topL <- length(nombreL)
topC <- length(nombreC)
for (i in 1:topL) {
for (j in 1:topC) {
2019 Oct 25
2
Duda de como contar casos por Programa.
Hola,
Tengo un tabla de datos con pacientes asistidos, para los cuáles tengo
variables como dni, género, programa de atención etc. Hay pacientes que
atendieron en más de un programa por lo cuál se repiten en la tabla. Lo que
quiero es poder contar con una matriz que me permita identificar la
cantidad de pacientes que coinciden entre programas.
Va un ejemplo:
[image: image.png]
Intenté de
2018 May 31
2
predicciones sobre el OOB de randomForest
Gracias Carlos. No uso caret, pero lo miraré.
Quoting Carlos Ortega <cof en qualityexcellence.es>:
> Hola,
>
> Creo que si utilizas "caret" y en la función "trainControl()" defines "oob"
> como criterio de randomización, puedes luego recuperar del objeto del
> modelo, las predicciones individuales...
>
> Saludos,
> Carlos Ortega
>
2019 Feb 19
2
crear un vector con las categorías
Bueno, creo que no contesté tu pregunta. Con training <- data[-i, ]
crea una df llamada training, sin la muestra i, que después utiliza
para entrenar el algoritmo.
Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>:
> Estimado Manuel Mendoza
>
> Con sus datos y a modo de curiosidad, ¿que pasa en training <- data[-i, ]?
>
> Javier Rubén Marcuzzi
>
2019 Feb 18
3
crear un vector con las categorías
Gracias Jorge. No entiendo bien; la variable objetivo es ya factor. El
árbol me la predice bien, como factor, también. Es al ir construyendo
el vector que lo anota con un nº, según de cuál de las 4 categorías se
trate.
Quoting Jorge I Velez <jorgeivanvelez en gmail.com>:
> Estimado Manuel,
>
> Debes definir ecsta como factor usando, por ejemplo,
>
> factor(ecsta,
2018 Feb 19
3
gbm.step para clasificación no binaria
Hola de nuevo. Se me olvidaba la principal razón para utilizar
gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan
(a diferencia de los random forest o cualquier otro bootstrap) pero
gbm.step hace validación cruzada para determinar el nº óptimo de
árboles y evitarlo. Es fundamental.
La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces,
y usar el
2018 Apr 14
2
Encontrar el más votado
Gracias Carlos J., sale bien, pero me transforma las 6 categorías en
números del 1 al 6
¿sabes cómo evitarlo?
Quoting "Carlos J. Gil Bellosta" <cgb en datanalytics.com>:
> apply(data, 1, function(x) which.max(table(x)))
>
> El sáb., 14 abr. 2018 a las 19:54, Manuel Mendoza (<mmendoza en mncn.csic.es>)
> escribió:
>
>>
>> Buenas tardes de
2018 Feb 19
3
gbm.step para clasificación no binaria
Gracias Carlos. Hasta donde yo entiendo si las hay:
El argumento family puede ser:
"gaussian" (for minimizing squared error); por lo que tiene que ser numérica
"bernoulli" (logistic regression for 0-1 out-comes); binaria por narices
"poisson" (count outcomes; requires the response to be a positive
integer); numérica también, pues.
La única podría ser
2018 Jun 22
4
loop con matriz que cambia de nombre
Funciona, me crea una matriz en cada iteración, con un nombre que
incluye el nº de la iteración. Me surge ahora el problema de que,
dentro del mismo bucle la quiero convertir en df y ponerle nombre a
las columnas, y como el nombre de la matriz es distinto cada vez, no
sé cómo hacerlo. Supongo que se hará todo al crearla, pero no sé cómo.
Un problema adicional es que las variables
2018 Jun 24
2
loop con matriz que cambia de nombre
Gracias Javier, pero creo que si no consigo que me lo haga todo de una
vez con un loop, me merece más la pena hacerlo como hasta ahora, una a
una.
Manuel
Quoting Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com>:
> Estimado Manuel Mendoza
>
> No sería lo ideal, pero de pronto podría ir guardando en json, que es una
> forma no estructurada, luego toma los datos
2018 Jun 27
2
error en un cmeans
Pues no lo sé. Es algo del código de RandomForest, supongo.
Quoting Jesús Para Fernández <j.para.fernandez en hotmail.com>:
> U es un dataframe?
>
> Obtener Outlook para Android<https://aka.ms/ghei36>
>
> ________________________________
> From: R-help-es <r-help-es-bounces en r-project.org> on behalf of
> Manuel Mendoza <mmendoza en mncn.csic.es>
2019 Jun 30
3
¿cómo puedo cambiar mi email para esta lista de correo?
¿cómo puedo cambiar mi email para esta lista de correo?
--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural Science (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain
2018 Jan 20
2
Paquete pdp
Buenas. El Paquete pdp es muy fácil de usar, pero cuando se lo aplico
a mis datos me da:
Error in eval(stats::getCall(object)$data) : object 'x.data' not found.
Os copio abajo un ejemplo de aplicación a un RF. El mio es de un
boosted regression trees (paquete gbm). No sé si esa puede ser la
razón del error. En el paquete pdp no especifica que sea solo para RF,
aunque en los
2018 Jan 17
4
Random Forests
Buenas tardes a todos. El paquete randomForest tiene la función
treesize, que es el nº de nodos. Me dan valores realmente elevados (en
torno a 1000), y eso me parece extraño. ¿sabéis si es así?
Gracias,
Manuel
--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural History (MNCN)
Spanish Scientific Council (CSIC)
C/ Serrano 115bis, 28006 MADRID
Spain
2018 Jun 23
2
loop con matriz que cambia de nombre
Bien, Carlos, lo de ir metiendo las dfs en una lista parece buena
idea, y después puedo fusionarlas con un cbind, tal y como hago ahora
mismo, después de crear cada una de ellas independientemente. Son 9
dfs, y obtener cada una de ellas toma bastante tiempo de computación.
Lo que quiero es que me haga las 9 en un loop. El problema es que si
no les pone nombres distintos a las variables,
2018 Jan 07
4
partialPlot en un Randomforest
Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día
de reyes a la 1.20h y me contestas a las 2.45h)
Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En
un RF para clasificación me da valores parecidos a los de tu ejemplo,
y en otro para regresión, valores de y entre 45 y 55.
Para regresión, el último parámetro no puede ser una categoría, como
2018 Feb 19
2
Gráficas 3D
Gracias Carlos, mi idea es construir un cono, un cilindro u otros cuerpos
geométrico y luego graficarlos. Alguna idea de como empezar?
Muchas gracias como siempre
El lun., 19 de feb. de 2018 15:06, <r-help-es-request en r-project.org>
escribió:
> Envíe los mensajes para la lista R-help-es a
> r-help-es en r-project.org
>
> Para subscribirse o anular su subscripción a
2018 Jun 22
3
loop con matriz que cambia de nombre
Buenos días. Quiero hacer un for (j), anidado en otro for (i). En el
2º for, en cada iteración ha de crear una matriz vacía: mat <-
matrix(nrow=nrow(data),ncol=19) pero llamándola de forma distinta cada
vez. El nombre ha de ser: paste("D",i,colnames(Data[j]),sep=""). Llevo
un rato haciendo pruebas pero no me sale. A ver si alguien pudiera
ayudarme,
gracias,
Manuel
2018 Apr 26
2
kappa
Buenas, ¿alguien sabe qué puede ser este error?
data es una df y las columnas 23 y 24 son las que quiero comparar; están bien.
testK<-kappa2(data[,c(23,24)], "equal")
Error in sort.list(y) : 'x' must be atomic for 'sort.list'
Have you called 'sort' on a list?
--
Dr Manuel Mendoza
Department of Biogeography and Global Change
National Museum of Natural