thr3ads.net - search: "submuestras"

Displaying 17 results from an estimated 17 matches for "submuestras".

Did you mean: submuestra

2017 Mar 08

Primer valor

Buenas Tengo un dataset como el que viene: datos1 datos2 grupo 0 122 A 1 128 A 2 129 A 3 241 A 0 201 A 1 185 A 2 174 A 3 125 A ... .... .... ... .... .... ...

Test K-S con distribuciones LogNormales

2014 Oct 15

Test K-S con distribuciones LogNormales

...endo mal, en el segundo caso trabajas con medias de una > distribución lognormal agrupada. Simplemente hacer notar que la > distribución teórica de estas medias no es lognormal y la varianza no > coincide con la de la distribución original (es la original dividida por el > tamaño de las submuestras = n/nbucket). > > En cuanto al test KS, ten en cuenta que lo que hace es comparar > funciones de distribución empíricas: > # La de los datos originales: > curve(ecdf(sample)(x), type="s") > # Esta se parece mucho a la teórica como sería de esperar con una muestra &g...

SVM plot duda

2023 Feb 16

SVM plot duda

Estimados En este modelo no puedo hacer el plot(svmfit,df11 ) #AQUI NO TRABAJA Le adjunto Excel library(readxl) df11 attach(df11) df11$fallecido=factor(df11$fallecido) # Selección de una submuestra del 70% de los datos set.seed(101) tamano.total <- nrow(df11) tamano.entreno <- round(tamano.total*0.7) datos.indices <- sample(1:tamano.total , size=tamano.entreno) datos.entreno <-

SVM plot duda

2023 Feb 16

SVM plot duda

Hola, El mensaje es claro: el modelo svmfit no existe, tú has llamado al ajuste ?modelo?. De todas formas, aparte de eso tendrías que especificar qué dimensiones (variables predictivas) quieres representar. Si miras en la ayuda de ?plot.svm lo tienes explicado. Esto sí funcionaría: plot(modelo,df11, LDH ~ INL ) Gracias por proporcionar el código y los datos para poder reproducir el error. Un

Una pregunta de estadística (marginalmente relacionada con R)

2009 Apr 29

Una pregunta de estadística (marginalmente relacionada con R)

Hola, ¿qué tal? Tengo una pregunta de esta

Tabular datos de Encuesta Continua de Hogares

2012 Oct 28

Tabular datos de Encuesta Continua de Hogares

Buenas, tengo la siguiente inquietud. Tengo un data frame con los microdatos de la ECH de mi pais. He realizado un cuadro sin problemas en excel pero me gustaria una rutina de R para poder generar la tabla. El data.frame se llama ECH2009. Cuenta con las siguientes variables para este caso: idhogar region estrato integranteshogar expansor ingpercapsvl Computador TvAbonado Internet 1 capital 1 2

Tabular datos de Encuesta Continua de Hogares}

2012 Oct 29

Tabular datos de Encuesta Continua de Hogares}

> Buenas, tengo la siguiente inquietud. > Tengo un data frame con los microdatos de la ECH de mi pais. He realizado > un cuadro sin problemas en excel pero me gustaria una rutina de R para > poder generar la tabla. El data.frame se llama ECH2009. Cuenta con las > siguientes variables para este caso: > > idhogar region estrato integranteshogar expansor ingpercapsvl Computador

CV en R

2017 Jun 02

CV en R

Buenas, Puse los modelos lo mas simplificados, para centrar el tiro en el tema que me preocupa. Es una pena no poder hablar cara a cara, porque por email puedo sonar algo borde, pero no es así, al contrario estoy enormemente agradecido por tu ayuda, pero le veo un problema. Me dices que use un list para ir guardando el modelo, pero tal y como he propuesto en el bucle for, el modelo se crea 10

CV en R

2017 Jun 02

CV en R

Hola, Eso es justamente lo que hace "caret" de una manera muy sencilla y sin que tú te tengas que preocupar de quedarte con el mejor bucket (del CV) o con la mejor combinación en tu "grid search". Te recomiendo que uses "caret" para esto.... Puedes incluso evaluar los dos algoritmos "RF" y "svm" a la vez y conocer realmente el nivel de precisión

CV en R

2017 Jun 02

CV en R

Una vez que tienes la técnica y los parámetros óptimos resultantes de la validación cruzada, ya tienes el modelo que necesitas, NO tienes que hacer nada más. Si vuelves a modelar con todos los datos todo el trabajo de validación que has hecho lo envías a hacer gárgaras. Estarías construyendo un modelo con sobreajuste. Para quedarte tranquilo, haz la prueba, coge el modelo resultante de la

CV en R

2017 Jun 02

CV en R

Es que es justo ahi donde no se como hacerlo. Es decir, dentro del bucle for hago las comprobaciones train test, y me da que de media el mejor es randomForest, pero claro, no me estoy quedando con el modelo, ya que no se va guardando....Entonces es cuando no se como seguir para quedarme con ese modelo.... ________________________________ De: Isidro Hidalgo Arellano <ihidalgo en

CV en R

2017 Jun 02

CV en R

El algoritmo en sí no, pero si quieres ajustar los parámetros (número de árboles, tamaño del nodo, etc.) hay que hacerlo. En la práctica te puedo asegurar que hay diferencia entre usar 500 árboles o 100, igual que el tamaño del nodo que cojas; afinar los parámetros puede suponer ajustar bastante los resultados. Un saludo Isidro Hidalgo Arellano Observatorio del Mercado de Trabajo

CV en R

2017 Jun 02

CV en R

No, llega un momento en el que más árboles no te supone mejoría, e incluso funciona peor. Que funcione peor lo atribuyo al ruido, porque en teoría no tiene mucho sentido, la verdad... Pero no he probado a coger más árboles de los "necesarios". Lo probaré… Un saludo De: Jesús Para Fernández [mailto:j.para.fernandez en hotmail.com] Enviado el: viernes, 02 de junio de 2017 14:54

CV en R

2017 Jun 03

CV en R

?Hola, Puedes ver aquí un ejemplo de cómo comparar varios modelos usando "caret". https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret O mejor en el propio manual de "caret", en esta sección: https://topepo.github.io/caret/model-training-and-tuning.html#exploring-and-comparing-resampling-distributions Y como recomendación te

CV en R

2017 Jun 04

CV en R

Si nos dices el tipo de problema que estás intentando solucionar y el tamaño del dataset podemos recomendarte algo más. En tu pseudo-código mezclas algoritmos supervisados y no-supervisados. Además de ranger, daría alguna oportunidad a "gbm" o como no a "xgboost". Y éstos los probaría dentro de H2O. Saludos, Carlos Ortega www.qualityexcellence.es El 4 de junio de 2017,

STATA base de datos

2017 Dec 06

STATA base de datos

Estimados Pienso que falta memoria, aparte de las sugerencias ya aportadas, de pronto se podrían colocar algunos rm(liberar_de_memoria), para no tener ocupado espacio que no es requerido porque ese paso ya fue realizado. Javier Rubén Marcuzzi El 6 de diciembre de 2017, 13:58, Antonio Rodriguez Andres < antoniorodriguezandres70 en gmail.com> escribió: > Carlos > He tecleado lo

CV en R

2017 Jun 04

CV en R

H2O va bien (muy bien) tanto en un ordenador sobremesa/portátil y sobre un clúster. En uno de sobremesa si tienes buena RAM y muchos cores, mejor. Y no tienes porqué usar Spark si no necesitas una solución tiempo real o "near real-time". H2O tiene otra solución para interaccionar con Spark (Sparkling Water). Incluso sobre un clúster, puedes usar "sparklyr" y

search for: submuestras