similar to: DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA

Displaying 20 results from an estimated 500 matches similar to: "DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA"

2018 Feb 19
3
gbm.step para clasificación no binaria
Hola de nuevo. Se me olvidaba la principal razón para utilizar gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan (a diferencia de los random forest o cualquier otro bootstrap) pero gbm.step hace validación cruzada para determinar el nº óptimo de árboles y evitarlo. Es fundamental. La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces, y usar el
2015 Aug 06
3
consulta graficas para GLM
Estimados amigos y expertos del R, Les escribo para hacerles una pregunta que parece un poco sencilla pero me ha costado mucho. Estoy tratando de graficar los datos correspondientes a tasas de consumo de algunos organismos cuando están expuestos o no expuestos a un químico sobre tres tipos de presa. Por definición, debía ajustar los datos a un glm con distribución gama. Las gráficas pueden ser
2012 Oct 04
0
Predicción de ventas retail y estimacion de elasticidades precio directa y cruzada
Buenas, Escribo a la lista de R con la siguiente inquietud. Me gustaria que quienes ya han trabajado con algún modelo para proyectar ventas retail de cientos de articulos, que me comenten sobre metodologias (fuera de R) o soluciones sobre paquetes de R que me permitan modelar (de alguna manera mas o menos automatica, ya que son muchas series) en terminos semanales las ventas de cientos de
2012 Mar 19
9
Efectos fijos y aleatorios en un modelo lineal
Hola a todos, Tengo algunas dudas sobre como introducir en un modelo lineal factores con efectos fijos y aleatorios. Mi diseño es el siguiente: Factores Line: 40 líneas de trigo (Fijo) Rep: 3 Bloques (Aleatorio) Year: 2 Años (Aleatorio) Variable dependiente alpha.ug.mg Nota: Adjunto tabla de datos Dentro del diseño, 'Rep' y 'Year' se considera de efectos aleatorios y
2009 Nov 06
4
PRUEBAS DE NORMALIDAD
Estimados todos: Me es grato escribir a esta lista de ayuda para R, ya que comparto 100% la filosofía de Software libre en especial software en Estadística ya que es la carrera que estoy siguiendo. El motivo de este mensaje es por un par de dudas que no pude resolver: 1. He utilizado las funciones para realizar pruebas de normalidad (kolmogorov-smirnov, cuando n>50) y (Shapiro, cuando
2011 Jul 08
3
Efectos aleatorios, interaccions y SNK, LSD o Tukey
Queridos R-users: Tengo una duda que hace mucho tiempo que estoy intentando resolver, os explico a modo de ejemplo: Tengo estos efectos: Año(5 niveles),Localidad (10 niveles) y genotipo (3 niveles), año y localidad son aleatorios y genotipo es fijo (los he escogido yo). Me gustaría hacer obtener una tabla parecida a la Tabla Anova donde aparezca cada factor y sus interacciones y
2017 Jun 02
5
CV en R
Buenas, Estoy haciendo modelos y comparando cual es mejor. Para ello, uso CV de 10 folds. Por ejemplo, hago la comparativa entre un svm y un randomForest para una serie de datos, por ello hago: midataset<-import..... #datos es un dataframe de 1500 filas y 15 variables for(i in 1:10){ numeros<-sample(1:1500,1500*0.7) train<-datos[numeros,] test<-datos[-numeros,] #modeloRF
2011 Feb 21
4
Distribuir paquete Windows
Buenos días, Trabajo en Linux (Fedora) y he creado un paquete de R para uso interno, llamado Ind, el cual he instalado en Linux y me funciona perfectamente. Ahora quiero distribuirlo entre mis compañeros y algunos trabajan con Windows, por lo que he tratado de instalarlo en Windows 7 (hice en mi portátil una partición del disco y tengo tanto Fedora como Windows 7). Según he leído en algunos
2012 Jun 27
4
Intervalos de variable de proporciones, para representar en mapa
Hola. Tengo que representar en un mapa, valores de proporciones de extranjeros con tarjetas de residencia en vigor, según nacionalidad y país de procedencia. Los datos son de este estilo Rumania Andalucía 0,200365823 Aragón 0,377192073 Asturias 0,205353012 I. Baleares 0,06592893 Canarias 0,03050312 Cantabria 0,190397393 Castilla-León 0,211670421 Castilla-La Mancha
2011 Sep 12
6
Rv: Re: Cosinor Analysis
--- El lun, 12/9/11, Cristalina <pa100cia77@yahoo.es> escribió: De: Cristalina <pa100cia77@yahoo.es> Asunto: Re: [R-es] Cosinor Analysis Para: "Carlos Ortega" <coforfe@gmail.com> Fecha: lunes, 12 de septiembre, 2011 08:43 Hola,   Carlos, muchas gracias.   El método empleado en http://tolstoy.newcastle.edu.au/R/e6/help/09/01/0626.html (el url que se referencia
2017 Jun 02
5
CV en R
Una vez que tienes la técnica y los parámetros óptimos resultantes de la validación cruzada, ya tienes el modelo que necesitas, NO tienes que hacer nada más. Si vuelves a modelar con todos los datos todo el trabajo de validación que has hecho lo envías a hacer gárgaras. Estarías construyendo un modelo con sobreajuste. Para quedarte tranquilo, haz la prueba, coge el modelo resultante de la
2013 May 12
2
Data mining
Hola, ¿cómo están? Soy estudiante de Ing. en Sistemas de Información y estoy cursando la materia Tecnologías para la Explotación de Datos. Me he decidido a usar R para hacer DM. Estoy recién comenzando con ambos. El asunto es que no he encontrado la implementación en R de uno de los algoritmos que dimos para árboles de decisión, ID3. Ya revisé varios de los paquetes para DM
2015 Apr 08
2
Temas para word markdown
Buenas, estaba siguiendo el hilo de Informes Periódicos en R de Jesus Herranz y me surgió una duda. Actualmente estoy tratando de usar markdown para todo así cualquier cosa que haga me queda presentable para informar o presentar en algún lugar. En general estoy usando html y o pdf principalmente porque cuando trato de compilar en word la verdad que queda bastante feíto. Alguién sabe, o puede
2017 Jun 02
2
CV en R
Hola, Eso es justamente lo que hace "caret" de una manera muy sencilla y sin que tú te tengas que preocupar de quedarte con el mejor bucket (del CV) o con la mejor combinación en tu "grid search". Te recomiendo que uses "caret" para esto.... Puedes incluso evaluar los dos algoritmos "RF" y "svm" a la vez y conocer realmente el nivel de precisión
2017 Jun 02
2
CV en R
Buenas, Puse los modelos lo mas simplificados, para centrar el tiro en el tema que me preocupa. Es una pena no poder hablar cara a cara, porque por email puedo sonar algo borde, pero no es así, al contrario estoy enormemente agradecido por tu ayuda, pero le veo un problema. Me dices que use un list para ir guardando el modelo, pero tal y como he propuesto en el bucle for, el modelo se crea 10
2016 Dec 30
3
Trabajar con un dataset muy grande
hola a todos, Me gustaria saber qué haceis cuando el dataset para trabsjar es tan grande que R no lo soporta. Lo troceo con alguna otra herramienta? Cual? Gracias y feliz año! Victoria > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org <javascript:;> > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Enviado con
2017 Jun 02
2
CV en R
Es que es justo ahi donde no se como hacerlo. Es decir, dentro del bucle for hago las comprobaciones train test, y me da que de media el mejor es randomForest, pero claro, no me estoy quedando con el modelo, ya que no se va guardando....Entonces es cuando no se como seguir para quedarme con ese modelo.... ________________________________ De: Isidro Hidalgo Arellano <ihidalgo en
2018 Feb 19
3
gbm.step para clasificación no binaria
Gracias Carlos. Hasta donde yo entiendo si las hay: El argumento family puede ser: "gaussian" (for minimizing squared error); por lo que tiene que ser numérica "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices "poisson" (count outcomes; requires the response to be a positive integer); numérica también, pues. La única podría ser
2013 Apr 24
12
Re-instalacion de sistema operativo
Hola! Necesito reinstalar ubuntu, con lo cual R se actualizará a 2.13.3 (es la última version, verdad?) y me gustaría saber si hay alguna forma de conservar los paquetes que ya tengo instalados en R.? Muchas gracias!! Milagros [[alternative HTML version deleted]]
2017 Jun 02
2
CV en R
El algoritmo en sí no, pero si quieres ajustar los parámetros (número de árboles, tamaño del nodo, etc.) hay que hacerlo. En la práctica te puedo asegurar que hay diferencia entre usar 500 árboles o 100, igual que el tamaño del nodo que cojas; afinar los parámetros puede suponer ajustar bastante los resultados. Un saludo Isidro Hidalgo Arellano Observatorio del Mercado de Trabajo