thr3ads.net - similar to: "DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA"

Displaying 20 results from an estimated 500 matches similar to: "DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA"

2018 Feb 19

gbm.step para clasificación no binaria

Hola de nuevo. Se me olvidaba la principal razón para utilizar gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan (a diferencia de los random forest o cualquier otro bootstrap) pero gbm.step hace validación cruzada para determinar el nº óptimo de árboles y evitarlo. Es fundamental. La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces, y usar el

consulta graficas para GLM

2015 Aug 06

consulta graficas para GLM

Estimados amigos y expertos del R, Les escribo para hacerles una pregunta que parece un poco sencilla pero me ha costado mucho. Estoy tratando de graficar los datos correspondientes a tasas de consumo de algunos organismos cuando están expuestos o no expuestos a un químico sobre tres tipos de presa. Por definición, debía ajustar los datos a un glm con distribución gama. Las gráficas pueden ser

Predicción de ventas retail y estimacion de elasticidades precio directa y cruzada

2012 Oct 04

Predicción de ventas retail y estimacion de elasticidades precio directa y cruzada

Buenas, Escribo a la lista de R con la siguiente inquietud. Me gustaria que quienes ya han trabajado con algún modelo para proyectar ventas retail de cientos de articulos, que me comenten sobre metodologias (fuera de R) o soluciones sobre paquetes de R que me permitan modelar (de alguna manera mas o menos automatica, ya que son muchas series) en terminos semanales las ventas de cientos de

Efectos fijos y aleatorios en un modelo lineal

2012 Mar 19

Efectos fijos y aleatorios en un modelo lineal

Hola a todos, Tengo algunas dudas sobre como introducir en un modelo lineal factores con efectos fijos y aleatorios. Mi diseño es el siguiente: Factores Line: 40 líneas de trigo (Fijo) Rep: 3 Bloques (Aleatorio) Year: 2 Años (Aleatorio) Variable dependiente alpha.ug.mg Nota: Adjunto tabla de datos Dentro del diseño, 'Rep' y 'Year' se considera de efectos aleatorios y

PRUEBAS DE NORMALIDAD

2009 Nov 06

PRUEBAS DE NORMALIDAD

Estimados todos: Me es grato escribir a esta lista de ayuda para R, ya que comparto 100% la filosofía de Software libre en especial software en Estadística ya que es la carrera que estoy siguiendo. El motivo de este mensaje es por un par de dudas que no pude resolver: 1. He utilizado las funciones para realizar pruebas de normalidad (kolmogorov-smirnov, cuando n>50) y (Shapiro, cuando

Efectos aleatorios, interaccions y SNK, LSD o Tukey

2011 Jul 08

Efectos aleatorios, interaccions y SNK, LSD o Tukey

Queridos R-users: Tengo una duda que hace mucho tiempo que estoy intentando resolver, os explico a modo de ejemplo: Tengo estos efectos: Año(5 niveles),Localidad (10 niveles) y genotipo (3 niveles), año y localidad son aleatorios y genotipo es fijo (los he escogido yo). Me gustaría hacer obtener una tabla parecida a la Tabla Anova donde aparezca cada factor y sus interacciones y

CV en R

2017 Jun 02

CV en R

Buenas, Estoy haciendo modelos y comparando cual es mejor. Para ello, uso CV de 10 folds. Por ejemplo, hago la comparativa entre un svm y un randomForest para una serie de datos, por ello hago: midataset<-import..... #datos es un dataframe de 1500 filas y 15 variables for(i in 1:10){ numeros<-sample(1:1500,1500*0.7) train<-datos[numeros,] test<-datos[-numeros,] #modeloRF

Distribuir paquete Windows

2011 Feb 21

Distribuir paquete Windows

Buenos días, Trabajo en Linux (Fedora) y he creado un paquete de R para uso interno, llamado Ind, el cual he instalado en Linux y me funciona perfectamente. Ahora quiero distribuirlo entre mis compañeros y algunos trabajan con Windows, por lo que he tratado de instalarlo en Windows 7 (hice en mi portátil una partición del disco y tengo tanto Fedora como Windows 7). Según he leído en algunos

Intervalos de variable de proporciones, para representar en mapa

2012 Jun 27

Intervalos de variable de proporciones, para representar en mapa

Hola. Tengo que representar en un mapa, valores de proporciones de extranjeros con tarjetas de residencia en vigor, según nacionalidad y país de procedencia. Los datos son de este estilo Rumania Andalucía 0,200365823 Aragón 0,377192073 Asturias 0,205353012 I. Baleares 0,06592893 Canarias 0,03050312 Cantabria 0,190397393 Castilla-León 0,211670421 Castilla-La Mancha

Rv: Re: Cosinor Analysis

2011 Sep 12

Rv: Re: Cosinor Analysis

--- El lun, 12/9/11, Cristalina <pa100cia77@yahoo.es> escribió: De: Cristalina <pa100cia77@yahoo.es> Asunto: Re: [R-es] Cosinor Analysis Para: "Carlos Ortega" <coforfe@gmail.com> Fecha: lunes, 12 de septiembre, 2011 08:43 Hola, Carlos, muchas gracias. El método empleado en http://tolstoy.newcastle.edu.au/R/e6/help/09/01/0626.html (el url que se referencia

CV en R

2017 Jun 02

CV en R

Una vez que tienes la técnica y los parámetros óptimos resultantes de la validación cruzada, ya tienes el modelo que necesitas, NO tienes que hacer nada más. Si vuelves a modelar con todos los datos todo el trabajo de validación que has hecho lo envías a hacer gárgaras. Estarías construyendo un modelo con sobreajuste. Para quedarte tranquilo, haz la prueba, coge el modelo resultante de la

Data mining

2013 May 12

Data mining

Hola, ¿cómo están? Soy estudiante de Ing. en Sistemas de Información y estoy cursando la materia Tecnologías para la Explotación de Datos. Me he decidido a usar R para hacer DM. Estoy recién comenzando con ambos. El asunto es que no he encontrado la implementación en R de uno de los algoritmos que dimos para árboles de decisión, ID3. Ya revisé varios de los paquetes para DM

Temas para word markdown

2015 Apr 08

Temas para word markdown

Buenas, estaba siguiendo el hilo de Informes Periódicos en R de Jesus Herranz y me surgió una duda. Actualmente estoy tratando de usar markdown para todo así cualquier cosa que haga me queda presentable para informar o presentar en algún lugar. En general estoy usando html y o pdf principalmente porque cuando trato de compilar en word la verdad que queda bastante feíto. Alguién sabe, o puede

CV en R

2017 Jun 02

CV en R

Hola, Eso es justamente lo que hace "caret" de una manera muy sencilla y sin que tú te tengas que preocupar de quedarte con el mejor bucket (del CV) o con la mejor combinación en tu "grid search". Te recomiendo que uses "caret" para esto.... Puedes incluso evaluar los dos algoritmos "RF" y "svm" a la vez y conocer realmente el nivel de precisión

CV en R

2017 Jun 02

CV en R

Buenas, Puse los modelos lo mas simplificados, para centrar el tiro en el tema que me preocupa. Es una pena no poder hablar cara a cara, porque por email puedo sonar algo borde, pero no es así, al contrario estoy enormemente agradecido por tu ayuda, pero le veo un problema. Me dices que use un list para ir guardando el modelo, pero tal y como he propuesto en el bucle for, el modelo se crea 10

Trabajar con un dataset muy grande

2016 Dec 30

Trabajar con un dataset muy grande

hola a todos, Me gustaria saber qué haceis cuando el dataset para trabsjar es tan grande que R no lo soporta. Lo troceo con alguna otra herramienta? Cual? Gracias y feliz año! Victoria > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org <javascript:;> > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Enviado con

CV en R

2017 Jun 02

CV en R

Es que es justo ahi donde no se como hacerlo. Es decir, dentro del bucle for hago las comprobaciones train test, y me da que de media el mejor es randomForest, pero claro, no me estoy quedando con el modelo, ya que no se va guardando....Entonces es cuando no se como seguir para quedarme con ese modelo.... ________________________________ De: Isidro Hidalgo Arellano <ihidalgo en

gbm.step para clasificación no binaria

2018 Feb 19

gbm.step para clasificación no binaria

Gracias Carlos. Hasta donde yo entiendo si las hay: El argumento family puede ser: "gaussian" (for minimizing squared error); por lo que tiene que ser numérica "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices "poisson" (count outcomes; requires the response to be a positive integer); numérica también, pues. La única podría ser

Re-instalacion de sistema operativo

2013 Apr 24

Re-instalacion de sistema operativo

Hola! Necesito reinstalar ubuntu, con lo cual R se actualizará a 2.13.3 (es la última version, verdad?) y me gustaría saber si hay alguna forma de conservar los paquetes que ya tengo instalados en R.? Muchas gracias!! Milagros [[alternative HTML version deleted]]

CV en R

2017 Jun 02

CV en R

El algoritmo en sí no, pero si quieres ajustar los parámetros (número de árboles, tamaño del nodo, etc.) hay que hacerlo. En la práctica te puedo asegurar que hay diferencia entre usar 500 árboles o 100, igual que el tamaño del nodo que cojas; afinar los parámetros puede suponer ajustar bastante los resultados. Un saludo Isidro Hidalgo Arellano Observatorio del Mercado de Trabajo

similar to: DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA