Displaying 20 results from an estimated 500 matches similar to: "DUDA SOBRE PARTICIÓN DE DATOS PARA VALIDACIÓN CRUZADA"
2018 Feb 19
3
gbm.step para clasificación no binaria
Hola de nuevo. Se me olvidaba la principal razón para utilizar
gbm.step del paquete dismo. Como sabéis, los boosted si sobreajustan
(a diferencia de los random forest o cualquier otro bootstrap) pero
gbm.step hace validación cruzada para determinar el nº óptimo de
árboles y evitarlo. Es fundamental.
La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces,
y usar el
2015 Aug 06
3
consulta graficas para GLM
Estimados amigos y expertos del R,
Les escribo para hacerles una pregunta que parece un poco sencilla pero me
ha costado mucho. Estoy tratando de graficar los datos correspondientes a
tasas de consumo de algunos organismos cuando están expuestos o no
expuestos a un químico sobre tres tipos de presa. Por definición, debía
ajustar los datos a un glm con distribución gama.
Las gráficas pueden ser
2012 Oct 04
0
Predicción de ventas retail y estimacion de elasticidades precio directa y cruzada
Buenas,
Escribo a la lista de R con la siguiente inquietud. Me gustaria que quienes ya han trabajado con algún modelo para proyectar ventas retail de cientos de articulos, que me comenten sobre metodologias (fuera de R) o soluciones sobre paquetes de R que me permitan modelar (de alguna manera mas o menos automatica, ya que son muchas series) en terminos semanales las ventas de cientos de
2012 Mar 19
9
Efectos fijos y aleatorios en un modelo lineal
Hola a todos,
Tengo algunas dudas sobre como introducir en un modelo lineal factores
con efectos fijos y aleatorios. Mi diseño es el siguiente:
Factores
Line: 40 líneas de trigo (Fijo)
Rep: 3 Bloques (Aleatorio)
Year: 2 Años (Aleatorio)
Variable dependiente
alpha.ug.mg
Nota: Adjunto tabla de datos
Dentro del diseño, 'Rep' y 'Year' se considera de efectos aleatorios y
2009 Nov 06
4
PRUEBAS DE NORMALIDAD
Estimados todos:
Me es grato escribir a esta lista de ayuda para R, ya que comparto 100% la filosofía de Software libre en especial software en Estadística ya que es la carrera que estoy siguiendo.
El motivo de este mensaje es por un par de dudas que no pude resolver:
1. He utilizado las funciones para realizar pruebas de normalidad (kolmogorov-smirnov, cuando n>50) y (Shapiro, cuando
2011 Jul 08
3
Efectos aleatorios, interaccions y SNK, LSD o Tukey
Queridos R-users:
Tengo una duda que hace mucho tiempo que estoy intentando resolver, os
explico a modo de ejemplo:
Tengo estos efectos: Año(5 niveles),Localidad (10 niveles) y genotipo
(3 niveles), año y localidad son aleatorios y genotipo es fijo (los he
escogido yo).
Me gustaría hacer obtener una tabla parecida a la Tabla Anova donde
aparezca cada factor y sus interacciones y
2017 Jun 02
5
CV en R
Buenas,
Estoy haciendo modelos y comparando cual es mejor. Para ello, uso CV de 10 folds.
Por ejemplo, hago la comparativa entre un svm y un randomForest para una serie de datos, por ello hago:
midataset<-import.....
#datos es un dataframe de 1500 filas y 15 variables
for(i in 1:10){
numeros<-sample(1:1500,1500*0.7)
train<-datos[numeros,]
test<-datos[-numeros,]
#modeloRF
2011 Feb 21
4
Distribuir paquete Windows
Buenos días,
Trabajo en Linux (Fedora) y he creado un paquete de R para uso interno,
llamado Ind, el cual he instalado en Linux y me funciona perfectamente.
Ahora quiero distribuirlo entre mis compañeros y algunos trabajan con
Windows, por lo que he tratado de instalarlo en Windows 7 (hice en mi
portátil una partición del disco y tengo tanto Fedora como Windows 7).
Según he leído en algunos
2012 Jun 27
4
Intervalos de variable de proporciones, para representar en mapa
Hola.
Tengo que representar en un mapa, valores de proporciones de extranjeros
con tarjetas de residencia en vigor, según nacionalidad y país de
procedencia.
Los datos son de este estilo
Rumania
Andalucía 0,200365823
Aragón 0,377192073
Asturias 0,205353012
I. Baleares 0,06592893
Canarias 0,03050312
Cantabria 0,190397393
Castilla-León 0,211670421
Castilla-La Mancha
2011 Sep 12
6
Rv: Re: Cosinor Analysis
--- El lun, 12/9/11, Cristalina <pa100cia77@yahoo.es> escribió:
De: Cristalina <pa100cia77@yahoo.es>
Asunto: Re: [R-es] Cosinor Analysis
Para: "Carlos Ortega" <coforfe@gmail.com>
Fecha: lunes, 12 de septiembre, 2011 08:43
Hola,
Carlos, muchas gracias.
El método empleado en http://tolstoy.newcastle.edu.au/R/e6/help/09/01/0626.html (el url que se referencia
2017 Jun 02
5
CV en R
Una vez que tienes la técnica y los parámetros óptimos resultantes de la
validación cruzada, ya tienes el modelo que necesitas, NO tienes que hacer
nada más. Si vuelves a modelar con todos los datos todo el trabajo de
validación que has hecho lo envías a hacer gárgaras. Estarías construyendo
un modelo con sobreajuste.
Para quedarte tranquilo, haz la prueba, coge el modelo resultante de la
2013 May 12
2
Data mining
Hola, ¿cómo están?
Soy estudiante de Ing. en Sistemas de Información y estoy cursando
la materia Tecnologías para la Explotación de Datos. Me he decidido a usar
R para hacer DM. Estoy recién comenzando con ambos.
El asunto es que no he encontrado la implementación en R de uno de
los algoritmos que dimos para árboles de decisión, ID3. Ya revisé varios de
los paquetes para DM
2015 Apr 08
2
Temas para word markdown
Buenas, estaba siguiendo el hilo de Informes Periódicos en R de Jesus
Herranz y me surgió una duda. Actualmente estoy tratando de usar
markdown para todo así cualquier cosa que haga me queda presentable para
informar o presentar en algún lugar. En general estoy usando html y o
pdf principalmente porque cuando trato de compilar en word la verdad que
queda bastante feíto.
Alguién sabe, o puede
2017 Jun 02
2
CV en R
Hola,
Eso es justamente lo que hace "caret" de una manera muy sencilla y sin que
tú te tengas que preocupar de quedarte con el mejor bucket (del CV) o con
la mejor combinación en tu "grid search".
Te recomiendo que uses "caret" para esto....
Puedes incluso evaluar los dos algoritmos "RF" y "svm" a la vez y conocer
realmente el nivel de precisión
2017 Jun 02
2
CV en R
Buenas,
Puse los modelos lo mas simplificados, para centrar el tiro en el tema que me preocupa.
Es una pena no poder hablar cara a cara, porque por email puedo sonar algo borde, pero no es así, al contrario estoy enormemente agradecido por tu ayuda, pero le veo un problema.
Me dices que use un list para ir guardando el modelo, pero tal y como he propuesto en el bucle for, el modelo se crea 10
2016 Dec 30
3
Trabajar con un dataset muy grande
hola a todos,
Me gustaria saber qué haceis cuando el dataset para trabsjar es tan grande
que R no lo soporta.
Lo troceo con alguna otra herramienta?
Cual?
Gracias y feliz año!
Victoria
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org <javascript:;>
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
--
Enviado con
2017 Jun 02
2
CV en R
Es que es justo ahi donde no se como hacerlo.
Es decir, dentro del bucle for hago las comprobaciones train test, y me da que de media el mejor es randomForest, pero claro, no me estoy quedando con el modelo, ya que no se va guardando....Entonces es cuando no se como seguir para quedarme con ese modelo....
________________________________
De: Isidro Hidalgo Arellano <ihidalgo en
2018 Feb 19
3
gbm.step para clasificación no binaria
Gracias Carlos. Hasta donde yo entiendo si las hay:
El argumento family puede ser:
"gaussian" (for minimizing squared error); por lo que tiene que ser numérica
"bernoulli" (logistic regression for 0-1 out-comes); binaria por narices
"poisson" (count outcomes; requires the response to be a positive
integer); numérica también, pues.
La única podría ser
2013 Apr 24
12
Re-instalacion de sistema operativo
Hola!
Necesito reinstalar ubuntu, con lo cual R se actualizará a 2.13.3 (es la
última version, verdad?) y me gustaría saber si hay alguna forma de
conservar los paquetes que ya tengo instalados en R.?
Muchas gracias!!
Milagros
[[alternative HTML version deleted]]
2017 Jun 02
2
CV en R
El algoritmo en sí no, pero si quieres ajustar los parámetros (número de árboles, tamaño del nodo, etc.) hay que hacerlo.
En la práctica te puedo asegurar que hay diferencia entre usar 500 árboles o 100, igual que el tamaño del nodo que cojas; afinar los parámetros puede suponer ajustar bastante los resultados.
Un saludo
Isidro Hidalgo Arellano
Observatorio del Mercado de Trabajo