similar to: Variable Progresiva

Displaying 20 results from an estimated 1000 matches similar to: "Variable Progresiva"

2016 Sep 26
3
Variable Progresiva
Una duda, si fuese a leer 3 archivos csv que se llamar archivo 1, archivo 2 y archivo 3 también se podría usar? gracias ________________________________ De: Isidro Hidalgo Arellano <ihidalgo en jccm.es> Enviado: lunes, 26 de septiembre de 2016 07:48 a.m. Para: 'Rafael Saturno'; 'R' Asunto: RE: [R-es] Variable Progresiva Lo que quieres hacer se hace con la función
2016 Oct 24
2
Quitar datos atípicos de una recta
Ok, lo pruebo y os digo... Jesús ________________________________ De: Isidro Hidalgo Arellano <ihidalgo en jccm.es> Enviado: lunes, 24 de octubre de 2016 9:46 Para: 'Jesús Para Fernández'; r-help-es en r-project.org Asunto: RE: [R-es] Quitar datos atípicos de una recta Hay un paquete que lo hace, pero no lo he utilizado, así que no sé cómo se porta: "outliers"... Un
2016 Sep 14
3
Saltar filas no numericas al importar csv
No me vale, porque no es un problema de columnas, es de filas. Cuando importo el csv, como tiene cada columna segun la fila o numeros o texto, R convierte la columna automaticametne en factor. He probado a convertir las columnas a numeric, pero tampoco me vale, ya que transforma el texto a numeros.... ¿Alguna alternativa? estoy pensando ne poner skip y ne el skip meter las letras del
2016 Sep 14
6
Saltar filas no numericas al importar csv
Buenas Quiero saltar las filas no numericas al importar un csv. Saltar las primeras filas es facil, con el read.csv("datos.csv",skip=30) El problema es que el csv tiene cada x filas un encabezado, y quiero que excel solo pille los datos. ¿Cómo podría hacerlo? Gracias Jesús [[alternative HTML version deleted]]
2016 Oct 24
2
Quitar datos atípicos de una recta
Buenas, Tengo unas rectas en las que cada x número de ellas hay algún error en la captura de los datos y se produce un outlier. Os pongo un ejemplo: x<-rnorm(15,12,2) y<-jitter(x,200) y[7]<-20 plot(x,y) En este ejemplo se ve muy claro que el outlier y quitarlo seria facil, pero... ¿como hacerlo de manera automatica? es que hay mil curvas com oesta y puede ser una locura. Gracias
2017 Jun 02
2
CV en R
Es que es justo ahi donde no se como hacerlo. Es decir, dentro del bucle for hago las comprobaciones train test, y me da que de media el mejor es randomForest, pero claro, no me estoy quedando con el modelo, ya que no se va guardando....Entonces es cuando no se como seguir para quedarme con ese modelo.... ________________________________ De: Isidro Hidalgo Arellano <ihidalgo en
2017 Jun 02
5
CV en R
Buenas, Estoy haciendo modelos y comparando cual es mejor. Para ello, uso CV de 10 folds. Por ejemplo, hago la comparativa entre un svm y un randomForest para una serie de datos, por ello hago: midataset<-import..... #datos es un dataframe de 1500 filas y 15 variables for(i in 1:10){ numeros<-sample(1:1500,1500*0.7) train<-datos[numeros,] test<-datos[-numeros,] #modeloRF
2017 Jun 02
5
CV en R
Una vez que tienes la técnica y los parámetros óptimos resultantes de la validación cruzada, ya tienes el modelo que necesitas, NO tienes que hacer nada más. Si vuelves a modelar con todos los datos todo el trabajo de validación que has hecho lo envías a hacer gárgaras. Estarías construyendo un modelo con sobreajuste. Para quedarte tranquilo, haz la prueba, coge el modelo resultante de la
2017 Jun 02
2
CV en R
No, llega un momento en el que más árboles no te supone mejoría, e incluso funciona peor. Que funcione peor lo atribuyo al ruido, porque en teoría no tiene mucho sentido, la verdad... Pero no he probado a coger más árboles de los "necesarios". Lo probaré… Un saludo De: Jesús Para Fernández [mailto:j.para.fernandez en hotmail.com] Enviado el: viernes, 02 de junio de 2017 14:54
2016 Oct 03
4
Manual avanzado de R
Buenas, Alguien puede recomendarme un manual avanzzado de R, que me enseñe por ejemplo como aplicar tapply con sacar la pendiente de una recta, y cosas así. Gracias Jesús [[alternative HTML version deleted]]
2017 Jun 03
2
CV en R
?Hola, Puedes ver aquí un ejemplo de cómo comparar varios modelos usando "caret". https://stackoverflow.com/questions/14800021/statistics-of-prediction-for-multiple-models-with-caret O mejor en el propio manual de "caret", en esta sección: https://topepo.github.io/caret/model-training-and-tuning.html#exploring-and-comparing-resampling-distributions Y como recomendación te
2017 Jun 02
2
CV en R
El algoritmo en sí no, pero si quieres ajustar los parámetros (número de árboles, tamaño del nodo, etc.) hay que hacerlo. En la práctica te puedo asegurar que hay diferencia entre usar 500 árboles o 100, igual que el tamaño del nodo que cojas; afinar los parámetros puede suponer ajustar bastante los resultados. Un saludo Isidro Hidalgo Arellano Observatorio del Mercado de Trabajo
2017 Jun 02
2
CV en R
Buenas, Puse los modelos lo mas simplificados, para centrar el tiro en el tema que me preocupa. Es una pena no poder hablar cara a cara, porque por email puedo sonar algo borde, pero no es así, al contrario estoy enormemente agradecido por tu ayuda, pero le veo un problema. Me dices que use un list para ir guardando el modelo, pero tal y como he propuesto en el bucle for, el modelo se crea 10
2017 Jun 04
2
CV en R
Si nos dices el tipo de problema que estás intentando solucionar y el tamaño del dataset podemos recomendarte algo más. En tu pseudo-código mezclas algoritmos supervisados y no-supervisados. Además de ranger, daría alguna oportunidad a "gbm" o como no a "xgboost". Y éstos los probaría dentro de H2O. Saludos, Carlos Ortega www.qualityexcellence.es El 4 de junio de 2017,
2017 Jun 02
2
CV en R
Hola, Eso es justamente lo que hace "caret" de una manera muy sencilla y sin que tú te tengas que preocupar de quedarte con el mejor bucket (del CV) o con la mejor combinación en tu "grid search". Te recomiendo que uses "caret" para esto.... Puedes incluso evaluar los dos algoritmos "RF" y "svm" a la vez y conocer realmente el nivel de precisión
2017 Jun 04
2
CV en R
H2O va bien (muy bien) tanto en un ordenador sobremesa/portátil y sobre un clúster. En uno de sobremesa si tienes buena RAM y muchos cores, mejor. Y no tienes porqué usar Spark si no necesitas una solución tiempo real o "near real-time". H2O tiene otra solución para interaccionar con Spark (Sparkling Water). Incluso sobre un clúster, puedes usar "sparklyr" y
2014 Feb 01
2
Standby secondary domain controller
Hello, I configured a main DC and secondary domain controller successfully. The only problem is that I want the secondary DC to Stand By, so most of the time it is shutdown. The problem is that when the secondary DC is shutdown on the primary DC I receive continously the following error which is filling the logs: Feb 1 14:23:56 saturno samba[3217]: [2014/02/01 14:23:56.021591, 0]
2016 Sep 26
2
Listado de Valores
Hola Comunidad, Una duda Como hago para saber los valores que hay en un campo de un Frame? Tengo un csv con mas de un millon de registros y en un campo de fecha quiero ver cuales fechas salen Muchas Gracias [[alternative HTML version deleted]]
2006 Mar 11
1
Non-linear Regression : Error in eval(expr, envir, enclos)
Hi.. i have an expression of the form: model1<-nls(y~beta1*(x1+(k1*x2)+(k1*k1*x3)+(k2*x4)+(k2*k1*x5)+(k2*k2*x6)+(k3*x7)+(k3*k4*x8)+(k3*k2*x9)+(k3*k3*x10)+ (k4*x11)+(k4*k1*x12)+(k4*k2*x13)+(k4*k3*x14)+(k4*k4*x15)+(k5*x16)+(k5*k1*x17)+(k5*k2*x18)+(k5*k3*x19)+
2013 Sep 04
5
Stack de un data.frame
Estimada comunidad, voy a describir lo que necesito hacer y no he encontrado como, pues no se si hay funciones en R para esto. Tengo la siguiente tabla de doble entrada que obtuve con la funcion CAST: sol 1 2 3 4 5 1 con 0.00259587 NaN NaN 0.001905260 NaN 2 dec NaN 0.002719438 NaN 0.002339808 0.002970884 3