Estimadados, Me encuentro trabajando con variar librer?as del paquete scorecard, pero al trabajar con mi base de datos, me arroja un problema inusual. Al momento de usar el var_filter, donde mi base de datos es de 830.000 registros aproximadamente, y tengo 28 variables, entre ellas mi variable binomial "Y", me muestra el siguiente error...> dt_sel = var_filter(data, "Y")There are 2 variables have too many unique character/factor values, which might cause the binning process slow. Please double check the following variables: RUT, Score Continue the binning process? 1: yes 2: no Selection: 1 Variable filtering on 833944 rows and 27 columns in 0: 0:32 2 variables are removed Warning message: In rmcol_datetime_unique1(dt) : There are 1 columns have only one unique values, which are removed from input dataset. (ColumnNames: Intercepto_SCORE) Si alguien me pudiera ayudar lo agradecer? DAYANA MU?OZ GIL Ingeniero Estad?stico Universidad de Valpara?so [[alternative HTML version deleted]]
Estimada Dayana Muñoz Gil Si ni comprendo mal, usted tiene en la base de datos una variable binomial, digamos que es 0 o 1, ¿que posibilidad hay que en realidad en la base de datos los registros sean 0, 1 y null? o 0 y 1 en el mismo registro, hay bases de datos que permiten más de un chequeo y los guardan a todos, otras solo uno solo con si o no. Javier Rubén Marcuzzi El mié., 14 nov. 2018 a las 11:17, Dayana Muñoz (<dayanaa.mg en hotmail.com>) escribió:> Estimadados, > > Me encuentro trabajando con variar librerías del paquete scorecard, pero > al trabajar con mi base de datos, me arroja un problema inusual. Al momento > de usar el var_filter, donde mi base de datos es de 830.000 registros > aproximadamente, y tengo 28 variables, entre ellas mi variable binomial > "Y", me muestra el siguiente error... > > > dt_sel = var_filter(data, "Y") > > There are 2 variables have too many unique character/factor values, which > might cause the binning process slow. Please double check the following > variables: > RUT, Score > > Continue the binning process? > > 1: yes > 2: no > > Selection: 1 > > Variable filtering on 833944 rows and 27 columns in 0: 0:32 > 2 variables are removed > Warning message: > In rmcol_datetime_unique1(dt) : > There are 1 columns have only one unique values, which are removed from > input dataset. > (ColumnNames: Intercepto_SCORE) > > > > Si alguien me pudiera ayudar lo agradeceré > > > DAYANA MUÑOZ GIL > Ingeniero Estadístico > Universidad de Valparaíso > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
Hola Dayana, No es realmente un "error" es un aviso ("warning"). Te está indicando que en el proceso para transformar a binario tu variable target, una de las variables de tu conjunto, como es constante, no la va a usar. Saludos, Carlos Ortega www.qualityexcellence.es El mié., 14 nov. 2018 a las 15:17, Dayana Muñoz (<dayanaa.mg en hotmail.com>) escribió:> Estimadados, > > Me encuentro trabajando con variar librerías del paquete scorecard, pero > al trabajar con mi base de datos, me arroja un problema inusual. Al momento > de usar el var_filter, donde mi base de datos es de 830.000 registros > aproximadamente, y tengo 28 variables, entre ellas mi variable binomial > "Y", me muestra el siguiente error... > > > dt_sel = var_filter(data, "Y") > > There are 2 variables have too many unique character/factor values, which > might cause the binning process slow. Please double check the following > variables: > RUT, Score > > Continue the binning process? > > 1: yes > 2: no > > Selection: 1 > > Variable filtering on 833944 rows and 27 columns in 0: 0:32 > 2 variables are removed > Warning message: > In rmcol_datetime_unique1(dt) : > There are 1 columns have only one unique values, which are removed from > input dataset. > (ColumnNames: Intercepto_SCORE) > > > > Si alguien me pudiera ayudar lo agradeceré > > > DAYANA MUÑOZ GIL > Ingeniero Estadístico > Universidad de Valparaíso > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]