Estimadados, Me encuentro trabajando con variar librer?as del paquete scorecard, pero al trabajar con mi base de datos, me arroja un problema inusual. Al momento de usar el var_filter, donde mi base de datos es de 830.000 registros aproximadamente, y tengo 28 variables, entre ellas mi variable binomial "Y", me muestra el siguiente error...> dt_sel = var_filter(data, "Y")There are 2 variables have too many unique character/factor values, which might cause the binning process slow. Please double check the following variables: RUT, Score Continue the binning process? 1: yes 2: no Selection: 1 Variable filtering on 833944 rows and 27 columns in 0: 0:32 2 variables are removed Warning message: In rmcol_datetime_unique1(dt) : There are 1 columns have only one unique values, which are removed from input dataset. (ColumnNames: Intercepto_SCORE) Si alguien me pudiera ayudar lo agradecer? DAYANA MU?OZ GIL Ingeniero Estad?stico Universidad de Valpara?so [[alternative HTML version deleted]]
Estimada Dayana Muñoz Gil Si ni comprendo mal, usted tiene en la base de datos una variable binomial, digamos que es 0 o 1, ¿que posibilidad hay que en realidad en la base de datos los registros sean 0, 1 y null? o 0 y 1 en el mismo registro, hay bases de datos que permiten más de un chequeo y los guardan a todos, otras solo uno solo con si o no. Javier Rubén Marcuzzi El mié., 14 nov. 2018 a las 11:17, Dayana Muñoz (<dayanaa.mg en hotmail.com>) escribió:> Estimadados, > > Me encuentro trabajando con variar librerías del paquete scorecard, pero > al trabajar con mi base de datos, me arroja un problema inusual. Al momento > de usar el var_filter, donde mi base de datos es de 830.000 registros > aproximadamente, y tengo 28 variables, entre ellas mi variable binomial > "Y", me muestra el siguiente error... > > > dt_sel = var_filter(data, "Y") > > There are 2 variables have too many unique character/factor values, which > might cause the binning process slow. Please double check the following > variables: > RUT, Score > > Continue the binning process? > > 1: yes > 2: no > > Selection: 1 > > Variable filtering on 833944 rows and 27 columns in 0: 0:32 > 2 variables are removed > Warning message: > In rmcol_datetime_unique1(dt) : > There are 1 columns have only one unique values, which are removed from > input dataset. > (ColumnNames: Intercepto_SCORE) > > > > Si alguien me pudiera ayudar lo agradeceré > > > DAYANA MUÑOZ GIL > Ingeniero Estadístico > Universidad de Valparaíso > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
Hola Dayana,
No es realmente un "error" es un aviso ("warning").
Te está indicando que en el proceso para transformar a binario tu variable
target, una de las variables de tu conjunto, como es constante, no la va a
usar.
Saludos,
Carlos Ortega
www.qualityexcellence.es
El mié., 14 nov. 2018 a las 15:17, Dayana Muñoz (<dayanaa.mg en
hotmail.com>)
escribió:
> Estimadados,
>
> Me encuentro trabajando con variar librerías del paquete scorecard, pero
> al trabajar con mi base de datos, me arroja un problema inusual. Al momento
> de usar el var_filter, donde mi base de datos es de 830.000 registros
> aproximadamente, y tengo 28 variables, entre ellas mi variable binomial
> "Y", me muestra el siguiente error...
>
> > dt_sel = var_filter(data, "Y")
>
> There are 2 variables have too many unique character/factor values, which
> might cause the binning process slow. Please double check the following
> variables:
> RUT, Score
>
> Continue the binning process?
>
> 1: yes
> 2: no
>
> Selection: 1
>
> Variable filtering on 833944 rows and 27 columns in  0: 0:32
> 2 variables are removed
> Warning message:
> In rmcol_datetime_unique1(dt) :
>   There are 1 columns have only one unique values, which are removed from
> input dataset.
>  (ColumnNames: Intercepto_SCORE)
>
>
>
> Si alguien me pudiera ayudar lo agradeceré
>
>
> DAYANA MUÑOZ GIL
> Ingeniero  Estadístico
> Universidad de Valparaíso
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
	[[alternative HTML version deleted]]