Hola, adjunto proceso con lo que hago identificación y exclusión de outliers
# analiza y filtra atípicos
# ingresos disponibles
ing_dsp_out1 <-
dlookr::imputate_outlier(eda1,ing_dsp_vl,method="capping")
ing_dsp_out2 <-
data.table(out_pos=attr(ing_dsp_out1,"outlier_pos"),out_vl=attr(ing_dsp_out1,"outliers"))[order(out_vl)]
# estadísticas de atípicos
out_sta1 <- data.table(smbinning.eda(ing_dsp_out2,rounding=3,pbar=0)$eda) #
Table with basic statistics
# filtra valores menores al Q50 de los atípicos
eda2 <- eda1[ing_dsp_vl<=out_sta1[Field=="out_vl",Q50]]
dlookr::plot_outlier(eda2[,.(ing_dsp_vl)])
El sáb, 3 dic 2022 a la(s) 06:00, <r-help-es-request en r-project.org>
escribió:
> Envíe los mensajes para la lista R-help-es a
> r-help-es en r-project.org
>
> Para subscribirse o anular su subscripción a través de la WEB
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
> O por correo electrónico, enviando un mensaje con el texto "help"
en
> el asunto (subject) o en el cuerpo a:
> r-help-es-request en r-project.org
>
> Puede contactar con el responsable de la lista escribiendo a:
> r-help-es-owner en r-project.org
>
> Si responde a algún contenido de este mensaje, por favor, edite la
> linea del asunto (subject) para que el texto sea mas especifico que:
> "Re: Contents of R-help-es digest...". Además, por favor, incluya
en
> la respuesta sólo aquellas partes del mensaje a las que está
> respondiendo.
> Asuntos del día:
>
> 1. eliminar outliers en un tapply (Manuel Mendoza)
>
>
> ---------- Forwarded message ----------
> From: Manuel Mendoza <mmendoza en fulbrightmail.org>
> To: Lista R <r-help-es en r-project.org>
> Cc:
> Bcc:
> Date: Sat, 3 Dec 2022 09:14:11 +0100
> Subject: [R-es] eliminar outliers en un tapply
> Buenos días, utilizo:
>
> max <- tapply (Data$varnum, Data$varcat, max)
>
> para obtener el máximo de varnum en cada una de las categorías de varcat
>
> ¿cómo podría obtener los máximos, pero sin los outliers (Q75 + 1.5*IQR)?
>
> Es fácil quitar los outliers superiores de varnum, pero no es eso lo que
> necesito quitar, sino los outliers dentro ya de cada categoría de varcat.
>
> Gracias, como siempre,
> Manuel
>
> [[alternative HTML version deleted]]
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
[[alternative HTML version deleted]]