ESTIMADA COMUNIDAD R, Tengo un data frame de datos de salud sobre Enfermedades de Notificacion Obligatoria. Algunas variables tienen una codificacion 99, 999, y 9999 para asiganr los valores perdidos. LAs variables que tienen esta codificacion son la EDAD, COMUNA_RESIDENCIA y la REGION_RESIDENCIA, respectivamente. Me gustaria poder editar esos valores a NA, sin tener que hacerlo uno por uno con la opcion fix().... ya que son muchos es una base datos muy grande. Conoce alguno de esutedes amigos, alguna funcion para realizar dicha edicion les agradeceria mucho, sus comentarios y ayudas..... Envio una extracto de la base de datos en .txt para mostrar el problemita por por si alguno le sirviera mirarla se llama ENO2011 Un gran abrazo desde Chile Alex Mellado V Ms(c) en Epidemiología Universidad Católica de Chile ------------ próxima parte ------------ Se ha borrado un adjunto en formato HTML... URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20141009/7d16fc7c/attachment.html> ------------ próxima parte ------------ SERV EDAD SEXO COMUNA_RESIDENCIA REGION_RESIDENCIA DIAG FECHNOT 3 14 2 2101 2 A010 12-01-2011 17 16 2 8417 8 A010 11-04-2011 16 14 1 7102 7 A010 12-05-2011 15 15 1 6110 6 A010 24-05-2011 19 15 2 8110 8 A010 29-06-2011 24 16 1 10108 10 A549 17-01-2011 2 16 1 1101 1 A549 24-02-2011 33 16 1 10209 10 A549 03-03-2011 10 999 1 13117 13 A549 23-02-2011 3 16 2 2101 2 A549 18-02-2011 3 16 1 2101 2 A549 06-04-2011 3 15 1 2101 2 A549 18-04-2011 19 16 1 8110 8 A549 19-05-2011 3 16 1 2101 2 A549 24-05-2011 6 15 1 5603 5 A549 05-06-2011 25 16 2 11101 11 A549 10-06-2011 13 15 1 13105 13 A549 05-04-2011 5 16 1 4102 4 A549 16-06-2011 3 16 1 2101 2 A549 23-06-2011 14 15 2 13110 13 A549 07-04-2011 14 16 1 13110 13 A549 05-04-2011 24 16 2 10101 10 A549 28-06-2011 19 16 1 8110 8 A549 15-07-2011 28 14 1 8203 8 A549 21-07-2011 10 15 1 13117 13 A549 23-06-2011 24 14 1 10101 10 A549 09-08-2011 7 16 1 5801 5 A549 05-08-2011 1 14 2 15101 15 A549 18-08-2011 7 15 1 5107 5 A549 26-08-2011 1 14 2 15101 15 A549 07-09-2011 12 14 1 13122 13 A549 04-08-2011 24 16 1 10101 10 A549 22-08-2011 33 16 1 10209 10 A549 03-03-2011 1 15 2 15101 15 A549 14-11-2011 2 15 2 1101 1 A549 11-11-2011 13 15 1 13402 13 A549 07-10-2011 24 16 1 10101 10 A549 22-11-2011 5 16 2 4102 4 A549 01-12-2011 1 16 2 15101 15 A630 04-01-2011 1 15 2 15101 15 A630 07-01-2011 1 14 1 15101 15 A630 21-01-2011 1 16 1 15101 15 A630 21-04-2011 1 16 2 15101 15 A630 07-06-2011 1 15 2 15101 15 A630 08-07-2011 1 16 1 15101 15 A630 19-07-2011 1 14 2 15101 15 A630 05-08-2011 1 15 2 15101 15 A630 29-08-2011 1 16 2 15101 15 A630 24-10-2011 1 16 2 15101 15 A64X 11-07-2011 1 15 2 15101 15 A64X 20-09-2011 1 15 2 15101 15 A64X 14-11-2011 1 16 2 15101 15 B159 19-01-2011 1 16 1 15101 15 B159 18-01-2011 1 16 1 15101 15 B159 21-03-2011 12 15 1 13123 13 B159 24-03-2011 1 14 1 15101 15 B159 11-04-2011 1 14 1 15101 15 B159 11-04-2011 1 16 2 15101 15 B159 06-04-2011 1 16 2 15101 15 B159 19-05-2011 16 15 1 7304 7 B159 17-05-2011 12 14 1 13122 13 B159 01-06-2011 13 14 2 13402 13 B159 08-05-2011 1 16 1 15101 15 B159 13-06-2011 21 16 1 9101 9 B159 27-05-2011 1 14 2 15101 15 B159 25-06-2011 13 16 2 13116 13 B159 24-06-2011 1 16 1 15101 15 B159 15-07-2011 20 16 2 8301 8 B159 10-08-2011 20 14 2 8301 8 B159 08-08-2011 1 15 2 15101 15 B159 22-08-2011 14 16 1 13111 13 B159 22-08-2011 12 16 2 13110 13 B159 06-09-2011 14 999 1 13201 13 B159 29-05-2011 20 16 2 8305 8 B159 12-09-2011 14 16 2 13110 13 B159 09-11-2011 2 16 2 1101 1 B159 09-12-2011 13 16 2 13109 13 B169 07-04-2011 3 999 1 2201 2 B169 25-05-2011 3 15 1 2101 2 B169 09-06-2011 16 15 1 7301 7 B169 23-07-2011 29 999 1 9201 9 B169 19-07-2011 20 15 2 8301 8 B169 02-08-2011 9 15 1 13125 13 B181 21-07-2011 3 15 1 2101 2 B181 23-12-2011 3 16 1 2101 2 B181 23-12-2011 11 999 1 13201 13 B181 05-09-2011 6 14 1 5101 5 B189 21-09-2011 5 14 2 4102 4 B190 15-09-2011 2 14 1 1101 1 B199 02-02-2011 14 16 1 13111 13 B199 17-02-2011 14 15 1 13201 13 B199 25-02-2011 13 15 2 13121 13 B199 24-02-2011 14 14 1 13201 13 B199 13-03-2011 11 14 1 13106 13 B199 13-03-2011 11 14 1 13101 13 B199 31-03-2011 21 15 1 9121 9 B199 23-03-2011 21 16 2 9111 9 B199 23-03-2011 5 15 1 4102 4 B199 09-04-2011 14 16 2 13125 13 B199 02-06-2011 12 16 2 13120 13 B199 21-06-2011 5 16 2 4303 4 B199 25-07-2011 13 14 1 13116 13 B199 13-08-2011 2 16 2 1101 1 B199 06-09-2011 14 14 1 13201 13 B199 01-08-2011 12 16 1 13120 13 B199 14-09-2011 14 15 2 13201 13 B199 20-09-2011 29 15 1 9210 9 B199 11-07-2011 6 14 1 5101 5 B199 13-10-2011 2 14 2 1101 1 B199 06-12-2011 2 16 2 1101 1 B199 15-12-2011 2 14 1 1101 1 B199 15-12-2011 2 16 1 1101 1 B199 02-12-2011 2 14 1 1107 1 B199 31-12-2011 23 16 2 10301 10 B269 04-01-2011 12 16 1 13107 13 B269 18-01-2011 2 14 1 1107 1 B269 11-02-2011 17 14 1 8417 8 B269 22-02-2011 9 999 1 13302 13 B269 23-02-2011 15 14 1 6310 6 B269 13-03-2011 15 14 1 6108 6 B269 06-02-2011 12 16 2 13114 13 B269 01-03-2011 15 14 1 6305 6 B269 28-03-2011 12 15 1 13114 13 B269 09-04-2011 12 14 2 13118 13 B269 18-04-2011 18 16 2 8106 8 B269 01-05-2011 8 16 2 5701 5 B269 02-06-2011 16 15 2 7401 7 B269 03-06-2011 8 14 2 5706 5 B269 14-06-2011 18 15 2 8102 8 B269 09-06-2011 7 14 1 5804 5 B269 27-05-2011 3 15 1 2101 2 B269 25-08-2011 12 16 2 13114 13 B269 25-08-2011 15 15 2 6310 6 B269 09-09-2011 12 14 2 13120 13 B269 12-09-2011 20 14 2 8312 8 B269 27-10-2011 23 999 2 10301 10 B269 06-10-2011 21 16 2 9101 9 B269 24-11-2011 23 14 1 10305 10 B269 25-11-2011 16 16 2 7102 7 B269 15-11-2011 29 15 2 9205 9 B269 06-12-2011 9 16 1 13118 13 B334 30-03-2011 1 16 2 15101 15 B379 28-01-2011 1 15 2 15101 15 B379 01-09-2011 1 16 1 15101 15 B379 17-11-2011 11 999 2 13108 13 B571 13-04-2011 9 999 1 13125 13 B571 15-06-2011 7 14 1 5502 5 B571 27-05-2011 5 14 1 4303 4 B571 17-07-2011 5 14 1 4302 4 B571 17-01-2011 5 16 2 4303 4 B572 27-01-2011 5 14 2 4303 4 B575 13-07-2011 5 15 2 4304 4 B575 22-09-2011 20 16 1 8309 8 B670 10-01-2011 25 14 1 11301 11 B670 19-04-2011 22 15 2 14108 14 B670 03-08-2011 29 15 1 9208 9 B670 20-06-2011 17 15 1 8418 8 B670 28-09-2011 25 16 2 11101 11 B670 24-08-2011 22 16 2 9118 9 B671 24-06-2011 16 15 1 7201 7 B671 01-07-2011 24 14 2 9211 9 B671 01-08-2011 18 14 1 8207 8 B671 31-08-2011 29 14 1 9202 9 B671 09-06-2011 21 14 2 9204 9 B671 26-10-2011 16 14 1 7201 7 B671 18-11-2011 12 16 1 10208 10 B75X 11-01-2011 7 15 1 5101 5 B75X 27-10-2011 16 14 2 7301 7 G002 01-07-2011 10 16 2 13501 13 G009 26-02-2011 1 15 2 9999 99 J128 07-04-2011 1 15 2 9999 99 J128 03-04-2011 1 15 2 9999 99 J128 13-04-2011 1 16 2 9999 99 J128 26-12-2011 1 16 2 9999 99 Z228 07-11-2011
"Marcuzzi, Javier Rubén"
2014-Oct-09 15:37 UTC
[R-es] cambiar un valor por NA en data frame
Estimado Una persona (que sabe y se leer sus artículos) escribió en una página lo siguiente: Package gdata has a set of functions for working with missing values in general. See the vignette. Javier Marcuzzi El 09/10/2014 a las 12:22 p.m., ALEX FABIAN Mellado escibió:> ESTIMADA COMUNIDAD R, > > Tengo un data frame de datos de salud sobre Enfermedades de > Notificacion Obligatoria. Algunas variables tienen una codificacion > 99, 999, y 9999 para asiganr los valores perdidos. LAs variables que > tienen esta codificacion son la EDAD, COMUNA_RESIDENCIA y la > REGION_RESIDENCIA, respectivamente. > > Me gustaria poder editar esos valores a NA, sin tener que hacerlo uno > por uno con la opcion fix().... ya que son muchos es una base datos > muy grande. > > Conoce alguno de esutedes amigos, alguna funcion para realizar dicha > edicion les agradeceria mucho, sus comentarios y ayudas..... > > Envio una extracto de la base de datos en .txt para mostrar el > problemita por por si alguno le sirviera mirarla se llama ENO2011 > > Un gran abrazo desde Chile > > Alex Mellado V > Ms(c) en Epidemiología > Universidad Católica de Chile > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es[[alternative HTML version deleted]]
Hola, Una forma de hacerlo es esta (he cargado tus datos en un data.frame "datIn")...:> datIn$EdadNew <- ifelse(datIn$EDAD > 98, "NA", datIn$EDAD)> head(datIn,10) SERV EDAD SEXO COMUNA_RESIDENCIA REGION_RESIDENCIA DIAG FECHNOT EdadNew1 3 14 2 2101 2 A010 12-01-2011 14 2 17 16 2 8417 8 A010 11-04-2011 16 3 16 14 1 7102 7 A010 12-05-2011 14 4 15 15 1 6110 6 A010 24-05-2011 15 5 19 15 2 8110 8 A010 29-06-2011 15 6 24 16 1 10108 10 A549 17-01-2011 16 7 2 16 1 1101 1 A549 24-02-2011 16 8 33 16 1 10209 10 A549 03-03-2011 16 9 10 *999 * 1 13117 13 A549 23-02-2011 NA 10 3 16 2 2101 2 A549 18-02-2011 16 Saludos, Carlos Ortega www.qualityexcellence.es El 9 de octubre de 2014, 17:22, ALEX FABIAN Mellado <afmellad en uc.cl> escribió:> ESTIMADA COMUNIDAD R, > > Tengo un data frame de datos de salud sobre Enfermedades de Notificacion > Obligatoria. Algunas variables tienen una codificacion 99, 999, y 9999 para > asiganr los valores perdidos. LAs variables que tienen esta codificacion > son la EDAD, COMUNA_RESIDENCIA y la REGION_RESIDENCIA, respectivamente. > > Me gustaria poder editar esos valores a NA, sin tener que hacerlo uno por > uno con la opcion fix().... ya que son muchos es una base datos muy grande. > > Conoce alguno de esutedes amigos, alguna funcion para realizar dicha > edicion les agradeceria mucho, sus comentarios y ayudas..... > > Envio una extracto de la base de datos en .txt para mostrar el problemita > por por si alguno le sirviera mirarla se llama ENO2011 > > Un gran abrazo desde Chile > > Alex Mellado V > Ms(c) en Epidemiología > Universidad Católica de Chile > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
ALEX Algo así debiera funcionar: ENO <- read.table("ENO_2011.txt", header=TRUE) ENO[ ENO$EDAD == 999 | ENO$COMUNA_RESIDENCIA == 9999 | ENO$REGION_RESIDENCIA == 99, ] <- NA Donde ENO es el data.table que enviaste. Daniel Merino El 9 de octubre de 2014, 12:38, Carlos Ortega <cof en qualityexcellence.es> escribió:> Hola, > > Una forma de hacerlo es esta (he cargado tus datos en un data.frame > "datIn")...: > > > datIn$EdadNew <- ifelse(datIn$EDAD > 98, "NA", datIn$EDAD)> > head(datIn,10) SERV EDAD SEXO COMUNA_RESIDENCIA REGION_RESIDENCIA DIAG > FECHNOT EdadNew > 1 3 14 2 2101 2 A010 12-01-2011 > 14 > 2 17 16 2 8417 8 A010 11-04-2011 > 16 > 3 16 14 1 7102 7 A010 12-05-2011 > 14 > 4 15 15 1 6110 6 A010 24-05-2011 > 15 > 5 19 15 2 8110 8 A010 29-06-2011 > 15 > 6 24 16 1 10108 10 A549 17-01-2011 > 16 > 7 2 16 1 1101 1 A549 24-02-2011 > 16 > 8 33 16 1 10209 10 A549 03-03-2011 > 16 > 9 10 *999 * 1 13117 13 A549 23-02-2011 > NA > 10 3 16 2 2101 2 A549 18-02-2011 > 16 > > > > Saludos, > Carlos Ortega > www.qualityexcellence.es > > > > El 9 de octubre de 2014, 17:22, ALEX FABIAN Mellado <afmellad en uc.cl> > escribió: > > > ESTIMADA COMUNIDAD R, > > > > Tengo un data frame de datos de salud sobre Enfermedades de Notificacion > > Obligatoria. Algunas variables tienen una codificacion 99, 999, y 9999 > para > > asiganr los valores perdidos. LAs variables que tienen esta codificacion > > son la EDAD, COMUNA_RESIDENCIA y la REGION_RESIDENCIA, respectivamente. > > > > Me gustaria poder editar esos valores a NA, sin tener que hacerlo uno por > > uno con la opcion fix().... ya que son muchos es una base datos muy > grande. > > > > Conoce alguno de esutedes amigos, alguna funcion para realizar dicha > > edicion les agradeceria mucho, sus comentarios y ayudas..... > > > > Envio una extracto de la base de datos en .txt para mostrar el problemita > > por por si alguno le sirviera mirarla se llama ENO2011 > > > > Un gran abrazo desde Chile > > > > Alex Mellado V > > Ms(c) en Epidemiología > > Universidad Católica de Chile > > > > _______________________________________________ > > R-help-es mailing list > > R-help-es en r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > > > > > -- > Saludos, > Carlos Ortega > www.qualityexcellence.es > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >-- Daniel [[alternative HTML version deleted]]