ismael mardomingo
2012-May-28 08:22 UTC
[R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas)
Hola a todos de nuevo, El otro día tuve un problema al utilizar la función aggregate. La estoy utilizando para ver la existencia de registros duplicados y algunas veces (solo algunas veces con el mismo data.frame con pequeñas variaciones en algunos registros) me aparece el siguiente error:> agg_DIR_EMP=aggregate(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + Provincia_RS + CP_RS, data = DATOS, sum)Error en `[[<-.data.frame`(`*tmp*`, len + i, value = c(1, 1, 1, 1, 1, : replacement has 534 rows, data has 535 Sobre el mismo data.frame utilizo la función summaryBy de la librería doBy y me lo hace correctamente.> agg_DIR_EMP=summaryBy(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + Provincia_RS + CP_RS, data = DATOS, FUN=c(sum)) > nrow(agg_DIR_EMP)[1] 537>En este caso concreto he encontrado una solución utilizando otra función pero me gustaría saber por qué da el problema la función aggregate, si alguien tiene alguna sugerencia pruebo a ver. Gracias de nuevo. Un saludo Ismael [[alternative HTML version deleted]]
Carlos Ortega
2012-May-28 08:37 UTC
[R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas)
Hola, Si nos pasas el data.frame y los cambios en los que te aparece el error quizás podamos ver de dónde viene el error. Saludos, Carlos Ortega www.qualityexcellence.es El 28 de mayo de 2012 10:22, ismael mardomingo <gayofas@hotmail.com>escribió:> > > > > > Hola a todos de nuevo, > > El otro día tuve un problema al utilizar la función aggregate. La estoy > utilizando para ver la existencia de registros duplicados y algunas veces > (solo algunas veces con el mismo data.frame con pequeñas variaciones en > algunos registros) me aparece el siguiente error: > > > agg_DIR_EMP=aggregate(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + > Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + > Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + > Provincia_RS + CP_RS, data = DATOS, sum) > Error en `[[<-.data.frame`(`*tmp*`, len + i, value = c(1, 1, 1, 1, 1, : > replacement has 534 rows, data has 535 > > Sobre el mismo data.frame utilizo la función summaryBy de la librería doBy > y me lo hace correctamente. > > > > agg_DIR_EMP=summaryBy(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + > Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + > Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + > Provincia_RS + CP_RS, data = DATOS, FUN=c(sum)) > > nrow(agg_DIR_EMP) > [1] 537 > > > > > En este caso concreto he encontrado una solución utilizando otra función > pero me gustaría saber por qué da el problema la función aggregate, si > alguien tiene alguna sugerencia pruebo a ver. > > Gracias de nuevo. > Un saludo > Ismael > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
ismael mardomingo
2012-May-28 08:43 UTC
[R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas)
Hola, El problema es que la información que contiene el data.frame no tengo permiso para distribuirla. Vamos que en este caso he encontrado una solución y he escrito por si alguien tiene un problema parecido o por si alguien me puede dar alguna idea para investigar por qué da el error. Y la cuestión es por qué con la función aggregate da error y con la función summaryBy no sobre el mismo data.frame. ¿Puede ser que algún caracter o secuencia de caracteres contenido dentro de algún registro pueda causar el error? Date: Mon, 28 May 2012 10:37:03 +0200 Subject: Re: [R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas) From: cof@qualityexcellence.es To: gayofas@hotmail.com CC: r-help-es@r-project.org Hola, Si nos pasas el data.frame y los cambios en los que te aparece el error quizás podamos ver de dónde viene el error. Saludos,Carlos Ortegawww.qualityexcellence.es El 28 de mayo de 2012 10:22, ismael mardomingo <gayofas@hotmail.com> escribió: Hola a todos de nuevo, El otro día tuve un problema al utilizar la función aggregate. La estoy utilizando para ver la existencia de registros duplicados y algunas veces (solo algunas veces con el mismo data.frame con pequeñas variaciones en algunos registros) me aparece el siguiente error:> agg_DIR_EMP=aggregate(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + Provincia_RS + CP_RS, data = DATOS, sum)Error en `[[<-.data.frame`(`*tmp*`, len + i, value = c(1, 1, 1, 1, 1, : replacement has 534 rows, data has 535 Sobre el mismo data.frame utilizo la función summaryBy de la librería doBy y me lo hace correctamente.> agg_DIR_EMP=summaryBy(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + Provincia_RS + CP_RS, data = DATOS, FUN=c(sum))> nrow(agg_DIR_EMP)[1] 537>En este caso concreto he encontrado una solución utilizando otra función pero me gustaría saber por qué da el problema la función aggregate, si alguien tiene alguna sugerencia pruebo a ver. Gracias de nuevo. Un saludo Ismael [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Oscar Perpiñán Lamigueiro
2012-May-28 08:45 UTC
[R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas)
Carlos Ortega <cof en qualityexcellence.es> writes:> Hola, > > Si nos pasas el data.frame y los cambios en los que te aparece el error > quiz.s podamos ver de d.nde viene el error.Así es, o al menos el resultado de un summary() o un str(). Tengo la intuición de que pueda deberse a algún problema con la presencia de NAs. ¿Has probado a añadir na.rm=TRUE en la llamada a aggregate? Oscar.> El 28 de mayo de 2012 10:22, ismael mardomingo <gayofas en hotmail.com>escribi.: > >> >> >> >> >> >> Hola a todos de nuevo, >> >> El otro d.a tuve un problema al utilizar la funci.n aggregate. La estoy >> utilizando para ver la existencia de registros duplicados y algunas veces >> (solo algunas veces con el mismo data.frame con peque.as variaciones en >> algunos registros) me aparece el siguiente error: >> >> > agg_DIR_EMP=aggregate(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + >> Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + >> Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + >> Provincia_RS + CP_RS, data = DATOS, sum) >> Error en `[[<-.data.frame`(`*tmp*`, len + i, value = c(1, 1, 1, 1, 1, : >> replacement has 534 rows, data has 535 >> >> Sobre el mismo data.frame utilizo la funci.n summaryBy de la librer.a doBy >> y me lo hace correctamente. >> >> >> > agg_DIR_EMP=summaryBy(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + >> Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + >> Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + >> Provincia_RS + CP_RS, data = DATOS, FUN=c(sum)) >> > nrow(agg_DIR_EMP) >> [1] 537 >> > >> >> >> En este caso concreto he encontrado una soluci.n utilizando otra funci.n >> pero me gustar.a saber por qu. da el problema la funci.n aggregate, si >> alguien tiene alguna sugerencia pruebo a ver. >> >> Gracias de nuevo. >> Un saludo >> Ismael >> >> >> [[alternative HTML version deleted]] >> >> >> _______________________________________________ >> R-help-es mailing list >> R-help-es en r-project.org >> https://stat.ethz.ch/mailman/listinfo/r-help-es >> >>-- Oscar Perpiñán Lamigueiro Dpto. Ingeniería Eléctrica EUITI-UPM URL: http://procomun.wordpress.com Twitter: @oscarperpinan
ismael mardomingo
2012-May-28 09:08 UTC
[R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas)
He añadido na.rm=TRUE y sigue dando el mismo error (la mayoría son variables de tipo carácter y tuve la precaución de recodificar a "" o a 0 las variables numéricas antes de hacer el aggregate pero por si se ha colado alguno he probado). Por añadir algo más, el data.frame está formado por la unión de unos 10 ficheros de datos de distinta procedencia y he encontrado caracteres "º" diferentes ya que al hacer un table de alguna variable la "misma" cadena me aparecia más de 1 vez. Por eso he comentado que si un carácter o secuencia de caracteres puede ser el causante de este error. Un saludo, Ismael> From: oscar.perpinan@gmail.com > To: cof@qualityexcellence.es > CC: gayofas@hotmail.com; r-help-es@r-project.org > Subject: Re: [R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas) > Date: Mon, 28 May 2012 10:45:57 +0200 > > > Carlos Ortega <cof@qualityexcellence.es> writes: > > > Hola, > > > > Si nos pasas el data.frame y los cambios en los que te aparece el error > > quiz.s podamos ver de d.nde viene el error. > > Así es, o al menos el resultado de un summary() o un str(). > > Tengo la intuición de que pueda deberse a algún problema con la > presencia de NAs. ¿Has probado a añadir na.rm=TRUE en la llamada a > aggregate? > > Oscar. > > > El 28 de mayo de 2012 10:22, ismael mardomingo <gayofas@hotmail.com>escribi.: > > > >> > >> > >> > >> > >> > >> Hola a todos de nuevo, > >> > >> El otro d.a tuve un problema al utilizar la funci.n aggregate. La estoy > >> utilizando para ver la existencia de registros duplicados y algunas veces > >> (solo algunas veces con el mismo data.frame con peque.as variaciones en > >> algunos registros) me aparece el siguiente error: > >> > >> > agg_DIR_EMP=aggregate(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + > >> Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + > >> Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + > >> Provincia_RS + CP_RS, data = DATOS, sum) > >> Error en `[[<-.data.frame`(`*tmp*`, len + i, value = c(1, 1, 1, 1, 1, : > >> replacement has 534 rows, data has 535 > >> > >> Sobre el mismo data.frame utilizo la funci.n summaryBy de la librer.a doBy > >> y me lo hace correctamente. > >> > >> > >> > agg_DIR_EMP=summaryBy(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + > >> Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + > >> Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + > >> Provincia_RS + CP_RS, data = DATOS, FUN=c(sum)) > >> > nrow(agg_DIR_EMP) > >> [1] 537 > >> > > >> > >> > >> En este caso concreto he encontrado una soluci.n utilizando otra funci.n > >> pero me gustar.a saber por qu. da el problema la funci.n aggregate, si > >> alguien tiene alguna sugerencia pruebo a ver. > >> > >> Gracias de nuevo. > >> Un saludo > >> Ismael > >> > >> > >> [[alternative HTML version deleted]] > >> > >> > >> _______________________________________________ > >> R-help-es mailing list > >> R-help-es@r-project.org > >> https://stat.ethz.ch/mailman/listinfo/r-help-es > >> > >> > > -- > Oscar Perpiñán Lamigueiro > Dpto. Ingeniería Eléctrica > EUITI-UPM > URL: http://procomun.wordpress.com > Twitter: @oscarperpinan[[alternative HTML version deleted]]
Carlos Ortega
2012-May-28 09:13 UTC
[R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas)
Hola, No sé si en el caso en el que se produce el error con "aggregate()" tienes el detalle de la/s fila/s en las que se produce el error. Si es así, no sé si podrás enviar esas líneas (junto con algunas más) y así tener algo concreto sobre lo que probar, de otra manera... muy complicado... O bueno, por si ayuda, a mí no me ha pasado. Con las cadenas de caracteres, es básico limpiar caracteres del tipo tabulador, nueva línea, incluso dejarlas todas en minúscula o mayúscula (pero misma codificación), quitar los espacios en blanco tanto por delante como por el final, o incluso sustituir los intermedios si existen por otro carácter visible... Es tan amplia la casuística... Saludos, Carlos Ortega www.qualityexcellence.es El 28 de mayo de 2012 11:08, ismael mardomingo <gayofas@hotmail.com>escribió:> He añadido na.rm=TRUE y sigue dando el mismo error (la mayoría son > variables de tipo carácter y tuve la precaución de recodificar a "" o a 0 > las variables numéricas antes de hacer el aggregate pero por si se ha > colado alguno he probado). > > Por añadir algo más, el data.frame está formado por la unión de unos 10 > ficheros de datos de distinta procedencia y he encontrado caracteres "º" > diferentes ya que al hacer un table de alguna variable la "misma" cadena me > aparecia más de 1 vez. Por eso he comentado que si un carácter o secuencia > de caracteres puede ser el causante de este error. > > Un saludo, > Ismael > > > > > From: oscar.perpinan@gmail.com > > To: cof@qualityexcellence.es > > CC: gayofas@hotmail.com; r-help-es@r-project.org > > > Subject: Re: [R-es] Problema al utilizar la función aggregate (con la > función summaryBy he conseguido el mismo resultado sin problemas) > > Date: Mon, 28 May 2012 10:45:57 +0200 > > > > > > > Carlos Ortega <cof@qualityexcellence.es> writes: > > > > > Hola, > > > > > > Si nos pasas el data.frame y los cambios en los que te aparece el error > > > quiz.s podamos ver de d.nde viene el error. > > > > Así es, o al menos el resultado de un summary() o un str(). > > > > Tengo la intuición de que pueda deberse a algún problema con la > > presencia de NAs. ¿Has probado a añadir na.rm=TRUE en la llamada a > > aggregate? > > > > Oscar. > > > > > El 28 de mayo de 2012 10:22, ismael mardomingo <gayofas@hotmail.com > >escribi.: > > > > > >> > > >> > > >> > > >> > > >> > > >> Hola a todos de nuevo, > > >> > > >> El otro d.a tuve un problema al utilizar la funci.n aggregate. La > estoy > > >> utilizando para ver la existencia de registros duplicados y algunas > veces > > >> (solo algunas veces con el mismo data.frame con peque.as variaciones > en > > >> algunos registros) me aparece el siguiente error: > > >> > > >> > agg_DIR_EMP=aggregate(Centros_DDPP ~ CIF_NIF + Razon_Social + > Siglas + > > >> Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + > > >> Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + > Municipio_RS + > > >> Provincia_RS + CP_RS, data = DATOS, sum) > > >> Error en `[[<-.data.frame`(`*tmp*`, len + i, value = c(1, 1, 1, 1, 1, > : > > >> replacement has 534 rows, data has 535 > > >> > > >> Sobre el mismo data.frame utilizo la funci.n summaryBy de la librer.a > doBy > > >> y me lo hace correctamente. > > >> > > >> > > >> > agg_DIR_EMP=summaryBy(Centros_DDPP ~ CIF_NIF + Razon_Social + > Siglas + > > >> Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + > > >> Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + > Municipio_RS + > > >> Provincia_RS + CP_RS, data = DATOS, FUN=c(sum)) > > >> > nrow(agg_DIR_EMP) > > >> [1] 537 > > >> > > > >> > > >> > > >> En este caso concreto he encontrado una soluci.n utilizando otra > funci.n > > >> pero me gustar.a saber por qu. da el problema la funci.n aggregate, si > > >> alguien tiene alguna sugerencia pruebo a ver. > > >> > > >> Gracias de nuevo. > > >> Un saludo > > >> Ismael > > >> > > >> > > >> [[alternative HTML version deleted]] > > >> > > >> > > >> _______________________________________________ > > >> R-help-es mailing list > > >> R-help-es@r-project.org > > >> https://stat.ethz.ch/mailman/listinfo/r-help-es > > >> > > >> > > > > -- > > Oscar Perpiñán Lamigueiro > > Dpto. Ingeniería Eléctrica > > EUITI-UPM > > URL: http://procomun.wordpress.com > > Twitter: @oscarperpinan >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
ismael mardomingo
2012-May-28 09:23 UTC
[R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas)
Hola, Gracias por todas las aportaciones, cuando tenga tiempo seguiré investigando el error y probaré todas las sugerencias, pero de momento voy a tener que dejarlo aparcado que se me acumula el trabajo. Carlos, como se trata de una agregación el error que da se referirá a las filas del nuevo data.frame que genera la función pero al dar el error no me da ningún resultado, por lo tanto no tengo fácil averiguar qué filas del data.frame inicial son las que generar el error.> >> Error en `[[<-.data.frame`(`*tmp*`, len + i, value = c(1, 1, 1, 1, 1, :> >> replacement has 534 rows, data has 535He hecho alguna prueba haciendo la agregación eliminando filas del data.frame inicial pero no he podido llegar a ninguna conclusión de momento. Un saludo, Ismael Date: Mon, 28 May 2012 11:13:49 +0200 Subject: Re: [R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas) From: cof@qualityexcellence.es To: gayofas@hotmail.com CC: r-help-es@r-project.org Hola, No sé si en el caso en el que se produce el error con "aggregate()" tienes el detalle de la/s fila/s en las que se produce el error. Si es así, no sé si podrás enviar esas líneas (junto con algunas más) y así tener algo concreto sobre lo que probar, de otra manera... muy complicado... O bueno, por si ayuda, a mí no me ha pasado.Con las cadenas de caracteres, es básico limpiar caracteres del tipo tabulador, nueva línea, incluso dejarlas todas en minúscula o mayúscula (pero misma codificación), quitar los espacios en blanco tanto por delante como por el final, o incluso sustituir los intermedios si existen por otro carácter visible... Es tan amplia la casuística... Saludos,Carlos Ortegawww.qualityexcellence.es El 28 de mayo de 2012 11:08, ismael mardomingo <gayofas@hotmail.com> escribió: He añadido na.rm=TRUE y sigue dando el mismo error (la mayoría son variables de tipo carácter y tuve la precaución de recodificar a "" o a 0 las variables numéricas antes de hacer el aggregate pero por si se ha colado alguno he probado). Por añadir algo más, el data.frame está formado por la unión de unos 10 ficheros de datos de distinta procedencia y he encontrado caracteres "º" diferentes ya que al hacer un table de alguna variable la "misma" cadena me aparecia más de 1 vez. Por eso he comentado que si un carácter o secuencia de caracteres puede ser el causante de este error. Un saludo, Ismael> From: oscar.perpinan@gmail.com > To: cof@qualityexcellence.es> CC: gayofas@hotmail.com; r-help-es@r-project.org > Subject: Re: [R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas)> Date: Mon, 28 May 2012 10:45:57 +0200 > > > Carlos Ortega <cof@qualityexcellence.es> writes: >> > Hola, > > > > Si nos pasas el data.frame y los cambios en los que te aparece el error > > quiz.s podamos ver de d.nde viene el error. > > Así es, o al menos el resultado de un summary() o un str().> > Tengo la intuición de que pueda deberse a algún problema con la > presencia de NAs. ¿Has probado a añadir na.rm=TRUE en la llamada a > aggregate? > > Oscar. > > > El 28 de mayo de 2012 10:22, ismael mardomingo <gayofas@hotmail.com>escribi.:> > > >> > >> > >> > >> > >> > >> Hola a todos de nuevo, > >> > >> El otro d.a tuve un problema al utilizar la funci.n aggregate. La estoy> >> utilizando para ver la existencia de registros duplicados y algunas veces > >> (solo algunas veces con el mismo data.frame con peque.as variaciones en> >> algunos registros) me aparece el siguiente error: > >> > >> > agg_DIR_EMP=aggregate(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + > >> Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS +> >> Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + > >> Provincia_RS + CP_RS, data = DATOS, sum) > >> Error en `[[<-.data.frame`(`*tmp*`, len + i, value = c(1, 1, 1, 1, 1, :> >> replacement has 534 rows, data has 535 > >> > >> Sobre el mismo data.frame utilizo la funci.n summaryBy de la librer.a doBy > >> y me lo hace correctamente. > >>> >> > >> > agg_DIR_EMP=summaryBy(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + > >> Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + > >> Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS +> >> Provincia_RS + CP_RS, data = DATOS, FUN=c(sum)) > >> > nrow(agg_DIR_EMP) > >> [1] 537 > >> > > >> > >> > >> En este caso concreto he encontrado una soluci.n utilizando otra funci.n> >> pero me gustar.a saber por qu. da el problema la funci.n aggregate, si > >> alguien tiene alguna sugerencia pruebo a ver. > >> > >> Gracias de nuevo. > >> Un saludo> >> Ismael > >> > >> > >> [[alternative HTML version deleted]] > >> > >> > >> _______________________________________________ > >> R-help-es mailing list> >> R-help-es@r-project.org > >> https://stat.ethz.ch/mailman/listinfo/r-help-es> >> > >> > > -- > Oscar Perpiñán Lamigueiro > Dpto. Ingeniería Eléctrica > EUITI-UPM > URL: http://procomun.wordpress.com> Twitter: @oscarperpinan-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]
Jorge I Velez
2012-May-28 12:59 UTC
[R-es] Problema al utilizar la función aggregate (con la función summaryBy he conseguido el mismo resultado sin problemas)
Hola Ismael, Has probado con la funcion dupicated() ? Esta permite, precisamente, determinar si existen registros duplicados en un data.frame() o en una variable particular. Saludos, Jorge.- 2012/5/28 ismael mardomingo <>> > > > > > Hola a todos de nuevo, > > El otro día tuve un problema al utilizar la función aggregate. La estoy > utilizando para ver la existencia de registros duplicados y algunas veces > (solo algunas veces con el mismo data.frame con pequeñas variaciones en > algunos registros) me aparece el siguiente error: > > > agg_DIR_EMP=aggregate(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + > Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + > Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + > Provincia_RS + CP_RS, data = DATOS, sum) > Error en `[[<-.data.frame`(`*tmp*`, len + i, value = c(1, 1, 1, 1, 1, : > replacement has 534 rows, data has 535 > > Sobre el mismo data.frame utilizo la función summaryBy de la librería doBy > y me lo hace correctamente. > > > > agg_DIR_EMP=summaryBy(Centros_DDPP ~ CIF_NIF + Razon_Social + Siglas + > Forma_Juridica + tipo_ident + Clase_vial_RS + Particula_RS + Vial_RS + > Clase_numero_RS + Numero_RS + Calif_numero_RS + Resto_RS + Municipio_RS + > Provincia_RS + CP_RS, data = DATOS, FUN=c(sum)) > > nrow(agg_DIR_EMP) > [1] 537 > > > > > En este caso concreto he encontrado una solución utilizando otra función > pero me gustaría saber por qué da el problema la función aggregate, si > alguien tiene alguna sugerencia pruebo a ver. > > Gracias de nuevo. > Un saludo > Ismael > > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >[[alternative HTML version deleted]]