federico bentos
2012-Oct-28 16:32 UTC
[R-es] Tabular datos de Encuesta Continua de Hogares
Buenas, tengo la siguiente inquietud. Tengo un data frame con los microdatos de la ECH de mi pais. He realizado un cuadro sin problemas en excel pero me gustaria una rutina de R para poder generar la tabla. El data.frame se llama ECH2009. Cuenta con las siguientes variables para este caso: idhogar region estrato integranteshogar expansor ingpercapsvl Computador TvAbonado Internet 1 capital 1 2 33 62944 1 1 1 2 interior urbano 2 3 25 4949 1 2 2 3 interior rural 3 6 32 6185 1 1 2 4 capital 4 2 18 8041 1 2 2 5 interior urbano 5 3 13 12100 1 2 1 6 interior rural 6 3 26 6950 1 2 2 7 capital 7 4 33 35716 1 2 2 8 interior urbano 8 4 17 29575 2 2 2 9 interior rural 9 4 24 4656 1 2 2 10 capital 1 3 26 1733 2 1 2 11 interior urbano 2 6 27 2800 1 2 1 12 interior rural 3 7 33 20374 2 2 2 1) El identificador del hogar. 2) La region del país al que pertenecen. 3) El estrato de la muestra (no es relevante para este caso) 4) Cantidad de integrantes del hogar. 5) Expansor de los datos de la muestra a la población (expansor anual) 6) Ingreso per capita del hogar sin valor locativo. 7) Posee computador u ordenador (1=si, 2=no) 8) Contrato Tv para abonados(1=si, 2=no) 9) Posee internet en su hogar (1=si, 2=no) El cuadro que quiero armar en R (que ya obtuve en excel). Debe mostrar la proporción de personas en la población que posee ordenador, contrato de tv para abonados e internet en su hogar. Para la poblacion urbana (capital + interior urbano). Desagregado por decil de ingreso. Seria algo así: Acceso a TIC En % de personas por decil de ingreso percapita sin valor locativo. Total País Urbano Deciles Computador Tv Abonados Internet 1 53,6% 2,6% 5,8% 2 51,5% 36,9% 10,6% 3 52,1% 45,7% 17,9% 4 53,8% 50,1% 24,4% 5 54,3% 53,5% 28,1% 6 58,8% 59,4% 37,6% 7 62,8% 64,6% 45,3% 8 67,5% 69,0% 54,5% 9 75,0% 73,9% 63,8% 10 81,4% 82,5% 72,6% Total 59,4% 52,3% 31,5% Obviamente la muestra se debe expandir para llegar a la estimación poblacional. El analisis es para un subconjnto de la muestra (urbano=capital+interior urbano). Los deciles de ingreso se calculan para todos los hogares de la submuestra urbana. Cada dato de la muestra es un hogar, para obtener los porcentajes en terminos de personas se debe multiplicar por la cantidad de individuos del hogar. Los porcentajes corresponden a datos que se codificaron como 1=si para cada una de las 3 variables que aparecen en columnas. Espero haber sido lo mas claro posible. Me gustaria algún codigo de ejemplo que me permitiera tabular estos datos en R. Quizas exista algun paquete especifico que lo permita. Agradezco ejemplos. Saludos a todos y gracias desde ya. ________________________________ De: "r-help-es-request@r-project.org" <r-help-es-request@r-project.org> Para: r-help-es@r-project.org Enviado: domingo, 28 de octubre de 2012 9:00 Asunto: Resumen de R-help-es, Vol 44, Envío 32 Envíe los mensajes para la lista R-help-es a r-help-es@r-project.org Para subscribirse o anular su subscripción a través de la WEB https://stat.ethz.ch/mailman/listinfo/r-help-es O por correo electrónico, enviando un mensaje con el texto "help" en el asunto (subject) o en el cuerpo a: r-help-es-request@r-project.org Puede contactar con el responsable de la lista escribiendo a: r-help-es-owner@r-project.org Si responde a algún contenido de este mensaje, por favor, edite la linea del asunto (subject) para que el texto sea mas especifico que: "Re: Contents of R-help-es digest...". Además, por favor, incluya en la respuesta sólo aquellas partes del mensaje a las que está respondiendo. Asuntos del día: 1. Re: Problemas UniCode (Eva Prieto Castro) ---------------------------------------------------------------------- Message: 1 Date: Sun, 28 Oct 2012 10:06:47 +0000 (GMT) From: Eva Prieto Castro <evapcastro@yahoo.es> To: r-help-es@r-project.org Subject: Re: [R-es] Problemas UniCode Message-ID: <1351418807.6478.YahooMailClassic@web171506.mail.ir2.yahoo.com> Content-Type: text/plain Hola de nuevo: Pues va a ser que no: el problema persiste. En la máquina desde la cual creo el paquete (Windows):> l10n_info()$MBCS [1] FALSE $`UTF-8` [1] FALSE $`Latin-1` [1] TRUE $codepage [1] 1252 En la máquina desde la cual se prueba el paquete (Mac):> l10n_info()$MBCS [1] TRUE $`UTF-8` [1] TRUE $`Latin-1` [1] FALSE Las preguntas son: 1º) ¿En qué codificación debo salvar mis fuentes? (En Windows) 2º) ¿A qué nivel debo tenerlo en cuenta al crear el paquete? (Windows). ¿Qué debo indicar en el Encoding del DESCRIPTION?. Gracias. Eva Asunto: Re: Problemas UniCode Para: r-help-es@r-project.org Fecha: sábado, 27 de octubre, 2012 08:48 Hola: Resolví el problema de la siguiente manera: source(file="example.R", encoding="UCS-2") Gracias. Eva Asunto: Problemas UniCode Para: r-help-es@r-project.org Fecha: sábado, 27 de octubre, 2012 06:45 Buenos días: Tengo el siguiente problema: si salvo como ANSI mis ficheros de código en R, al ejecutar fuera de Windows me da error al intentar escribir el símbolo del grado. Sin embargo, si salvo el código en codificación Unicode, me da error al hacer el source. ¿Cómo puedo resolver?. Gracias. Un saludo. Eva [[alternative HTML version deleted]] ------------------------------ _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es Fin de Resumen de R-help-es, Vol 44, Envío 32 ********************************************* [[alternative HTML version deleted]]
Hola, Mira este ejemplo aprenderás como calcular cada columna de la tabla final: http://stackoverflow.com/questions/11960410/create-decile-data-for-multiple-years-in-r Saludos, Carlos Ortega www.qualityexcellence.es El 28 de octubre de 2012 17:32, federico bentos < federico_bentos@yahoo.com.ar> escribió:> Buenas, tengo la siguiente inquietud. > Tengo un data frame con los microdatos de la ECH de mi pais. He realizado > un cuadro sin problemas en excel pero me gustaria una rutina de R para > poder generar la tabla. El data.frame se llama ECH2009. Cuenta con las > siguientes variables para este caso: > > idhogar region estrato integranteshogar expansor ingpercapsvl Computador > TvAbonado Internet > 1 capital 1 2 33 62944 1 1 1 > 2 interior urbano 2 3 25 4949 1 2 2 > 3 interior rural 3 6 32 6185 1 1 2 > 4 capital 4 2 18 8041 1 2 2 > 5 interior urbano 5 3 13 12100 1 2 1 > 6 interior rural 6 3 26 6950 1 2 2 > 7 capital 7 4 33 35716 1 2 2 > 8 interior urbano 8 4 17 29575 2 2 2 > 9 interior rural 9 4 24 4656 1 2 2 > 10 capital 1 3 26 1733 2 1 2 > 11 interior urbano 2 6 27 2800 1 2 1 > 12 interior rural 3 7 33 20374 2 2 2 > > 1) El identificador del hogar. > 2) La region del país al que pertenecen. > 3) El estrato de la muestra (no es relevante para este caso) > 4) Cantidad de integrantes del hogar. > 5) Expansor de los datos de la muestra a la población (expansor anual) > 6) Ingreso per capita del hogar sin valor locativo. > 7) Posee computador u ordenador (1=si, 2=no) > 8) Contrato Tv para abonados(1=si, 2=no) > 9) Posee internet en su hogar (1=si, 2=no) > > El cuadro que quiero armar en R (que ya obtuve en excel). Debe mostrar la > proporción de personas en la población que posee ordenador, contrato de tv > para abonados e internet en su hogar. Para la poblacion urbana (capital + > interior urbano). Desagregado por decil de ingreso. Seria algo así: > > Acceso a TIC > En % de personas por decil de ingreso percapita sin valor locativo. Total > País Urbano > Deciles Computador Tv Abonados Internet > 1 53,6% 2,6% 5,8% > 2 51,5% 36,9% 10,6% > 3 52,1% 45,7% 17,9% > 4 53,8% 50,1% 24,4% > 5 54,3% 53,5% 28,1% > 6 58,8% 59,4% 37,6% > 7 62,8% 64,6% 45,3% > 8 67,5% 69,0% 54,5% > 9 75,0% 73,9% 63,8% > 10 81,4% 82,5% 72,6% > Total 59,4% 52,3% 31,5% > > > Obviamente la muestra se debe expandir para llegar a la estimación > poblacional. El analisis es para un subconjnto de la muestra > (urbano=capital+interior urbano). Los deciles de ingreso se calculan para > todos los hogares de la submuestra urbana. Cada dato de la muestra es un > hogar, para obtener los porcentajes en terminos de personas se debe > multiplicar por la cantidad de individuos del hogar. Los porcentajes > corresponden a datos que se codificaron como 1=si para cada una de las 3 > variables que aparecen en columnas. > Espero haber sido lo mas claro posible. Me gustaria algún codigo de > ejemplo que me permitiera tabular estos datos en R. Quizas exista algun > paquete especifico que lo permita. Agradezco ejemplos. > Saludos a todos y gracias desde ya. > > > ________________________________ > De: "r-help-es-request@r-project.org" <r-help-es-request@r-project.org> > Para: r-help-es@r-project.org > Enviado: domingo, 28 de octubre de 2012 9:00 > Asunto: Resumen de R-help-es, Vol 44, Envío 32 > > Envíe los mensajes para la lista R-help-es a > r-help-es@r-project.org > > Para subscribirse o anular su subscripción a través de la WEB > https://stat.ethz.ch/mailman/listinfo/r-help-es > > O por correo electrónico, enviando un mensaje con el texto "help" en > el asunto (subject) o en el cuerpo a: > r-help-es-request@r-project.org > > Puede contactar con el responsable de la lista escribiendo a: > r-help-es-owner@r-project.org > > Si responde a algún contenido de este mensaje, por favor, edite la > linea del asunto (subject) para que el texto sea mas especifico que: > "Re: Contents of R-help-es digest...". Además, por favor, incluya en > la respuesta sólo aquellas partes del mensaje a las que está > respondiendo. > > > Asuntos del día: > > 1. Re: Problemas UniCode (Eva Prieto Castro) > > > ---------------------------------------------------------------------- > > Message: 1 > Date: Sun, 28 Oct 2012 10:06:47 +0000 (GMT) > From: Eva Prieto Castro <evapcastro@yahoo.es> > To: r-help-es@r-project.org > Subject: Re: [R-es] Problemas UniCode > Message-ID: > <1351418807.6478.YahooMailClassic@web171506.mail.ir2.yahoo.com> > Content-Type: text/plain > > Hola de nuevo: > > Pues va a ser que no: el problema persiste. > > En la máquina desde la cual creo el paquete (Windows): > > > l10n_info() > $MBCS > [1] FALSE > > $`UTF-8` > [1] FALSE > > $`Latin-1` > [1] TRUE > > $codepage > [1] 1252 > > > En la máquina desde la cual se prueba el paquete (Mac): > > > > > l10n_info() > $MBCS > [1] TRUE > > $`UTF-8` > [1] > TRUE > > $`Latin-1` > [1] FALSE > > > Las preguntas son: > > 1º) ¿En qué codificación debo salvar mis fuentes? (En Windows) > 2º) ¿A qué nivel debo tenerlo en cuenta al crear el paquete? (Windows). > ¿Qué debo indicar en el Encoding del DESCRIPTION?. > > > Gracias. > > Eva > > > > Asunto: Re: Problemas UniCode > Para: r-help-es@r-project.org > Fecha: sábado, 27 de octubre, 2012 08:48 > > Hola: > > Resolví el problema de la siguiente manera: > > source(file="example.R", encoding="UCS-2") > > Gracias. > > > Eva > > > > > Asunto: Problemas UniCode > Para: r-help-es@r-project.org > Fecha: sábado, 27 de octubre, 2012 06:45 > > Buenos días: > > Tengo el siguiente problema: si salvo como ANSI mis ficheros de código en > R, al ejecutar fuera de Windows me da error al intentar escribir el símbolo > del grado. Sin embargo, si salvo el código en codificación > Unicode, me da error al hacer el source. > > ¿Cómo puedo resolver?. > > Gracias. > > Un saludo. > > Eva > > [[alternative HTML version deleted]] > > > > ------------------------------ > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > > > Fin de Resumen de R-help-es, Vol 44, Envío 32 > ********************************************* > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > >-- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]]