jluis.gilsanz en tasacionesh.com
2011-Dec-20 09:42 UTC
[R-es] read.px() no lee algunos archivos pc-axis
Hola: Posteo este asunto en la lista porque me consta que los "padres" del paquete pxR (por el que les estoy enormemente agradecido) son asiduos de ella y nos aclaran a muchos novatos como yo un montón de dudas de R. Si prefieren que tratemos este asunto de forma menos "publica" no tienen mas que decirlo. Bueno al turrón (nunca mejor dicho)!!! Estoy montando una serie de scripts en R que descargan distintos ficheros pc-axis del INE, los leen a través del paquete pxR, y tras una serie de transformaciones y verificaciones, "suben" esos datos a un servidor Microsoft SQL. Para tratar los ficheros disponibles en: http://www.ine.es/inebase/fic/px/l0/HPT_es_25.px http://www.ine.es/inebase/fic/px/l0/HPT_es_24.px http://www.ine.es/inebase/fic/px/l0/HPT_es_18.px La función read.px() del paquete pxR ha funcionado perfectamente bien, pero al ir a tratar los ficheros de estas url: http://www.ine.es/pcaxisdl//t30/p168/serie/l0/01001.px http://www.ine.es/pcaxisdl//t30/p168/serie/l0/01002.px http://www.ine.es/pcaxisdl//t30/p168/serie/l0/01003.px Obtengo siempre el mismo error: Error en textConnection(px$DATA$value) : argumento 'text' inválido Además: Mensajes de aviso perdidos In scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : entrada inválida encontrada en la conexión de entrada 'ETDP_Total.px' He probado con ambas alternativas de codificación sugeridas en la documentación de pxR para la funcion read.px() (encoding="latin1" y encoding="utf-8"), por si esa fuera la causa, obteniendo el mismo error ya mencionado en ambos casos. Abriendo un fichero pc-axis de cada tipo (los que se leen bien y los que no se leen) con un bloc de notas, parece que tuvieran una estructura distinta, lo cual me hace pensar que el paquete no es "inmune" a distintas estructuras internas del fichero pc-axis. Esta es mi información de sesión por si sirviera de ayuda: R version 2.12.1 (2010-12-16) Platform: i386-pc-mingw32/i386 (32-bit) locale: [1] LC_COLLATE=Spanish_Spain.1252 LC_CTYPE=Spanish_Spain.1252 LC_MONETARY=Spanish_Spain.1252 LC_NUMERIC=C [5] LC_TIME=Spanish_Spain.1252 attached base packages: [1] stats graphics grDevices datasets utils methods base other attached packages: [1] pxR_0.24 MBA_0.0-7 sp_0.9-91 fields_6.6.1 spam_0.27-0 plyr_1.6 RODBC_1.3-3 loaded via a namespace (and not attached): [1] grid_2.12.1 lattice_0.19-33 tools_2.12.1 Un saludo y muchas gracias José Luis Gilsanz Gómez Estadística Tasaciones Hipotecarias María de Molina, 54 - 28006 - Madrid Tel. : 34-914549694 Fax : 34-917822164 Email : jluis.gilsanz en tasacionesh.com Site web: www.tasacionesh.es -- AVISO LEGAL -- Los datos personales que en esta comunicación aparecen, así como los que nuestra empresa mantiene de Vd. y de su empresa, son tratados con la finalidad de mantener el contacto así como realizar las gestiones que en esta aparecen (Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de Carácter Personal). Puede ejercer sus derechos de acceso, rectificación, cancelación y oposición dirigiéndose a atencion.clientesth en tasacionesh.com. La utilización de su dirección de correo electrónico por parte de nuestra empresa queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de la Sociedad de la Información y el Comercio Electrónico. Si Vd. recibe comunicación comercial por nuestra parte y desea dejar de recibirla, rogamos nos lo comunique por vía electrónica a través de la dirección atencion.clientesth en tasacionesh.com . -- AVISO LEGAL -- Los datos personales que en esta comunicación aparecen, así como los que nuestra empresa mantiene de Vd. y de su empresa, son tratados con la finalidad de mantener el contacto así como realizar las gestiones que en esta aparecen (Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de Carácter Personal). Puede ejercer sus derechos de acceso, rectificación, cancelación y oposición dirigiéndose a atencion.clientes en tasacionesh.com La utilización de su dirección de correo electrónico por parte de nuestra empresa queda sujeta a las disposiciones de la Ley 34/2002, de Servicios de la Sociedad de la Información y el Comercio Electrónico. Si Vd. recibe comunicación comercial por nuestra parte y desea dejar de recibirla, rogamos nos lo comunique por vía electrónica a través de la dirección atencion.clientes en tasacionesh.com ------------ próxima parte ------------ Se ha borrado un adjunto en formato HTML... URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20111220/7d7de378/attachment-0001.html> ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: no disponible Type: image/jpeg Size: 24195 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20111220/7d7de378/attachment-0001.jpe>
Oscar Perpiñan Lamigueiro
2011-Dec-20 11:21 UTC
[R-es] read.px() no lee algunos archivos pc-axis
Hola Jose Luis,>La función read.px() del paquete pxR ha funcionado perfectamente bien, >pero al ir a tratar los ficheros de estas url: >http://www.ine.es/pcaxisdl//t30/p168/serie/l0/01001.px >http://www.ine.es/pcaxisdl//t30/p168/serie/l0/01002.px >http://www.ine.es/pcaxisdl//t30/p168/serie/l0/01003.px > > >Obtengo siempre el mismo error: >Error en textConnection(px$DATA$value) : argumento 'text' inválido >Además: Mensajes de aviso perdidos >In scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : > entrada inválida encontrada en la conexión de entrada 'ETDP_Total.px'>Abriendo un fichero pc-axis de cada tipo (los que se leen bien y los >que no se leen) con un bloc de notas, parece que tuvieran una >estructura distinta, lo cual me hace pensar que el paquete no es >"inmune" a distintas estructuras internas del fichero pc-axis.Efectivamente el problema está en la estructura "diferente" de estos ficheros. La versión 0.24 (la que está actualmente en CRAN) no funciona bien con esos ficheros pero la que está en desarrollo en R-Forge los lee sin problemas aparentes (acabo de comprobarlo). Ahora mismo el tar.gz que genera R-Forge no está disponible (intentaré solucionarlo lo antes posible). Puedes conseguir todo el proyecto con svn checkout svn://scm.r-forge.r-project.org/svnroot/pxr y compilando tu mismo (no dudes en preguntarme ante cualquier problema con esto). No hay problema en discutir "en público" estos problemas, pero dado que son muy específicos del paquete pxR, te aconsejo que uses el foro de discusión en R-Forge https://r-forge.r-project.org/forum/forum.php?forum_id=3566 Saludos. Oscar.