Salvador Castillo Raya
2015-Dec-28 20:56 UTC
[R-es] Resumen de R-help-es, Vol 82, Envío 37
El código de autonomías y de los municipios es por orden alfabético y el de provincia es el código postal. Por ejemplo, Andalucía es CA01, Córdoba su código postal es14 y el primer municipio por orden alfabético de la provincia es Adamuz 14001. Espero q sea de ayuda. Enviado desde mi dispositivo Samsung -------- Mensaje original -------- De: "Karel L." <krelopq en yahoo.es> Fecha: 28/12/2015 20:28 (GMT+01:00) Para: r-help-es en r-project.org Asunto: Re: [R-es] Resumen de R-help-es, Vol 82, Envío 37 Hola Pedro, Por suerte creo que no son códigos postales, tienen pinta de ser los código de municipios. Lo de json desagragado por municipios sería "muy duro" pero posible. Cuestión de pensarlo bien y tener en cuenta algunas excepciones. De todas formas, lo que tu necesitas es mucho más sencillo, me refiero a un número más manejable de data.frames. Tienes que decargarte la aplicación para Linux (no importa que uses Windows) y descomprimirla. Verás dentro algunos archivos pero el directorio importante se llama "data", y dentro este hay otro llamado "ES" que tiene unos subdirectorios ordenados jerárquicamente por CCAA>Provincia>Municipio>...,. Cuando entras al directorio de Provincias, por ejemplo Almería, "ES/CA01/04" verás todos los municipios ordenados en directorios y un info.json solitario, según unas comprobaciones (no exhaustivas) es el agregado de esa provincia. Sería manejable, 52 data.frames, nada, luego te paso un correo y ya me dices si te sirve. Con respecto al scrapper, es método es mucho más complicado, sucio y en general el proceso no es muy diferente. Saludos. El 28/12/15 a las 19:04, Pedro Concejero Cerezo escribió:> Gracias Iv?n por preguntar, a mi tambi?n me interesan esos datos para hacer un an?lisis de correspondencias con la tabla municipios por partidos. > Gracias tambi?n Karel por proponer la lectura de json mediante bucle o similar, pero me temo que no funcionar?, explico por qu?. > Yo me descargu? la "herramienta" de an?lisis (para guindous) esperando que tendr?a alg?n dataset agregado y me encontr? con la desagradable sorpresa de que s?, ah? est? todo, pero en un chorreo de json que adem?s son muy complicados. Porque ag?rrense, est?n por c?digo postal, o eso me parece, y cada json incluye entradas para todos los partidos que se presentaban, de tal modo que tienes un mont?n de entradas con 0 votos. Me tir? un buen rato s?lo para encontrar el resultado de mi c?digo postal (si es que es ?se el c?digo usado). > > As? que recorrer lo 8 298 archivos me parece una locura, y me temo que puede ser m?s ?til (no s? si m?s r?pido) escrapear la p?gina que propones. Lo malo: no tengo ni idea de scrapear, y ahora muy poco tiempo para ponerme a estudiarlo. > > Karel: mi objetivo es tener una tabla provincia x partido con representaci?n parlamentaria que contenga el n?mero de votos. > Ser?a una tabla 52 provincias x 13 (con bastantes NAs en provincias que no se presentaban determinados partidos...). > Creo que el objetivo de Iv?n es a nivel municipio. Se multiplicar?an las filas. No s? hasta qu? punto Iv?n quiere incluir partidos sin representaci?n. > > Si nos dec?s como escrapear una p?gina (p.ej. http://resultadosgenerales2015.interior.es/congreso/#/ES201512-CON-ES/ES/CA12/32) a lo mejor nos podemos organizar para hacerlo nosotros. > (Eso s? estoy seguro que los medios ya tienen esos datasets agregados... Debieran ser p?blicos!!!) > > Saludos, > > -- > Pedro Concejero > E-mail: pedro.concejerocerezo en telefonica.com<mailto:pedro.concejerocerezo en telefonica.com> > skype: pedro.concejero > twitter @ConcejeroPedro<https://twitter.com/ConcejeroPedro> > linkedin pedroconcejero<http://www.linkedin.com/in/pedroconcejero/es> > Entusiasta R, me encontrar?is aqu? gRupo R madRid <http://madrid.r-es.org/> > > ________________________________ > > Este mensaje y sus adjuntos se dirigen exclusivamente a su destinatario, puede contener informaci?n privilegiada o confidencial y es para uso exclusivo de la persona o entidad de destino. Si no es usted. el destinatario indicado, queda notificado de que la lectura, utilizaci?n, divulgaci?n y/o copia sin autorizaci?n puede estar prohibida en virtud de la legislaci?n vigente. Si ha recibido este mensaje por error, le rogamos que nos lo comunique inmediatamente por esta misma v?a y proceda a su destrucci?n. > > The information contained in this transmission is privileged and confidential information intended only for the use of the individual or entity named above. If the reader of this message is not the intended recipient, you are hereby notified that any dissemination, distribution or copying of this communication is strictly prohibited. If you have received this transmission in error, do not read it. Please immediately reply to the sender that you have received this communication in error and then delete it. > > Esta mensagem e seus anexos se dirigem exclusivamente ao seu destinat?rio, pode conter informa??o privilegiada ou confidencial e ? para uso exclusivo da pessoa ou entidade de destino. Se n?o ? vossa senhoria o destinat?rio indicado, fica notificado de que a leitura, utiliza??o, divulga??o e/ou c?pia sem autoriza??o pode estar proibida em virtude da legisla??o vigente. Se recebeu esta mensagem por erro, rogamos-lhe que nos o comunique imediatamente por esta mesma via e proceda a sua destrui??o > > [[alternative HTML version deleted]] > > > > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es[[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]]