Maria Ruiz
2019-Mar-17 18:16 UTC
[R-es] Ayuda para campo con numerico y texto con Problemas
Hola a todos, Soy nueva usando R y tengo unos problema en procesado de datos que quiero hacer en R. Tengo un fichero de datos en formato texto separado con ; (punto y coma). Este fichero contiene las columnas: Poblacion;Sexo;Nota; EdadP, EdadM Tengo 2 problemas que no se como tratar. 1.- Problema La columna *Poblacion* debo tenerla siempre con la primera letra en mayúsculas y tengo poblaciones que tiene artículos o prepsosicones entre medias como por ejemplo: ( de, del,, las...) Albaida *de*l Aljarafe o Santa Cruz de Tenerife, tambien tengo algunas con Valencia, valencia, y (blanco)Valencia o Valencia(blanco) NO sé cémo tratar este dato para que solo aparezca en La primera letra de cada palabra y no los enlace o artículos, es decir no debe aparecer: del o de . 2,. Problema La columna *Nota* por hay errores y los datos no todso son de tipo 7.8 o 8.9 Parece que han errores y tengo algunos 6,5 o 6,9 ES decir han introducido la coma como separador decimal en vez de punto. Nota podria corregir los errores con otro programa pero quiero hacerlo todo con R. Gracias y espero un pronta respuesta Adjunto un troz del fichero Un trozo de ejemplo del fichero : Poblacion;Sexo;Nota;EdadP;EdadM Valencia ;m;7.23;45;34 Albaida del Aljarafe;M;5.93;36;37 valencia;M;NA;34;35 Barcelona;M;6.33;37;29 Albalate de las Nogueras; M;8.93;35;26 Valencia ;M;7.23;29;44 Santa Cruz de Tenerife; M ;NA;26;23 Valencia;M;9.23;44;46 Valencia; M ;7.63;23;35 Valencia ;M;5.73;46;31 Valencia;M;5.03;35;35 Valencia;M;NA;31;-24 Valencia;M ;6.13;35;28 Albalate de las Nogueras; M;7.63;24;37 Valencia;M ;7.53;28;26 Valencia; M;6.33;37;20 Santa Cruz de Tenerife;M;5.33;26;25 Santa cruz de Tenerife; m;7.33;20;35 Santa Cruz de tenerife;M;8.23;-25;39 Santa cruz de tenerife;M ;6.93;35;36 valencia; M;5.33;39;44 Valencia; M;7.73;36;46 Valencia;M ;6.23;44;35 Valencia;M;6.43;40;31 Santa cruz de Tenerife; m;6.83;36;35 valencia;M;5,73;39;24 valencia;M;6.23;58;28 valencia ; m;7.03;50;37 Albalate de las Nogueras; m;7.33;20;35 Albaida del Aljarafe;M;8.23;25;39 ------------ próxima parte ------------ Se ha borrado un adjunto en formato HTML... URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20190317/32bf8e02/attachment-0001.html> ------------ próxima parte ------------ A non-text attachment was scrubbed... Name: notas_selectivo.csv Type: application/vnd.ms-excel Size: 51746 bytes Desc: no disponible URL: <https://stat.ethz.ch/pipermail/r-help-es/attachments/20190317/32bf8e02/attachment-0001.xlb>
Javier Marcuzzi
2019-Mar-17 19:19 UTC
[R-es] Ayuda para campo con numerico y texto con Problemas
Estimada María Ruiz. Lo más simple, si son pocos datos, arregle los datos con excel, una base de datos, etc. Limpieza de datos fuera de R. Luego, las palabras y su trabajo, mire tm, texto mining. Saludos Javier Rubén Marcuzzi El dom., 17 de mar. de 2019 3:17 PM, Maria Ruiz <brew5157 en gmail.com> escribió:> Hola a todos, > Soy nueva usando R y tengo unos problema en procesado de datos que quiero > hacer en R. > > Tengo un fichero de datos en formato texto separado con ; (punto y coma). > Este fichero contiene las columnas: > Poblacion;Sexo;Nota; EdadP, EdadM > Tengo 2 problemas que no se como tratar. > 1.- Problema > La columna *Poblacion* debo tenerla siempre con la primera letra en > mayúsculas y tengo poblaciones que tiene artículos o prepsosicones entre > medias como por ejemplo: ( de, del,, las...) > Albaida *de*l Aljarafe o Santa Cruz de Tenerife, tambien tengo algunas > con Valencia, valencia, y (blanco)Valencia o Valencia(blanco) > > > NO sé cémo tratar este dato para que solo aparezca en La primera letra de > cada palabra y no los enlace o artículos, es decir no debe aparecer: del o > de . > > 2,. Problema > La columna *Nota* por hay errores y los datos no todso son de tipo 7.8 o > 8.9 > Parece que han errores y tengo algunos 6,5 o 6,9 > ES decir han introducido la coma como separador decimal en vez de punto. > > Nota podria corregir los errores con otro programa pero quiero hacerlo > todo con R. > > Gracias y espero un pronta respuesta > Adjunto un troz del fichero > > > Un trozo de ejemplo del fichero : > > Poblacion;Sexo;Nota;EdadP;EdadM > > Valencia ;m;7.23;45;34 > > Albaida del Aljarafe;M;5.93;36;37 > > valencia;M;NA;34;35 > > Barcelona;M;6.33;37;29 > > Albalate de las Nogueras; M;8.93;35;26 > > Valencia ;M;7.23;29;44 > > Santa Cruz de Tenerife; M ;NA;26;23 > > Valencia;M;9.23;44;46 > > Valencia; M ;7.63;23;35 > > Valencia ;M;5.73;46;31 > > Valencia;M;5.03;35;35 > > Valencia;M;NA;31;-24 > > Valencia;M ;6.13;35;28 > > Albalate de las Nogueras; M;7.63;24;37 > > Valencia;M ;7.53;28;26 > > Valencia; M;6.33;37;20 > > Santa Cruz de Tenerife;M;5.33;26;25 > > Santa cruz de Tenerife; m;7.33;20;35 > > Santa Cruz de tenerife;M;8.23;-25;39 > > Santa cruz de tenerife;M ;6.93;35;36 > > valencia; M;5.33;39;44 > > Valencia; M;7.73;36;46 > > Valencia;M ;6.23;44;35 > > Valencia;M;6.43;40;31 > > Santa cruz de Tenerife; m;6.83;36;35 > > valencia;M;5,73;39;24 > > valencia;M;6.23;58;28 > > valencia ; m;7.03;50;37 > > Albalate de las Nogueras; m;7.33;20;35 > > Albaida del Aljarafe;M;8.23;25;39 > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]]
Francisco Rodríguez
2019-Mar-17 19:33 UTC
[R-es] Ayuda para campo con numerico y texto con Problemas
Efectivamente siga el consejo de Javier, tiene datos no normalizados y por tanto le toca limpiar y preparar la informaci?n como sea necesaria. Pero tenga en cuenta que la falta de normalizaci?n har? que en todo caso solucione el problema para un caso en concreto, cuando trate de unir esos datos ?limpios? con otros, otra vez vuelta a empezar. Por normalizar entiendo en su contexto tener identificados al menos los municipios por un c?digo que puede ser el c?digo municipal. Por otro lado si tiene otro programa que le corrige los errores, ?selo o bien pase ese programa a R, si va a usar R es porque alguna ganancia debe reportarle Un saludo Enviado desde Correo<https://go.microsoft.com/fwlink/?LinkId=550986> para Windows 10 ________________________________ De: R-help-es <r-help-es-bounces en r-project.org> en nombre de Javier Marcuzzi <javier.ruben.marcuzzi en gmail.com> Enviado: Sunday, March 17, 2019 8:19:36 PM Para: Maria Ruiz Cc: r-help-es Asunto: Re: [R-es] Ayuda para campo con numerico y texto con Problemas Estimada Mar?a Ruiz. Lo m?s simple, si son pocos datos, arregle los datos con excel, una base de datos, etc. Limpieza de datos fuera de R. Luego, las palabras y su trabajo, mire tm, texto mining. Saludos Javier Rub?n Marcuzzi El dom., 17 de mar. de 2019 3:17 PM, Maria Ruiz <brew5157 en gmail.com> escribi?:> Hola a todos, > Soy nueva usando R y tengo unos problema en procesado de datos que quiero > hacer en R. > > Tengo un fichero de datos en formato texto separado con ; (punto y coma). > Este fichero contiene las columnas: > Poblacion;Sexo;Nota; EdadP, EdadM > Tengo 2 problemas que no se como tratar. > 1.- Problema > La columna *Poblacion* debo tenerla siempre con la primera letra en > may?sculas y tengo poblaciones que tiene art?culos o prepsosicones entre > medias como por ejemplo: ( de, del,, las...) > Albaida *de*l Aljarafe o Santa Cruz de Tenerife, tambien tengo algunas > con Valencia, valencia, y (blanco)Valencia o Valencia(blanco) > > > NO s? c?mo tratar este dato para que solo aparezca en La primera letra de > cada palabra y no los enlace o art?culos, es decir no debe aparecer: del o > de . > > 2,. Problema > La columna *Nota* por hay errores y los datos no todso son de tipo 7.8 o > 8.9 > Parece que han errores y tengo algunos 6,5 o 6,9 > ES decir han introducido la coma como separador decimal en vez de punto. > > Nota podria corregir los errores con otro programa pero quiero hacerlo > todo con R. > > Gracias y espero un pronta respuesta > Adjunto un troz del fichero > > > Un trozo de ejemplo del fichero : > > Poblacion;Sexo;Nota;EdadP;EdadM > > Valencia ;m;7.23;45;34 > > Albaida del Aljarafe;M;5.93;36;37 > > valencia;M;NA;34;35 > > Barcelona;M;6.33;37;29 > > Albalate de las Nogueras; M;8.93;35;26 > > Valencia ;M;7.23;29;44 > > Santa Cruz de Tenerife; M ;NA;26;23 > > Valencia;M;9.23;44;46 > > Valencia; M ;7.63;23;35 > > Valencia ;M;5.73;46;31 > > Valencia;M;5.03;35;35 > > Valencia;M;NA;31;-24 > > Valencia;M ;6.13;35;28 > > Albalate de las Nogueras; M;7.63;24;37 > > Valencia;M ;7.53;28;26 > > Valencia; M;6.33;37;20 > > Santa Cruz de Tenerife;M;5.33;26;25 > > Santa cruz de Tenerife; m;7.33;20;35 > > Santa Cruz de tenerife;M;8.23;-25;39 > > Santa cruz de tenerife;M ;6.93;35;36 > > valencia; M;5.33;39;44 > > Valencia; M;7.73;36;46 > > Valencia;M ;6.23;44;35 > > Valencia;M;6.43;40;31 > > Santa cruz de Tenerife; m;6.83;36;35 > > valencia;M;5,73;39;24 > > valencia;M;6.23;58;28 > > valencia ; m;7.03;50;37 > > Albalate de las Nogueras; m;7.33;20;35 > > Albaida del Aljarafe;M;8.23;25;39 > _______________________________________________ > R-help-es mailing list > R-help-es en r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es >[[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]]
Isidro Hidalgo Arellano
2019-Mar-18 07:27 UTC
[R-es] Ayuda para campo con numerico y texto con Problemas
Si lo necesitas, yo puedo pasarte el nombre de las localidades de Castilla-La Mancha de cuatro formas diferentes. Un saludo Isidro Hidalgo Arellano Observatorio del Mercado de Trabajo Consejería de Economía, Empresas y Empleo <http://www.castillalamancha.es/> http://www.castillalamancha.es/ De: R-help-es <r-help-es-bounces en r-project.org> En nombre de Maria Ruiz Enviado el: domingo, 17 de marzo de 2019 19:17 Para: r-help-es en r-project.org Asunto: [R-es] Ayuda para campo con numerico y texto con Problemas Hola a todos, Soy nueva usando R y tengo unos problema en procesado de datos que quiero hacer en R. Tengo un fichero de datos en formato texto separado con ; (punto y coma). Este fichero contiene las columnas: Poblacion;Sexo;Nota; EdadP, EdadM Tengo 2 problemas que no se como tratar. 1.- Problema La columna Poblacion debo tenerla siempre con la primera letra en mayúsculas y tengo poblaciones que tiene artículos o prepsosicones entre medias como por ejemplo: ( de, del,, las...) Albaida del Aljarafe o Santa Cruz de Tenerife, tambien tengo algunas con Valencia, valencia, y (blanco)Valencia o Valencia(blanco) NO sé cémo tratar este dato para que solo aparezca en La primera letra de cada palabra y no los enlace o artículos, es decir no debe aparecer: del o de . 2,. Problema La columna Nota por hay errores y los datos no todso son de tipo 7.8 o 8.9 Parece que han errores y tengo algunos 6,5 o 6,9 ES decir han introducido la coma como separador decimal en vez de punto. Nota podria corregir los errores con otro programa pero quiero hacerlo todo con R. Gracias y espero un pronta respuesta Adjunto un troz del fichero Un trozo de ejemplo del fichero : Poblacion;Sexo;Nota;EdadP;EdadM Valencia ;m;7.23;45;34 Albaida del Aljarafe;M;5.93;36;37 valencia;M;NA;34;35 Barcelona;M;6.33;37;29 Albalate de las Nogueras; M;8.93;35;26 Valencia ;M;7.23;29;44 Santa Cruz de Tenerife; M ;NA;26;23 Valencia;M;9.23;44;46 Valencia; M ;7.63;23;35 Valencia ;M;5.73;46;31 Valencia;M;5.03;35;35 Valencia;M;NA;31;-24 Valencia;M ;6.13;35;28 Albalate de las Nogueras; M;7.63;24;37 Valencia;M ;7.53;28;26 Valencia; M;6.33;37;20 Santa Cruz de Tenerife;M;5.33;26;25 Santa cruz de Tenerife; m;7.33;20;35 Santa Cruz de tenerife;M;8.23;-25;39 Santa cruz de tenerife;M ;6.93;35;36 valencia; M;5.33;39;44 Valencia; M;7.73;36;46 Valencia;M ;6.23;44;35 Valencia;M;6.43;40;31 Santa cruz de Tenerife; m;6.83;36;35 valencia;M;5,73;39;24 valencia;M;6.23;58;28 valencia ; m;7.03;50;37 Albalate de las Nogueras; m;7.33;20;35 Albaida del Aljarafe;M;8.23;25;39 [[alternative HTML version deleted]]
miguei@@@gei@rodriguez@mui@os m@iii@g oii serg@s@es
2019-Mar-18 08:22 UTC
[R-es] Concurso de visualización de datos con R
https://rusersasturias.github.io/contest/ ________________________________ Nota: A información contida nesta mensaxe e os seus posibles documentos adxuntos é privada e confidencial e está dirixida únicamente ó seu destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe, por favor elimínea. A distribución ou copia desta mensaxe non está autorizada. Nota: La información contenida en este mensaje y sus posibles documentos adjuntos es privada y confidencial y está dirigida únicamente a su destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, por favor elimínelo. La distribución o copia de este mensaje no está autorizada. See more languages: http://www.sergas.es/aviso-confidencialidad