Hola Jose, muchas gracias por la sugerencia, no conocia la existencia de "sed" ... yo preguntaba por la posibilidad de hacerlo con R mismo para no tener que escribir algo en otro lenguaje, porque te refieres a "sed" en linux, no ? y tambien por lo mucho mejor que es un script que hacerlo a mano, considerando que son varios cientos de archivos ... voy a probar con un script de bash a ver si me funciona. Muchas gracias a todos, Saludos, Eric. On 05/15/2016 11:57 AM, JA Palazón wrote:> Hola > > Lo más sencillo es utilizar sed, desde la línea de comandos: > > sed 's/^I^I/^I/g' ficheroOriginal.dat >ficheroCorregido.dat > > Alternativa: usa la hoja de cálculo de libre office te da > la opción de eliminar repeticiones de separador de campos. > > Espero que te sirva > > El 14/05/16 a las 18:58, eric escribió: >> Estimados, tengo el siguiente problema: >> >> tengo muchos archivos (algunos cientos) con columnas de datos >> separados por \tab y al importar en R me di cuenta que me faltaban >> algunas filas ... despues de 3 dias dandole vueltas al problema >> encontre que las filas que faltaban tenian un doble \tab en alguna >> columna >> >> Luego la pregunta es: >> >> existe alguna forma de importar los archivos de modo que el doble \tab >> no produzca errores o >> >> existe alguna forma de "abrir" los archivos sin importarlos en R (pero >> con R), buscar y reemplazar ese doble \tab para luego importar >> >> Saludos y muchas gracias, >> >> Eric, >> >> >> >> >-- Forest Engineer Master in Environmental and Natural Resource Economics Ph.D. student in Sciences of Natural Resources at La Frontera University Member in AguaDeTemu2030, citizen movement for Temuco with green city standards for living Nota: Las tildes se han omitido para asegurar compatibilidad con algunos lectores de correo.
Usa la función system para desde R usar las herramientas del sistema. On 17/05/16 16:13, eric wrote:> Hola Jose, muchas gracias por la sugerencia, no conocia la existencia > de "sed" ... yo preguntaba por la posibilidad de hacerlo con R mismo > para no tener que escribir algo en otro lenguaje, porque te refieres a > "sed" en linux, no ? y tambien por lo mucho mejor que es un script que > hacerlo a mano, considerando que son varios cientos de archivos ... > voy a probar con un script de bash a ver si me funciona. > > Muchas gracias a todos, > > Saludos, Eric. > > > > > > > > > > > On 05/15/2016 11:57 AM, JA Palazón wrote: >> Hola >> >> Lo más sencillo es utilizar sed, desde la línea de comandos: >> >> sed 's/^I^I/^I/g' ficheroOriginal.dat >ficheroCorregido.dat >> >> Alternativa: usa la hoja de cálculo de libre office te da >> la opción de eliminar repeticiones de separador de campos. >> >> Espero que te sirva >> >> El 14/05/16 a las 18:58, eric escribió: >>> Estimados, tengo el siguiente problema: >>> >>> tengo muchos archivos (algunos cientos) con columnas de datos >>> separados por \tab y al importar en R me di cuenta que me faltaban >>> algunas filas ... despues de 3 dias dandole vueltas al problema >>> encontre que las filas que faltaban tenian un doble \tab en alguna >>> columna >>> >>> Luego la pregunta es: >>> >>> existe alguna forma de importar los archivos de modo que el doble \tab >>> no produzca errores o >>> >>> existe alguna forma de "abrir" los archivos sin importarlos en R (pero >>> con R), buscar y reemplazar ese doble \tab para luego importar >>> >>> Saludos y muchas gracias, >>> >>> Eric, >>> >>> >>> >>> >> >
Javier Marcuzzi
2016-May-17 21:19 UTC
[R-es] buscar y reemplazar tabs dentro de un archivo
Estimado Eric Las filas que faltan, ¿son filas enteras, donde todo es valor NA o ?? en un data.frame? Porque si es así podrías importar todo y luego buscar (filtrar) los que no son NA. Copio y pego un código que utilizo en un trabajo, posiblemente le sea útil. Tratamientos$Tratamiento[Tratamientos$Tratamiento == ""] <- NA # asignar NA a las celdas vacías Tratamientos<- Tratamientos[ !is.na(Tratamientos$Tratamiento),] #Solo dejo filas en las que las tratamiento son diferentes de cero Javier Rubén Marcuzzi De: ja palazon Enviado: martes, 17 de mayo de 2016 18:06 Para: r-help-es en r-project.org Asunto: Re: [R-es] buscar y reemplazar tabs dentro de un archivo Usa la función system para desde R usar las herramientas del sistema. On 17/05/16 16:13, eric wrote:> Hola Jose, muchas gracias por la sugerencia, no conocia la existencia > de "sed" ... yo preguntaba por la posibilidad de hacerlo con R mismo > para no tener que escribir algo en otro lenguaje, porque te refieres a > "sed" en linux, no ? y tambien por lo mucho mejor que es un script que > hacerlo a mano, considerando que son varios cientos de archivos ... > voy a probar con un script de bash a ver si me funciona. > > Muchas gracias a todos, > > Saludos, Eric. > > > > > > > > > > > On 05/15/2016 11:57 AM, JA Palazón wrote: >> Hola >> >> Lo más sencillo es utilizar sed, desde la línea de comandos: >> >> sed 's/^I^I/^I/g' ficheroOriginal.dat >ficheroCorregido.dat >> >> Alternativa: usa la hoja de cálculo de libre office te da >> la opción de eliminar repeticiones de separador de campos. >> >> Espero que te sirva >> >> El 14/05/16 a las 18:58, eric escribió: >>> Estimados, tengo el siguiente problema: >>> >>> tengo muchos archivos (algunos cientos) con columnas de datos >>> separados por \tab y al importar en R me di cuenta que me faltaban >>> algunas filas ... despues de 3 dias dandole vueltas al problema >>> encontre que las filas que faltaban tenian un doble \tab en alguna >>> columna >>> >>> Luego la pregunta es: >>> >>> existe alguna forma de importar los archivos de modo que el doble \tab >>> no produzca errores o >>> >>> existe alguna forma de "abrir" los archivos sin importarlos en R (pero >>> con R), buscar y reemplazar ese doble \tab para luego importar >>> >>> Saludos y muchas gracias, >>> >>> Eric, >>> >>> >>> >>> >> >_______________________________________________ R-help-es mailing list R-help-es en r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]]