Estimados, tengo el siguiente problema: tengo muchos archivos (algunos cientos) con columnas de datos separados por \tab y al importar en R me di cuenta que me faltaban algunas filas ... despues de 3 dias dandole vueltas al problema encontre que las filas que faltaban tenian un doble \tab en alguna columna Luego la pregunta es: existe alguna forma de importar los archivos de modo que el doble \tab no produzca errores o existe alguna forma de "abrir" los archivos sin importarlos en R (pero con R), buscar y reemplazar ese doble \tab para luego importar Saludos y muchas gracias, Eric, -- Forest Engineer Master in Environmental and Natural Resource Economics Ph.D. student in Sciences of Natural Resources at La Frontera University Member in AguaDeTemu2030, citizen movement for Temuco with green city standards for living Nota: Las tildes se han omitido para asegurar compatibilidad con algunos lectores de correo.
Hola Lo más sencillo es utilizar sed, desde la línea de comandos: sed 's/^I^I/^I/g' ficheroOriginal.dat >ficheroCorregido.dat Alternativa: usa la hoja de cálculo de libre office te da la opción de eliminar repeticiones de separador de campos. Espero que te sirva El 14/05/16 a las 18:58, eric escribió:> Estimados, tengo el siguiente problema: > > tengo muchos archivos (algunos cientos) con columnas de datos > separados por \tab y al importar en R me di cuenta que me faltaban > algunas filas ... despues de 3 dias dandole vueltas al problema > encontre que las filas que faltaban tenian un doble \tab en alguna > columna > > Luego la pregunta es: > > existe alguna forma de importar los archivos de modo que el doble \tab > no produzca errores o > > existe alguna forma de "abrir" los archivos sin importarlos en R (pero > con R), buscar y reemplazar ese doble \tab para luego importar > > Saludos y muchas gracias, > > Eric, > > > >-- ___________________________________________________________ José Antonio Palazón Ferrando Profesor Titular. Departamento de Ecología e Hidrología. Facultad de Biología. Universidad de Murcia. Campus Universitario de Espinardo 30100 MURCIA-SPAIN Telf: +34 868 88 49 80 Fax : +34 868 88 39 63 Email: palazon en um.es http://webs.um.es/palazon
JA Palazón
2016-May-15 09:59 UTC
[R-es] buscar y reemplazar tabs dentro de un archivo (y 2)
Olvidaba, por si acaso, para "escribrir" ^I (tabulador) debes utilizar ctrl-V y despues ctrl-I lo que visulamente dará ^I Seguimos El 14/05/16 a las 18:58, eric escribió:> Estimados, tengo el siguiente problema: > > tengo muchos archivos (algunos cientos) con columnas de datos > separados por \tab y al importar en R me di cuenta que me faltaban > algunas filas ... despues de 3 dias dandole vueltas al problema > encontre que las filas que faltaban tenian un doble \tab en alguna > columna > > Luego la pregunta es: > > existe alguna forma de importar los archivos de modo que el doble \tab > no produzca errores o > > existe alguna forma de "abrir" los archivos sin importarlos en R (pero > con R), buscar y reemplazar ese doble \tab para luego importar > > Saludos y muchas gracias, > > Eric, > > > >-- ___________________________________________________________ José Antonio Palazón Ferrando Profesor Titular. Departamento de Ecología e Hidrología. Facultad de Biología. Universidad de Murcia. Campus Universitario de Espinardo 30100 MURCIA-SPAIN Telf: +34 868 88 49 80 Fax : +34 868 88 39 63 Email: palazon en um.es http://webs.um.es/palazon
Hola Jose, muchas gracias por la sugerencia, no conocia la existencia de "sed" ... yo preguntaba por la posibilidad de hacerlo con R mismo para no tener que escribir algo en otro lenguaje, porque te refieres a "sed" en linux, no ? y tambien por lo mucho mejor que es un script que hacerlo a mano, considerando que son varios cientos de archivos ... voy a probar con un script de bash a ver si me funciona. Muchas gracias a todos, Saludos, Eric. On 05/15/2016 11:57 AM, JA Palazón wrote:> Hola > > Lo más sencillo es utilizar sed, desde la línea de comandos: > > sed 's/^I^I/^I/g' ficheroOriginal.dat >ficheroCorregido.dat > > Alternativa: usa la hoja de cálculo de libre office te da > la opción de eliminar repeticiones de separador de campos. > > Espero que te sirva > > El 14/05/16 a las 18:58, eric escribió: >> Estimados, tengo el siguiente problema: >> >> tengo muchos archivos (algunos cientos) con columnas de datos >> separados por \tab y al importar en R me di cuenta que me faltaban >> algunas filas ... despues de 3 dias dandole vueltas al problema >> encontre que las filas que faltaban tenian un doble \tab en alguna >> columna >> >> Luego la pregunta es: >> >> existe alguna forma de importar los archivos de modo que el doble \tab >> no produzca errores o >> >> existe alguna forma de "abrir" los archivos sin importarlos en R (pero >> con R), buscar y reemplazar ese doble \tab para luego importar >> >> Saludos y muchas gracias, >> >> Eric, >> >> >> >> >-- Forest Engineer Master in Environmental and Natural Resource Economics Ph.D. student in Sciences of Natural Resources at La Frontera University Member in AguaDeTemu2030, citizen movement for Temuco with green city standards for living Nota: Las tildes se han omitido para asegurar compatibilidad con algunos lectores de correo.